This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/
-
CodeGen/SelectionDAG/
-
SelectionDAG/
-
SelectionDAGBuilder.h
-
SelectionDAGBuilder.cpp
-
Target/AMDGPU/
-
AMDGPU/
2
AMDGPUISelLowering.cpp
-
test/CodeGen/AMDGPU/
-
CodeGen/
-
AMDGPU/
-
fcanonicalize-elimination.ll
-
fcanonicalize.f16.ll
-
fcanonicalize.ll
-
fdiv32-to-rcp-folding.ll
-
fmuladd.f16.ll
-
fmuladd.f32.ll
-
fneg-combines.ll
-
selectcc-opt.ll
-
set-dx10.ll

Differential D84056

[FPEnv] Don't transform FSUB(-0, X) -> FNEG(X) in SelectionDAGBuilder.
ClosedPublic

Authored by cameron.mcinally on Jul 17 2020, 10:47 AM.

Download Raw Diff

Details

Reviewers

arsenm

Commits

rG31c7a2fd5c9a: [FPEnv] Don't transform FSUB(-0,X)->FNEG(X) in SelectionDAGBuilder.

Summary

This is a subset of the patch in D73978. Hopefully this change is easier to digest...

This patch stops unconditionally transforming FSUB(-0, X) into an FNEG(X) while building the DAG. There are also two small changes to handle the new FSUB(-0,X) similarly to FNEG(X).

I've left some NOTE comments in the tests to illustrate the assembly changes, since I'm not that familiar with AMDGPU. These are just to ease reviewing. I'll remove those comments if the asm looks acceptable.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

cameron.mcinally created this revision.Jul 17 2020, 10:47 AM

Herald added a project: Restricted Project. · View Herald TranscriptJul 17 2020, 10:47 AM

Herald added subscribers: llvm-commits, kerbowa, hiraditya and 4 others. · View Herald Transcript

Harbormaster failed remote builds in B64721: Diff 278840!Jul 17 2020, 11:45 AM

arsenm added inline comments.Jul 20 2020, 6:58 AM

llvm/lib/Target/AMDGPU/SIISelLowering.cpp
9274–9275 ↗	(On Diff #278840)	I thought the point was this cannot be lowered this way?
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fmed3.ll
39 ↗	(On Diff #278840)	This is a code size regression. We probably need This should just change to use fneg. We could probably consider the fsub case in performFNegCombine though

cameron.mcinally added inline comments.Jul 20 2020, 7:24 AM

llvm/lib/Target/AMDGPU/SIISelLowering.cpp
9274–9275 ↗	(On Diff #278840)	This isn't as bad as it seems, I think. This is `isCanonicalized(...)`, so we're just saying the the FSUB(-0,X) might not flush denormals (if DAGCombine wants to change it to an FNEG(X) later). We could check the DenormalMode here though. That would let us know what will happen to the FSUB(-0,X) in DAGCombine. Assuming it's not a can of worms, I could do that. If it is a can-of-worms, might be better left for separate patch. It should be functional with this patch, just not optimal.
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fmed3.ll
39 ↗	(On Diff #278840)	This should just change to use fneg. Are you saying the IR in this test should just be updated to use FNEG? I'll look to see if there's a clean way to combine FSUB with the FMED...

cameron.mcinally added inline comments.Jul 20 2020, 1:11 PM

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fmed3.ll
39 ↗	(On Diff #278840)	This problem is really sticky (and maybe a design flaw in DAGCombine). The initial DAGs for pre/post-Diff are largely the same, except for the FSUB/FNEG node. The problem arrises in visitFSUB(...), when the FSUB(-0,X) is transformed to FNEG(X). This combine, of course, removes the FSUB(-0,X) from its current position in the Worklist, and the new FNEG(X) is placed at the end of the Worklist. This new Worklist order is pretty unfortunate. The two transforms that are needed to fold the FNEG into the FMED3 are now out of order. (If DAGCombine ran one more time, it looks like we'd correctly get the fold.)

cameron.mcinally added inline comments.Jul 20 2020, 3:23 PM

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fmed3.ll
39 ↗	(On Diff #278840)	Actually, this is a bug in `AMDGPUTargetLowering::performFNegCombine(...)`. Under the FMED3 case, we have this code: if (Res.getOpcode() != AMDGPUISD::FMED3) return SDValue(); // Op got folded away. if (!Op.hasOneUse()) DAG.ReplaceAllUsesWith(Op, DAG.getNode(ISD::FNEG, SL, VT, Res)); return Res; That's a problem. We're using RAUW to insert the new user(s) of Res. But we return Res, not the new user(s), to DAGCombine. DAGCombine will then add the users of Res back to the Worklist, but not the users of the new FNEG. So we miss the new FNEG combine opportunity. More details to come tomorrow...

Fix the FMED3 DAGCombine problem by explicitly adding the new node's users to the Worklist.

Heads up, @arsenm. There are other instances of this bug in performFNegCombine(...). I see at least two in the other FMA cases.

cameron.mcinally added inline comments.Jul 21 2020, 8:57 AM

llvm/lib/Target/AMDGPU/SIISelLowering.cpp
9274–9275 ↗	(On Diff #278840)	We could check the DenormalMode here though. Guarding this code based on denormal mode is easy enough, but it affects the assembly in a number of tests where denormals are enabled. That will make this patch harder to review. It might be better to optimize in a stand-alone Diff. Thoughts on this?

arsenm added inline comments.Jul 21 2020, 9:05 AM

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fmed3.ll
39 ↗	(On Diff #278840)	Yes, the IR should be changed. Theoretically the fsub case would be another test and a different optimization

arsenm added inline comments.Jul 21 2020, 9:08 AM

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
3796–3798	I don't actually know why this would ever happen?
llvm/lib/Target/AMDGPU/SIISelLowering.cpp
9274–9275 ↗	(On Diff #278840)	I think checking for denormals isn't quite correct; canonicalized doesn't just mean denormals are flushed. It also means at minimum signaling nans are quieted

cameron.mcinally added inline comments.Jul 21 2020, 11:18 AM

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
3796–3798	Came from D50706. The IR for this particular problem is: %med3 = call float @llvm.amdgcn.fmed3.f32(float %src0, float %src1, float %src2) %neg.med3 = fsub float -0.0, %med3 %med3.user = fmul float %med3, 4.0 The intention is that the FNEG is sunk into the FMED3 operands and the FMUL absorbs it by negating the constant. Seems like a pretty specific peep to me, but I'm no expert on this instruction...
llvm/lib/Target/AMDGPU/SIISelLowering.cpp
9274–9275 ↗	(On Diff #278840)	That's true, but there is more nuance here... For the general FSUB case, the result will be canonicalized. No problem there. For the FSUB(-0,X) case, the result may or may not be canonicalized, depending on if the FSUB is replaced with a FNEG or not. And DAGCombine will only do that FNEG transform if in a particular denormal mode. So, as long as both this check and the decision to transform FSUB(-0,X)->FNEG(X) are in lockstep, it's not really a problem. But, clearly, this is somewhat brittle and error prone. Being a little pessimistic in order to more forward isn't the worst thing, assuming we don't regress too much. Figuring out a good solution to this subproblem will be easier (for me at least) if we can isolate it from the larger project.

cameron.mcinally added inline comments.Jul 22 2020, 2:05 PM

llvm/lib/Target/AMDGPU/SIISelLowering.cpp

9274–9275 ↗

(On Diff #278840)

This is the test that's tripping:

; GCN-LABEL: {{^}}v_test_canonicalize_fneg_fabs_var_f32:
; GFX678: v_mul_f32_e64 [[REG:v[0-9]+]], -1.0, |{{v[0-9]+}}|
; GFX9: v_max_f32_e64 [[REG:v[0-9]+]], -|{{v[0-9]+}}|, -|{{v[0-9]+}}|
; GCN: {{flat|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_f32(float addrspace(1)* %out) #1 {
  %val = load float, float addrspace(1)* %out
  %val.fabs = call float @llvm.fabs.f32(float %val)
  %val.fabs.fneg = fsub float -0.0, %val.fabs
  %canonicalized = call float @llvm.canonicalize.f32(float %val.fabs.fneg)
  store float %canonicalized, float addrspace(1)* %out
  ret void
}

attributes #1 = { nounwind "denormal-fp-math-f32"="preserve-sign,preserve-sign" }

We need a way for isCanonicalized(...) to return that an FSUB(-0,X) might not canonicalize if it is combined into an FNEG. Otherwise, the @llvm.canonicalize.f32 will be removed and we end up with:

flat_load_dword v2, v[0:1]
s_waitcnt vmcnt(0) lgkmcnt(0)
v_or_b32_e32 v2, 0x80000000, v2
flat_store_dword v[0:1], v2

Maybe we need a isFSUBtoFNEGLegal(...) helper function? That way the check is uniform across all uses?

arsenm added inline comments.Jul 22 2020, 3:05 PM

llvm/lib/Target/AMDGPU/SIISelLowering.cpp
9274–9275 ↗	(On Diff #278840)	Basically none of these tests you're running into are intended to use fsub. They're all fnegs that weren't ported since that's what the source modifiers are intended to directly match. Trying to do anything smarter with folding fsub's is an optimization beyond what this intended to check. I think we should just start from the position that it is not legal to lower fsub -0, x to fneg and work from there

cameron.mcinally added inline comments.Jul 23 2020, 7:58 AM

llvm/lib/Target/AMDGPU/SIISelLowering.cpp
9274–9275 ↗	(On Diff #278840)	Basically none of these tests you're running into are intended to use fsub. They're all fnegs that weren't ported since that's what the source modifiers are intended to directly match. Trying to do anything smarter with folding fsub's is an optimization beyond what this intended to check. Ok, that's fair. To reiterate, the tests should be updated to use FNEG. I'll prepare that patch for you to check out. I apologize for putting that burden on you, but I have very little intuition about the AMDGPU backend, so I want to change as little as possible. I think we should just start from the position that it is not legal to lower fsub -0, x to fneg and work from there I think this is the right thing to do, assuming we don't impact out-of-tree targets that might still generate the old FSUB(-0,X) idiom. Thinking some more, I'm fairly sure there are bugs in opt that mistakenly generate the old FSUB(-0,X) pattern. So those will need to be sorted out too. And I'm not sure we can get away with bulk updating all the llc tests for other targets to use FNEG over FSUB(-0,X). Threading a needle....

Update the tests failing from the SelectionDAGBuilder change to use FNEG.

LGTM. Can you also make the same fix in GlobalISel?

This revision is now accepted and ready to land.Jul 29 2020, 9:46 AM

I think this needs to be done in FastISel too?

Apologies for the slow reply. I was on vacation last week...

Thanks. Will do. I still need to unwind the unconditional FNEG transform in DAGCombine too.

Closed by commit rG31c7a2fd5c9a: [FPEnv] Don't transform FSUB(-0,X)->FNEG(X) in SelectionDAGBuilder. (authored by cameron.mcinally). · Explain WhyAug 3 2020, 8:22 AM

This revision was automatically updated to reflect the committed changes.

cameron.mcinally added a commit: rG31c7a2fd5c9a: [FPEnv] Don't transform FSUB(-0,X)->FNEG(X) in SelectionDAGBuilder..

cameron.mcinally mentioned this in D85139: [GlobalISel] Don't transform FSUB(-0, X) -> FNEG(X) in GlobalISel..Aug 3 2020, 8:52 AM

cameron.mcinally mentioned this in D85149: [FastISel] Don't transform FSUB(-0, X) -> FNEG(X) in FastISel.Aug 3 2020, 12:37 PM

cameron.mcinally mentioned this in rG23adbac9ee23: [GlobalISel] Don't transform FSUB(-0, X) -> FNEG(X) in GlobalISel..Aug 4 2020, 9:27 AM

cameron.mcinally mentioned this in rG0f2b47b6da0b: [FastISel] Don't transform FSUB(-0, X) -> FNEG(X) in FastISel.Aug 4 2020, 12:43 PM

cameron.mcinally mentioned this in D73978: [WIP][FPEnv] Don't transform FSUB(-0.0,X)->FNEG(X) when flushing denormals.Aug 20 2020, 2:21 PM

Revision Contents

Path

Size

llvm/

lib/

CodeGen/

SelectionDAG/

SelectionDAGBuilder.h

2 lines

SelectionDAGBuilder.cpp

14 lines

Target/

AMDGPU/

AMDGPUISelLowering.cpp

11 lines

test/

CodeGen/

AMDGPU/

fcanonicalize-elimination.ll

4 lines

fcanonicalize.f16.ll

12 lines

fcanonicalize.ll

8 lines

fdiv32-to-rcp-folding.ll

2 lines

10 lines

10 lines

228 lines

4 lines

12 lines

Diff 282633

llvm/lib/CodeGen/SelectionDAG/SelectionDAGBuilder.h

Show First 20 Lines • Show All 686 Lines • ▼ Show 20 Lines	private:
void visitUnary(const User &I, unsigned Opcode);		void visitUnary(const User &I, unsigned Opcode);
void visitFNeg(const User &I) { visitUnary(I, ISD::FNEG); }		void visitFNeg(const User &I) { visitUnary(I, ISD::FNEG); }

void visitBinary(const User &I, unsigned Opcode);		void visitBinary(const User &I, unsigned Opcode);
void visitShift(const User &I, unsigned Opcode);		void visitShift(const User &I, unsigned Opcode);
void visitAdd(const User &I) { visitBinary(I, ISD::ADD); }		void visitAdd(const User &I) { visitBinary(I, ISD::ADD); }
void visitFAdd(const User &I) { visitBinary(I, ISD::FADD); }		void visitFAdd(const User &I) { visitBinary(I, ISD::FADD); }
void visitSub(const User &I) { visitBinary(I, ISD::SUB); }		void visitSub(const User &I) { visitBinary(I, ISD::SUB); }
void visitFSub(const User &I);		void visitFSub(const User &I) { visitBinary(I, ISD::FSUB); }
void visitMul(const User &I) { visitBinary(I, ISD::MUL); }		void visitMul(const User &I) { visitBinary(I, ISD::MUL); }
void visitFMul(const User &I) { visitBinary(I, ISD::FMUL); }		void visitFMul(const User &I) { visitBinary(I, ISD::FMUL); }
void visitURem(const User &I) { visitBinary(I, ISD::UREM); }		void visitURem(const User &I) { visitBinary(I, ISD::UREM); }
void visitSRem(const User &I) { visitBinary(I, ISD::SREM); }		void visitSRem(const User &I) { visitBinary(I, ISD::SREM); }
void visitFRem(const User &I) { visitBinary(I, ISD::FREM); }		void visitFRem(const User &I) { visitBinary(I, ISD::FREM); }
void visitUDiv(const User &I) { visitBinary(I, ISD::UDIV); }		void visitUDiv(const User &I) { visitBinary(I, ISD::UDIV); }
void visitSDiv(const User &I);		void visitSDiv(const User &I);
void visitFDiv(const User &I) { visitBinary(I, ISD::FDIV); }		void visitFDiv(const User &I) { visitBinary(I, ISD::FDIV); }
▲ Show 20 Lines • Show All 207 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/SelectionDAGBuilder.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 2,999 Lines • ▼ Show 20 Lines	if (&I != &BB.front()) {
return;		return;
}		}
}		}
}		}

DAG.setRoot(DAG.getNode(ISD::TRAP, getCurSDLoc(), MVT::Other, DAG.getRoot()));		DAG.setRoot(DAG.getNode(ISD::TRAP, getCurSDLoc(), MVT::Other, DAG.getRoot()));
}		}

void SelectionDAGBuilder::visitFSub(const User &I) {
// -0.0 - X --> fneg
Type *Ty = I.getType();
if (isa<Constant>(I.getOperand(0)) &&
I.getOperand(0) == ConstantFP::getZeroValueForNegation(Ty)) {
SDValue Op2 = getValue(I.getOperand(1));
setValue(&I, DAG.getNode(ISD::FNEG, getCurSDLoc(),
Op2.getValueType(), Op2));
return;
}

visitBinary(I, ISD::FSUB);
}

void SelectionDAGBuilder::visitUnary(const User &I, unsigned Opcode) {		void SelectionDAGBuilder::visitUnary(const User &I, unsigned Opcode) {
SDNodeFlags Flags;		SDNodeFlags Flags;

SDValue Op = getValue(I.getOperand(0));		SDValue Op = getValue(I.getOperand(0));
SDValue UnNodeValue = DAG.getNode(Opcode, getCurSDLoc(), Op.getValueType(),		SDValue UnNodeValue = DAG.getNode(Opcode, getCurSDLoc(), Op.getValueType(),
Op, Flags);		Op, Flags);
setValue(&I, UnNodeValue);		setValue(&I, UnNodeValue);
}		}
▲ Show 20 Lines • Show All 7,704 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp

Show First 20 Lines • Show All 3,787 Lines • ▼ Show 20 Lines	case AMDGPUISD::FMIN_LEGACY: {
return Res;		return Res;
}		}
case AMDGPUISD::FMED3: {		case AMDGPUISD::FMED3: {
SDValue Ops[3];		SDValue Ops[3];
for (unsigned I = 0; I < 3; ++I)		for (unsigned I = 0; I < 3; ++I)
Ops[I] = DAG.getNode(ISD::FNEG, SL, VT, N0->getOperand(I), N0->getFlags());		Ops[I] = DAG.getNode(ISD::FNEG, SL, VT, N0->getOperand(I), N0->getFlags());

SDValue Res = DAG.getNode(AMDGPUISD::FMED3, SL, VT, Ops, N0->getFlags());		SDValue Res = DAG.getNode(AMDGPUISD::FMED3, SL, VT, Ops, N0->getFlags());
if (Res.getOpcode() != AMDGPUISD::FMED3)		if (Res.getOpcode() != AMDGPUISD::FMED3)
return SDValue(); // Op got folded away.		return SDValue(); // Op got folded away.
if (!N0.hasOneUse())
		arsenmUnsubmitted Not Done Reply Inline Actions I don't actually know why this would ever happen? arsenm: I don't actually know why this would ever happen?
		cameron.mcinallyAuthorUnsubmitted Not Done Reply Inline Actions Came from D50706. The IR for this particular problem is: %med3 = call float @llvm.amdgcn.fmed3.f32(float %src0, float %src1, float %src2) %neg.med3 = fsub float -0.0, %med3 %med3.user = fmul float %med3, 4.0 The intention is that the FNEG is sunk into the FMED3 operands and the FMUL absorbs it by negating the constant. Seems like a pretty specific peep to me, but I'm no expert on this instruction... cameron.mcinally: Came from D50706. The IR for this particular problem is: ``` %med3 = call float @llvm.amdgcn.
DAG.ReplaceAllUsesWith(N0, DAG.getNode(ISD::FNEG, SL, VT, Res));		if (!N0.hasOneUse()) {
		SDValue Neg = DAG.getNode(ISD::FNEG, SL, VT, Res);
		DAG.ReplaceAllUsesWith(N0, Neg);

		for (SDNode *U : Neg->uses())
		DCI.AddToWorklist(U);
		}

return Res;		return Res;
}		}
case ISD::FP_EXTEND:		case ISD::FP_EXTEND:
case ISD::FTRUNC:		case ISD::FTRUNC:
case ISD::FRINT:		case ISD::FRINT:
case ISD::FNEARBYINT: // XXX - Should fround be handled?		case ISD::FNEARBYINT: // XXX - Should fround be handled?
case ISD::FSIN:		case ISD::FSIN:
case ISD::FCANONICALIZE:		case ISD::FCANONICALIZE:
▲ Show 20 Lines • Show All 932 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fcanonicalize-elimination.ll

	Show First 20 Lines • Show All 305 Lines • ▼ Show 20 Lines

	; GCN-LABEL: test_no_fold_canonicalize_fneg_value_f32:			; GCN-LABEL: test_no_fold_canonicalize_fneg_value_f32:
	; VI: v_mul_f32_e32 v{{[0-9]+}}, -1.0, v{{[0-9]+}}			; VI: v_mul_f32_e32 v{{[0-9]+}}, -1.0, v{{[0-9]+}}
	; GFX9: v_max_f32_e64 v{{[0-9]+}}, -v{{[0-9]+}}, -v{{[0-9]+}}			; GFX9: v_max_f32_e64 v{{[0-9]+}}, -v{{[0-9]+}}, -v{{[0-9]+}}
	define amdgpu_kernel void @test_no_fold_canonicalize_fneg_value_f32(float addrspace(1)* %arg) {			define amdgpu_kernel void @test_no_fold_canonicalize_fneg_value_f32(float addrspace(1)* %arg) {
	%id = tail call i32 @llvm.amdgcn.workitem.id.x()			%id = tail call i32 @llvm.amdgcn.workitem.id.x()
	%gep = getelementptr inbounds float, float addrspace(1)* %arg, i32 %id			%gep = getelementptr inbounds float, float addrspace(1)* %arg, i32 %id
	%load = load float, float addrspace(1)* %gep, align 4			%load = load float, float addrspace(1)* %gep, align 4
	%v = fsub float -0.0, %load			%v = fneg float %load
	%canonicalized = tail call float @llvm.canonicalize.f32(float %v)			%canonicalized = tail call float @llvm.canonicalize.f32(float %v)
	store float %canonicalized, float addrspace(1)* %gep, align 4			store float %canonicalized, float addrspace(1)* %gep, align 4
	ret void			ret void
	}			}

	; GCN-LABEL: test_fold_canonicalize_fneg_value_f32:			; GCN-LABEL: test_fold_canonicalize_fneg_value_f32:
	; GCN: v_xor_b32_e32 [[V:v[0-9]+]], 0x80000000, v{{[0-9]+}}			; GCN: v_xor_b32_e32 [[V:v[0-9]+]], 0x80000000, v{{[0-9]+}}
	; GCN-NOT: v_mul			; GCN-NOT: v_mul
	; GCN-NOT: v_max			; GCN-NOT: v_max
	; GCN: {{flat\|global}}_store_dword v[{{[0-9:]+}}], [[V]]			; GCN: {{flat\|global}}_store_dword v[{{[0-9:]+}}], [[V]]
	define amdgpu_kernel void @test_fold_canonicalize_fneg_value_f32(float addrspace(1)* %arg) {			define amdgpu_kernel void @test_fold_canonicalize_fneg_value_f32(float addrspace(1)* %arg) {
	%id = tail call i32 @llvm.amdgcn.workitem.id.x()			%id = tail call i32 @llvm.amdgcn.workitem.id.x()
	%gep = getelementptr inbounds float, float addrspace(1)* %arg, i32 %id			%gep = getelementptr inbounds float, float addrspace(1)* %arg, i32 %id
	%load = load float, float addrspace(1)* %gep, align 4			%load = load float, float addrspace(1)* %gep, align 4
	%v0 = fadd float %load, 0.0			%v0 = fadd float %load, 0.0
	%v = fsub float -0.0, %v0			%v = fneg float %v0
	%canonicalized = tail call float @llvm.canonicalize.f32(float %v)			%canonicalized = tail call float @llvm.canonicalize.f32(float %v)
	store float %canonicalized, float addrspace(1)* %gep, align 4			store float %canonicalized, float addrspace(1)* %gep, align 4
	ret void			ret void
	}			}

	; GCN-LABEL: test_no_fold_canonicalize_fabs_value_f32:			; GCN-LABEL: test_no_fold_canonicalize_fabs_value_f32:
	; VI: v_mul_f32_e64 v{{[0-9]+}}, 1.0, \|v{{[0-9]+}}\|			; VI: v_mul_f32_e64 v{{[0-9]+}}, 1.0, \|v{{[0-9]+}}\|
	; GFX9: v_max_f32_e64 v{{[0-9]+}}, \|v{{[0-9]+}}\|, \|v{{[0-9]+}}\|			; GFX9: v_max_f32_e64 v{{[0-9]+}}, \|v{{[0-9]+}}\|, \|v{{[0-9]+}}\|
	▲ Show 20 Lines • Show All 570 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fcanonicalize.f16.ll

	Show First 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; GFX89: v_max_f16_e64 [[REG:v[0-9]+]], -\|{{v[0-9]+}}\|, -\|{{v[0-9]+}}\|			; GFX89: v_max_f16_e64 [[REG:v[0-9]+]], -\|{{v[0-9]+}}\|, -\|{{v[0-9]+}}\|
	; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]

	; CI: v_cvt_f32_f16_e64 v{{[0-9]+}}, -\|v{{[0-9]+}}\|			; CI: v_cvt_f32_f16_e64 v{{[0-9]+}}, -\|v{{[0-9]+}}\|
	; CI: v_mul_f32_e32 {{v[0-9]+}}, 1.0, {{v[0-9]+}}			; CI: v_mul_f32_e32 {{v[0-9]+}}, 1.0, {{v[0-9]+}}
	define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_f16(half addrspace(1)* %out) #1 {			define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_f16(half addrspace(1)* %out) #1 {
	%val = load half, half addrspace(1)* %out			%val = load half, half addrspace(1)* %out
	%val.fabs = call half @llvm.fabs.f16(half %val)			%val.fabs = call half @llvm.fabs.f16(half %val)
	%val.fabs.fneg = fsub half -0.0, %val.fabs			%val.fabs.fneg = fneg half %val.fabs
	%canonicalized = call half @llvm.canonicalize.f16(half %val.fabs.fneg)			%canonicalized = call half @llvm.canonicalize.f16(half %val.fabs.fneg)
	store half %canonicalized, half addrspace(1)* %out			store half %canonicalized, half addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}v_test_canonicalize_fneg_var_f16:			; GCN-LABEL: {{^}}v_test_canonicalize_fneg_var_f16:
	; GFX89: v_max_f16_e64 [[REG:v[0-9]+]], -{{v[0-9]+}}, -{{v[0-9]+}}			; GFX89: v_max_f16_e64 [[REG:v[0-9]+]], -{{v[0-9]+}}, -{{v[0-9]+}}
	; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]

	; CI: v_cvt_f32_f16_e64 {{v[0-9]+}}, -{{v[0-9]+}}			; CI: v_cvt_f32_f16_e64 {{v[0-9]+}}, -{{v[0-9]+}}
	; CI: v_mul_f32_e32 {{v[0-9]+}}, 1.0, {{v[0-9]+}}			; CI: v_mul_f32_e32 {{v[0-9]+}}, 1.0, {{v[0-9]+}}
	define amdgpu_kernel void @v_test_canonicalize_fneg_var_f16(half addrspace(1)* %out) #1 {			define amdgpu_kernel void @v_test_canonicalize_fneg_var_f16(half addrspace(1)* %out) #1 {
	%val = load half, half addrspace(1)* %out			%val = load half, half addrspace(1)* %out
	%val.fneg = fsub half -0.0, %val			%val.fneg = fneg half %val
	%canonicalized = call half @llvm.canonicalize.f16(half %val.fneg)			%canonicalized = call half @llvm.canonicalize.f16(half %val.fneg)
	store half %canonicalized, half addrspace(1)* %out			store half %canonicalized, half addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}v_test_no_denormals_canonicalize_fneg_var_f16:			; GCN-LABEL: {{^}}v_test_no_denormals_canonicalize_fneg_var_f16:
	; VI: v_mul_f16_e32 [[REG:v[0-9]+]], -1.0, v{{[0-9]+}}			; VI: v_mul_f16_e32 [[REG:v[0-9]+]], -1.0, v{{[0-9]+}}
	; GFX9: v_max_f16_e64 [[REG:v[0-9]+]], -v{{[0-9]+}}, -v{{[0-9]+}}			; GFX9: v_max_f16_e64 [[REG:v[0-9]+]], -v{{[0-9]+}}, -v{{[0-9]+}}
	; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
	define amdgpu_kernel void @v_test_no_denormals_canonicalize_fneg_var_f16(half addrspace(1)* %out) #2 {			define amdgpu_kernel void @v_test_no_denormals_canonicalize_fneg_var_f16(half addrspace(1)* %out) #2 {
	%val = load half, half addrspace(1)* %out			%val = load half, half addrspace(1)* %out
	%val.fneg = fsub half -0.0, %val			%val.fneg = fneg half %val
	%canonicalized = call half @llvm.canonicalize.f16(half %val.fneg)			%canonicalized = call half @llvm.canonicalize.f16(half %val.fneg)
	store half %canonicalized, half addrspace(1)* %out			store half %canonicalized, half addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}v_test_no_denormals_canonicalize_fneg_fabs_var_f16:			; GCN-LABEL: {{^}}v_test_no_denormals_canonicalize_fneg_fabs_var_f16:
	; VI: v_mul_f16_e64 [[REG:v[0-9]+]], -1.0, \|v{{[0-9]+}}\|			; VI: v_mul_f16_e64 [[REG:v[0-9]+]], -1.0, \|v{{[0-9]+}}\|
	; GFX9: v_max_f16_e64 [[REG:v[0-9]+]], -\|v{{[0-9]+}}\|, -\|v{{[0-9]+}}\|			; GFX9: v_max_f16_e64 [[REG:v[0-9]+]], -\|v{{[0-9]+}}\|, -\|v{{[0-9]+}}\|

	; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]

	; CI: v_cvt_f32_f16_e64 {{v[0-9]+}}, -\|{{v[0-9]+}}\|			; CI: v_cvt_f32_f16_e64 {{v[0-9]+}}, -\|{{v[0-9]+}}\|
	; CI: v_mul_f32_e32 {{v[0-9]+}}, 1.0, {{v[0-9]+}}			; CI: v_mul_f32_e32 {{v[0-9]+}}, 1.0, {{v[0-9]+}}
	define amdgpu_kernel void @v_test_no_denormals_canonicalize_fneg_fabs_var_f16(half addrspace(1)* %out) #2 {			define amdgpu_kernel void @v_test_no_denormals_canonicalize_fneg_fabs_var_f16(half addrspace(1)* %out) #2 {
	%val = load half, half addrspace(1)* %out			%val = load half, half addrspace(1)* %out
	%val.fabs = call half @llvm.fabs.f16(half %val)			%val.fabs = call half @llvm.fabs.f16(half %val)
	%val.fabs.fneg = fsub half -0.0, %val.fabs			%val.fabs.fneg = fneg half %val.fabs
	%canonicalized = call half @llvm.canonicalize.f16(half %val.fabs.fneg)			%canonicalized = call half @llvm.canonicalize.f16(half %val.fabs.fneg)
	store half %canonicalized, half addrspace(1)* %out			store half %canonicalized, half addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}test_fold_canonicalize_p0_f16:			; GCN-LABEL: {{^}}test_fold_canonicalize_p0_f16:
	; GFX89: v_mov_b32_e32 [[REG:v[0-9]+]], 0{{$}}			; GFX89: v_mov_b32_e32 [[REG:v[0-9]+]], 0{{$}}
	; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GFX89: {{flat\|global}}_store_short v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
	▲ Show 20 Lines • Show All 186 Lines • ▼ Show 20 Lines
	; CI: v_cvt_f32_f16			; CI: v_cvt_f32_f16
	; CI: v_mul_f32_e32 v{{[0-9]+}}, 1.0			; CI: v_mul_f32_e32 v{{[0-9]+}}, 1.0
	; CI: v_mul_f32_e32 v{{[0-9]+}}, 1.0			; CI: v_mul_f32_e32 v{{[0-9]+}}, 1.0
	define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_v2f16(<2 x half> addrspace(1)* %out) #1 {			define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_v2f16(<2 x half> addrspace(1)* %out) #1 {
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%gep = getelementptr <2 x half>, <2 x half> addrspace(1)* %out, i32 %tid			%gep = getelementptr <2 x half>, <2 x half> addrspace(1)* %out, i32 %tid
	%val = load <2 x half>, <2 x half> addrspace(1)* %gep			%val = load <2 x half>, <2 x half> addrspace(1)* %gep
	%val.fabs = call <2 x half> @llvm.fabs.v2f16(<2 x half> %val)			%val.fabs = call <2 x half> @llvm.fabs.v2f16(<2 x half> %val)
	%val.fabs.fneg = fsub <2 x half> <half -0.0, half -0.0>, %val.fabs			%val.fabs.fneg = fneg <2 x half> %val.fabs
	%canonicalized = call <2 x half> @llvm.canonicalize.v2f16(<2 x half> %val.fabs.fneg)			%canonicalized = call <2 x half> @llvm.canonicalize.v2f16(<2 x half> %val.fabs.fneg)
	store <2 x half> %canonicalized, <2 x half> addrspace(1)* %out			store <2 x half> %canonicalized, <2 x half> addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}v_test_canonicalize_fneg_var_v2f16:			; GCN-LABEL: {{^}}v_test_canonicalize_fneg_var_v2f16:
	; VI-DAG: v_max_f16_sdwa [[REG1:v[0-9]+]], -v{{[0-9]+}}, -v{{[0-9]+}} dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1			; VI-DAG: v_max_f16_sdwa [[REG1:v[0-9]+]], -v{{[0-9]+}}, -v{{[0-9]+}} dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
	; VI-DAG: v_max_f16_e64 [[REG0:v[0-9]+]], -v{{[0-9]+}}, -v{{[0-9]+}}			; VI-DAG: v_max_f16_e64 [[REG0:v[0-9]+]], -v{{[0-9]+}}, -v{{[0-9]+}}
	; VI-NOT: 0xffff			; VI-NOT: 0xffff

	; GFX9: v_pk_max_f16 [[REG:v[0-9]+]], {{v[0-9]+}}, {{v[0-9]+}} neg_lo:[1,1] neg_hi:[1,1]{{$}}			; GFX9: v_pk_max_f16 [[REG:v[0-9]+]], {{v[0-9]+}}, {{v[0-9]+}} neg_lo:[1,1] neg_hi:[1,1]{{$}}
	; GFX9: {{flat\|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GFX9: {{flat\|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
	define amdgpu_kernel void @v_test_canonicalize_fneg_var_v2f16(<2 x half> addrspace(1)* %out) #1 {			define amdgpu_kernel void @v_test_canonicalize_fneg_var_v2f16(<2 x half> addrspace(1)* %out) #1 {
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%gep = getelementptr <2 x half>, <2 x half> addrspace(1)* %out, i32 %tid			%gep = getelementptr <2 x half>, <2 x half> addrspace(1)* %out, i32 %tid
	%val = load <2 x half>, <2 x half> addrspace(1)* %gep			%val = load <2 x half>, <2 x half> addrspace(1)* %gep
	%fneg.val = fsub <2 x half> <half -0.0, half -0.0>, %val			%fneg.val = fneg <2 x half> %val
	%canonicalized = call <2 x half> @llvm.canonicalize.v2f16(<2 x half> %fneg.val)			%canonicalized = call <2 x half> @llvm.canonicalize.v2f16(<2 x half> %fneg.val)
	store <2 x half> %canonicalized, <2 x half> addrspace(1)* %out			store <2 x half> %canonicalized, <2 x half> addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}s_test_canonicalize_var_v2f16:			; GCN-LABEL: {{^}}s_test_canonicalize_var_v2f16:
	; VI-DAG: v_max_f16_sdwa [[REG0:v[0-9]+]], {{v[0-9]+}}, {{v[0-9]+}} dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; VI-DAG: v_max_f16_sdwa [[REG0:v[0-9]+]], {{v[0-9]+}}, {{v[0-9]+}} dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; VI-DAG: v_max_f16_e64 [[REG1:v[0-9]+]], {{s[0-9]+}}, {{s[0-9]+}}			; VI-DAG: v_max_f16_e64 [[REG1:v[0-9]+]], {{s[0-9]+}}, {{s[0-9]+}}
	▲ Show 20 Lines • Show All 396 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fcanonicalize.ll

	Show First 20 Lines • Show All 51 Lines • ▼ Show 20 Lines

	; GCN-LABEL: {{^}}v_test_canonicalize_fneg_fabs_var_f32:			; GCN-LABEL: {{^}}v_test_canonicalize_fneg_fabs_var_f32:
	; GFX678: v_mul_f32_e64 [[REG:v[0-9]+]], -1.0, \|{{v[0-9]+}}\|			; GFX678: v_mul_f32_e64 [[REG:v[0-9]+]], -1.0, \|{{v[0-9]+}}\|
	; GFX9: v_max_f32_e64 [[REG:v[0-9]+]], -\|{{v[0-9]+}}\|, -\|{{v[0-9]+}}\|			; GFX9: v_max_f32_e64 [[REG:v[0-9]+]], -\|{{v[0-9]+}}\|, -\|{{v[0-9]+}}\|
	; GCN: {{flat\|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GCN: {{flat\|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
	define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_f32(float addrspace(1)* %out) #1 {			define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_f32(float addrspace(1)* %out) #1 {
	%val = load float, float addrspace(1)* %out			%val = load float, float addrspace(1)* %out
	%val.fabs = call float @llvm.fabs.f32(float %val)			%val.fabs = call float @llvm.fabs.f32(float %val)
	%val.fabs.fneg = fsub float -0.0, %val.fabs			%val.fabs.fneg = fneg float %val.fabs
	%canonicalized = call float @llvm.canonicalize.f32(float %val.fabs.fneg)			%canonicalized = call float @llvm.canonicalize.f32(float %val.fabs.fneg)
	store float %canonicalized, float addrspace(1)* %out			store float %canonicalized, float addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}v_test_canonicalize_fneg_var_f32:			; GCN-LABEL: {{^}}v_test_canonicalize_fneg_var_f32:
	; GFX678: v_mul_f32_e32 [[REG:v[0-9]+]], -1.0, {{v[0-9]+}}			; GFX678: v_mul_f32_e32 [[REG:v[0-9]+]], -1.0, {{v[0-9]+}}
	; GFX9: v_max_f32_e64 [[REG:v[0-9]+]], -{{v[0-9]+}}, -{{v[0-9]+}}			; GFX9: v_max_f32_e64 [[REG:v[0-9]+]], -{{v[0-9]+}}, -{{v[0-9]+}}
	; GCN: {{flat\|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GCN: {{flat\|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
	define amdgpu_kernel void @v_test_canonicalize_fneg_var_f32(float addrspace(1)* %out) #1 {			define amdgpu_kernel void @v_test_canonicalize_fneg_var_f32(float addrspace(1)* %out) #1 {
	%val = load float, float addrspace(1)* %out			%val = load float, float addrspace(1)* %out
	%val.fneg = fsub float -0.0, %val			%val.fneg = fneg float %val
	%canonicalized = call float @llvm.canonicalize.f32(float %val.fneg)			%canonicalized = call float @llvm.canonicalize.f32(float %val.fneg)
	store float %canonicalized, float addrspace(1)* %out			store float %canonicalized, float addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}test_fold_canonicalize_undef_f32:			; GCN-LABEL: {{^}}test_fold_canonicalize_undef_f32:
	; GCN: v_mov_b32_e32 [[REG:v[0-9]+]], 0x7fc00000{{$}}			; GCN: v_mov_b32_e32 [[REG:v[0-9]+]], 0x7fc00000{{$}}
	; GCN: {{flat\|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GCN: {{flat\|global}}_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
	▲ Show 20 Lines • Show All 178 Lines • ▼ Show 20 Lines
	}			}

	; GCN-LABEL: {{^}}v_test_canonicalize_fneg_fabs_var_f64:			; GCN-LABEL: {{^}}v_test_canonicalize_fneg_fabs_var_f64:
	; GCN: v_max_f64 [[REG:v\[[0-9]+:[0-9]\]]], -\|{{v\[[0-9]+:[0-9]+\]}}\|, -\|{{v\[[0-9]+:[0-9]+\]}}\|			; GCN: v_max_f64 [[REG:v\[[0-9]+:[0-9]\]]], -\|{{v\[[0-9]+:[0-9]+\]}}\|, -\|{{v\[[0-9]+:[0-9]+\]}}\|
	; GCN: {{flat\|global}}_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GCN: {{flat\|global}}_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
	define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_f64(double addrspace(1)* %out) #1 {			define amdgpu_kernel void @v_test_canonicalize_fneg_fabs_var_f64(double addrspace(1)* %out) #1 {
	%val = load double, double addrspace(1)* %out			%val = load double, double addrspace(1)* %out
	%val.fabs = call double @llvm.fabs.f64(double %val)			%val.fabs = call double @llvm.fabs.f64(double %val)
	%val.fabs.fneg = fsub double -0.0, %val.fabs			%val.fabs.fneg = fneg double %val.fabs
	%canonicalized = call double @llvm.canonicalize.f64(double %val.fabs.fneg)			%canonicalized = call double @llvm.canonicalize.f64(double %val.fabs.fneg)
	store double %canonicalized, double addrspace(1)* %out			store double %canonicalized, double addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}v_test_canonicalize_fneg_var_f64:			; GCN-LABEL: {{^}}v_test_canonicalize_fneg_var_f64:
	; GCN: v_max_f64 [[REG:v\[[0-9]+:[0-9]+\]]], -{{v\[[0-9]+:[0-9]+\]}}, -{{v\[[0-9]+:[0-9]+\]}}			; GCN: v_max_f64 [[REG:v\[[0-9]+:[0-9]+\]]], -{{v\[[0-9]+:[0-9]+\]}}, -{{v\[[0-9]+:[0-9]+\]}}
	; GCN: {{flat\|global}}_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[REG]]			; GCN: {{flat\|global}}_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[REG]]
	define amdgpu_kernel void @v_test_canonicalize_fneg_var_f64(double addrspace(1)* %out) #1 {			define amdgpu_kernel void @v_test_canonicalize_fneg_var_f64(double addrspace(1)* %out) #1 {
	%val = load double, double addrspace(1)* %out			%val = load double, double addrspace(1)* %out
	%val.fneg = fsub double -0.0, %val			%val.fneg = fneg double %val
	%canonicalized = call double @llvm.canonicalize.f64(double %val.fneg)			%canonicalized = call double @llvm.canonicalize.f64(double %val.fneg)
	store double %canonicalized, double addrspace(1)* %out			store double %canonicalized, double addrspace(1)* %out
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}test_fold_canonicalize_p0_f64:			; GCN-LABEL: {{^}}test_fold_canonicalize_p0_f64:
	; GCN: v_mov_b32_e32 v[[LO:[0-9]+]], 0{{$}}			; GCN: v_mov_b32_e32 v[[LO:[0-9]+]], 0{{$}}
	; GCN: v_mov_b32_e32 v[[HI:[0-9]+]], v[[LO]]{{$}}			; GCN: v_mov_b32_e32 v[[HI:[0-9]+]], v[[LO]]{{$}}
	▲ Show 20 Lines • Show All 376 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fdiv32-to-rcp-folding.ll

	Show First 20 Lines • Show All 305 Lines • ▼ Show 20 Lines

	; GCN-NOT: v_cmp_gt_f32_e64			; GCN-NOT: v_cmp_gt_f32_e64
	; GCN-NOT: v_cndmask_b32_e32			; GCN-NOT: v_cndmask_b32_e32
	; GCN-FLUSH-NOT: v_div			; GCN-FLUSH-NOT: v_div

	; GCN: global_store_dwordx4			; GCN: global_store_dwordx4
	define amdgpu_kernel void @div_v4_c_by_minus_x_25ulp(<4 x float> addrspace(1)* %arg) {			define amdgpu_kernel void @div_v4_c_by_minus_x_25ulp(<4 x float> addrspace(1)* %arg) {
	%load = load <4 x float>, <4 x float> addrspace(1)* %arg, align 16			%load = load <4 x float>, <4 x float> addrspace(1)* %arg, align 16
	%neg = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %load			%neg = fneg <4 x float> %load
	%div = fdiv <4 x float> <float 2.000000e+00, float 1.000000e+00, float -1.000000e+00, float -2.000000e+00>, %neg, !fpmath !0			%div = fdiv <4 x float> <float 2.000000e+00, float 1.000000e+00, float -1.000000e+00, float -2.000000e+00>, %neg, !fpmath !0
	store <4 x float> %div, <4 x float> addrspace(1)* %arg, align 16			store <4 x float> %div, <4 x float> addrspace(1)* %arg, align 16
	ret void			ret void
	}			}

	; GCN-LABEL: {{^}}div_v_by_x_25ulp:			; GCN-LABEL: {{^}}div_v_by_x_25ulp:
	; GCN-DAG: s_load_dword [[VAL:s[0-9]+]], s[{{[0-9:]+}}], 0x0{{$}}			; GCN-DAG: s_load_dword [[VAL:s[0-9]+]], s[{{[0-9:]+}}], 0x0{{$}}

	▲ Show 20 Lines • Show All 123 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fmuladd.f16.ll

Show First 20 Lines • Show All 250 Lines • ▼ Show 20 Lines	define amdgpu_kernel void @fmuladd_neg_2.0_neg_a_b_f16(half addrspace(1)* %out, half addrspace(1)* %in) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%gep.0 = getelementptr half, half addrspace(1)* %out, i32 %tid		%gep.0 = getelementptr half, half addrspace(1)* %out, i32 %tid
%gep.1 = getelementptr half, half addrspace(1)* %gep.0, i32 1		%gep.1 = getelementptr half, half addrspace(1)* %gep.0, i32 1
%gep.out = getelementptr half, half addrspace(1)* %out, i32 %tid		%gep.out = getelementptr half, half addrspace(1)* %out, i32 %tid

%r1 = load volatile half, half addrspace(1)* %gep.0		%r1 = load volatile half, half addrspace(1)* %gep.0
%r2 = load volatile half, half addrspace(1)* %gep.1		%r2 = load volatile half, half addrspace(1)* %gep.1

%r1.fneg = fsub half -0.000000e+00, %r1		%r1.fneg = fneg half %r1

%r3 = tail call half @llvm.fmuladd.f16(half -2.0, half %r1.fneg, half %r2)		%r3 = tail call half @llvm.fmuladd.f16(half -2.0, half %r1.fneg, half %r2)
store half %r3, half addrspace(1)* %gep.out		store half %r3, half addrspace(1)* %gep.out
ret void		ret void
}		}

; GCN-LABEL: {{^}}fmuladd_2.0_neg_a_b_f16		; GCN-LABEL: {{^}}fmuladd_2.0_neg_a_b_f16
; GCN: {{buffer\|flat\|global}}_load_ushort [[R1:v[0-9]+]],		; GCN: {{buffer\|flat\|global}}_load_ushort [[R1:v[0-9]+]],
Show All 14 Lines	define amdgpu_kernel void @fmuladd_2.0_neg_a_b_f16(half addrspace(1)* %out, half addrspace(1)* %in) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%gep.0 = getelementptr half, half addrspace(1)* %out, i32 %tid		%gep.0 = getelementptr half, half addrspace(1)* %out, i32 %tid
%gep.1 = getelementptr half, half addrspace(1)* %gep.0, i32 1		%gep.1 = getelementptr half, half addrspace(1)* %gep.0, i32 1
%gep.out = getelementptr half, half addrspace(1)* %out, i32 %tid		%gep.out = getelementptr half, half addrspace(1)* %out, i32 %tid

%r1 = load volatile half, half addrspace(1)* %gep.0		%r1 = load volatile half, half addrspace(1)* %gep.0
%r2 = load volatile half, half addrspace(1)* %gep.1		%r2 = load volatile half, half addrspace(1)* %gep.1

%r1.fneg = fsub half -0.000000e+00, %r1		%r1.fneg = fneg half %r1

%r3 = tail call half @llvm.fmuladd.f16(half 2.0, half %r1.fneg, half %r2)		%r3 = tail call half @llvm.fmuladd.f16(half 2.0, half %r1.fneg, half %r2)
store half %r3, half addrspace(1)* %gep.out		store half %r3, half addrspace(1)* %gep.out
ret void		ret void
}		}

; GCN-LABEL: {{^}}fmuladd_2.0_a_neg_b_f16		; GCN-LABEL: {{^}}fmuladd_2.0_a_neg_b_f16
; GCN: {{buffer\|flat\|global}}_load_ushort [[R1:v[0-9]+]],		; GCN: {{buffer\|flat\|global}}_load_ushort [[R1:v[0-9]+]],
; GCN: {{buffer\|flat\|global}}_load_ushort [[R2:v[0-9]+]],		; GCN: {{buffer\|flat\|global}}_load_ushort [[R2:v[0-9]+]],
; VI-FLUSH: v_mad_f16 [[RESULT:v[0-9]+]], [[R1]], 2.0, -[[R2]]		; VI-FLUSH: v_mad_f16 [[RESULT:v[0-9]+]], [[R1]], 2.0, -[[R2]]
; GCN-DENORM: v_fma_f16 [[RESULT:v[0-9]+]], [[R1]], 2.0, -[[R2]]		; GCN-DENORM: v_fma_f16 [[RESULT:v[0-9]+]], [[R1]], 2.0, -[[R2]]
; VI: flat_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; VI: flat_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
; GFX10-FLUSH: v_add_f16_e32 [[MUL2:v[0-9]+]], [[R1]], [[R1]]		; GFX10-FLUSH: v_add_f16_e32 [[MUL2:v[0-9]+]], [[R1]], [[R1]]
; GFX10-FLUSH: v_sub_f16_e32 [[RESULT:v[0-9]+]], [[MUL2]], [[R2]]		; GFX10-FLUSH: v_sub_f16_e32 [[RESULT:v[0-9]+]], [[MUL2]], [[R2]]
; GFX10: global_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GFX10: global_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @fmuladd_2.0_a_neg_b_f16(half addrspace(1)* %out, half addrspace(1)* %in) #0 {		define amdgpu_kernel void @fmuladd_2.0_a_neg_b_f16(half addrspace(1)* %out, half addrspace(1)* %in) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%gep.0 = getelementptr half, half addrspace(1)* %out, i32 %tid		%gep.0 = getelementptr half, half addrspace(1)* %out, i32 %tid
%gep.1 = getelementptr half, half addrspace(1)* %gep.0, i32 1		%gep.1 = getelementptr half, half addrspace(1)* %gep.0, i32 1
%gep.out = getelementptr half, half addrspace(1)* %out, i32 %tid		%gep.out = getelementptr half, half addrspace(1)* %out, i32 %tid

%r1 = load volatile half, half addrspace(1)* %gep.0		%r1 = load volatile half, half addrspace(1)* %gep.0
%r2 = load volatile half, half addrspace(1)* %gep.1		%r2 = load volatile half, half addrspace(1)* %gep.1

%r2.fneg = fsub half -0.000000e+00, %r2		%r2.fneg = fneg half %r2

%r3 = tail call half @llvm.fmuladd.f16(half 2.0, half %r1, half %r2.fneg)		%r3 = tail call half @llvm.fmuladd.f16(half 2.0, half %r1, half %r2.fneg)
store half %r3, half addrspace(1)* %gep.out		store half %r3, half addrspace(1)* %gep.out
ret void		ret void
}		}

; GCN-LABEL: {{^}}mad_sub_f16:		; GCN-LABEL: {{^}}mad_sub_f16:
; GCN: {{buffer\|flat\|global}}_load_ushort [[REGA:v[0-9]+]]		; GCN: {{buffer\|flat\|global}}_load_ushort [[REGA:v[0-9]+]]
▲ Show 20 Lines • Show All 165 Lines • ▼ Show 20 Lines	define amdgpu_kernel void @neg_neg_mad_f16(half addrspace(1)* noalias nocapture %out, half addrspace(1)* noalias nocapture readonly %ptr) #1 {
%add1 = add i64 %tid.ext, 1		%add1 = add i64 %tid.ext, 1
%gep1 = getelementptr half, half addrspace(1)* %ptr, i64 %add1		%gep1 = getelementptr half, half addrspace(1)* %ptr, i64 %add1
%add2 = add i64 %tid.ext, 2		%add2 = add i64 %tid.ext, 2
%gep2 = getelementptr half, half addrspace(1)* %ptr, i64 %add2		%gep2 = getelementptr half, half addrspace(1)* %ptr, i64 %add2
%outgep = getelementptr half, half addrspace(1)* %out, i64 %tid.ext		%outgep = getelementptr half, half addrspace(1)* %out, i64 %tid.ext
%a = load volatile half, half addrspace(1)* %gep0, align 2		%a = load volatile half, half addrspace(1)* %gep0, align 2
%b = load volatile half, half addrspace(1)* %gep1, align 2		%b = load volatile half, half addrspace(1)* %gep1, align 2
%c = load volatile half, half addrspace(1)* %gep2, align 2		%c = load volatile half, half addrspace(1)* %gep2, align 2
%nega = fsub half -0.000000e+00, %a		%nega = fneg half %a
%negb = fsub half -0.000000e+00, %b		%negb = fneg half %b
%mul = fmul half %nega, %negb		%mul = fmul half %nega, %negb
%sub = fadd half %mul, %c		%sub = fadd half %mul, %c
store half %sub, half addrspace(1)* %outgep, align 2		store half %sub, half addrspace(1)* %outgep, align 2
ret void		ret void
}		}

; GCN-LABEL: {{^}}mad_fabs_sub_f16:		; GCN-LABEL: {{^}}mad_fabs_sub_f16:
; GCN: {{buffer\|flat\|global}}_load_ushort [[REGA:v[0-9]+]]		; GCN: {{buffer\|flat\|global}}_load_ushort [[REGA:v[0-9]+]]
▲ Show 20 Lines • Show All 103 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fmuladd.f32.ll

Show First 20 Lines • Show All 268 Lines • ▼ Show 20 Lines	define amdgpu_kernel void @fmuladd_neg_2.0_neg_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%gep.0 = getelementptr float, float addrspace(1)* %out, i32 %tid		%gep.0 = getelementptr float, float addrspace(1)* %out, i32 %tid
%gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1		%gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
%gep.out = getelementptr float, float addrspace(1)* %out, i32 %tid		%gep.out = getelementptr float, float addrspace(1)* %out, i32 %tid

%r1 = load volatile float, float addrspace(1)* %gep.0		%r1 = load volatile float, float addrspace(1)* %gep.0
%r2 = load volatile float, float addrspace(1)* %gep.1		%r2 = load volatile float, float addrspace(1)* %gep.1

%r1.fneg = fsub float -0.000000e+00, %r1		%r1.fneg = fneg float %r1

%r3 = tail call float @llvm.fmuladd.f32(float -2.0, float %r1.fneg, float %r2)		%r3 = tail call float @llvm.fmuladd.f32(float -2.0, float %r1.fneg, float %r2)
store float %r3, float addrspace(1)* %gep.out		store float %r3, float addrspace(1)* %gep.out
ret void		ret void
}		}

; GCN-LABEL: {{^}}fmuladd_2.0_neg_a_b_f32:		; GCN-LABEL: {{^}}fmuladd_2.0_neg_a_b_f32:
; GCN: {{buffer\|flat\|global}}_load_dword [[R1:v[0-9]+]],		; GCN: {{buffer\|flat\|global}}_load_dword [[R1:v[0-9]+]],
Show All 16 Lines	define amdgpu_kernel void @fmuladd_2.0_neg_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%gep.0 = getelementptr float, float addrspace(1)* %out, i32 %tid		%gep.0 = getelementptr float, float addrspace(1)* %out, i32 %tid
%gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1		%gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
%gep.out = getelementptr float, float addrspace(1)* %out, i32 %tid		%gep.out = getelementptr float, float addrspace(1)* %out, i32 %tid

%r1 = load volatile float, float addrspace(1)* %gep.0		%r1 = load volatile float, float addrspace(1)* %gep.0
%r2 = load volatile float, float addrspace(1)* %gep.1		%r2 = load volatile float, float addrspace(1)* %gep.1

%r1.fneg = fsub float -0.000000e+00, %r1		%r1.fneg = fneg float %r1

%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1.fneg, float %r2)		%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1.fneg, float %r2)
store float %r3, float addrspace(1)* %gep.out		store float %r3, float addrspace(1)* %gep.out
ret void		ret void
}		}

; GCN-LABEL: {{^}}fmuladd_2.0_a_neg_b_f32:		; GCN-LABEL: {{^}}fmuladd_2.0_a_neg_b_f32:
; GCN: {{buffer\|flat\|global}}_load_dword [[R1:v[0-9]+]],		; GCN: {{buffer\|flat\|global}}_load_dword [[R1:v[0-9]+]],
Show All 15 Lines	define amdgpu_kernel void @fmuladd_2.0_a_neg_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%gep.0 = getelementptr float, float addrspace(1)* %out, i32 %tid		%gep.0 = getelementptr float, float addrspace(1)* %out, i32 %tid
%gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1		%gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
%gep.out = getelementptr float, float addrspace(1)* %out, i32 %tid		%gep.out = getelementptr float, float addrspace(1)* %out, i32 %tid

%r1 = load volatile float, float addrspace(1)* %gep.0		%r1 = load volatile float, float addrspace(1)* %gep.0
%r2 = load volatile float, float addrspace(1)* %gep.1		%r2 = load volatile float, float addrspace(1)* %gep.1

%r2.fneg = fsub float -0.000000e+00, %r2		%r2.fneg = fneg float %r2

%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1, float %r2.fneg)		%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1, float %r2.fneg)
store float %r3, float addrspace(1)* %gep.out		store float %r3, float addrspace(1)* %gep.out
ret void		ret void
}		}

; GCN-LABEL: {{^}}mad_sub_f32:		; GCN-LABEL: {{^}}mad_sub_f32:
; GCN: {{buffer\|flat\|global}}_load_dword [[REGA:v[0-9]+]]		; GCN: {{buffer\|flat\|global}}_load_dword [[REGA:v[0-9]+]]
▲ Show 20 Lines • Show All 161 Lines • ▼ Show 20 Lines	define amdgpu_kernel void @neg_neg_mad_f32(float addrspace(1)* noalias nocapture %out, float addrspace(1)* noalias nocapture readonly %ptr) #0 {
%add1 = add i64 %tid.ext, 1		%add1 = add i64 %tid.ext, 1
%gep1 = getelementptr float, float addrspace(1)* %ptr, i64 %add1		%gep1 = getelementptr float, float addrspace(1)* %ptr, i64 %add1
%add2 = add i64 %tid.ext, 2		%add2 = add i64 %tid.ext, 2
%gep2 = getelementptr float, float addrspace(1)* %ptr, i64 %add2		%gep2 = getelementptr float, float addrspace(1)* %ptr, i64 %add2
%outgep = getelementptr float, float addrspace(1)* %out, i64 %tid.ext		%outgep = getelementptr float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %gep0, align 4		%a = load volatile float, float addrspace(1)* %gep0, align 4
%b = load volatile float, float addrspace(1)* %gep1, align 4		%b = load volatile float, float addrspace(1)* %gep1, align 4
%c = load volatile float, float addrspace(1)* %gep2, align 4		%c = load volatile float, float addrspace(1)* %gep2, align 4
%nega = fsub float -0.000000e+00, %a		%nega = fneg float %a
%negb = fsub float -0.000000e+00, %b		%negb = fneg float %b
%mul = fmul float %nega, %negb		%mul = fmul float %nega, %negb
%sub = fadd float %mul, %c		%sub = fadd float %mul, %c
store float %sub, float addrspace(1)* %outgep, align 4		store float %sub, float addrspace(1)* %outgep, align 4
ret void		ret void
}		}

; GCN-LABEL: {{^}}mad_fabs_sub_f32:		; GCN-LABEL: {{^}}mad_fabs_sub_f32:
; GCN: {{buffer\|flat\|global}}_load_dword [[REGA:v[0-9]+]]		; GCN: {{buffer\|flat\|global}}_load_dword [[REGA:v[0-9]+]]
▲ Show 20 Lines • Show All 99 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fneg-combines.ll

Show All 20 Lines	define amdgpu_kernel void @v_fneg_add_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%add = fadd float %a, %b		%add = fadd float %a, %b
%fneg = fsub float -0.000000e+00, %add		%fneg = fneg float %add
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_add_store_use_add_f32:		; GCN-LABEL: {{^}}v_fneg_add_store_use_add_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_add_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN-DAG: v_add_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN-DAG: v_xor_b32_e32 [[NEG_ADD:v[0-9]+]], 0x80000000, [[ADD]]		; GCN-DAG: v_xor_b32_e32 [[NEG_ADD:v[0-9]+]], 0x80000000, [[ADD]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_ADD]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_ADD]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_add_store_use_add_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_add_store_use_add_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%add = fadd float %a, %b		%add = fadd float %a, %b
%fneg = fsub float -0.000000e+00, %add		%fneg = fneg float %add
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %add, float addrspace(1)* %out		store volatile float %add, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_add_multi_use_add_f32:		; GCN-LABEL: {{^}}v_fneg_add_multi_use_add_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
Show All 11 Lines	define amdgpu_kernel void @v_fneg_add_multi_use_add_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%add = fadd float %a, %b		%add = fadd float %a, %b
%fneg = fsub float -0.000000e+00, %add		%fneg = fneg float %add
%use1 = fmul float %add, 4.0		%use1 = fmul float %add, 4.0
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_add_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_add_fneg_x_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]

; GCN-SAFE: v_sub_f32_e32		; GCN-SAFE: v_sub_f32_e32
; GCN-SAFE: v_xor_b32_e32 [[ADD:v[0-9]+]], 0x80000000,		; GCN-SAFE: v_xor_b32_e32 [[ADD:v[0-9]+]], 0x80000000,

; GCN-NSZ: v_sub_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN-NSZ: v_sub_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]

; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_add_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_add_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%add = fadd float %fneg.a, %b		%add = fadd float %fneg.a, %b
%fneg = fsub float -0.000000e+00, %add		%fneg = fneg float %add
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_add_x_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_add_x_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]

; GCN-SAFE: v_sub_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN-SAFE: v_sub_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN-SAFE: v_xor_b32_e32 v{{[0-9]+}}, 0x80000000, [[ADD]]		; GCN-SAFE: v_xor_b32_e32 v{{[0-9]+}}, 0x80000000, [[ADD]]

; GCN-NSZ: v_sub_f32_e32 [[ADD:v[0-9]+]], [[B]], [[A]]		; GCN-NSZ: v_sub_f32_e32 [[ADD:v[0-9]+]], [[B]], [[A]]
; GCN-NSZ: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN-NSZ: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_add_x_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_add_x_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.b = fsub float -0.000000e+00, %b		%fneg.b = fneg float %b
%add = fadd float %a, %fneg.b		%add = fadd float %a, %fneg.b
%fneg = fsub float -0.000000e+00, %add		%fneg = fneg float %add
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_add_fneg_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_add_fneg_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]

; GCN-SAFE: v_sub_f32_e64 [[ADD:v[0-9]+]], -[[A]], [[B]]		; GCN-SAFE: v_sub_f32_e64 [[ADD:v[0-9]+]], -[[A]], [[B]]
; GCN-SAFE: v_xor_b32_e32 v{{[0-9]+}}, 0x80000000, [[ADD]]		; GCN-SAFE: v_xor_b32_e32 v{{[0-9]+}}, 0x80000000, [[ADD]]

; GCN-NSZ: v_add_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN-NSZ: v_add_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN-NSZ: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN-NSZ: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_add_fneg_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_add_fneg_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fneg.b = fsub float -0.000000e+00, %b		%fneg.b = fneg float %b
%add = fadd float %fneg.a, %fneg.b		%add = fadd float %fneg.a, %fneg.b
%fneg = fsub float -0.000000e+00, %add		%fneg = fneg float %add
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_add_store_use_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_add_store_use_fneg_x_f32:
; GCN-SAFE-DAG: s_brev_b32 [[SIGNBIT:s[0-9]+]], 1{{$}}		; GCN-SAFE-DAG: s_brev_b32 [[SIGNBIT:s[0-9]+]], 1{{$}}
; GCN-DAG: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN-DAG: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN-DAG: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN-DAG: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
Show All 9 Lines
define amdgpu_kernel void @v_fneg_add_store_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_add_store_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%add = fadd float %fneg.a, %b		%add = fadd float %fneg.a, %b
%fneg = fsub float -0.000000e+00, %add		%fneg = fneg float %add
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %fneg.a, float addrspace(1)* %out		store volatile float %fneg.a, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_add_multi_use_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_add_multi_use_fneg_x_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
Show All 9 Lines
define amdgpu_kernel void @v_fneg_add_multi_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float %c) #0 {		define amdgpu_kernel void @v_fneg_add_multi_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float %c) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%add = fadd float %fneg.a, %b		%add = fadd float %fneg.a, %b
%fneg = fsub float -0.000000e+00, %add		%fneg = fneg float %add
%use1 = fmul float %fneg.a, %c		%use1 = fmul float %fneg.a, %c
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; This one asserted with -enable-no-signed-zeros-fp-math		; This one asserted with -enable-no-signed-zeros-fp-math
; GCN-LABEL: {{^}}fneg_fadd_0:		; GCN-LABEL: {{^}}fneg_fadd_0:
; GCN-SAFE-DAG: v_mad_f32 [[A:v[0-9]+]],		; GCN-SAFE-DAG: v_mad_f32 [[A:v[0-9]+]],
; GCN-SAFE-DAG: v_cmp_ngt_f32_e32 {{.*}}, [[A]]		; GCN-SAFE-DAG: v_cmp_ngt_f32_e32 {{.*}}, [[A]]
; GCN-SAFE-DAG: v_cndmask_b32_e64 v{{[0-9]+}}, -[[A]]		; GCN-SAFE-DAG: v_cndmask_b32_e64 v{{[0-9]+}}, -[[A]]
define amdgpu_ps float @fneg_fadd_0(float inreg %tmp2, float inreg %tmp6, <4 x i32> %arg) local_unnamed_addr #0 {		define amdgpu_ps float @fneg_fadd_0(float inreg %tmp2, float inreg %tmp6, <4 x i32> %arg) local_unnamed_addr #0 {
.entry:		.entry:
%tmp7 = fdiv float 1.000000e+00, %tmp6		%tmp7 = fdiv float 1.000000e+00, %tmp6
%tmp8 = fmul float 0.000000e+00, %tmp7		%tmp8 = fmul float 0.000000e+00, %tmp7
%tmp9 = fmul reassoc nnan arcp contract float 0.000000e+00, %tmp8		%tmp9 = fmul reassoc nnan arcp contract float 0.000000e+00, %tmp8
%.i188 = fadd float %tmp9, 0.000000e+00		%.i188 = fadd float %tmp9, 0.000000e+00
%tmp10 = fcmp uge float %.i188, %tmp2		%tmp10 = fcmp uge float %.i188, %tmp2
%tmp11 = fsub float -0.000000e+00, %.i188		%tmp11 = fneg float %.i188
%.i092 = select i1 %tmp10, float %tmp2, float %tmp11		%.i092 = select i1 %tmp10, float %tmp2, float %tmp11
%tmp12 = fcmp ule float %.i092, 0.000000e+00		%tmp12 = fcmp ule float %.i092, 0.000000e+00
%.i198 = select i1 %tmp12, float 0.000000e+00, float 0x7FF8000000000000		%.i198 = select i1 %tmp12, float 0.000000e+00, float 0x7FF8000000000000
ret float %.i198		ret float %.i198
}		}

; This is a workaround because -enable-no-signed-zeros-fp-math does not set up		; This is a workaround because -enable-no-signed-zeros-fp-math does not set up
; function attribute unsafe-fp-math automatically. Combine with the previous test		; function attribute unsafe-fp-math automatically. Combine with the previous test
; when that is done.		; when that is done.
; GCN-LABEL: {{^}}fneg_fadd_0_nsz:		; GCN-LABEL: {{^}}fneg_fadd_0_nsz:
; GCN-NSZ-DAG: v_rcp_f32_e32 [[A:v[0-9]+]],		; GCN-NSZ-DAG: v_rcp_f32_e32 [[A:v[0-9]+]],
; GCN-NSZ-DAG: v_mov_b32_e32 [[B:v[0-9]+]],		; GCN-NSZ-DAG: v_mov_b32_e32 [[B:v[0-9]+]],
; GCN-NSZ-DAG: v_mov_b32_e32 [[C:v[0-9]+]],		; GCN-NSZ-DAG: v_mov_b32_e32 [[C:v[0-9]+]],
; GCN-NSZ-DAG: v_mul_f32_e32 [[D:v[0-9]+]],		; GCN-NSZ-DAG: v_mul_f32_e32 [[D:v[0-9]+]],
; GCN-NSZ-DAG: v_cmp_nlt_f32_e64 {{.*}}, -[[D]]		; GCN-NSZ-DAG: v_cmp_nlt_f32_e64 {{.*}}, -[[D]]
define amdgpu_ps float @fneg_fadd_0_nsz(float inreg %tmp2, float inreg %tmp6, <4 x i32> %arg) local_unnamed_addr #2 {		define amdgpu_ps float @fneg_fadd_0_nsz(float inreg %tmp2, float inreg %tmp6, <4 x i32> %arg) local_unnamed_addr #2 {
.entry:		.entry:
%tmp7 = fdiv float 1.000000e+00, %tmp6		%tmp7 = fdiv float 1.000000e+00, %tmp6
%tmp8 = fmul float 0.000000e+00, %tmp7		%tmp8 = fmul float 0.000000e+00, %tmp7
%tmp9 = fmul reassoc nnan arcp contract float 0.000000e+00, %tmp8		%tmp9 = fmul reassoc nnan arcp contract float 0.000000e+00, %tmp8
%.i188 = fadd float %tmp9, 0.000000e+00		%.i188 = fadd float %tmp9, 0.000000e+00
%tmp10 = fcmp uge float %.i188, %tmp2		%tmp10 = fcmp uge float %.i188, %tmp2
%tmp11 = fsub float -0.000000e+00, %.i188		%tmp11 = fneg float %.i188
%.i092 = select i1 %tmp10, float %tmp2, float %tmp11		%.i092 = select i1 %tmp10, float %tmp2, float %tmp11
%tmp12 = fcmp ule float %.i092, 0.000000e+00		%tmp12 = fcmp ule float %.i092, 0.000000e+00
%.i198 = select i1 %tmp12, float 0.000000e+00, float 0x7FF8000000000000		%.i198 = select i1 %tmp12, float 0.000000e+00, float 0x7FF8000000000000
ret float %.i198		ret float %.i198
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; fmul tests		; fmul tests
; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------

; GCN-LABEL: {{^}}v_fneg_mul_f32:		; GCN-LABEL: {{^}}v_fneg_mul_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], [[A]], -[[B]]		; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], [[A]], -[[B]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_mul_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%mul = fmul float %a, %b		%mul = fmul float %a, %b
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_store_use_mul_f32:		; GCN-LABEL: {{^}}v_fneg_mul_store_use_mul_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_mul_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN-DAG: v_mul_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN-DAG: v_xor_b32_e32 [[NEG_MUL:v[0-9]+]], 0x80000000, [[ADD]]		; GCN-DAG: v_xor_b32_e32 [[NEG_MUL:v[0-9]+]], 0x80000000, [[ADD]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_mul_store_use_mul_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_store_use_mul_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%mul = fmul float %a, %b		%mul = fmul float %a, %b
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %mul, float addrspace(1)* %out		store volatile float %mul, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_multi_use_mul_f32:		; GCN-LABEL: {{^}}v_fneg_mul_multi_use_mul_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_f32_e64 [[MUL0:v[0-9]+]], [[A]], -[[B]]		; GCN: v_mul_f32_e64 [[MUL0:v[0-9]+]], [[A]], -[[B]]
; GCN-NEXT: v_mul_f32_e32 [[MUL1:v[0-9]+]], -4.0, [[MUL0]]		; GCN-NEXT: v_mul_f32_e32 [[MUL1:v[0-9]+]], -4.0, [[MUL0]]

; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL0]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL0]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL1]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL1]]
define amdgpu_kernel void @v_fneg_mul_multi_use_mul_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_multi_use_mul_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%mul = fmul float %a, %b		%mul = fmul float %a, %b
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
%use1 = fmul float %mul, 4.0		%use1 = fmul float %mul, 4.0
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_mul_fneg_x_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN: v_mul_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_mul_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%mul = fmul float %fneg.a, %b		%mul = fmul float %fneg.a, %b
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_x_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_mul_x_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN: v_mul_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_mul_x_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_x_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.b = fsub float -0.000000e+00, %b		%fneg.b = fneg float %b
%mul = fmul float %a, %fneg.b		%mul = fmul float %a, %fneg.b
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_fneg_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_mul_fneg_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_f32_e64 [[ADD:v[0-9]+]], [[A]], -[[B]]		; GCN: v_mul_f32_e64 [[ADD:v[0-9]+]], [[A]], -[[B]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_mul_fneg_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_fneg_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fneg.b = fsub float -0.000000e+00, %b		%fneg.b = fneg float %b
%mul = fmul float %fneg.a, %fneg.b		%mul = fmul float %fneg.a, %fneg.b
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_store_use_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_mul_store_use_fneg_x_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_xor_b32_e32 [[NEG_A:v[0-9]+]], 0x80000000, [[A]]		; GCN-DAG: v_xor_b32_e32 [[NEG_A:v[0-9]+]], 0x80000000, [[A]]
; GCN-DAG: v_mul_f32_e32 [[NEG_MUL:v[0-9]+]], [[A]], [[B]]		; GCN-DAG: v_mul_f32_e32 [[NEG_MUL:v[0-9]+]], [[A]], [[B]]

; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_A]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_A]]
define amdgpu_kernel void @v_fneg_mul_store_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_store_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%mul = fmul float %fneg.a, %b		%mul = fmul float %fneg.a, %b
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %fneg.a, float addrspace(1)* %out		store volatile float %fneg.a, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_multi_use_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_mul_multi_use_fneg_x_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_mul_f32_e32 [[NEG_MUL:v[0-9]+]], [[A]], [[B]]		; GCN-DAG: v_mul_f32_e32 [[NEG_MUL:v[0-9]+]], [[A]], [[B]]
; GCN-DAG: v_mul_f32_e64 [[MUL:v[0-9]+]], -[[A]], s{{[0-9]+}}		; GCN-DAG: v_mul_f32_e64 [[MUL:v[0-9]+]], -[[A]], s{{[0-9]+}}
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]
define amdgpu_kernel void @v_fneg_mul_multi_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float %c) #0 {		define amdgpu_kernel void @v_fneg_mul_multi_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float %c) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%mul = fmul float %fneg.a, %b		%mul = fmul float %fneg.a, %b
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
%use1 = fmul float %fneg.a, %c		%use1 = fmul float %fneg.a, %c
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; fminnum tests		; fminnum tests
Show All 10 Lines	define amdgpu_kernel void @v_fneg_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%min = call float @llvm.minnum.f32(float %a, float %b)		%min = call float @llvm.minnum.f32(float %a, float %b)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_minnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_minnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN-NOT: v1		; GCN-NOT: v1
; GCN: v_max_f32_e64 v0, -v0, -v1		; GCN: v_max_f32_e64 v0, -v0, -v1
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_minnum_f32_no_ieee(float %a, float %b) #0 {		define amdgpu_ps float @v_fneg_minnum_f32_no_ieee(float %a, float %b) #0 {
%min = call float @llvm.minnum.f32(float %a, float %b)		%min = call float @llvm.minnum.f32(float %a, float %b)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
ret float %fneg		ret float %fneg
}		}

; GCN-LABEL: {{^}}v_fneg_self_minnum_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_self_minnum_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_A:v[0-9]+]], -1.0, [[A]]		; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_A:v[0-9]+]], -1.0, [[A]]
; GCN: v_max_f32_e32 [[RESULT:v[0-9]+]], [[NEG_QUIET_A]], [[NEG_QUIET_A]]		; GCN: v_max_f32_e32 [[RESULT:v[0-9]+]], [[NEG_QUIET_A]], [[NEG_QUIET_A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
Show All 26 Lines
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_posk_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_posk_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%min = call float @llvm.minnum.f32(float 4.0, float %a)		%min = call float @llvm.minnum.f32(float 4.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_posk_minnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_posk_minnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN: v_max_f32_e64 v0, -v0, -4.0		; GCN: v_max_f32_e64 v0, -v0, -4.0
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_posk_minnum_f32_no_ieee(float %a) #0 {		define amdgpu_ps float @v_fneg_posk_minnum_f32_no_ieee(float %a) #0 {
%min = call float @llvm.minnum.f32(float 4.0, float %a)		%min = call float @llvm.minnum.f32(float 4.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
ret float %fneg		ret float %fneg
}		}

; GCN-LABEL: {{^}}v_fneg_negk_minnum_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_negk_minnum_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_mul_f32_e32 [[QUIET_NEG_A:v[0-9]+]], -1.0, [[A]]		; GCN: v_mul_f32_e32 [[QUIET_NEG_A:v[0-9]+]], -1.0, [[A]]
; GCN: v_max_f32_e32 [[RESULT:v[0-9]+]], 4.0, [[QUIET_NEG_A]]		; GCN: v_max_f32_e32 [[RESULT:v[0-9]+]], 4.0, [[QUIET_NEG_A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_negk_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_negk_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%min = call float @llvm.minnum.f32(float -4.0, float %a)		%min = call float @llvm.minnum.f32(float -4.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_negk_minnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_negk_minnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN: v_max_f32_e64 v0, -v0, 4.0		; GCN: v_max_f32_e64 v0, -v0, 4.0
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_negk_minnum_f32_no_ieee(float %a) #0 {		define amdgpu_ps float @v_fneg_negk_minnum_f32_no_ieee(float %a) #0 {
%min = call float @llvm.minnum.f32(float -4.0, float %a)		%min = call float @llvm.minnum.f32(float -4.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
ret float %fneg		ret float %fneg
}		}

; GCN-LABEL: {{^}}v_fneg_0_minnum_f32:		; GCN-LABEL: {{^}}v_fneg_0_minnum_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_min_f32_e32 [[RESULT:v[0-9]+]], 0, [[A]]		; GCN: v_min_f32_e32 [[RESULT:v[0-9]+]], 0, [[A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_0_minnum_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_0_minnum_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%min = call float @llvm.minnum.f32(float 0.0, float %a)		%min = call float @llvm.minnum.f32(float 0.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_neg0_minnum_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_neg0_minnum_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_mul_f32_e32 [[QUIET_NEG_A:v[0-9]+]], -1.0, [[A]]		; GCN: v_mul_f32_e32 [[QUIET_NEG_A:v[0-9]+]], -1.0, [[A]]
; GCN: v_max_f32_e32 [[RESULT:v[0-9]+]], 0, [[QUIET_NEG_A]]		; GCN: v_max_f32_e32 [[RESULT:v[0-9]+]], 0, [[QUIET_NEG_A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_neg0_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_neg0_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%min = call float @llvm.minnum.f32(float -0.0, float %a)		%min = call float @llvm.minnum.f32(float -0.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_inv2pi_minnum_f32:		; GCN-LABEL: {{^}}v_fneg_inv2pi_minnum_f32:
; GCN-DAG: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN-DAG: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]

; SI-DAG: v_mul_f32_e32 [[QUIET_NEG:v[0-9]+]], -1.0, [[A]]		; SI-DAG: v_mul_f32_e32 [[QUIET_NEG:v[0-9]+]], -1.0, [[A]]
; SI: v_max_f32_e32 [[RESULT:v[0-9]+]], 0xbe22f983, [[QUIET_NEG]]		; SI: v_max_f32_e32 [[RESULT:v[0-9]+]], 0xbe22f983, [[QUIET_NEG]]

; VI: v_mul_f32_e32 [[QUIET:v[0-9]+]], 1.0, [[A]]		; VI: v_mul_f32_e32 [[QUIET:v[0-9]+]], 1.0, [[A]]
; VI: v_min_f32_e32 [[MAX:v[0-9]+]], 0.15915494, [[QUIET]]		; VI: v_min_f32_e32 [[MAX:v[0-9]+]], 0.15915494, [[QUIET]]
; VI: v_xor_b32_e32 [[RESULT:v[0-9]+]], 0x80000000, [[MAX]]		; VI: v_xor_b32_e32 [[RESULT:v[0-9]+]], 0x80000000, [[MAX]]

; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_inv2pi_minnum_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_inv2pi_minnum_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%min = call float @llvm.minnum.f32(float 0x3FC45F3060000000, float %a)		%min = call float @llvm.minnum.f32(float 0x3FC45F3060000000, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_neg_inv2pi_minnum_f32:		; GCN-LABEL: {{^}}v_fneg_neg_inv2pi_minnum_f32:
; GCN-DAG: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN-DAG: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]

; SI: v_mul_f32_e32 [[NEG_QUIET:v[0-9]+]], -1.0, [[A]]		; SI: v_mul_f32_e32 [[NEG_QUIET:v[0-9]+]], -1.0, [[A]]
; SI: v_max_f32_e32 [[RESULT:v[0-9]+]], 0x3e22f983, [[NEG_QUIET]]		; SI: v_max_f32_e32 [[RESULT:v[0-9]+]], 0x3e22f983, [[NEG_QUIET]]

; VI: v_mul_f32_e32 [[NEG_QUIET:v[0-9]+]], -1.0, [[A]]		; VI: v_mul_f32_e32 [[NEG_QUIET:v[0-9]+]], -1.0, [[A]]
; VI: v_max_f32_e32 [[RESULT:v[0-9]+]], 0.15915494, [[NEG_QUIET]]		; VI: v_max_f32_e32 [[RESULT:v[0-9]+]], 0.15915494, [[NEG_QUIET]]

; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_neg_inv2pi_minnum_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_neg_inv2pi_minnum_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%min = call float @llvm.minnum.f32(float 0xBFC45F3060000000, float %a)		%min = call float @llvm.minnum.f32(float 0xBFC45F3060000000, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_inv2pi_minnum_f16:		; GCN-LABEL: {{^}}v_fneg_inv2pi_minnum_f16:
; GCN-DAG: {{buffer\|flat}}_load_ushort [[A:v[0-9]+]]		; GCN-DAG: {{buffer\|flat}}_load_ushort [[A:v[0-9]+]]

; SI: v_cvt_f32_f16_e64 [[CVT:v[0-9]+]], -[[A]]		; SI: v_cvt_f32_f16_e64 [[CVT:v[0-9]+]], -[[A]]
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
}		}

; GCN-LABEL: {{^}}v_fneg_neg0_minnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_neg0_minnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN: v_max_f32_e64 v0, -v0, 0{{$}}		; GCN: v_max_f32_e64 v0, -v0, 0{{$}}
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_neg0_minnum_f32_no_ieee(float %a) #0 {		define amdgpu_ps float @v_fneg_neg0_minnum_f32_no_ieee(float %a) #0 {
%min = call float @llvm.minnum.f32(float -0.0, float %a)		%min = call float @llvm.minnum.f32(float -0.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
ret float %fneg		ret float %fneg
}		}

; GCN-LABEL: {{^}}v_fneg_0_minnum_foldable_use_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_0_minnum_foldable_use_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_f32_e32 [[QUIET_A:v[0-9]+]], 1.0, [[A]]		; GCN: v_mul_f32_e32 [[QUIET_A:v[0-9]+]], 1.0, [[A]]
; GCN: v_min_f32_e32 [[MIN:v[0-9]+]], 0, [[QUIET_A]]		; GCN: v_min_f32_e32 [[MIN:v[0-9]+]], 0, [[QUIET_A]]
; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], -[[MIN]], [[B]]		; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], -[[MIN]], [[B]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_0_minnum_foldable_use_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_0_minnum_foldable_use_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%min = call float @llvm.minnum.f32(float 0.0, float %a)		%min = call float @llvm.minnum.f32(float 0.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
%mul = fmul float %fneg, %b		%mul = fmul float %fneg, %b
store float %mul, float addrspace(1)* %out.gep		store float %mul, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_inv2pi_minnum_foldable_use_f32:		; GCN-LABEL: {{^}}v_fneg_inv2pi_minnum_foldable_use_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
Show All 12 Lines	define amdgpu_kernel void @v_fneg_inv2pi_minnum_foldable_use_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%min = call float @llvm.minnum.f32(float 0x3FC45F3060000000, float %a)		%min = call float @llvm.minnum.f32(float 0x3FC45F3060000000, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
%mul = fmul float %fneg, %b		%mul = fmul float %fneg, %b
store float %mul, float addrspace(1)* %out.gep		store float %mul, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_0_minnum_foldable_use_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_0_minnum_foldable_use_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN-NOT: v1		; GCN-NOT: v1
; GCN: v_min_f32_e32 [[MIN:v[0-9]+]], 0, v0		; GCN: v_min_f32_e32 [[MIN:v[0-9]+]], 0, v0
; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], -[[MIN]], v1		; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], -[[MIN]], v1
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_0_minnum_foldable_use_f32_no_ieee(float %a, float %b) #0 {		define amdgpu_ps float @v_fneg_0_minnum_foldable_use_f32_no_ieee(float %a, float %b) #0 {
%min = call float @llvm.minnum.f32(float 0.0, float %a)		%min = call float @llvm.minnum.f32(float 0.0, float %a)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
%mul = fmul float %fneg, %b		%mul = fmul float %fneg, %b
ret float %mul		ret float %mul
}		}

; GCN-LABEL: {{^}}v_fneg_minnum_multi_use_minnum_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_minnum_multi_use_minnum_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_A:v[0-9]+]], -1.0, [[A]]		; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_A:v[0-9]+]], -1.0, [[A]]
; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_B:v[0-9]+]], -1.0, [[B]]		; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_B:v[0-9]+]], -1.0, [[B]]
; GCN: v_max_f32_e32 [[MAX0:v[0-9]+]], [[NEG_QUIET_A]], [[NEG_QUIET_B]]		; GCN: v_max_f32_e32 [[MAX0:v[0-9]+]], [[NEG_QUIET_A]], [[NEG_QUIET_B]]
; GCN-NEXT: v_mul_f32_e32 [[MUL1:v[0-9]+]], -4.0, [[MAX0]]		; GCN-NEXT: v_mul_f32_e32 [[MUL1:v[0-9]+]], -4.0, [[MAX0]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MAX0]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MAX0]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL1]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL1]]
define amdgpu_kernel void @v_fneg_minnum_multi_use_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_minnum_multi_use_minnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%min = call float @llvm.minnum.f32(float %a, float %b)		%min = call float @llvm.minnum.f32(float %a, float %b)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
%use1 = fmul float %min, 4.0		%use1 = fmul float %min, 4.0
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_minnum_multi_use_minnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_minnum_multi_use_minnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN-NOT: v1		; GCN-NOT: v1
; GCN: v_max_f32_e64 v0, -v0, -v1		; GCN: v_max_f32_e64 v0, -v0, -v1
; GCN-NEXT: v_mul_f32_e32 v1, -4.0, v0		; GCN-NEXT: v_mul_f32_e32 v1, -4.0, v0
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps <2 x float> @v_fneg_minnum_multi_use_minnum_f32_no_ieee(float %a, float %b) #0 {		define amdgpu_ps <2 x float> @v_fneg_minnum_multi_use_minnum_f32_no_ieee(float %a, float %b) #0 {
%min = call float @llvm.minnum.f32(float %a, float %b)		%min = call float @llvm.minnum.f32(float %a, float %b)
%fneg = fsub float -0.000000e+00, %min		%fneg = fneg float %min
%use1 = fmul float %min, 4.0		%use1 = fmul float %min, 4.0
%ins0 = insertelement <2 x float> undef, float %fneg, i32 0		%ins0 = insertelement <2 x float> undef, float %fneg, i32 0
%ins1 = insertelement <2 x float> %ins0, float %use1, i32 1		%ins1 = insertelement <2 x float> %ins0, float %use1, i32 1
ret <2 x float> %ins1		ret <2 x float> %ins1
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; fmaxnum tests		; fmaxnum tests
Show All 11 Lines	define amdgpu_kernel void @v_fneg_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%max = call float @llvm.maxnum.f32(float %a, float %b)		%max = call float @llvm.maxnum.f32(float %a, float %b)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_maxnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_maxnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN-NOT: v1		; GCN-NOT: v1
; GCN: v_min_f32_e64 v0, -v0, -v1		; GCN: v_min_f32_e64 v0, -v0, -v1
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_maxnum_f32_no_ieee(float %a, float %b) #0 {		define amdgpu_ps float @v_fneg_maxnum_f32_no_ieee(float %a, float %b) #0 {
%max = call float @llvm.maxnum.f32(float %a, float %b)		%max = call float @llvm.maxnum.f32(float %a, float %b)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
ret float %fneg		ret float %fneg
}		}

; GCN-LABEL: {{^}}v_fneg_self_maxnum_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_self_maxnum_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_A:v[0-9]+]], -1.0, [[A]]		; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_A:v[0-9]+]], -1.0, [[A]]
; GCN: v_min_f32_e32 [[RESULT:v[0-9]+]], [[NEG_QUIET_A]], [[NEG_QUIET_A]]		; GCN: v_min_f32_e32 [[RESULT:v[0-9]+]], [[NEG_QUIET_A]], [[NEG_QUIET_A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
Show All 26 Lines
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_posk_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_posk_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%max = call float @llvm.maxnum.f32(float 4.0, float %a)		%max = call float @llvm.maxnum.f32(float 4.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_posk_maxnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_posk_maxnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN: v_min_f32_e64 v0, -v0, -4.0		; GCN: v_min_f32_e64 v0, -v0, -4.0
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_posk_maxnum_f32_no_ieee(float %a) #0 {		define amdgpu_ps float @v_fneg_posk_maxnum_f32_no_ieee(float %a) #0 {
%max = call float @llvm.maxnum.f32(float 4.0, float %a)		%max = call float @llvm.maxnum.f32(float 4.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
ret float %fneg		ret float %fneg
}		}

; GCN-LABEL: {{^}}v_fneg_negk_maxnum_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_negk_maxnum_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_mul_f32_e32 [[QUIET_NEG_A:v[0-9]+]], -1.0, [[A]]		; GCN: v_mul_f32_e32 [[QUIET_NEG_A:v[0-9]+]], -1.0, [[A]]
; GCN: v_min_f32_e32 [[RESULT:v[0-9]+]], 4.0, [[QUIET_NEG_A]]		; GCN: v_min_f32_e32 [[RESULT:v[0-9]+]], 4.0, [[QUIET_NEG_A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_negk_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_negk_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%max = call float @llvm.maxnum.f32(float -4.0, float %a)		%max = call float @llvm.maxnum.f32(float -4.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_negk_maxnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_negk_maxnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN: v_min_f32_e64 v0, -v0, 4.0		; GCN: v_min_f32_e64 v0, -v0, 4.0
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_negk_maxnum_f32_no_ieee(float %a) #0 {		define amdgpu_ps float @v_fneg_negk_maxnum_f32_no_ieee(float %a) #0 {
%max = call float @llvm.maxnum.f32(float -4.0, float %a)		%max = call float @llvm.maxnum.f32(float -4.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
ret float %fneg		ret float %fneg
}		}

; GCN-LABEL: {{^}}v_fneg_0_maxnum_f32:		; GCN-LABEL: {{^}}v_fneg_0_maxnum_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_max_f32_e32 [[RESULT:v[0-9]+]], 0, [[A]]		; GCN: v_max_f32_e32 [[RESULT:v[0-9]+]], 0, [[A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_0_maxnum_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_0_maxnum_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%max = call float @llvm.maxnum.f32(float 0.0, float %a)		%max = call float @llvm.maxnum.f32(float 0.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_neg0_maxnum_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_neg0_maxnum_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_mul_f32_e32 [[QUIET_NEG_A:v[0-9]+]], -1.0, [[A]]		; GCN: v_mul_f32_e32 [[QUIET_NEG_A:v[0-9]+]], -1.0, [[A]]
; GCN: v_min_f32_e32 [[RESULT:v[0-9]+]], 0, [[QUIET_NEG_A]]		; GCN: v_min_f32_e32 [[RESULT:v[0-9]+]], 0, [[QUIET_NEG_A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_neg0_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_neg0_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%max = call float @llvm.maxnum.f32(float -0.0, float %a)		%max = call float @llvm.maxnum.f32(float -0.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_neg0_maxnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_neg0_maxnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN: v_min_f32_e64 v0, -v0, 0{{$}}		; GCN: v_min_f32_e64 v0, -v0, 0{{$}}
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_neg0_maxnum_f32_no_ieee(float %a) #0 {		define amdgpu_ps float @v_fneg_neg0_maxnum_f32_no_ieee(float %a) #0 {
%max = call float @llvm.maxnum.f32(float -0.0, float %a)		%max = call float @llvm.maxnum.f32(float -0.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
ret float %fneg		ret float %fneg
}		}

; GCN-LABEL: {{^}}v_fneg_0_maxnum_foldable_use_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_0_maxnum_foldable_use_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_f32_e32 [[QUIET_A:v[0-9]+]], 1.0, [[A]]		; GCN: v_mul_f32_e32 [[QUIET_A:v[0-9]+]], 1.0, [[A]]
; GCN: v_max_f32_e32 [[MAX:v[0-9]+]], 0, [[QUIET_A]]		; GCN: v_max_f32_e32 [[MAX:v[0-9]+]], 0, [[QUIET_A]]
; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], -[[MAX]], [[B]]		; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], -[[MAX]], [[B]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_0_maxnum_foldable_use_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_0_maxnum_foldable_use_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%max = call float @llvm.maxnum.f32(float 0.0, float %a)		%max = call float @llvm.maxnum.f32(float 0.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
%mul = fmul float %fneg, %b		%mul = fmul float %fneg, %b
store float %mul, float addrspace(1)* %out.gep		store float %mul, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_0_maxnum_foldable_use_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_0_maxnum_foldable_use_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN-NOT: v1		; GCN-NOT: v1
; GCN: v_max_f32_e32 [[MAX:v[0-9]+]], 0, v0		; GCN: v_max_f32_e32 [[MAX:v[0-9]+]], 0, v0
; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], -[[MAX]], v1		; GCN: v_mul_f32_e64 [[RESULT:v[0-9]+]], -[[MAX]], v1
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps float @v_fneg_0_maxnum_foldable_use_f32_no_ieee(float %a, float %b) #0 {		define amdgpu_ps float @v_fneg_0_maxnum_foldable_use_f32_no_ieee(float %a, float %b) #0 {
%max = call float @llvm.maxnum.f32(float 0.0, float %a)		%max = call float @llvm.maxnum.f32(float 0.0, float %a)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
%mul = fmul float %fneg, %b		%mul = fmul float %fneg, %b
ret float %mul		ret float %mul
}		}

; GCN-LABEL: {{^}}v_fneg_maxnum_multi_use_maxnum_f32_ieee:		; GCN-LABEL: {{^}}v_fneg_maxnum_multi_use_maxnum_f32_ieee:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_A:v[0-9]+]], -1.0, [[A]]		; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_A:v[0-9]+]], -1.0, [[A]]
; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_B:v[0-9]+]], -1.0, [[B]]		; GCN-DAG: v_mul_f32_e32 [[NEG_QUIET_B:v[0-9]+]], -1.0, [[B]]
; GCN: v_min_f32_e32 [[MAX0:v[0-9]+]], [[NEG_QUIET_A]], [[NEG_QUIET_B]]		; GCN: v_min_f32_e32 [[MAX0:v[0-9]+]], [[NEG_QUIET_A]], [[NEG_QUIET_B]]
; GCN-NEXT: v_mul_f32_e32 [[MUL1:v[0-9]+]], -4.0, [[MAX0]]		; GCN-NEXT: v_mul_f32_e32 [[MUL1:v[0-9]+]], -4.0, [[MAX0]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MAX0]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MAX0]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL1]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL1]]
define amdgpu_kernel void @v_fneg_maxnum_multi_use_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_maxnum_multi_use_maxnum_f32_ieee(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%max = call float @llvm.maxnum.f32(float %a, float %b)		%max = call float @llvm.maxnum.f32(float %a, float %b)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
%use1 = fmul float %max, 4.0		%use1 = fmul float %max, 4.0
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_maxnum_multi_use_maxnum_f32_no_ieee:		; GCN-LABEL: {{^}}v_fneg_maxnum_multi_use_maxnum_f32_no_ieee:
; GCN-NOT: v0		; GCN-NOT: v0
; GCN-NOT: v1		; GCN-NOT: v1
; GCN: v_min_f32_e64 v0, -v0, -v1		; GCN: v_min_f32_e64 v0, -v0, -v1
; GCN-NEXT: v_mul_f32_e32 v1, -4.0, v0		; GCN-NEXT: v_mul_f32_e32 v1, -4.0, v0
; GCN-NEXT: ; return		; GCN-NEXT: ; return
define amdgpu_ps <2 x float> @v_fneg_maxnum_multi_use_maxnum_f32_no_ieee(float %a, float %b) #0 {		define amdgpu_ps <2 x float> @v_fneg_maxnum_multi_use_maxnum_f32_no_ieee(float %a, float %b) #0 {
%max = call float @llvm.maxnum.f32(float %a, float %b)		%max = call float @llvm.maxnum.f32(float %a, float %b)
%fneg = fsub float -0.000000e+00, %max		%fneg = fneg float %max
%use1 = fmul float %max, 4.0		%use1 = fmul float %max, 4.0
%ins0 = insertelement <2 x float> undef, float %fneg, i32 0		%ins0 = insertelement <2 x float> undef, float %fneg, i32 0
%ins1 = insertelement <2 x float> %ins0, float %use1, i32 1		%ins1 = insertelement <2 x float> %ins0, float %use1, i32 1
ret <2 x float> %ins1		ret <2 x float> %ins1
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; fma tests		; fma tests
Show All 15 Lines	define amdgpu_kernel void @v_fneg_fma_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fma = call float @llvm.fma.f32(float %a, float %b, float %c)		%fma = call float @llvm.fma.f32(float %a, float %b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_store_use_fma_f32:		; GCN-LABEL: {{^}}v_fneg_fma_store_use_fma_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]
; GCN-DAG: v_fma_f32 [[FMA:v[0-9]+]], [[A]], [[B]], [[C]]		; GCN-DAG: v_fma_f32 [[FMA:v[0-9]+]], [[A]], [[B]], [[C]]
; GCN-DAG: v_xor_b32_e32 [[NEG_FMA:v[0-9]+]], 0x80000000, [[FMA]]		; GCN-DAG: v_xor_b32_e32 [[NEG_FMA:v[0-9]+]], 0x80000000, [[FMA]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_FMA]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_FMA]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[FMA]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[FMA]]
define amdgpu_kernel void @v_fneg_fma_store_use_fma_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {		define amdgpu_kernel void @v_fneg_fma_store_use_fma_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fma = call float @llvm.fma.f32(float %a, float %b, float %c)		%fma = call float @llvm.fma.f32(float %a, float %b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %fma, float addrspace(1)* %out		store volatile float %fma, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_multi_use_fma_f32:		; GCN-LABEL: {{^}}v_fneg_fma_multi_use_fma_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
Show All 14 Lines	define amdgpu_kernel void @v_fneg_fma_multi_use_fma_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fma = call float @llvm.fma.f32(float %a, float %b, float %c)		%fma = call float @llvm.fma.f32(float %a, float %b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
%use1 = fmul float %fma, 4.0		%use1 = fmul float %fma, 4.0
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_fneg_x_y_f32:		; GCN-LABEL: {{^}}v_fneg_fma_fneg_x_y_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
Show All 11 Lines	define amdgpu_kernel void @v_fneg_fma_fneg_x_y_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fma = call float @llvm.fma.f32(float %fneg.a, float %b, float %c)		%fma = call float @llvm.fma.f32(float %fneg.a, float %b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_x_fneg_y_f32:		; GCN-LABEL: {{^}}v_fneg_fma_x_fneg_y_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]
Show All 9 Lines	define amdgpu_kernel void @v_fneg_fma_x_fneg_y_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fneg.b = fsub float -0.000000e+00, %b		%fneg.b = fneg float %b
%fma = call float @llvm.fma.f32(float %a, float %fneg.b, float %c)		%fma = call float @llvm.fma.f32(float %a, float %fneg.b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_fneg_fneg_y_f32:		; GCN-LABEL: {{^}}v_fneg_fma_fneg_fneg_y_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]
Show All 9 Lines	define amdgpu_kernel void @v_fneg_fma_fneg_fneg_y_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fneg.b = fsub float -0.000000e+00, %b		%fneg.b = fneg float %b
%fma = call float @llvm.fma.f32(float %fneg.a, float %fneg.b, float %c)		%fma = call float @llvm.fma.f32(float %fneg.a, float %fneg.b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_fneg_x_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_fma_fneg_x_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]
Show All 9 Lines	define amdgpu_kernel void @v_fneg_fma_fneg_x_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fneg.c = fsub float -0.000000e+00, %c		%fneg.c = fneg float %c
%fma = call float @llvm.fma.f32(float %fneg.a, float %b, float %fneg.c)		%fma = call float @llvm.fma.f32(float %fneg.a, float %b, float %fneg.c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_x_y_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_fma_x_y_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]
Show All 9 Lines	define amdgpu_kernel void @v_fneg_fma_x_y_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fneg.c = fsub float -0.000000e+00, %c		%fneg.c = fneg float %c
%fma = call float @llvm.fma.f32(float %a, float %b, float %fneg.c)		%fma = call float @llvm.fma.f32(float %a, float %b, float %fneg.c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_store_use_fneg_x_y_f32:		; GCN-LABEL: {{^}}v_fneg_fma_store_use_fneg_x_y_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]
Show All 15 Lines	define amdgpu_kernel void @v_fneg_fma_store_use_fneg_x_y_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fma = call float @llvm.fma.f32(float %fneg.a, float %b, float %c)		%fma = call float @llvm.fma.f32(float %fneg.a, float %b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %fneg.a, float addrspace(1)* %out		store volatile float %fneg.a, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_multi_use_fneg_x_y_f32:		; GCN-LABEL: {{^}}v_fneg_fma_multi_use_fneg_x_y_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
Show All 11 Lines	define amdgpu_kernel void @v_fneg_fma_multi_use_fneg_x_y_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr, float %d) #0 {
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fma = call float @llvm.fma.f32(float %fneg.a, float %b, float %c)		%fma = call float @llvm.fma.f32(float %fneg.a, float %b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
%use1 = fmul float %fneg.a, %d		%use1 = fmul float %fneg.a, %d
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; fmad tests		; fmad tests
Show All 15 Lines	define amdgpu_kernel void @v_fneg_fmad_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fma = call float @llvm.fmuladd.f32(float %a, float %b, float %c)		%fma = call float @llvm.fmuladd.f32(float %a, float %b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fmad_v4f32:		; GCN-LABEL: {{^}}v_fneg_fmad_v4f32:

; GCN-NSZ: v_mad_f32 v{{[0-9]+}}, v{{[0-9]+}}, -v{{[0-9]+}}, -v{{[0-9]+}}		; GCN-NSZ: v_mad_f32 v{{[0-9]+}}, v{{[0-9]+}}, -v{{[0-9]+}}, -v{{[0-9]+}}
; GCN-NSZ: v_mad_f32 v{{[0-9]+}}, v{{[0-9]+}}, -v{{[0-9]+}}, -v{{[0-9]+}}		; GCN-NSZ: v_mad_f32 v{{[0-9]+}}, v{{[0-9]+}}, -v{{[0-9]+}}, -v{{[0-9]+}}
Show All 35 Lines	define amdgpu_kernel void @v_fneg_fmad_multi_use_fmad_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext		%c.gep = getelementptr inbounds float, float addrspace(1)* %c.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%c = load volatile float, float addrspace(1)* %c.gep		%c = load volatile float, float addrspace(1)* %c.gep
%fma = call float @llvm.fmuladd.f32(float %a, float %b, float %c)		%fma = call float @llvm.fmuladd.f32(float %a, float %b, float %c)
%fneg = fsub float -0.000000e+00, %fma		%fneg = fneg float %fma
%use1 = fmul float %fma, 4.0		%use1 = fmul float %fma, 4.0
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; fp_extend tests		; fp_extend tests
Show All 20 Lines
; GCN: v_cvt_f64_f32_e32 [[RESULT:v\[[0-9]+:[0-9]+\]]], [[A]]		; GCN: v_cvt_f64_f32_e32 [[RESULT:v\[[0-9]+:[0-9]+\]]], [[A]]
; GCN: {{buffer\|flat}}_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: {{buffer\|flat}}_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_fp_extend_fneg_f32_to_f64(double addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_fp_extend_fneg_f32_to_f64(double addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds double, double addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds double, double addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fpext = fpext float %fneg.a to double		%fpext = fpext float %fneg.a to double
%fneg = fsub double -0.000000e+00, %fpext		%fneg = fsub double -0.000000e+00, %fpext
store double %fneg, double addrspace(1)* %out.gep		store double %fneg, double addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fp_extend_store_use_fneg_f32_to_f64:		; GCN-LABEL: {{^}}v_fneg_fp_extend_store_use_fneg_f32_to_f64:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN-DAG: v_cvt_f64_f32_e32 [[RESULT:v\[[0-9]+:[0-9]+\]]], [[A]]		; GCN-DAG: v_cvt_f64_f32_e32 [[RESULT:v\[[0-9]+:[0-9]+\]]], [[A]]
; GCN-DAG: v_xor_b32_e32 [[FNEG_A:v[0-9]+]], 0x80000000, [[A]]		; GCN-DAG: v_xor_b32_e32 [[FNEG_A:v[0-9]+]], 0x80000000, [[A]]
; GCN: flat_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[FNEG_A]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[FNEG_A]]
define amdgpu_kernel void @v_fneg_fp_extend_store_use_fneg_f32_to_f64(double addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_fp_extend_store_use_fneg_f32_to_f64(double addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds double, double addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds double, double addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fpext = fpext float %fneg.a to double		%fpext = fpext float %fneg.a to double
%fneg = fsub double -0.000000e+00, %fpext		%fneg = fsub double -0.000000e+00, %fpext
store volatile double %fneg, double addrspace(1)* %out.gep		store volatile double %fneg, double addrspace(1)* %out.gep
store volatile float %fneg.a, float addrspace(1)* undef		store volatile float %fneg.a, float addrspace(1)* undef
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_multi_use_fp_extend_fneg_f32_to_f64:		; GCN-LABEL: {{^}}v_fneg_multi_use_fp_extend_fneg_f32_to_f64:
Show All 40 Lines
; GCN-LABEL: {{^}}v_fneg_multi_use_fp_extend_fneg_f16_to_f32:		; GCN-LABEL: {{^}}v_fneg_multi_use_fp_extend_fneg_f16_to_f32:
define amdgpu_kernel void @v_fneg_multi_use_fp_extend_fneg_f16_to_f32(float addrspace(1)* %out, half addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_multi_use_fp_extend_fneg_f16_to_f32(float addrspace(1)* %out, half addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds half, half addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds half, half addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile half, half addrspace(1)* %a.gep		%a = load volatile half, half addrspace(1)* %a.gep
%fpext = fpext half %a to float		%fpext = fpext half %a to float
%fneg = fsub float -0.000000e+00, %fpext		%fneg = fneg float %fpext
store volatile float %fneg, float addrspace(1)* %out.gep		store volatile float %fneg, float addrspace(1)* %out.gep
store volatile float %fpext, float addrspace(1)* %out.gep		store volatile float %fpext, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_multi_foldable_use_fp_extend_fneg_f16_to_f32:		; GCN-LABEL: {{^}}v_fneg_multi_foldable_use_fp_extend_fneg_f16_to_f32:
define amdgpu_kernel void @v_fneg_multi_foldable_use_fp_extend_fneg_f16_to_f32(float addrspace(1)* %out, half addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_multi_foldable_use_fp_extend_fneg_f16_to_f32(float addrspace(1)* %out, half addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds half, half addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds half, half addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile half, half addrspace(1)* %a.gep		%a = load volatile half, half addrspace(1)* %a.gep
%fpext = fpext half %a to float		%fpext = fpext half %a to float
%fneg = fsub float -0.000000e+00, %fpext		%fneg = fneg float %fpext
%mul = fmul float %fpext, 4.0		%mul = fmul float %fpext, 4.0
store volatile float %fneg, float addrspace(1)* %out.gep		store volatile float %fneg, float addrspace(1)* %out.gep
store volatile float %mul, float addrspace(1)* %out.gep		store volatile float %mul, float addrspace(1)* %out.gep
ret void		ret void
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; fp_round tests		; fp_round tests
; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------

; GCN-LABEL: {{^}}v_fneg_fp_round_f64_to_f32:		; GCN-LABEL: {{^}}v_fneg_fp_round_f64_to_f32:
; GCN: {{buffer\|flat}}_load_dwordx2 [[A:v\[[0-9]+:[0-9]+\]]]		; GCN: {{buffer\|flat}}_load_dwordx2 [[A:v\[[0-9]+:[0-9]+\]]]
; GCN: v_cvt_f32_f64_e64 [[RESULT:v[0-9]+]], -[[A]]		; GCN: v_cvt_f32_f64_e64 [[RESULT:v[0-9]+]], -[[A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_fp_round_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_fp_round_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile double, double addrspace(1)* %a.gep		%a = load volatile double, double addrspace(1)* %a.gep
%fpround = fptrunc double %a to float		%fpround = fptrunc double %a to float
%fneg = fsub float -0.000000e+00, %fpround		%fneg = fneg float %fpround
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fp_round_fneg_f64_to_f32:		; GCN-LABEL: {{^}}v_fneg_fp_round_fneg_f64_to_f32:
; GCN: {{buffer\|flat}}_load_dwordx2 [[A:v\[[0-9]+:[0-9]+\]]]		; GCN: {{buffer\|flat}}_load_dwordx2 [[A:v\[[0-9]+:[0-9]+\]]]
; GCN: v_cvt_f32_f64_e32 [[RESULT:v[0-9]+]], [[A]]		; GCN: v_cvt_f32_f64_e32 [[RESULT:v[0-9]+]], [[A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_fp_round_fneg_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_fp_round_fneg_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile double, double addrspace(1)* %a.gep		%a = load volatile double, double addrspace(1)* %a.gep
%fneg.a = fsub double -0.000000e+00, %a		%fneg.a = fsub double -0.000000e+00, %a
%fpround = fptrunc double %fneg.a to float		%fpround = fptrunc double %fneg.a to float
%fneg = fsub float -0.000000e+00, %fpround		%fneg = fneg float %fpround
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fp_round_store_use_fneg_f64_to_f32:		; GCN-LABEL: {{^}}v_fneg_fp_round_store_use_fneg_f64_to_f32:
; GCN: {{buffer\|flat}}_load_dwordx2 v{{\[}}[[A_LO:[0-9]+]]:[[A_HI:[0-9]+]]{{\]}}		; GCN: {{buffer\|flat}}_load_dwordx2 v{{\[}}[[A_LO:[0-9]+]]:[[A_HI:[0-9]+]]{{\]}}
; GCN-DAG: v_cvt_f32_f64_e32 [[RESULT:v[0-9]+]], v{{\[}}[[A_LO]]:[[A_HI]]{{\]}}		; GCN-DAG: v_cvt_f32_f64_e32 [[RESULT:v[0-9]+]], v{{\[}}[[A_LO]]:[[A_HI]]{{\]}}
; GCN-DAG: v_xor_b32_e32 v[[NEG_A_HI:[0-9]+]], 0x80000000, v[[A_HI]]		; GCN-DAG: v_xor_b32_e32 v[[NEG_A_HI:[0-9]+]], 0x80000000, v[[A_HI]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
; GCN: flat_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, v{{\[}}[[A_LO]]:[[NEG_A_HI]]{{\]}}		; GCN: flat_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, v{{\[}}[[A_LO]]:[[NEG_A_HI]]{{\]}}
define amdgpu_kernel void @v_fneg_fp_round_store_use_fneg_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_fp_round_store_use_fneg_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile double, double addrspace(1)* %a.gep		%a = load volatile double, double addrspace(1)* %a.gep
%fneg.a = fsub double -0.000000e+00, %a		%fneg.a = fsub double -0.000000e+00, %a
%fpround = fptrunc double %fneg.a to float		%fpround = fptrunc double %fneg.a to float
%fneg = fsub float -0.000000e+00, %fpround		%fneg = fneg float %fpround
store volatile float %fneg, float addrspace(1)* %out.gep		store volatile float %fneg, float addrspace(1)* %out.gep
store volatile double %fneg.a, double addrspace(1)* undef		store volatile double %fneg.a, double addrspace(1)* undef
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fp_round_multi_use_fneg_f64_to_f32:		; GCN-LABEL: {{^}}v_fneg_fp_round_multi_use_fneg_f64_to_f32:
; GCN: {{buffer\|flat}}_load_dwordx2 [[A:v\[[0-9]+:[0-9]+\]]]		; GCN: {{buffer\|flat}}_load_dwordx2 [[A:v\[[0-9]+:[0-9]+\]]]
; GCN-DAG: v_cvt_f32_f64_e32 [[RESULT:v[0-9]+]], [[A]]		; GCN-DAG: v_cvt_f32_f64_e32 [[RESULT:v[0-9]+]], [[A]]
; GCN-DAG: v_mul_f64 [[USE1:v\[[0-9]+:[0-9]+\]]], -[[A]], s{{\[}}		; GCN-DAG: v_mul_f64 [[USE1:v\[[0-9]+:[0-9]+\]]], -[[A]], s{{\[}}

; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
; GCN: flat_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[USE1]]		; GCN: flat_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, [[USE1]]
define amdgpu_kernel void @v_fneg_fp_round_multi_use_fneg_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr, double %c) #0 {		define amdgpu_kernel void @v_fneg_fp_round_multi_use_fneg_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr, double %c) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile double, double addrspace(1)* %a.gep		%a = load volatile double, double addrspace(1)* %a.gep
%fneg.a = fsub double -0.000000e+00, %a		%fneg.a = fsub double -0.000000e+00, %a
%fpround = fptrunc double %fneg.a to float		%fpround = fptrunc double %fneg.a to float
%fneg = fsub float -0.000000e+00, %fpround		%fneg = fneg float %fpround
%use1 = fmul double %fneg.a, %c		%use1 = fmul double %fneg.a, %c
store volatile float %fneg, float addrspace(1)* %out.gep		store volatile float %fneg, float addrspace(1)* %out.gep
store volatile double %use1, double addrspace(1)* undef		store volatile double %use1, double addrspace(1)* undef
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fp_round_f32_to_f16:		; GCN-LABEL: {{^}}v_fneg_fp_round_f32_to_f16:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
Show All 16 Lines
; GCN: v_cvt_f16_f32_e32 [[RESULT:v[0-9]+]], [[A]]		; GCN: v_cvt_f16_f32_e32 [[RESULT:v[0-9]+]], [[A]]
; GCN: flat_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_fp_round_fneg_f32_to_f16(half addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_fp_round_fneg_f32_to_f16(half addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds half, half addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds half, half addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fpround = fptrunc float %fneg.a to half		%fpround = fptrunc float %fneg.a to half
%fneg = fsub half -0.000000e+00, %fpround		%fneg = fsub half -0.000000e+00, %fpround
store half %fneg, half addrspace(1)* %out.gep		store half %fneg, half addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_multi_use_fp_round_fneg_f64_to_f32:		; GCN-LABEL: {{^}}v_fneg_multi_use_fp_round_fneg_f64_to_f32:
; GCN: {{buffer\|flat}}_load_dwordx2 [[A:v\[[0-9]+:[0-9]+\]]]		; GCN: {{buffer\|flat}}_load_dwordx2 [[A:v\[[0-9]+:[0-9]+\]]]
; GCN-DAG: v_cvt_f32_f64_e32 [[CVT:v[0-9]+]], [[A]]		; GCN-DAG: v_cvt_f32_f64_e32 [[CVT:v[0-9]+]], [[A]]
; GCN-DAG: v_xor_b32_e32 [[NEG:v[0-9]+]], 0x80000000, [[CVT]]		; GCN-DAG: v_xor_b32_e32 [[NEG:v[0-9]+]], 0x80000000, [[CVT]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[CVT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[CVT]]
define amdgpu_kernel void @v_fneg_multi_use_fp_round_fneg_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_multi_use_fp_round_fneg_f64_to_f32(float addrspace(1)* %out, double addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds double, double addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile double, double addrspace(1)* %a.gep		%a = load volatile double, double addrspace(1)* %a.gep
%fpround = fptrunc double %a to float		%fpround = fptrunc double %a to float
%fneg = fsub float -0.000000e+00, %fpround		%fneg = fneg float %fpround
store volatile float %fneg, float addrspace(1)* %out.gep		store volatile float %fneg, float addrspace(1)* %out.gep
store volatile float %fpround, float addrspace(1)* %out.gep		store volatile float %fpround, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fp_round_store_use_fneg_f32_to_f16:		; GCN-LABEL: {{^}}v_fneg_fp_round_store_use_fneg_f32_to_f16:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN-DAG: v_cvt_f16_f32_e32 [[RESULT:v[0-9]+]], [[A]]		; GCN-DAG: v_cvt_f16_f32_e32 [[RESULT:v[0-9]+]], [[A]]
; GCN-DAG: v_xor_b32_e32 [[NEG_A:v[0-9]+]], 0x80000000, [[A]]		; GCN-DAG: v_xor_b32_e32 [[NEG_A:v[0-9]+]], 0x80000000, [[A]]
; GCN: flat_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_A]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_A]]
define amdgpu_kernel void @v_fneg_fp_round_store_use_fneg_f32_to_f16(half addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_fp_round_store_use_fneg_f32_to_f16(half addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds half, half addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds half, half addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fpround = fptrunc float %fneg.a to half		%fpround = fptrunc float %fneg.a to half
%fneg = fsub half -0.000000e+00, %fpround		%fneg = fsub half -0.000000e+00, %fpround
store volatile half %fneg, half addrspace(1)* %out.gep		store volatile half %fneg, half addrspace(1)* %out.gep
store volatile float %fneg.a, float addrspace(1)* undef		store volatile float %fneg.a, float addrspace(1)* undef
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fp_round_multi_use_fneg_f32_to_f16:		; GCN-LABEL: {{^}}v_fneg_fp_round_multi_use_fneg_f32_to_f16:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN-DAG: v_cvt_f16_f32_e32 [[RESULT:v[0-9]+]], [[A]]		; GCN-DAG: v_cvt_f16_f32_e32 [[RESULT:v[0-9]+]], [[A]]
; GCN-DAG: v_mul_f32_e64 [[USE1:v[0-9]+]], -[[A]], s		; GCN-DAG: v_mul_f32_e64 [[USE1:v[0-9]+]], -[[A]], s
; GCN: flat_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_short v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[USE1]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[USE1]]
define amdgpu_kernel void @v_fneg_fp_round_multi_use_fneg_f32_to_f16(half addrspace(1)* %out, float addrspace(1)* %a.ptr, float %c) #0 {		define amdgpu_kernel void @v_fneg_fp_round_multi_use_fneg_f32_to_f16(half addrspace(1)* %out, float addrspace(1)* %a.ptr, float %c) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds half, half addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds half, half addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fpround = fptrunc float %fneg.a to half		%fpround = fptrunc float %fneg.a to half
%fneg = fsub half -0.000000e+00, %fpround		%fneg = fsub half -0.000000e+00, %fpround
%use1 = fmul float %fneg.a, %c		%use1 = fmul float %fneg.a, %c
store volatile half %fneg, half addrspace(1)* %out.gep		store volatile half %fneg, half addrspace(1)* %out.gep
store volatile float %use1, float addrspace(1)* undef		store volatile float %use1, float addrspace(1)* undef
ret void		ret void
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; rcp tests		; rcp tests
; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------

; GCN-LABEL: {{^}}v_fneg_rcp_f32:		; GCN-LABEL: {{^}}v_fneg_rcp_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_rcp_f32_e64 [[RESULT:v[0-9]+]], -[[A]]		; GCN: v_rcp_f32_e64 [[RESULT:v[0-9]+]], -[[A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_rcp_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_rcp_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%rcp = call float @llvm.amdgcn.rcp.f32(float %a)		%rcp = call float @llvm.amdgcn.rcp.f32(float %a)
%fneg = fsub float -0.000000e+00, %rcp		%fneg = fneg float %rcp
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_rcp_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_rcp_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_rcp_f32_e32 [[RESULT:v[0-9]+]], [[A]]		; GCN: v_rcp_f32_e32 [[RESULT:v[0-9]+]], [[A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_rcp_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_rcp_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%rcp = call float @llvm.amdgcn.rcp.f32(float %fneg.a)		%rcp = call float @llvm.amdgcn.rcp.f32(float %fneg.a)
%fneg = fsub float -0.000000e+00, %rcp		%fneg = fneg float %rcp
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_rcp_store_use_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_rcp_store_use_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN-DAG: v_rcp_f32_e32 [[RESULT:v[0-9]+]], [[A]]		; GCN-DAG: v_rcp_f32_e32 [[RESULT:v[0-9]+]], [[A]]
; GCN-DAG: v_xor_b32_e32 [[NEG_A:v[0-9]+]], 0x80000000, [[A]]		; GCN-DAG: v_xor_b32_e32 [[NEG_A:v[0-9]+]], 0x80000000, [[A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_A]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_A]]
define amdgpu_kernel void @v_fneg_rcp_store_use_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_rcp_store_use_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%rcp = call float @llvm.amdgcn.rcp.f32(float %fneg.a)		%rcp = call float @llvm.amdgcn.rcp.f32(float %fneg.a)
%fneg = fsub float -0.000000e+00, %rcp		%fneg = fneg float %rcp
store volatile float %fneg, float addrspace(1)* %out.gep		store volatile float %fneg, float addrspace(1)* %out.gep
store volatile float %fneg.a, float addrspace(1)* undef		store volatile float %fneg.a, float addrspace(1)* undef
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_rcp_multi_use_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_rcp_multi_use_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN-DAG: v_rcp_f32_e32 [[RESULT:v[0-9]+]], [[A]]		; GCN-DAG: v_rcp_f32_e32 [[RESULT:v[0-9]+]], [[A]]
; GCN-DAG: v_mul_f32_e64 [[MUL:v[0-9]+]], -[[A]], s{{[0-9]+}}		; GCN-DAG: v_mul_f32_e64 [[MUL:v[0-9]+]], -[[A]], s{{[0-9]+}}
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]
define amdgpu_kernel void @v_fneg_rcp_multi_use_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float %c) #0 {		define amdgpu_kernel void @v_fneg_rcp_multi_use_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float %c) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%rcp = call float @llvm.amdgcn.rcp.f32(float %fneg.a)		%rcp = call float @llvm.amdgcn.rcp.f32(float %fneg.a)
%fneg = fsub float -0.000000e+00, %rcp		%fneg = fneg float %rcp
%use1 = fmul float %fneg.a, %c		%use1 = fmul float %fneg.a, %c
store volatile float %fneg, float addrspace(1)* %out.gep		store volatile float %fneg, float addrspace(1)* %out.gep
store volatile float %use1, float addrspace(1)* undef		store volatile float %use1, float addrspace(1)* undef
ret void		ret void
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; fmul_legacy tests		; fmul_legacy tests
; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------

; GCN-LABEL: {{^}}v_fneg_mul_legacy_f32:		; GCN-LABEL: {{^}}v_fneg_mul_legacy_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_legacy_f32_e64 [[RESULT:v[0-9]+]], [[A]], -[[B]]		; GCN: v_mul_legacy_f32_e64 [[RESULT:v[0-9]+]], [[A]], -[[B]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_mul_legacy_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_legacy_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)		%mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_legacy_store_use_mul_legacy_f32:		; GCN-LABEL: {{^}}v_fneg_mul_legacy_store_use_mul_legacy_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_mul_legacy_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN-DAG: v_mul_legacy_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN-DAG: v_xor_b32_e32 [[NEG_MUL_LEGACY:v[0-9]+]], 0x80000000, [[ADD]]		; GCN-DAG: v_xor_b32_e32 [[NEG_MUL_LEGACY:v[0-9]+]], 0x80000000, [[ADD]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL_LEGACY]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL_LEGACY]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_mul_legacy_store_use_mul_legacy_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_legacy_store_use_mul_legacy_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)		%mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %mul, float addrspace(1)* %out		store volatile float %mul, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_legacy_multi_use_mul_legacy_f32:		; GCN-LABEL: {{^}}v_fneg_mul_legacy_multi_use_mul_legacy_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_legacy_f32_e64 [[ADD:v[0-9]+]], [[A]], -[[B]]		; GCN: v_mul_legacy_f32_e64 [[ADD:v[0-9]+]], [[A]], -[[B]]
; GCN-NEXT: v_mul_legacy_f32_e64 [[MUL:v[0-9]+]], -[[ADD]], 4.0		; GCN-NEXT: v_mul_legacy_f32_e64 [[MUL:v[0-9]+]], -[[ADD]], 4.0
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]
define amdgpu_kernel void @v_fneg_mul_legacy_multi_use_mul_legacy_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_legacy_multi_use_mul_legacy_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)		%mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
%use1 = call float @llvm.amdgcn.fmul.legacy(float %mul, float 4.0)		%use1 = call float @llvm.amdgcn.fmul.legacy(float %mul, float 4.0)
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_legacy_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_mul_legacy_fneg_x_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_legacy_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN: v_mul_legacy_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_mul_legacy_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_legacy_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%mul = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %b)		%mul = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %b)
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_legacy_x_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_mul_legacy_x_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_legacy_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]		; GCN: v_mul_legacy_f32_e32 [[ADD:v[0-9]+]], [[A]], [[B]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_mul_legacy_x_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_legacy_x_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.b = fsub float -0.000000e+00, %b		%fneg.b = fneg float %b
%mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %fneg.b)		%mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %fneg.b)
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_legacy_fneg_fneg_f32:		; GCN-LABEL: {{^}}v_fneg_mul_legacy_fneg_fneg_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: v_mul_legacy_f32_e64 [[ADD:v[0-9]+]], [[A]], -[[B]]		; GCN: v_mul_legacy_f32_e64 [[ADD:v[0-9]+]], [[A]], -[[B]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[ADD]]
define amdgpu_kernel void @v_fneg_mul_legacy_fneg_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_legacy_fneg_fneg_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%fneg.b = fsub float -0.000000e+00, %b		%fneg.b = fneg float %b
%mul = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %fneg.b)		%mul = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %fneg.b)
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_legacy_store_use_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_mul_legacy_store_use_fneg_x_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_xor_b32_e32 [[NEG_A:v[0-9]+]], 0x80000000, [[A]]		; GCN-DAG: v_xor_b32_e32 [[NEG_A:v[0-9]+]], 0x80000000, [[A]]
; GCN-DAG: v_mul_legacy_f32_e32 [[NEG_MUL_LEGACY:v[0-9]+]], [[A]], [[B]]		; GCN-DAG: v_mul_legacy_f32_e32 [[NEG_MUL_LEGACY:v[0-9]+]], [[A]], [[B]]
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL_LEGACY]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL_LEGACY]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_A]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_A]]
define amdgpu_kernel void @v_fneg_mul_legacy_store_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {		define amdgpu_kernel void @v_fneg_mul_legacy_store_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%mul = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %b)		%mul = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %b)
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %fneg.a, float addrspace(1)* %out		store volatile float %fneg.a, float addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_mul_legacy_multi_use_fneg_x_f32:		; GCN-LABEL: {{^}}v_fneg_mul_legacy_multi_use_fneg_x_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN-DAG: v_mul_legacy_f32_e32 [[NEG_MUL_LEGACY:v[0-9]+]], [[A]], [[B]]		; GCN-DAG: v_mul_legacy_f32_e32 [[NEG_MUL_LEGACY:v[0-9]+]], [[A]], [[B]]
; GCN-DAG: v_mul_legacy_f32_e64 [[MUL:v[0-9]+]], -[[A]], s{{[0-9]+}}		; GCN-DAG: v_mul_legacy_f32_e64 [[MUL:v[0-9]+]], -[[A]], s{{[0-9]+}}
; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL_LEGACY]]		; GCN-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_MUL_LEGACY]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]
define amdgpu_kernel void @v_fneg_mul_legacy_multi_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float %c) #0 {		define amdgpu_kernel void @v_fneg_mul_legacy_multi_use_fneg_x_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float %c) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext		%b.gep = getelementptr inbounds float, float addrspace(1)* %b.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%b = load volatile float, float addrspace(1)* %b.gep		%b = load volatile float, float addrspace(1)* %b.gep
%fneg.a = fsub float -0.000000e+00, %a		%fneg.a = fneg float %a
%mul = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %b)		%mul = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %b)
%fneg = fsub float -0.000000e+00, %mul		%fneg = fneg float %mul
%use1 = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %c)		%use1 = call float @llvm.amdgcn.fmul.legacy(float %fneg.a, float %c)
store volatile float %fneg, float addrspace(1)* %out		store volatile float %fneg, float addrspace(1)* %out
store volatile float %use1, float addrspace(1)* %out		store volatile float %use1, float addrspace(1)* %out
ret void		ret void
}		}

; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------
; sin tests		; sin tests
; --------------------------------------------------------------------------------		; --------------------------------------------------------------------------------

; GCN-LABEL: {{^}}v_fneg_sin_f32:		; GCN-LABEL: {{^}}v_fneg_sin_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_mul_f32_e32 [[MUL:v[0-9]+]], 0xbe22f983, [[A]]		; GCN: v_mul_f32_e32 [[MUL:v[0-9]+]], 0xbe22f983, [[A]]
; GCN: v_fract_f32_e32 [[FRACT:v[0-9]+]], [[MUL]]		; GCN: v_fract_f32_e32 [[FRACT:v[0-9]+]], [[MUL]]
; GCN: v_sin_f32_e32 [[RESULT:v[0-9]+]], [[FRACT]]		; GCN: v_sin_f32_e32 [[RESULT:v[0-9]+]], [[FRACT]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
define amdgpu_kernel void @v_fneg_sin_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {		define amdgpu_kernel void @v_fneg_sin_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext		%out.gep = getelementptr inbounds float, float addrspace(1)* %out, i64 %tid.ext
%a = load volatile float, float addrspace(1)* %a.gep		%a = load volatile float, float addrspace(1)* %a.gep
%sin = call float @llvm.sin.f32(float %a)		%sin = call float @llvm.sin.f32(float %a)
%fneg = fsub float -0.000000e+00, %sin		%fneg = fneg float %sin
store float %fneg, float addrspace(1)* %out.gep		store float %fneg, float addrspace(1)* %out.gep
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_amdgcn_sin_f32:		; GCN-LABEL: {{^}}v_fneg_amdgcn_sin_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: v_sin_f32_e64 [[RESULT:v[0-9]+]], -[[A]]		; GCN: v_sin_f32_e64 [[RESULT:v[0-9]+]], -[[A]]
; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]		; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[RESULT]]
▲ Show 20 Lines • Show All 533 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/selectcc-opt.ll

	; RUN: llc -march=amdgcn < %s \| FileCheck -check-prefix=SI -check-prefix=FUNC %s			; RUN: llc -march=amdgcn < %s \| FileCheck -check-prefix=SI -check-prefix=FUNC %s
	; RUN: llc -march=amdgcn -mcpu=tonga -mattr=-flat-for-global < %s \| FileCheck -check-prefix=SI -check-prefix=FUNC %s			; RUN: llc -march=amdgcn -mcpu=tonga -mattr=-flat-for-global < %s \| FileCheck -check-prefix=SI -check-prefix=FUNC %s
	; RUN: llc -march=r600 -mcpu=redwood < %s \| FileCheck -check-prefix=EG -check-prefix=FUNC %s			; RUN: llc -march=r600 -mcpu=redwood < %s \| FileCheck -check-prefix=EG -check-prefix=FUNC %s


	; FUNC-LABEL: {{^}}test_a:			; FUNC-LABEL: {{^}}test_a:
	; EG-NOT: CND			; EG-NOT: CND
	; EG: SET{{[NEQGTL]+}}_DX10			; EG: SET{{[NEQGTL]+}}_DX10

	define amdgpu_kernel void @test_a(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @test_a(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp olt float %in, 0.000000e+00			%0 = fcmp olt float %in, 0.000000e+00
	%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00			%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00
	%2 = fsub float -0.000000e+00, %1			%2 = fneg float %1
	%3 = fptosi float %2 to i32			%3 = fptosi float %2 to i32
	%4 = bitcast i32 %3 to float			%4 = bitcast i32 %3 to float
	%5 = bitcast float %4 to i32			%5 = bitcast float %4 to i32
	%6 = icmp ne i32 %5, 0			%6 = icmp ne i32 %5, 0
	br i1 %6, label %IF, label %ENDIF			br i1 %6, label %IF, label %ENDIF

	IF:			IF:
	%7 = getelementptr i32, i32 addrspace(1)* %out, i32 1			%7 = getelementptr i32, i32 addrspace(1)* %out, i32 1
	Show All 11 Lines
	; EG-LABEL: {{^}}test_b:			; EG-LABEL: {{^}}test_b:
	; EG: SET{{[GTEQN]+}}_DX10			; EG: SET{{[GTEQN]+}}_DX10
	; EG-NEXT: PRED_			; EG-NEXT: PRED_
	; EG-NEXT: ALU clause starting			; EG-NEXT: ALU clause starting
	define amdgpu_kernel void @test_b(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @test_b(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp olt float %in, 0.0			%0 = fcmp olt float %in, 0.0
	%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00			%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00
	%2 = fsub float -0.000000e+00, %1			%2 = fneg float %1
	%3 = fptosi float %2 to i32			%3 = fptosi float %2 to i32
	%4 = bitcast i32 %3 to float			%4 = bitcast i32 %3 to float
	%5 = bitcast float %4 to i32			%5 = bitcast float %4 to i32
	%6 = icmp ne i32 %5, 0			%6 = icmp ne i32 %5, 0
	br i1 %6, label %ENDIF, label %IF			br i1 %6, label %ENDIF, label %IF

	IF:			IF:
	%7 = getelementptr i32, i32 addrspace(1)* %out, i32 1			%7 = getelementptr i32, i32 addrspace(1)* %out, i32 1
	Show All 30 Lines

llvm/test/CodeGen/AMDGPU/set-dx10.ll

	; RUN: llc < %s -march=r600 -mcpu=redwood \| FileCheck %s			; RUN: llc < %s -march=r600 -mcpu=redwood \| FileCheck %s

	; These tests check that floating point comparisons which are used by select			; These tests check that floating point comparisons which are used by select
	; to store integer true (-1) and false (0) values are lowered to one of the			; to store integer true (-1) and false (0) values are lowered to one of the
	; SET*DX10 instructions.			; SET*DX10 instructions.

	; CHECK: {{^}}fcmp_une_select_fptosi:			; CHECK: {{^}}fcmp_une_select_fptosi:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETNE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,			; CHECK-NEXT: SETNE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,
	; CHECK-NEXT: 1084227584(5.000000e+00)			; CHECK-NEXT: 1084227584(5.000000e+00)
	define amdgpu_kernel void @fcmp_une_select_fptosi(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @fcmp_une_select_fptosi(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp une float %in, 5.0			%0 = fcmp une float %in, 5.0
	%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00			%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00
	%2 = fsub float -0.000000e+00, %1			%2 = fneg float %1
	%3 = fptosi float %2 to i32			%3 = fptosi float %2 to i32
	store i32 %3, i32 addrspace(1)* %out			store i32 %3, i32 addrspace(1)* %out
	ret void			ret void
	}			}

	; CHECK: {{^}}fcmp_une_select_i32:			; CHECK: {{^}}fcmp_une_select_i32:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETNE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,			; CHECK-NEXT: SETNE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,
	Show All 9 Lines
	; CHECK: {{^}}fcmp_oeq_select_fptosi:			; CHECK: {{^}}fcmp_oeq_select_fptosi:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,			; CHECK-NEXT: SETE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,
	; CHECK-NEXT: 1084227584(5.000000e+00)			; CHECK-NEXT: 1084227584(5.000000e+00)
	define amdgpu_kernel void @fcmp_oeq_select_fptosi(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @fcmp_oeq_select_fptosi(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp oeq float %in, 5.0			%0 = fcmp oeq float %in, 5.0
	%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00			%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00
	%2 = fsub float -0.000000e+00, %1			%2 = fneg float %1
	%3 = fptosi float %2 to i32			%3 = fptosi float %2 to i32
	store i32 %3, i32 addrspace(1)* %out			store i32 %3, i32 addrspace(1)* %out
	ret void			ret void
	}			}

	; CHECK: {{^}}fcmp_oeq_select_i32:			; CHECK: {{^}}fcmp_oeq_select_i32:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,			; CHECK-NEXT: SETE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,
	Show All 9 Lines
	; CHECK: {{^}}fcmp_ogt_select_fptosi:			; CHECK: {{^}}fcmp_ogt_select_fptosi:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETGT_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,			; CHECK-NEXT: SETGT_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,
	; CHECK-NEXT: 1084227584(5.000000e+00)			; CHECK-NEXT: 1084227584(5.000000e+00)
	define amdgpu_kernel void @fcmp_ogt_select_fptosi(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @fcmp_ogt_select_fptosi(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp ogt float %in, 5.0			%0 = fcmp ogt float %in, 5.0
	%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00			%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00
	%2 = fsub float -0.000000e+00, %1			%2 = fneg float %1
	%3 = fptosi float %2 to i32			%3 = fptosi float %2 to i32
	store i32 %3, i32 addrspace(1)* %out			store i32 %3, i32 addrspace(1)* %out
	ret void			ret void
	}			}

	; CHECK: {{^}}fcmp_ogt_select_i32:			; CHECK: {{^}}fcmp_ogt_select_i32:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETGT_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,			; CHECK-NEXT: SETGT_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,
	Show All 9 Lines
	; CHECK: {{^}}fcmp_oge_select_fptosi:			; CHECK: {{^}}fcmp_oge_select_fptosi:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETGE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,			; CHECK-NEXT: SETGE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,
	; CHECK-NEXT: 1084227584(5.000000e+00)			; CHECK-NEXT: 1084227584(5.000000e+00)
	define amdgpu_kernel void @fcmp_oge_select_fptosi(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @fcmp_oge_select_fptosi(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp oge float %in, 5.0			%0 = fcmp oge float %in, 5.0
	%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00			%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00
	%2 = fsub float -0.000000e+00, %1			%2 = fneg float %1
	%3 = fptosi float %2 to i32			%3 = fptosi float %2 to i32
	store i32 %3, i32 addrspace(1)* %out			store i32 %3, i32 addrspace(1)* %out
	ret void			ret void
	}			}

	; CHECK: {{^}}fcmp_oge_select_i32:			; CHECK: {{^}}fcmp_oge_select_i32:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETGE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,			; CHECK-NEXT: SETGE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, literal.y,
	Show All 9 Lines
	; CHECK: {{^}}fcmp_ole_select_fptosi:			; CHECK: {{^}}fcmp_ole_select_fptosi:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETGE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, literal.y, KC0[2].Z,			; CHECK-NEXT: SETGE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, literal.y, KC0[2].Z,
	; CHECK-NEXT: 1084227584(5.000000e+00)			; CHECK-NEXT: 1084227584(5.000000e+00)
	define amdgpu_kernel void @fcmp_ole_select_fptosi(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @fcmp_ole_select_fptosi(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp ole float %in, 5.0			%0 = fcmp ole float %in, 5.0
	%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00			%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00
	%2 = fsub float -0.000000e+00, %1			%2 = fneg float %1
	%3 = fptosi float %2 to i32			%3 = fptosi float %2 to i32
	store i32 %3, i32 addrspace(1)* %out			store i32 %3, i32 addrspace(1)* %out
	ret void			ret void
	}			}

	; CHECK: {{^}}fcmp_ole_select_i32:			; CHECK: {{^}}fcmp_ole_select_i32:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETGE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, literal.y, KC0[2].Z,			; CHECK-NEXT: SETGE_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, literal.y, KC0[2].Z,
	Show All 9 Lines
	; CHECK: {{^}}fcmp_olt_select_fptosi:			; CHECK: {{^}}fcmp_olt_select_fptosi:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETGT_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, literal.y, KC0[2].Z,			; CHECK-NEXT: SETGT_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, literal.y, KC0[2].Z,
	; CHECK-NEXT: 1084227584(5.000000e+00)			; CHECK-NEXT: 1084227584(5.000000e+00)
	define amdgpu_kernel void @fcmp_olt_select_fptosi(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @fcmp_olt_select_fptosi(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp olt float %in, 5.0			%0 = fcmp olt float %in, 5.0
	%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00			%1 = select i1 %0, float 1.000000e+00, float 0.000000e+00
	%2 = fsub float -0.000000e+00, %1			%2 = fneg float %1
	%3 = fptosi float %2 to i32			%3 = fptosi float %2 to i32
	store i32 %3, i32 addrspace(1)* %out			store i32 %3, i32 addrspace(1)* %out
	ret void			ret void
	}			}

	; CHECK: {{^}}fcmp_olt_select_i32:			; CHECK: {{^}}fcmp_olt_select_i32:
	; CHECK: LSHR			; CHECK: LSHR
	; CHECK-NEXT: SETGT_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, literal.y, KC0[2].Z,			; CHECK-NEXT: SETGT_DX10 * {{\** *}}T{{[0-9]+\.[XYZW]}}, literal.y, KC0[2].Z,
	; CHECK-NEXT: 1084227584(5.000000e+00)			; CHECK-NEXT: 1084227584(5.000000e+00)
	define amdgpu_kernel void @fcmp_olt_select_i32(i32 addrspace(1)* %out, float %in) {			define amdgpu_kernel void @fcmp_olt_select_i32(i32 addrspace(1)* %out, float %in) {
	entry:			entry:
	%0 = fcmp olt float %in, 5.0			%0 = fcmp olt float %in, 5.0
	%1 = select i1 %0, i32 -1, i32 0			%1 = select i1 %0, i32 -1, i32 0
	store i32 %1, i32 addrspace(1)* %out			store i32 %1, i32 addrspace(1)* %out
	ret void			ret void
	}			}