Diff 554748

llvm/lib/Target/AMDGPU/AMDGPUAtomicOptimizer.cpp

Show First 20 Lines • Show All 198 Lines • ▼ Show 20 Lines	void AMDGPUAtomicOptimizerImpl::visitAtomicRMWInst(AtomicRMWInst &I) {
case AtomicRMWInst::Or:		case AtomicRMWInst::Or:
case AtomicRMWInst::Xor:		case AtomicRMWInst::Xor:
case AtomicRMWInst::Max:		case AtomicRMWInst::Max:
case AtomicRMWInst::Min:		case AtomicRMWInst::Min:
case AtomicRMWInst::UMax:		case AtomicRMWInst::UMax:
case AtomicRMWInst::UMin:		case AtomicRMWInst::UMin:
case AtomicRMWInst::FAdd:		case AtomicRMWInst::FAdd:
case AtomicRMWInst::FSub:		case AtomicRMWInst::FSub:
		case AtomicRMWInst::FMax:
		case AtomicRMWInst::FMin:
break;		break;
}		}

// Only 32-bit floating point atomic ops are supported.		// Only 32-bit floating point atomic ops are supported.
if (AtomicRMWInst::isFPOperation(Op) && !I.getType()->isFloatTy()) {		if (AtomicRMWInst::isFPOperation(Op) && !I.getType()->isFloatTy()) {
return;		return;
}		}

▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	case Intrinsic::amdgcn_raw_ptr_buffer_atomic_smax:
break;		break;
case Intrinsic::amdgcn_buffer_atomic_umax:		case Intrinsic::amdgcn_buffer_atomic_umax:
case Intrinsic::amdgcn_struct_buffer_atomic_umax:		case Intrinsic::amdgcn_struct_buffer_atomic_umax:
case Intrinsic::amdgcn_struct_ptr_buffer_atomic_umax:		case Intrinsic::amdgcn_struct_ptr_buffer_atomic_umax:
case Intrinsic::amdgcn_raw_buffer_atomic_umax:		case Intrinsic::amdgcn_raw_buffer_atomic_umax:
case Intrinsic::amdgcn_raw_ptr_buffer_atomic_umax:		case Intrinsic::amdgcn_raw_ptr_buffer_atomic_umax:
Op = AtomicRMWInst::UMax;		Op = AtomicRMWInst::UMax;
break;		break;
}		}
		arsenmUnsubmitted Not Done Reply Inline Actions I don't want to implicitly convert the intrinsics here. We should move towards getting rid of the intrinsics and autoupgrading them arsenm: I don't want to implicitly convert the intrinsics here. We should move towards getting rid of…

const unsigned ValIdx = 0;		const unsigned ValIdx = 0;

const bool ValDivergent = UA->isDivergentUse(I.getOperandUse(ValIdx));		const bool ValDivergent = UA->isDivergentUse(I.getOperandUse(ValIdx));

// If the value operand is divergent, each lane is contributing a different		// If the value operand is divergent, each lane is contributing a different
// value to the atomic calculation. We can only optimize divergent values if		// value to the atomic calculation. We can only optimize divergent values if
// we have DPP available on our subtarget, and the atomic operation is 32		// we have DPP available on our subtarget, and the atomic operation is 32
▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	case AtomicRMWInst::Min:
Pred = CmpInst::ICMP_SLT;		Pred = CmpInst::ICMP_SLT;
break;		break;
case AtomicRMWInst::UMax:		case AtomicRMWInst::UMax:
Pred = CmpInst::ICMP_UGT;		Pred = CmpInst::ICMP_UGT;
break;		break;
case AtomicRMWInst::UMin:		case AtomicRMWInst::UMin:
Pred = CmpInst::ICMP_ULT;		Pred = CmpInst::ICMP_ULT;
break;		break;
		case AtomicRMWInst::FMax:
		return B.CreateMaxNum(LHS, RHS);
		pravinjagtapAuthorUnsubmitted Done Reply Inline Actions @arsenm you earlier suggested to use minnum/maxnum intrinsics for this. This also seems to give correct behavior. I am not sure what I am missing here pravinjagtap: @arsenm you earlier suggested to use minnum/maxnum intrinsics for this. This also seems to give…
		arsenmUnsubmitted Not Done Reply Inline Actions This is incorrect, you should create minnum/maxnum arsenm: This is incorrect, you should create minnum/maxnum
		arsenmUnsubmitted Not Done Reply Inline Actions Yes, it is wrong to use fcmp and select here. For example for fmax what you have returns the wrong result if LHS is a nan. select (ugt nan, rhs), nan, rhs -> nan maxnum(nan, rhs) -> rhs arsenm: Yes, it is wrong to use fcmp and select here. For example for fmax what you have returns the…
		pravinjagtapAuthorUnsubmitted Done Reply Inline Actions you should create minnum/maxnum Are you referring to `@llvm.amdgcn.fcmp.f32(float, float, i32)` intrinsic here right ? pravinjagtap: >you should create minnum/maxnum Are you referring to `@llvm.amdgcn.fcmp.f32(float, float…
		arsenmUnsubmitted Not Done Reply Inline Actions No, IRBuilder.CreateMinNum and CreateMaxNum arsenm: No, IRBuilder.CreateMinNum and CreateMaxNum
		case AtomicRMWInst::FMin:
		return B.CreateMinNum(LHS, RHS);
}		}
Value *Cond = B.CreateICmp(Pred, LHS, RHS);		Value *Cond = B.CreateICmp(Pred, LHS, RHS);
return B.CreateSelect(Cond, LHS, RHS);		return B.CreateSelect(Cond, LHS, RHS);
}		}

// Use the builder to create a reduction of V across the wavefront, with all		// Use the builder to create a reduction of V across the wavefront, with all
// lanes active, returning the same result in all lanes.		// lanes active, returning the same result in all lanes.
Value *AMDGPUAtomicOptimizerImpl::buildReduction(IRBuilder<> &B,		Value *AMDGPUAtomicOptimizerImpl::buildReduction(IRBuilder<> &B,
▲ Show 20 Lines • Show All 260 Lines • ▼ Show 20 Lines	static Constant getIdentityValueForAtomicOp(Type const Ty,
case AtomicRMWInst::Max:		case AtomicRMWInst::Max:
return ConstantInt::get(C, APInt::getSignedMinValue(BitWidth));		return ConstantInt::get(C, APInt::getSignedMinValue(BitWidth));
case AtomicRMWInst::Min:		case AtomicRMWInst::Min:
return ConstantInt::get(C, APInt::getSignedMaxValue(BitWidth));		return ConstantInt::get(C, APInt::getSignedMaxValue(BitWidth));
case AtomicRMWInst::FAdd:		case AtomicRMWInst::FAdd:
return ConstantFP::get(C, APFloat::getZero(Ty->getFltSemantics(), true));		return ConstantFP::get(C, APFloat::getZero(Ty->getFltSemantics(), true));
case AtomicRMWInst::FSub:		case AtomicRMWInst::FSub:
return ConstantFP::get(C, APFloat::getZero(Ty->getFltSemantics(), false));		return ConstantFP::get(C, APFloat::getZero(Ty->getFltSemantics(), false));
		case AtomicRMWInst::FMin:
		return ConstantFP::get(C, APFloat::getInf(Ty->getFltSemantics(), false));
		case AtomicRMWInst::FMax:
		return ConstantFP::get(C, APFloat::getInf(Ty->getFltSemantics(), true));
}		}
}		}

static Value buildMul(IRBuilder<> &B, Value LHS, Value *RHS) {		static Value buildMul(IRBuilder<> &B, Value LHS, Value *RHS) {
const ConstantInt *CI = dyn_cast<ConstantInt>(LHS);		const ConstantInt *CI = dyn_cast<ConstantInt>(LHS);
return (CI && CI->isOne()) ? RHS : B.CreateMul(LHS, RHS);		return (CI && CI->isOne()) ? RHS : B.CreateMul(LHS, RHS);
}		}

▲ Show 20 Lines • Show All 148 Lines • ▼ Show 20 Lines	case AtomicRMWInst::FSub: {
break;		break;
}		}
case AtomicRMWInst::And:		case AtomicRMWInst::And:
case AtomicRMWInst::Or:		case AtomicRMWInst::Or:
case AtomicRMWInst::Max:		case AtomicRMWInst::Max:
case AtomicRMWInst::Min:		case AtomicRMWInst::Min:
case AtomicRMWInst::UMax:		case AtomicRMWInst::UMax:
case AtomicRMWInst::UMin:		case AtomicRMWInst::UMin:
		case AtomicRMWInst::FMin:
		case AtomicRMWInst::FMax:
// These operations with a uniform value are idempotent: doing the atomic		// These operations with a uniform value are idempotent: doing the atomic
// operation multiple times has the same effect as doing it once.		// operation multiple times has the same effect as doing it once.
NewV = V;		NewV = V;
break;		break;

case AtomicRMWInst::Xor:		case AtomicRMWInst::Xor:
// The new value we will be contributing to the atomic operation is the		// The new value we will be contributing to the atomic operation is the
// old value times the parity of the number of active lanes.		// old value times the parity of the number of active lanes.
▲ Show 20 Lines • Show All 122 Lines • ▼ Show 20 Lines	if (ValDivergent) {
LaneOffset = buildMul(B, V, Mbcnt);		LaneOffset = buildMul(B, V, Mbcnt);
break;		break;
case AtomicRMWInst::And:		case AtomicRMWInst::And:
case AtomicRMWInst::Or:		case AtomicRMWInst::Or:
case AtomicRMWInst::Max:		case AtomicRMWInst::Max:
case AtomicRMWInst::Min:		case AtomicRMWInst::Min:
case AtomicRMWInst::UMax:		case AtomicRMWInst::UMax:
case AtomicRMWInst::UMin:		case AtomicRMWInst::UMin:
		case AtomicRMWInst::FMin:
		case AtomicRMWInst::FMax:
LaneOffset = B.CreateSelect(Cond, Identity, V);		LaneOffset = B.CreateSelect(Cond, Identity, V);
break;		break;
case AtomicRMWInst::Xor:		case AtomicRMWInst::Xor:
LaneOffset = buildMul(B, V, B.CreateAnd(Mbcnt, 1));		LaneOffset = buildMul(B, V, B.CreateAnd(Mbcnt, 1));
break;		break;
case AtomicRMWInst::FAdd:		case AtomicRMWInst::FAdd:
case AtomicRMWInst::FSub: {		case AtomicRMWInst::FSub: {
LaneOffset = B.CreateFMul(V, Mbcnt);		LaneOffset = B.CreateFMul(V, Mbcnt);
Show All 34 Lines

llvm/test/CodeGen/AMDGPU/global_atomic_optimizer_fp_rtn.ll

	Show First 20 Lines • Show All 509 Lines • ▼ Show 20 Lines
	; IR-DPP-NEXT: ret float [[TMP41]]			; IR-DPP-NEXT: ret float [[TMP41]]
	;			;
	%result = atomicrmw fsub ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fsub ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret float %result			ret float %result
	}			}

	define amdgpu_ps float @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(ptr addrspace(1) inreg %ptr, float inreg %val) #0 {			define amdgpu_ps float @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(ptr addrspace(1) inreg %ptr, float inreg %val) #0 {
	; IR-ITERATIVE-LABEL: @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(			; IR-ITERATIVE-LABEL: @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(
	; IR-ITERATIVE-NEXT: [[RESULT:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live()
	; IR-ITERATIVE-NEXT: ret float [[RESULT]]			; IR-ITERATIVE-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP20:%.]]
				; IR-ITERATIVE: 2:
				; IR-ITERATIVE-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-ITERATIVE-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-ITERATIVE-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-ITERATIVE-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-ITERATIVE-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0)
				; IR-ITERATIVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]])
				; IR-ITERATIVE-NEXT: [[TMP9:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP9]], label [[TMP10:%.]], label [[TMP12:%.]]
				; IR-ITERATIVE: 10:
				; IR-ITERATIVE-NEXT: [[TMP11:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4
				; IR-ITERATIVE-NEXT: br label [[TMP12]]
				; IR-ITERATIVE: 12:
				; IR-ITERATIVE-NEXT: [[TMP13:%.*]] = phi float [ poison, [[TMP2]] ], [ [[TMP11]], [[TMP10]] ]
				; IR-ITERATIVE-NEXT: [[TMP14:%.*]] = bitcast float [[TMP13]] to i32
				; IR-ITERATIVE-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.readfirstlane(i32 [[TMP14]])
				; IR-ITERATIVE-NEXT: [[TMP16:%.*]] = bitcast i32 [[TMP15]] to float
				; IR-ITERATIVE-NEXT: [[TMP17:%.*]] = uitofp i32 [[TMP8]] to float
				; IR-ITERATIVE-NEXT: [[TMP18:%.*]] = select i1 [[TMP9]], float 0x7FF0000000000000, float [[VAL]]
				; IR-ITERATIVE-NEXT: [[TMP19:%.*]] = call float @llvm.minnum.f32(float [[TMP16]], float [[TMP18]])
				; IR-ITERATIVE-NEXT: br label [[TMP20]]
				; IR-ITERATIVE: 20:
				; IR-ITERATIVE-NEXT: [[TMP21:%.]] = phi float [ poison, [[TMP0:%.]] ], [ [[TMP19]], [[TMP12]] ]
				; IR-ITERATIVE-NEXT: ret float [[TMP21]]
	;			;
	; IR-DPP-LABEL: @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(			; IR-DPP-LABEL: @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(
	; IR-DPP-NEXT: [[RESULT:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-DPP-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live()
	; IR-DPP-NEXT: ret float [[RESULT]]			; IR-DPP-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP20:%.]]
				; IR-DPP: 2:
				; IR-DPP-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-DPP-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-DPP-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-DPP-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-DPP-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0)
				; IR-DPP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]])
				; IR-DPP-NEXT: [[TMP9:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-DPP-NEXT: br i1 [[TMP9]], label [[TMP10:%.]], label [[TMP12:%.]]
				; IR-DPP: 10:
				; IR-DPP-NEXT: [[TMP11:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4
				; IR-DPP-NEXT: br label [[TMP12]]
				; IR-DPP: 12:
				; IR-DPP-NEXT: [[TMP13:%.*]] = phi float [ poison, [[TMP2]] ], [ [[TMP11]], [[TMP10]] ]
				; IR-DPP-NEXT: [[TMP14:%.*]] = bitcast float [[TMP13]] to i32
				; IR-DPP-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.readfirstlane(i32 [[TMP14]])
				; IR-DPP-NEXT: [[TMP16:%.*]] = bitcast i32 [[TMP15]] to float
				; IR-DPP-NEXT: [[TMP17:%.*]] = uitofp i32 [[TMP8]] to float
				; IR-DPP-NEXT: [[TMP18:%.*]] = select i1 [[TMP9]], float 0x7FF0000000000000, float [[VAL]]
				; IR-DPP-NEXT: [[TMP19:%.*]] = call float @llvm.minnum.f32(float [[TMP16]], float [[TMP18]])
				; IR-DPP-NEXT: br label [[TMP20]]
				; IR-DPP: 20:
				; IR-DPP-NEXT: [[TMP21:%.]] = phi float [ poison, [[TMP0:%.]] ], [ [[TMP19]], [[TMP12]] ]
				; IR-DPP-NEXT: ret float [[TMP21]]
	;			;
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fmin ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret float %result			ret float %result
	}			}

	define amdgpu_ps float @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(ptr addrspace(1) inreg %ptr, float %val) #0 {			define amdgpu_ps float @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(ptr addrspace(1) inreg %ptr, float %val) #0 {
	; IR-ITERATIVE-LABEL: @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(			; IR-ITERATIVE-LABEL: @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(
	; IR-ITERATIVE-NEXT: [[RESULT:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live()
	; IR-ITERATIVE-NEXT: ret float [[RESULT]]			; IR-ITERATIVE-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP18:%.]]
				; IR-ITERATIVE: 2:
				; IR-ITERATIVE-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-ITERATIVE-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-ITERATIVE-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-ITERATIVE-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-ITERATIVE-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0)
				; IR-ITERATIVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]])
				; IR-ITERATIVE-NEXT: [[TMP9:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-ITERATIVE-NEXT: br label [[COMPUTELOOP:%.*]]
				; IR-ITERATIVE: 10:
				; IR-ITERATIVE-NEXT: [[TMP11:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[TMP29:%.*]] syncscope("agent") monotonic, align 4
				; IR-ITERATIVE-NEXT: br label [[TMP12:%.*]]
				; IR-ITERATIVE: 12:
				; IR-ITERATIVE-NEXT: [[TMP13:%.]] = phi float [ poison, [[COMPUTEEND:%.]] ], [ [[TMP11]], [[TMP10:%.*]] ]
				; IR-ITERATIVE-NEXT: [[TMP14:%.*]] = bitcast float [[TMP13]] to i32
				; IR-ITERATIVE-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.readfirstlane(i32 [[TMP14]])
				; IR-ITERATIVE-NEXT: [[TMP16:%.*]] = bitcast i32 [[TMP15]] to float
				; IR-ITERATIVE-NEXT: [[TMP17:%.]] = call float @llvm.minnum.f32(float [[TMP16]], float [[TMP28:%.]])
				; IR-ITERATIVE-NEXT: br label [[TMP18]]
				; IR-ITERATIVE: 18:
				; IR-ITERATIVE-NEXT: [[TMP19:%.]] = phi float [ poison, [[TMP0:%.]] ], [ [[TMP17]], [[TMP12]] ]
				; IR-ITERATIVE-NEXT: ret float [[TMP19]]
				; IR-ITERATIVE: ComputeLoop:
				; IR-ITERATIVE-NEXT: [[ACCUMULATOR:%.*]] = phi float [ 0x7FF0000000000000, [[TMP2]] ], [ [[TMP29]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[OLDVALUEPHI:%.*]] = phi float [ poison, [[TMP2]] ], [ [[TMP28]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[ACTIVEBITS:%.]] = phi i64 [ [[TMP9]], [[TMP2]] ], [ [[TMP32:%.]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[TMP20:%.*]] = call i64 @llvm.cttz.i64(i64 [[ACTIVEBITS]], i1 true)
				; IR-ITERATIVE-NEXT: [[TMP21:%.*]] = trunc i64 [[TMP20]] to i32
				; IR-ITERATIVE-NEXT: [[TMP22:%.]] = bitcast float [[VAL:%.]] to i32
				; IR-ITERATIVE-NEXT: [[TMP23:%.*]] = call i32 @llvm.amdgcn.readlane(i32 [[TMP22]], i32 [[TMP21]])
				; IR-ITERATIVE-NEXT: [[TMP24:%.*]] = bitcast i32 [[TMP23]] to float
				; IR-ITERATIVE-NEXT: [[TMP25:%.*]] = bitcast float [[ACCUMULATOR]] to i32
				; IR-ITERATIVE-NEXT: [[TMP26:%.*]] = bitcast float [[OLDVALUEPHI]] to i32
				; IR-ITERATIVE-NEXT: [[TMP27:%.*]] = call i32 @llvm.amdgcn.writelane(i32 [[TMP25]], i32 [[TMP21]], i32 [[TMP26]])
				; IR-ITERATIVE-NEXT: [[TMP28]] = bitcast i32 [[TMP27]] to float
				; IR-ITERATIVE-NEXT: [[TMP29]] = call float @llvm.minnum.f32(float [[ACCUMULATOR]], float [[TMP24]])
				; IR-ITERATIVE-NEXT: [[TMP30:%.*]] = shl i64 1, [[TMP20]]
				; IR-ITERATIVE-NEXT: [[TMP31:%.*]] = xor i64 [[TMP30]], -1
				; IR-ITERATIVE-NEXT: [[TMP32]] = and i64 [[ACTIVEBITS]], [[TMP31]]
				; IR-ITERATIVE-NEXT: [[TMP33:%.*]] = icmp eq i64 [[TMP32]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP33]], label [[COMPUTEEND]], label [[COMPUTELOOP]]
				; IR-ITERATIVE: ComputeEnd:
				; IR-ITERATIVE-NEXT: [[TMP34:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP34]], label [[TMP10]], label [[TMP12]]
	;			;
	; IR-DPP-LABEL: @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(			; IR-DPP-LABEL: @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(
	; IR-DPP-NEXT: [[RESULT:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-DPP-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live()
	; IR-DPP-NEXT: ret float [[RESULT]]			; IR-DPP-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP40:%.]]
				; IR-DPP: 2:
				; IR-DPP-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-DPP-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-DPP-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-DPP-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				arsenmUnsubmitted Not Done Reply Inline Actions The canonical way to do this extract in the IR is trunc and trunc (lshr x, 32) arsenm: The canonical way to do this extract in the IR is trunc and trunc (lshr x, 32)
				; IR-DPP-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0)
				; IR-DPP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]])
				; IR-DPP-NEXT: [[TMP9:%.]] = bitcast float [[VAL:%.]] to i32
				; IR-DPP-NEXT: [[TMP10:%.*]] = call i32 @llvm.amdgcn.set.inactive.i32(i32 [[TMP9]], i32 2139095040)
				; IR-DPP-NEXT: [[TMP11:%.*]] = bitcast i32 [[TMP10]] to float
				; IR-DPP-NEXT: [[TMP12:%.*]] = bitcast i32 [[TMP9]] to float
				; IR-DPP-NEXT: [[TMP13:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP11]], i32 273, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP14:%.*]] = call float @llvm.minnum.f32(float [[TMP11]], float [[TMP13]])
				; IR-DPP-NEXT: [[TMP15:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP14]], i32 274, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP16:%.*]] = call float @llvm.minnum.f32(float [[TMP14]], float [[TMP15]])
				; IR-DPP-NEXT: [[TMP17:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP16]], i32 276, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP18:%.*]] = call float @llvm.minnum.f32(float [[TMP16]], float [[TMP17]])
				; IR-DPP-NEXT: [[TMP19:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP18]], i32 280, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP20:%.*]] = call float @llvm.minnum.f32(float [[TMP18]], float [[TMP19]])
				; IR-DPP-NEXT: [[TMP21:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP20]], i32 322, i32 10, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP22:%.*]] = call float @llvm.minnum.f32(float [[TMP20]], float [[TMP21]])
				; IR-DPP-NEXT: [[TMP23:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP22]], i32 323, i32 12, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP24:%.*]] = call float @llvm.minnum.f32(float [[TMP22]], float [[TMP23]])
				; IR-DPP-NEXT: [[TMP25:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP24]], i32 312, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP26:%.*]] = bitcast float [[TMP24]] to i32
				; IR-DPP-NEXT: [[TMP27:%.*]] = call i32 @llvm.amdgcn.readlane(i32 [[TMP26]], i32 63)
				; IR-DPP-NEXT: [[TMP28:%.*]] = bitcast i32 [[TMP27]] to float
				; IR-DPP-NEXT: [[TMP29:%.*]] = call float @llvm.amdgcn.strict.wwm.f32(float [[TMP28]])
				; IR-DPP-NEXT: [[TMP30:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-DPP-NEXT: br i1 [[TMP30]], label [[TMP31:%.]], label [[TMP33:%.]]
				; IR-DPP: 31:
				; IR-DPP-NEXT: [[TMP32:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[TMP29]] syncscope("agent") monotonic, align 4
				; IR-DPP-NEXT: br label [[TMP33]]
				; IR-DPP: 33:
				; IR-DPP-NEXT: [[TMP34:%.*]] = phi float [ poison, [[TMP2]] ], [ [[TMP32]], [[TMP31]] ]
				; IR-DPP-NEXT: [[TMP35:%.*]] = bitcast float [[TMP34]] to i32
				; IR-DPP-NEXT: [[TMP36:%.*]] = call i32 @llvm.amdgcn.readfirstlane(i32 [[TMP35]])
				; IR-DPP-NEXT: [[TMP37:%.*]] = bitcast i32 [[TMP36]] to float
				; IR-DPP-NEXT: [[TMP38:%.*]] = call float @llvm.amdgcn.strict.wwm.f32(float [[TMP25]])
				; IR-DPP-NEXT: [[TMP39:%.*]] = call float @llvm.minnum.f32(float [[TMP37]], float [[TMP38]])
				; IR-DPP-NEXT: br label [[TMP40]]
				; IR-DPP: 40:
				; IR-DPP-NEXT: [[TMP41:%.]] = phi float [ poison, [[TMP0:%.]] ], [ [[TMP39]], [[TMP33]] ]
				; IR-DPP-NEXT: ret float [[TMP41]]
	;			;
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fmin ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret float %result			ret float %result
	}			}

	define amdgpu_ps float @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(ptr addrspace(1) inreg %ptr, float inreg %val) #1{			define amdgpu_ps float @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(ptr addrspace(1) inreg %ptr, float inreg %val) #1{
	; IR-ITERATIVE-LABEL: @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(			; IR-ITERATIVE-LABEL: @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(
	; IR-ITERATIVE-NEXT: [[RESULT:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR7]]
	; IR-ITERATIVE-NEXT: ret float [[RESULT]]			; IR-ITERATIVE-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP20:%.]]
				; IR-ITERATIVE: 2:
				; IR-ITERATIVE-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-ITERATIVE-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-ITERATIVE-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-ITERATIVE-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP9:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP9]], label [[TMP10:%.]], label [[TMP12:%.]]
				; IR-ITERATIVE: 10:
				; IR-ITERATIVE-NEXT: [[TMP11:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4
				; IR-ITERATIVE-NEXT: br label [[TMP12]]
				; IR-ITERATIVE: 12:
				; IR-ITERATIVE-NEXT: [[TMP13:%.*]] = phi float [ poison, [[TMP2]] ], [ [[TMP11]], [[TMP10]] ]
				; IR-ITERATIVE-NEXT: [[TMP14:%.*]] = bitcast float [[TMP13]] to i32
				; IR-ITERATIVE-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.readfirstlane(i32 [[TMP14]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP16:%.*]] = bitcast i32 [[TMP15]] to float
				; IR-ITERATIVE-NEXT: [[TMP17:%.*]] = call float @llvm.experimental.constrained.uitofp.f32.i32(i32 [[TMP8]], metadata !"round.dynamic", metadata !"fpexcept.strict") #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP18:%.*]] = select i1 [[TMP9]], float 0xFFF0000000000000, float [[VAL]]
				; IR-ITERATIVE-NEXT: [[TMP19:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP16]], float [[TMP18]], metadata !"fpexcept.strict") #[[ATTR7]]
				; IR-ITERATIVE-NEXT: br label [[TMP20]]
				; IR-ITERATIVE: 20:
				; IR-ITERATIVE-NEXT: [[TMP21:%.]] = phi float [ poison, [[TMP0:%.]] ], [ [[TMP19]], [[TMP12]] ]
				; IR-ITERATIVE-NEXT: ret float [[TMP21]]
	;			;
	; IR-DPP-LABEL: @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(			; IR-DPP-LABEL: @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(
	; IR-DPP-NEXT: [[RESULT:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-DPP-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR8]]
	; IR-DPP-NEXT: ret float [[RESULT]]			; IR-DPP-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP20:%.]]
				; IR-DPP: 2:
				; IR-DPP-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-DPP-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-DPP-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-DPP-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP9:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-DPP-NEXT: br i1 [[TMP9]], label [[TMP10:%.]], label [[TMP12:%.]]
				; IR-DPP: 10:
				; IR-DPP-NEXT: [[TMP11:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4
				; IR-DPP-NEXT: br label [[TMP12]]
				; IR-DPP: 12:
				; IR-DPP-NEXT: [[TMP13:%.*]] = phi float [ poison, [[TMP2]] ], [ [[TMP11]], [[TMP10]] ]
				; IR-DPP-NEXT: [[TMP14:%.*]] = bitcast float [[TMP13]] to i32
				; IR-DPP-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.readfirstlane(i32 [[TMP14]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP16:%.*]] = bitcast i32 [[TMP15]] to float
				; IR-DPP-NEXT: [[TMP17:%.*]] = call float @llvm.experimental.constrained.uitofp.f32.i32(i32 [[TMP8]], metadata !"round.dynamic", metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP18:%.*]] = select i1 [[TMP9]], float 0xFFF0000000000000, float [[VAL]]
				; IR-DPP-NEXT: [[TMP19:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP16]], float [[TMP18]], metadata !"fpexcept.strict") #[[ATTR8]]
				arsenmUnsubmitted Not Done Reply Inline Actions This broke the strictfp handling (I thought this was supposed to fail the verifier now?) You probably need something like Builder.setIsFPConstrained( RMWI->getFunction()->hasFnAttribute(Attribute::StrictFP)); arsenm: This broke the strictfp handling (I thought this was supposed to fail the verifier now?) You…
				; IR-DPP-NEXT: br label [[TMP20]]
				; IR-DPP: 20:
				; IR-DPP-NEXT: [[TMP21:%.]] = phi float [ poison, [[TMP0:%.]] ], [ [[TMP19]], [[TMP12]] ]
				; IR-DPP-NEXT: ret float [[TMP21]]
	;			;
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fmax ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret float %result			ret float %result
	}			}

	define amdgpu_ps float @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(ptr addrspace(1) inreg %ptr, float %val) #1{			define amdgpu_ps float @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(ptr addrspace(1) inreg %ptr, float %val) #1{
	; IR-ITERATIVE-LABEL: @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(			; IR-ITERATIVE-LABEL: @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(
	; IR-ITERATIVE-NEXT: [[RESULT:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR7]]
	; IR-ITERATIVE-NEXT: ret float [[RESULT]]			; IR-ITERATIVE-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP18:%.]]
				; IR-ITERATIVE: 2:
				; IR-ITERATIVE-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-ITERATIVE-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-ITERATIVE-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-ITERATIVE-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP9:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: br label [[COMPUTELOOP:%.*]]
				; IR-ITERATIVE: 10:
				; IR-ITERATIVE-NEXT: [[TMP11:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[TMP29:%.*]] syncscope("agent") monotonic, align 4
				; IR-ITERATIVE-NEXT: br label [[TMP12:%.*]]
				; IR-ITERATIVE: 12:
				; IR-ITERATIVE-NEXT: [[TMP13:%.]] = phi float [ poison, [[COMPUTEEND:%.]] ], [ [[TMP11]], [[TMP10:%.*]] ]
				; IR-ITERATIVE-NEXT: [[TMP14:%.*]] = bitcast float [[TMP13]] to i32
				; IR-ITERATIVE-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.readfirstlane(i32 [[TMP14]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP16:%.*]] = bitcast i32 [[TMP15]] to float
				; IR-ITERATIVE-NEXT: [[TMP17:%.]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP16]], float [[TMP28:%.]], metadata !"fpexcept.strict") #[[ATTR7]]
				; IR-ITERATIVE-NEXT: br label [[TMP18]]
				; IR-ITERATIVE: 18:
				; IR-ITERATIVE-NEXT: [[TMP19:%.]] = phi float [ poison, [[TMP0:%.]] ], [ [[TMP17]], [[TMP12]] ]
				; IR-ITERATIVE-NEXT: ret float [[TMP19]]
				; IR-ITERATIVE: ComputeLoop:
				; IR-ITERATIVE-NEXT: [[ACCUMULATOR:%.*]] = phi float [ 0xFFF0000000000000, [[TMP2]] ], [ [[TMP29]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[OLDVALUEPHI:%.*]] = phi float [ poison, [[TMP2]] ], [ [[TMP28]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[ACTIVEBITS:%.]] = phi i64 [ [[TMP9]], [[TMP2]] ], [ [[TMP32:%.]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[TMP20:%.*]] = call i64 @llvm.cttz.i64(i64 [[ACTIVEBITS]], i1 true) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP21:%.*]] = trunc i64 [[TMP20]] to i32
				; IR-ITERATIVE-NEXT: [[TMP22:%.]] = bitcast float [[VAL:%.]] to i32
				; IR-ITERATIVE-NEXT: [[TMP23:%.*]] = call i32 @llvm.amdgcn.readlane(i32 [[TMP22]], i32 [[TMP21]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP24:%.*]] = bitcast i32 [[TMP23]] to float
				; IR-ITERATIVE-NEXT: [[TMP25:%.*]] = bitcast float [[ACCUMULATOR]] to i32
				; IR-ITERATIVE-NEXT: [[TMP26:%.*]] = bitcast float [[OLDVALUEPHI]] to i32
				; IR-ITERATIVE-NEXT: [[TMP27:%.*]] = call i32 @llvm.amdgcn.writelane(i32 [[TMP25]], i32 [[TMP21]], i32 [[TMP26]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP28]] = bitcast i32 [[TMP27]] to float
				; IR-ITERATIVE-NEXT: [[TMP29]] = call float @llvm.experimental.constrained.maxnum.f32(float [[ACCUMULATOR]], float [[TMP24]], metadata !"fpexcept.strict") #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP30:%.*]] = shl i64 1, [[TMP20]]
				; IR-ITERATIVE-NEXT: [[TMP31:%.*]] = xor i64 [[TMP30]], -1
				; IR-ITERATIVE-NEXT: [[TMP32]] = and i64 [[ACTIVEBITS]], [[TMP31]]
				; IR-ITERATIVE-NEXT: [[TMP33:%.*]] = icmp eq i64 [[TMP32]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP33]], label [[COMPUTEEND]], label [[COMPUTELOOP]]
				; IR-ITERATIVE: ComputeEnd:
				; IR-ITERATIVE-NEXT: [[TMP34:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP34]], label [[TMP10]], label [[TMP12]]
	;			;
	; IR-DPP-LABEL: @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(			; IR-DPP-LABEL: @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(
	; IR-DPP-NEXT: [[RESULT:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-DPP-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR8]]
	; IR-DPP-NEXT: ret float [[RESULT]]			; IR-DPP-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP40:%.]]
				; IR-DPP: 2:
				; IR-DPP-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-DPP-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-DPP-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-DPP-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP9:%.]] = bitcast float [[VAL:%.]] to i32
				; IR-DPP-NEXT: [[TMP10:%.*]] = call i32 @llvm.amdgcn.set.inactive.i32(i32 [[TMP9]], i32 -8388608) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP11:%.*]] = bitcast i32 [[TMP10]] to float
				; IR-DPP-NEXT: [[TMP12:%.*]] = bitcast i32 [[TMP9]] to float
				; IR-DPP-NEXT: [[TMP13:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP11]], i32 273, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP14:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP11]], float [[TMP13]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP15:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP14]], i32 274, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP16:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP14]], float [[TMP15]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP17:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP16]], i32 276, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP18:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP16]], float [[TMP17]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP19:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP18]], i32 280, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP20:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP18]], float [[TMP19]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP21:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP20]], i32 322, i32 10, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP22:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP20]], float [[TMP21]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP23:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP22]], i32 323, i32 12, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP24:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP22]], float [[TMP23]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP25:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP24]], i32 312, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP26:%.*]] = bitcast float [[TMP24]] to i32
				; IR-DPP-NEXT: [[TMP27:%.*]] = call i32 @llvm.amdgcn.readlane(i32 [[TMP26]], i32 63) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP28:%.*]] = bitcast i32 [[TMP27]] to float
				; IR-DPP-NEXT: [[TMP29:%.*]] = call float @llvm.amdgcn.strict.wwm.f32(float [[TMP28]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP30:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-DPP-NEXT: br i1 [[TMP30]], label [[TMP31:%.]], label [[TMP33:%.]]
				; IR-DPP: 31:
				; IR-DPP-NEXT: [[TMP32:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[TMP29]] syncscope("agent") monotonic, align 4
				; IR-DPP-NEXT: br label [[TMP33]]
				; IR-DPP: 33:
				; IR-DPP-NEXT: [[TMP34:%.*]] = phi float [ poison, [[TMP2]] ], [ [[TMP32]], [[TMP31]] ]
				; IR-DPP-NEXT: [[TMP35:%.*]] = bitcast float [[TMP34]] to i32
				; IR-DPP-NEXT: [[TMP36:%.*]] = call i32 @llvm.amdgcn.readfirstlane(i32 [[TMP35]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP37:%.*]] = bitcast i32 [[TMP36]] to float
				; IR-DPP-NEXT: [[TMP38:%.*]] = call float @llvm.amdgcn.strict.wwm.f32(float [[TMP25]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP39:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP37]], float [[TMP38]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: br label [[TMP40]]
				; IR-DPP: 40:
				; IR-DPP-NEXT: [[TMP41:%.]] = phi float [ poison, [[TMP0:%.]] ], [ [[TMP39]], [[TMP33]] ]
				; IR-DPP-NEXT: ret float [[TMP41]]
	;			;
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fmax ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret float %result			ret float %result
	}			}

	define amdgpu_ps float @global_atomic_fadd_uni_address_uni_value_system_scope_strictfp(ptr addrspace(1) inreg %ptr, float inreg %val) #2 {			define amdgpu_ps float @global_atomic_fadd_uni_address_uni_value_system_scope_strictfp(ptr addrspace(1) inreg %ptr, float inreg %val) #2 {
	; IR-ITERATIVE-LABEL: @global_atomic_fadd_uni_address_uni_value_system_scope_strictfp(			; IR-ITERATIVE-LABEL: @global_atomic_fadd_uni_address_uni_value_system_scope_strictfp(
	; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR7]]			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR7]]
	▲ Show 20 Lines • Show All 328 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/global_atomics_optimizer_fp_no_rtn.ll

	Show First 20 Lines • Show All 404 Lines • ▼ Show 20 Lines
	; IR-DPP-NEXT: ret void			; IR-DPP-NEXT: ret void
	;			;
	%result = atomicrmw fsub ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fsub ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret void			ret void
	}			}

	define amdgpu_ps void @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(ptr addrspace(1) inreg %ptr, float inreg %val) #0 {			define amdgpu_ps void @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(ptr addrspace(1) inreg %ptr, float inreg %val) #0 {
	; IR-ITERATIVE-LABEL: @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(			; IR-ITERATIVE-LABEL: @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(
	; IR-ITERATIVE-NEXT: [[RESULT:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live()
				; IR-ITERATIVE-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP13:%.]]
				; IR-ITERATIVE: 2:
				; IR-ITERATIVE-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-ITERATIVE-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-ITERATIVE-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-ITERATIVE-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-ITERATIVE-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0)
				; IR-ITERATIVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]])
				; IR-ITERATIVE-NEXT: [[TMP9:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP9]], label [[TMP10:%.]], label [[TMP12:%.]]
				; IR-ITERATIVE: 10:
				; IR-ITERATIVE-NEXT: [[TMP11:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4
				; IR-ITERATIVE-NEXT: br label [[TMP12]]
				; IR-ITERATIVE: 12:
				; IR-ITERATIVE-NEXT: br label [[TMP13]]
				; IR-ITERATIVE: 13:
	; IR-ITERATIVE-NEXT: ret void			; IR-ITERATIVE-NEXT: ret void
	;			;
	; IR-DPP-LABEL: @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(			; IR-DPP-LABEL: @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(
	; IR-DPP-NEXT: [[RESULT:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-DPP-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live()
				; IR-DPP-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP13:%.]]
				; IR-DPP: 2:
				; IR-DPP-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-DPP-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-DPP-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-DPP-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-DPP-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0)
				; IR-DPP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]])
				; IR-DPP-NEXT: [[TMP9:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-DPP-NEXT: br i1 [[TMP9]], label [[TMP10:%.]], label [[TMP12:%.]]
				; IR-DPP: 10:
				; IR-DPP-NEXT: [[TMP11:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4
				; IR-DPP-NEXT: br label [[TMP12]]
				; IR-DPP: 12:
				; IR-DPP-NEXT: br label [[TMP13]]
				; IR-DPP: 13:
	; IR-DPP-NEXT: ret void			; IR-DPP-NEXT: ret void
	;			;
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fmin ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret void			ret void
	}			}

	define amdgpu_ps void @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(ptr addrspace(1) inreg %ptr, float %val) #0 {			define amdgpu_ps void @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(ptr addrspace(1) inreg %ptr, float %val) #0 {
	; IR-ITERATIVE-LABEL: @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(			; IR-ITERATIVE-LABEL: @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(
	; IR-ITERATIVE-NEXT: [[RESULT:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live()
				; IR-ITERATIVE-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP13:%.]]
				; IR-ITERATIVE: 2:
				; IR-ITERATIVE-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-ITERATIVE-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-ITERATIVE-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-ITERATIVE-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-ITERATIVE-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0)
				; IR-ITERATIVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]])
				; IR-ITERATIVE-NEXT: [[TMP9:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-ITERATIVE-NEXT: br label [[COMPUTELOOP:%.*]]
				; IR-ITERATIVE: 10:
				; IR-ITERATIVE-NEXT: [[TMP11:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[TMP19:%.*]] syncscope("agent") monotonic, align 4
				; IR-ITERATIVE-NEXT: br label [[TMP12:%.*]]
				; IR-ITERATIVE: 12:
				; IR-ITERATIVE-NEXT: br label [[TMP13]]
				; IR-ITERATIVE: 13:
	; IR-ITERATIVE-NEXT: ret void			; IR-ITERATIVE-NEXT: ret void
				; IR-ITERATIVE: ComputeLoop:
				; IR-ITERATIVE-NEXT: [[ACCUMULATOR:%.*]] = phi float [ 0x7FF0000000000000, [[TMP2]] ], [ [[TMP19]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[ACTIVEBITS:%.]] = phi i64 [ [[TMP9]], [[TMP2]] ], [ [[TMP22:%.]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[TMP14:%.*]] = call i64 @llvm.cttz.i64(i64 [[ACTIVEBITS]], i1 true)
				; IR-ITERATIVE-NEXT: [[TMP15:%.*]] = trunc i64 [[TMP14]] to i32
				; IR-ITERATIVE-NEXT: [[TMP16:%.]] = bitcast float [[VAL:%.]] to i32
				; IR-ITERATIVE-NEXT: [[TMP17:%.*]] = call i32 @llvm.amdgcn.readlane(i32 [[TMP16]], i32 [[TMP15]])
				; IR-ITERATIVE-NEXT: [[TMP18:%.*]] = bitcast i32 [[TMP17]] to float
				; IR-ITERATIVE-NEXT: [[TMP19]] = call float @llvm.minnum.f32(float [[ACCUMULATOR]], float [[TMP18]])
				; IR-ITERATIVE-NEXT: [[TMP20:%.*]] = shl i64 1, [[TMP14]]
				; IR-ITERATIVE-NEXT: [[TMP21:%.*]] = xor i64 [[TMP20]], -1
				; IR-ITERATIVE-NEXT: [[TMP22]] = and i64 [[ACTIVEBITS]], [[TMP21]]
				; IR-ITERATIVE-NEXT: [[TMP23:%.*]] = icmp eq i64 [[TMP22]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP23]], label [[COMPUTEEND:%.*]], label [[COMPUTELOOP]]
				; IR-ITERATIVE: ComputeEnd:
				; IR-ITERATIVE-NEXT: [[TMP24:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP24]], label [[TMP10:%.*]], label [[TMP12]]
	;			;
	; IR-DPP-LABEL: @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(			; IR-DPP-LABEL: @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(
	; IR-DPP-NEXT: [[RESULT:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-DPP-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live()
				; IR-DPP-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP33:%.]]
				; IR-DPP: 2:
				; IR-DPP-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true)
				; IR-DPP-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-DPP-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-DPP-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-DPP-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0)
				; IR-DPP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]])
				; IR-DPP-NEXT: [[TMP9:%.]] = bitcast float [[VAL:%.]] to i32
				; IR-DPP-NEXT: [[TMP10:%.*]] = call i32 @llvm.amdgcn.set.inactive.i32(i32 [[TMP9]], i32 2139095040)
				; IR-DPP-NEXT: [[TMP11:%.*]] = bitcast i32 [[TMP10]] to float
				; IR-DPP-NEXT: [[TMP12:%.*]] = bitcast i32 [[TMP9]] to float
				; IR-DPP-NEXT: [[TMP13:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP11]], i32 273, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP14:%.*]] = call float @llvm.minnum.f32(float [[TMP11]], float [[TMP13]])
				; IR-DPP-NEXT: [[TMP15:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP14]], i32 274, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP16:%.*]] = call float @llvm.minnum.f32(float [[TMP14]], float [[TMP15]])
				; IR-DPP-NEXT: [[TMP17:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP16]], i32 276, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP18:%.*]] = call float @llvm.minnum.f32(float [[TMP16]], float [[TMP17]])
				; IR-DPP-NEXT: [[TMP19:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP18]], i32 280, i32 15, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP20:%.*]] = call float @llvm.minnum.f32(float [[TMP18]], float [[TMP19]])
				; IR-DPP-NEXT: [[TMP21:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP20]], i32 322, i32 10, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP22:%.*]] = call float @llvm.minnum.f32(float [[TMP20]], float [[TMP21]])
				; IR-DPP-NEXT: [[TMP23:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0x7FF0000000000000, float [[TMP22]], i32 323, i32 12, i32 15, i1 false)
				; IR-DPP-NEXT: [[TMP24:%.*]] = call float @llvm.minnum.f32(float [[TMP22]], float [[TMP23]])
				; IR-DPP-NEXT: [[TMP25:%.*]] = bitcast float [[TMP24]] to i32
				; IR-DPP-NEXT: [[TMP26:%.*]] = call i32 @llvm.amdgcn.readlane(i32 [[TMP25]], i32 63)
				; IR-DPP-NEXT: [[TMP27:%.*]] = bitcast i32 [[TMP26]] to float
				; IR-DPP-NEXT: [[TMP28:%.*]] = call float @llvm.amdgcn.strict.wwm.f32(float [[TMP27]])
				; IR-DPP-NEXT: [[TMP29:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-DPP-NEXT: br i1 [[TMP29]], label [[TMP30:%.]], label [[TMP32:%.]]
				; IR-DPP: 30:
				; IR-DPP-NEXT: [[TMP31:%.]] = atomicrmw fmin ptr addrspace(1) [[PTR:%.]], float [[TMP28]] syncscope("agent") monotonic, align 4
				; IR-DPP-NEXT: br label [[TMP32]]
				; IR-DPP: 32:
				; IR-DPP-NEXT: br label [[TMP33]]
				; IR-DPP: 33:
	; IR-DPP-NEXT: ret void			; IR-DPP-NEXT: ret void
	;			;
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fmin ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret void			ret void
	}			}

	define amdgpu_ps void @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(ptr addrspace(1) inreg %ptr, float inreg %val) #1{			define amdgpu_ps void @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(ptr addrspace(1) inreg %ptr, float inreg %val) #1{
	; IR-ITERATIVE-LABEL: @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(			; IR-ITERATIVE-LABEL: @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(
	; IR-ITERATIVE-NEXT: [[RESULT:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR7]]
				; IR-ITERATIVE-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP13:%.]]
				; IR-ITERATIVE: 2:
				; IR-ITERATIVE-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-ITERATIVE-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-ITERATIVE-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-ITERATIVE-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP9:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP9]], label [[TMP10:%.]], label [[TMP12:%.]]
				; IR-ITERATIVE: 10:
				; IR-ITERATIVE-NEXT: [[TMP11:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4
				; IR-ITERATIVE-NEXT: br label [[TMP12]]
				; IR-ITERATIVE: 12:
				; IR-ITERATIVE-NEXT: br label [[TMP13]]
				; IR-ITERATIVE: 13:
	; IR-ITERATIVE-NEXT: ret void			; IR-ITERATIVE-NEXT: ret void
	;			;
	; IR-DPP-LABEL: @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(			; IR-DPP-LABEL: @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe_structfp(
	; IR-DPP-NEXT: [[RESULT:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-DPP-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR8]]
				; IR-DPP-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP13:%.]]
				; IR-DPP: 2:
				; IR-DPP-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-DPP-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-DPP-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-DPP-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP9:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-DPP-NEXT: br i1 [[TMP9]], label [[TMP10:%.]], label [[TMP12:%.]]
				; IR-DPP: 10:
				; IR-DPP-NEXT: [[TMP11:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4
				; IR-DPP-NEXT: br label [[TMP12]]
				; IR-DPP: 12:
				; IR-DPP-NEXT: br label [[TMP13]]
				; IR-DPP: 13:
	; IR-DPP-NEXT: ret void			; IR-DPP-NEXT: ret void
	;			;
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fmax ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret void			ret void
	}			}

	define amdgpu_ps void @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(ptr addrspace(1) inreg %ptr, float %val) #1{			define amdgpu_ps void @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(ptr addrspace(1) inreg %ptr, float %val) #1{
	; IR-ITERATIVE-LABEL: @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(			; IR-ITERATIVE-LABEL: @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(
	; IR-ITERATIVE-NEXT: [[RESULT:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-ITERATIVE-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR7]]
				; IR-ITERATIVE-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP13:%.]]
				; IR-ITERATIVE: 2:
				; IR-ITERATIVE-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-ITERATIVE-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-ITERATIVE-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-ITERATIVE-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP9:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: br label [[COMPUTELOOP:%.*]]
				; IR-ITERATIVE: 10:
				; IR-ITERATIVE-NEXT: [[TMP11:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[TMP19:%.*]] syncscope("agent") monotonic, align 4
				; IR-ITERATIVE-NEXT: br label [[TMP12:%.*]]
				; IR-ITERATIVE: 12:
				; IR-ITERATIVE-NEXT: br label [[TMP13]]
				; IR-ITERATIVE: 13:
	; IR-ITERATIVE-NEXT: ret void			; IR-ITERATIVE-NEXT: ret void
				; IR-ITERATIVE: ComputeLoop:
				; IR-ITERATIVE-NEXT: [[ACCUMULATOR:%.*]] = phi float [ 0xFFF0000000000000, [[TMP2]] ], [ [[TMP19]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[ACTIVEBITS:%.]] = phi i64 [ [[TMP9]], [[TMP2]] ], [ [[TMP22:%.]], [[COMPUTELOOP]] ]
				; IR-ITERATIVE-NEXT: [[TMP14:%.*]] = call i64 @llvm.cttz.i64(i64 [[ACTIVEBITS]], i1 true) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP15:%.*]] = trunc i64 [[TMP14]] to i32
				; IR-ITERATIVE-NEXT: [[TMP16:%.]] = bitcast float [[VAL:%.]] to i32
				; IR-ITERATIVE-NEXT: [[TMP17:%.*]] = call i32 @llvm.amdgcn.readlane(i32 [[TMP16]], i32 [[TMP15]]) #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP18:%.*]] = bitcast i32 [[TMP17]] to float
				; IR-ITERATIVE-NEXT: [[TMP19]] = call float @llvm.experimental.constrained.maxnum.f32(float [[ACCUMULATOR]], float [[TMP18]], metadata !"fpexcept.strict") #[[ATTR7]]
				; IR-ITERATIVE-NEXT: [[TMP20:%.*]] = shl i64 1, [[TMP14]]
				; IR-ITERATIVE-NEXT: [[TMP21:%.*]] = xor i64 [[TMP20]], -1
				; IR-ITERATIVE-NEXT: [[TMP22]] = and i64 [[ACTIVEBITS]], [[TMP21]]
				; IR-ITERATIVE-NEXT: [[TMP23:%.*]] = icmp eq i64 [[TMP22]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP23]], label [[COMPUTEEND:%.*]], label [[COMPUTELOOP]]
				; IR-ITERATIVE: ComputeEnd:
				; IR-ITERATIVE-NEXT: [[TMP24:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-ITERATIVE-NEXT: br i1 [[TMP24]], label [[TMP10:%.*]], label [[TMP12]]
	;			;
	; IR-DPP-LABEL: @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(			; IR-DPP-LABEL: @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe_structfp(
	; IR-DPP-NEXT: [[RESULT:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[VAL:%.*]] syncscope("agent") monotonic, align 4			; IR-DPP-NEXT: [[TMP1:%.*]] = call i1 @llvm.amdgcn.ps.live() #[[ATTR8]]
				; IR-DPP-NEXT: br i1 [[TMP1]], label [[TMP2:%.]], label [[TMP33:%.]]
				; IR-DPP: 2:
				; IR-DPP-NEXT: [[TMP3:%.*]] = call i64 @llvm.amdgcn.ballot.i64(i1 true) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP3]] to i32
				; IR-DPP-NEXT: [[TMP5:%.*]] = lshr i64 [[TMP3]], 32
				; IR-DPP-NEXT: [[TMP6:%.*]] = trunc i64 [[TMP5]] to i32
				; IR-DPP-NEXT: [[TMP7:%.*]] = call i32 @llvm.amdgcn.mbcnt.lo(i32 [[TMP4]], i32 0) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.mbcnt.hi(i32 [[TMP6]], i32 [[TMP7]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP9:%.]] = bitcast float [[VAL:%.]] to i32
				; IR-DPP-NEXT: [[TMP10:%.*]] = call i32 @llvm.amdgcn.set.inactive.i32(i32 [[TMP9]], i32 -8388608) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP11:%.*]] = bitcast i32 [[TMP10]] to float
				; IR-DPP-NEXT: [[TMP12:%.*]] = bitcast i32 [[TMP9]] to float
				; IR-DPP-NEXT: [[TMP13:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP11]], i32 273, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP14:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP11]], float [[TMP13]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP15:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP14]], i32 274, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP16:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP14]], float [[TMP15]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP17:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP16]], i32 276, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP18:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP16]], float [[TMP17]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP19:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP18]], i32 280, i32 15, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP20:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP18]], float [[TMP19]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP21:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP20]], i32 322, i32 10, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP22:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP20]], float [[TMP21]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP23:%.*]] = call float @llvm.amdgcn.update.dpp.f32(float 0xFFF0000000000000, float [[TMP22]], i32 323, i32 12, i32 15, i1 false) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP24:%.*]] = call float @llvm.experimental.constrained.maxnum.f32(float [[TMP22]], float [[TMP23]], metadata !"fpexcept.strict") #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP25:%.*]] = bitcast float [[TMP24]] to i32
				; IR-DPP-NEXT: [[TMP26:%.*]] = call i32 @llvm.amdgcn.readlane(i32 [[TMP25]], i32 63) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP27:%.*]] = bitcast i32 [[TMP26]] to float
				; IR-DPP-NEXT: [[TMP28:%.*]] = call float @llvm.amdgcn.strict.wwm.f32(float [[TMP27]]) #[[ATTR8]]
				; IR-DPP-NEXT: [[TMP29:%.*]] = icmp eq i32 [[TMP8]], 0
				; IR-DPP-NEXT: br i1 [[TMP29]], label [[TMP30:%.]], label [[TMP32:%.]]
				; IR-DPP: 30:
				; IR-DPP-NEXT: [[TMP31:%.]] = atomicrmw fmax ptr addrspace(1) [[PTR:%.]], float [[TMP28]] syncscope("agent") monotonic, align 4
				; IR-DPP-NEXT: br label [[TMP32]]
				; IR-DPP: 32:
				; IR-DPP-NEXT: br label [[TMP33]]
				; IR-DPP: 33:
	; IR-DPP-NEXT: ret void			; IR-DPP-NEXT: ret void
	;			;
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic			%result = atomicrmw fmax ptr addrspace(1) %ptr, float %val syncscope("agent") monotonic
	ret void			ret void
	}			}

	define amdgpu_ps void @global_atomic_fadd_uni_address_uni_value_system_scope_strictfp(ptr addrspace(1) inreg %ptr, float inreg %val) #2 {			define amdgpu_ps void @global_atomic_fadd_uni_address_uni_value_system_scope_strictfp(ptr addrspace(1) inreg %ptr, float inreg %val) #2 {
	; IR-ITERATIVE-LABEL: @global_atomic_fadd_uni_address_uni_value_system_scope_strictfp(			; IR-ITERATIVE-LABEL: @global_atomic_fadd_uni_address_uni_value_system_scope_strictfp(
	▲ Show 20 Lines • Show All 294 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmax.ll

	Show All 11 Lines
	; RUN: llc -march=amdgcn -mcpu=gfx1100 -mattr=-wavefrontsize32,+wavefrontsize64 -amdgpu-atomic-optimizer-strategy=DPP -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GFX1164-DPP %s			; RUN: llc -march=amdgcn -mcpu=gfx1100 -mattr=-wavefrontsize32,+wavefrontsize64 -amdgpu-atomic-optimizer-strategy=DPP -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GFX1164-DPP %s
	; RUN: llc -march=amdgcn -mcpu=gfx1100 -mattr=+wavefrontsize32,-wavefrontsize64 -amdgpu-atomic-optimizer-strategy=DPP -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GFX1132-DPP %s			; RUN: llc -march=amdgcn -mcpu=gfx1100 -mattr=+wavefrontsize32,-wavefrontsize64 -amdgpu-atomic-optimizer-strategy=DPP -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GFX1132-DPP %s

	declare float @div.float.value()			declare float @div.float.value()

	define amdgpu_kernel void @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
				; GFX7LESS-NEXT: v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
				; GFX7LESS-NEXT: v_mbcnt_hi_u32_b32_e32 v0, exec_hi, v0
				; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX7LESS-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX7LESS-NEXT: s_cbranch_execz .LBB0_3
				; GFX7LESS-NEXT: ; %bb.1:
	; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0			; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0
	; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000			; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2
	; GFX7LESS-NEXT: s_mov_b32 s2, -1			; GFX7LESS-NEXT: s_mov_b32 s2, -1
	; GFX7LESS-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX7LESS-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1			; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1
	; GFX7LESS-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX7LESS-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX7LESS-NEXT: s_waitcnt expcnt(0)			; GFX7LESS-NEXT: s_waitcnt expcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1			; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1
	; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0			; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0
	; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc			; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc
	; GFX7LESS-NEXT: s_waitcnt vmcnt(0)			; GFX7LESS-NEXT: s_waitcnt vmcnt(0)
	; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1			; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1
	; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]			; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2
	; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]			; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]
	; GFX7LESS-NEXT: s_cbranch_execnz .LBB0_1			; GFX7LESS-NEXT: s_cbranch_execnz .LBB0_2
	; GFX7LESS-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX7LESS-NEXT: .LBB0_3:
	; GFX7LESS-NEXT: s_endpgm			; GFX7LESS-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX9-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-NEXT: s_cbranch_execz .LBB0_3
				; GFX9-NEXT: ; %bb.1:
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b64 s[2:3], 0			; GFX9-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-NEXT: v_mov_b32_e32 v2, 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s4			; GFX9-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX9-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX9-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB0_1			; GFX9-NEXT: s_cbranch_execnz .LBB0_2
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB0_3:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-NEXT: s_cbranch_execz .LBB0_3
				; GFX1064-NEXT: ; %bb.1:
	; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX1064-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1064-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB0_1			; GFX1064-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB0_3:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-NEXT: s_cbranch_execz .LBB0_3
				; GFX1032-NEXT: ; %bb.1:
	; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-NEXT: s_mov_b32 s2, 0			; GFX1032-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1032-NEXT: .LBB0_1: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1032-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB0_1			; GFX1032-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB0_3:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_cbranch_execz .LBB0_3
				; GFX1164-NEXT: ; %bb.1:
	; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX1164-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1164-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB0_1			; GFX1164-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB0_3:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_cbranch_execz .LBB0_3
				; GFX1132-NEXT: ; %bb.1:
	; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-NEXT: s_mov_b32 s2, 0			; GFX1132-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1132-NEXT: .LBB0_1: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1132-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB0_1			; GFX1132-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB0_3:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
				; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX9-DPP-NEXT: ; %bb.1:
	; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-DPP-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX9-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB0_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX1064-DPP-NEXT: ; %bb.1:
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-DPP-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB0_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX1032-DPP-NEXT: ; %bb.1:
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-DPP-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-DPP-NEXT: s_mov_b32 s2, 0			; GFX1032-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: .LBB0_1: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB0_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX1164-DPP-NEXT: ; %bb.1:
	; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-DPP-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB0_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_agent_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX1132-DPP-NEXT: ; %bb.1:
	; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-DPP-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-DPP-NEXT: s_mov_b32 s2, 0			; GFX1132-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: .LBB0_1: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB0_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float 4.0 syncscope("agent") monotonic, align 4			%result = atomicrmw fmax ptr addrspace(1) %ptr, float 4.0 syncscope("agent") monotonic, align 4
	ret void			ret void
	}			}

	define amdgpu_kernel void @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmax_uni_address_div_value_agent_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; GFX9-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX9-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-NEXT: s_mov_b32 s38, -1			; GFX9-NEXT: s_mov_b32 s38, -1
	; GFX9-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-NEXT: s_add_u32 s36, s36, s11			; GFX9-NEXT: s_add_u32 s36, s36, s11
	; GFX9-NEXT: s_addc_u32 s37, s37, 0			; GFX9-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-NEXT: s_mov_b32 s12, s8			; GFX9-NEXT: s_mov_b32 s12, s8
	; GFX9-NEXT: s_add_u32 s8, s4, 44			; GFX9-NEXT: s_add_u32 s8, s34, 44
	; GFX9-NEXT: s_mov_b32 s13, s9			; GFX9-NEXT: s_mov_b32 s13, s9
	; GFX9-NEXT: s_addc_u32 s9, s5, 0			; GFX9-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-NEXT: s_getpc_b64 s[4:5]			; GFX9-NEXT: s_getpc_b64 s[4:5]
	; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-NEXT: s_mov_b32 s14, s10			; GFX9-NEXT: s_mov_b32 s14, s10
	; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-NEXT: s_mov_b32 s32, 0			; GFX9-NEXT: s_mov_b32 s32, 0
	; GFX9-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-NEXT: s_mov_b64 s[0:1], exec
	; GFX9-NEXT: s_mov_b64 s[0:1], 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX9-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX9-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX9-NEXT: s_ff1_i32_b32 s2, s1
				; GFX9-NEXT: s_ff1_i32_b32 s3, s0
				; GFX9-NEXT: s_add_i32 s2, s2, 32
				; GFX9-NEXT: s_min_u32 s2, s3, s2
				; GFX9-NEXT: v_readlane_b32 s4, v0, s2
				; GFX9-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX9-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX9-NEXT: v_max_f32_e64 v2, s4, s4
				; GFX9-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX9-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX9-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX9-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX9-NEXT: s_cbranch_execz .LBB1_5
				; GFX9-NEXT: ; %bb.3:
				; GFX9-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-NEXT: v_mov_b32_e32 v3, 0
				; GFX9-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX9-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_max_f32_e32 v0, v0, v2			; GFX9-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX9-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB1_1			; GFX9-NEXT: s_cbranch_execnz .LBB1_4
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB1_5:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
	; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-NEXT: s_mov_b32 s38, -1			; GFX1064-NEXT: s_mov_b32 s38, -1
	; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-NEXT: s_add_u32 s36, s36, s11			; GFX1064-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-NEXT: s_mov_b32 s12, s8			; GFX1064-NEXT: s_mov_b32 s12, s8
	; GFX1064-NEXT: s_add_u32 s8, s4, 44			; GFX1064-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-NEXT: s_mov_b32 s13, s9			; GFX1064-NEXT: s_mov_b32 s13, s9
	; GFX1064-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-NEXT: s_mov_b32 s14, s10			; GFX1064-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_getpc_b64 s[6:7]			; GFX1064-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-NEXT: s_mov_b32 s14, s10
				; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b32 s32, 0			; GFX1064-NEXT: s_mov_b32 s32, 0
	; GFX1064-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1064-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-NEXT: s_mov_b64 s[0:1], exec
	; GFX1064-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX1064-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1064-NEXT: s_ff1_i32_b32 s2, s1
				; GFX1064-NEXT: s_ff1_i32_b32 s3, s0
				; GFX1064-NEXT: s_add_i32 s2, s2, 32
				; GFX1064-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1064-NEXT: s_min_u32 s2, s3, s2
				; GFX1064-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1064-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1064-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1064-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX1064-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1064-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX1064-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1064-NEXT: s_cbranch_execz .LBB1_5
				; GFX1064-NEXT: ; %bb.3:
				; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-NEXT: v_mov_b32_e32 v3, 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1064-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1064-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1064-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1064-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB1_1			; GFX1064-NEXT: s_cbranch_execnz .LBB1_4
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB1_5:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
	; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-NEXT: s_mov_b32 s38, -1			; GFX1032-NEXT: s_mov_b32 s38, -1
	; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-NEXT: s_add_u32 s36, s36, s11			; GFX1032-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-NEXT: s_mov_b32 s12, s8			; GFX1032-NEXT: s_mov_b32 s12, s8
	; GFX1032-NEXT: s_add_u32 s8, s4, 44			; GFX1032-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-NEXT: s_mov_b32 s13, s9			; GFX1032-NEXT: s_mov_b32 s13, s9
	; GFX1032-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-NEXT: s_mov_b32 s14, s10			; GFX1032-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_getpc_b64 s[6:7]			; GFX1032-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-NEXT: s_mov_b32 s14, s10
				; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b32 s32, 0			; GFX1032-NEXT: s_mov_b32 s32, 0
	; GFX1032-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1032-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-NEXT: s_mov_b32 s0, exec_lo
	; GFX1032-NEXT: s_mov_b32 s0, 0			; GFX1032-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX1032-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1032-NEXT: s_ff1_i32_b32 s1, s0
				; GFX1032-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1032-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1032-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1032-NEXT: s_andn2_b32 s0, s0, s1
				; GFX1032-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1032-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1032-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1032-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX1032-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1032-NEXT: s_cbranch_execz .LBB1_5
				; GFX1032-NEXT: ; %bb.3:
				; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-NEXT: v_mov_b32_e32 v3, 0
				; GFX1032-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1032-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1032-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1032-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB1_1			; GFX1032-NEXT: s_cbranch_execnz .LBB1_4
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB1_5:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-NEXT: s_mov_b32 s12, s8			; GFX1164-NEXT: s_mov_b32 s12, s8
	; GFX1164-NEXT: s_add_u32 s8, s4, 44			; GFX1164-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-NEXT: s_mov_b32 s13, s9			; GFX1164-NEXT: s_mov_b32 s13, s9
	; GFX1164-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-NEXT: s_mov_b32 s14, s10			; GFX1164-NEXT: s_mov_b32 s14, s10
	; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-NEXT: s_mov_b32 s32, 0			; GFX1164-NEXT: s_mov_b32 s32, 0
	; GFX1164-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1164-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-NEXT: s_mov_b64 s[0:1], exec
	; GFX1164-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX1164-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(SKIP_4) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: s_ctz_i32_b32 s2, s1
				; GFX1164-NEXT: s_ctz_i32_b32 s3, s0
				; GFX1164-NEXT: s_add_i32 s2, s2, 32
				; GFX1164-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1164-NEXT: s_min_u32 s2, s3, s2
				; GFX1164-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1164-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1164-NEXT: s_and_not1_b64 s[0:1], s[0:1], s[2:3]
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1164-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX1164-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1164-NEXT: s_cbranch_execz .LBB1_5
				; GFX1164-NEXT: ; %bb.3:
				; GFX1164-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-NEXT: v_mov_b32_e32 v3, 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1164-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1164-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB1_1			; GFX1164-NEXT: s_cbranch_execnz .LBB1_4
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB1_5:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
	; GFX1132-NEXT: s_add_u32 s8, s4, 44			; GFX1132-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-NEXT: s_getpc_b64 s[6:7]			; GFX1132-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-NEXT: s_mov_b32 s12, s13			; GFX1132-NEXT: s_mov_b32 s12, s13
				; GFX1132-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-NEXT: s_mov_b32 s13, s14			; GFX1132-NEXT: s_mov_b32 s13, s14
	; GFX1132-NEXT: s_mov_b32 s14, s15			; GFX1132-NEXT: s_mov_b32 s14, s15
	; GFX1132-NEXT: s_mov_b32 s32, 0			; GFX1132-NEXT: s_mov_b32 s32, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1132-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-NEXT: s_mov_b32 s0, exec_lo
	; GFX1132-NEXT: s_mov_b32 s0, 0			; GFX1132-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX1132-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: s_ctz_i32_b32 s1, s0
				; GFX1132-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1132-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1132-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(SALU_CYCLE_1)
				; GFX1132-NEXT: s_and_not1_b32 s0, s0, s1
				; GFX1132-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1132-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1132-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX1132-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1132-NEXT: s_cbranch_execz .LBB1_5
				; GFX1132-NEXT: ; %bb.3:
				; GFX1132-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-NEXT: v_dual_mov_b32 v3, 0 :: v_dual_max_f32 v2, v2, v2
				; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1132-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1132-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB1_1			; GFX1132-NEXT: s_cbranch_execnz .LBB1_4
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB1_5:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
	; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-DPP-NEXT: s_mov_b32 s38, -1			; GFX9-DPP-NEXT: s_mov_b32 s38, -1
	; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11
	; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-DPP-NEXT: s_mov_b32 s12, s8			; GFX9-DPP-NEXT: s_mov_b32 s12, s8
	; GFX9-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX9-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX9-DPP-NEXT: s_mov_b32 s13, s9			; GFX9-DPP-NEXT: s_mov_b32 s13, s9
	; GFX9-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX9-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]			; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-DPP-NEXT: s_mov_b32 s14, s10			; GFX9-DPP-NEXT: s_mov_b32 s14, s10
	; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-DPP-NEXT: s_mov_b32 s32, 0			; GFX9-DPP-NEXT: s_mov_b32 s32, 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v3, v0
	; GFX9-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX9-DPP-NEXT: s_nop 0
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:1 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:2 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:4 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:8 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_bcast:15 row_mask:0xa bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v4, v3 row_bcast:31 row_mask:0xc bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX9-DPP-NEXT: v_readlane_b32 s4, v3, 63
				; GFX9-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX9-DPP-NEXT: ; %bb.1:
				; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-DPP-NEXT: v_max_f32_e64 v6, s4, s4
				; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX9-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB1_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
	; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-DPP-NEXT: s_mov_b32 s38, -1			; GFX1064-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s12, s8			; GFX1064-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1064-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1064-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-DPP-NEXT: s_mov_b32 s13, s9			; GFX1064-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1064-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s14, s10			; GFX1064-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1064-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b32 s32, 0			; GFX1064-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1064-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1064-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_readlane_b32 s2, v3, 32
				; GFX1064-DPP-NEXT: v_readlane_b32 s3, v3, 0
				; GFX1064-DPP-NEXT: v_max_f32_e64 v3, s2, s2
				; GFX1064-DPP-NEXT: v_max_f32_e64 v4, s3, s3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v0
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX1064-DPP-NEXT: ; %bb.1:
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1064-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1064-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB1_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
	; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-DPP-NEXT: s_mov_b32 s38, -1			; GFX1032-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s12, s8			; GFX1032-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1032-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1032-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-DPP-NEXT: s_mov_b32 s13, s9			; GFX1032-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1032-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s14, s10			; GFX1032-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1032-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b32 s32, 0			; GFX1032-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
	; GFX1032-DPP-NEXT: s_mov_b32 s0, 0			; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1032-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1032-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX1032-DPP-NEXT: ; %bb.1:
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1032-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1032-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB1_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-DPP-NEXT: s_mov_b32 s12, s8			; GFX1164-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1164-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1164-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-DPP-NEXT: s_mov_b32 s13, s9			; GFX1164-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1164-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-DPP-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-DPP-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-DPP-NEXT: s_mov_b32 s14, s10			; GFX1164-DPP-NEXT: s_mov_b32 s14, s10
	; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-DPP-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-DPP-NEXT: s_mov_b32 s32, 0			; GFX1164-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, 0xff800000
	; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1164-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0xff800000
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_waitcnt_depctr 0xfff
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_permlane64_b32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX1164-DPP-NEXT: ; %bb.1:
				; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1164-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1164-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v4, v6
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v4, v5
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1164-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB1_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_div_value_agent_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
	; GFX1132-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1132-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1132-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-DPP-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b32 s12, s13			; GFX1132-DPP-NEXT: s_mov_b32 s12, s13
				; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-DPP-NEXT: s_mov_b32 s13, s14			; GFX1132-DPP-NEXT: s_mov_b32 s13, s14
	; GFX1132-DPP-NEXT: s_mov_b32 s14, s15			; GFX1132-DPP-NEXT: s_mov_b32 s14, s15
	; GFX1132-DPP-NEXT: s_mov_b32 s32, 0			; GFX1132-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, 0xff800000
	; GFX1132-DPP-NEXT: s_mov_b32 s0, 0			; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1132-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0xff800000
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v2, v2 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v2, v1
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1132-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX1132-DPP-NEXT: ; %bb.1:
				; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1132-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1132-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v4, v6
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v4, v5
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1132-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB1_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%divValue = call float @div.float.value()			%divValue = call float @div.float.value()
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float %divValue syncscope("agent") monotonic, align 4			%result = atomicrmw fmax ptr addrspace(1) %ptr, float %divValue syncscope("agent") monotonic, align 4
	ret void			ret void
	}			}

	define amdgpu_kernel void @global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
				; GFX7LESS-NEXT: v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
				; GFX7LESS-NEXT: v_mbcnt_hi_u32_b32_e32 v0, exec_hi, v0
				; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX7LESS-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX7LESS-NEXT: s_cbranch_execz .LBB2_3
				; GFX7LESS-NEXT: ; %bb.1:
	; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0			; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0
	; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000			; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2
	; GFX7LESS-NEXT: s_mov_b32 s2, -1			; GFX7LESS-NEXT: s_mov_b32 s2, -1
	; GFX7LESS-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX7LESS-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1			; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1
	; GFX7LESS-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX7LESS-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX7LESS-NEXT: s_waitcnt expcnt(0)			; GFX7LESS-NEXT: s_waitcnt expcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1			; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1
	; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0			; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0
	; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc			; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc
	; GFX7LESS-NEXT: s_waitcnt vmcnt(0)			; GFX7LESS-NEXT: s_waitcnt vmcnt(0)
	; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1			; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1
	; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]			; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2
	; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]			; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]
	; GFX7LESS-NEXT: s_cbranch_execnz .LBB2_1			; GFX7LESS-NEXT: s_cbranch_execnz .LBB2_2
	; GFX7LESS-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX7LESS-NEXT: .LBB2_3:
	; GFX7LESS-NEXT: s_endpgm			; GFX7LESS-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX9-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-NEXT: s_cbranch_execz .LBB2_3
				; GFX9-NEXT: ; %bb.1:
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b64 s[2:3], 0			; GFX9-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-NEXT: v_mov_b32_e32 v2, 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s4			; GFX9-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX9-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX9-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB2_1			; GFX9-NEXT: s_cbranch_execnz .LBB2_2
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB2_3:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-NEXT: s_cbranch_execz .LBB2_3
				; GFX1064-NEXT: ; %bb.1:
	; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX1064-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1064-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB2_1			; GFX1064-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB2_3:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-NEXT: s_cbranch_execz .LBB2_3
				; GFX1032-NEXT: ; %bb.1:
	; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-NEXT: s_mov_b32 s2, 0			; GFX1032-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1032-NEXT: .LBB2_1: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1032-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB2_1			; GFX1032-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB2_3:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_cbranch_execz .LBB2_3
				; GFX1164-NEXT: ; %bb.1:
	; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX1164-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1164-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB2_1			; GFX1164-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB2_3:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_cbranch_execz .LBB2_3
				; GFX1132-NEXT: ; %bb.1:
	; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-NEXT: s_mov_b32 s2, 0			; GFX1132-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1132-NEXT: .LBB2_1: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1132-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB2_1			; GFX1132-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB2_3:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
				; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX9-DPP-NEXT: ; %bb.1:
	; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-DPP-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX9-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB2_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX1064-DPP-NEXT: ; %bb.1:
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-DPP-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB2_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX1032-DPP-NEXT: ; %bb.1:
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-DPP-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-DPP-NEXT: s_mov_b32 s2, 0			; GFX1032-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: .LBB2_1: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB2_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX1164-DPP-NEXT: ; %bb.1:
	; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-DPP-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB2_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX1132-DPP-NEXT: ; %bb.1:
	; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-DPP-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-DPP-NEXT: s_mov_b32 s2, 0			; GFX1132-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: .LBB2_1: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB2_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float 4.0 syncscope("one-as") monotonic			%result = atomicrmw fmax ptr addrspace(1) %ptr, float 4.0 syncscope("one-as") monotonic
	ret void			ret void
	}			}


	define amdgpu_kernel void @global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; GFX9-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX9-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-NEXT: s_mov_b32 s38, -1			; GFX9-NEXT: s_mov_b32 s38, -1
	; GFX9-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-NEXT: s_add_u32 s36, s36, s11			; GFX9-NEXT: s_add_u32 s36, s36, s11
	; GFX9-NEXT: s_addc_u32 s37, s37, 0			; GFX9-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-NEXT: s_mov_b32 s12, s8			; GFX9-NEXT: s_mov_b32 s12, s8
	; GFX9-NEXT: s_add_u32 s8, s4, 44			; GFX9-NEXT: s_add_u32 s8, s34, 44
	; GFX9-NEXT: s_mov_b32 s13, s9			; GFX9-NEXT: s_mov_b32 s13, s9
	; GFX9-NEXT: s_addc_u32 s9, s5, 0			; GFX9-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-NEXT: s_getpc_b64 s[4:5]			; GFX9-NEXT: s_getpc_b64 s[4:5]
	; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-NEXT: s_mov_b32 s14, s10			; GFX9-NEXT: s_mov_b32 s14, s10
	; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-NEXT: s_mov_b32 s32, 0			; GFX9-NEXT: s_mov_b32 s32, 0
	; GFX9-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-NEXT: s_mov_b64 s[0:1], exec
	; GFX9-NEXT: s_mov_b64 s[0:1], 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX9-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX9-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX9-NEXT: s_ff1_i32_b32 s2, s1
				; GFX9-NEXT: s_ff1_i32_b32 s3, s0
				; GFX9-NEXT: s_add_i32 s2, s2, 32
				; GFX9-NEXT: s_min_u32 s2, s3, s2
				; GFX9-NEXT: v_readlane_b32 s4, v0, s2
				; GFX9-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX9-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX9-NEXT: v_max_f32_e64 v2, s4, s4
				; GFX9-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX9-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX9-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX9-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX9-NEXT: s_cbranch_execz .LBB3_5
				; GFX9-NEXT: ; %bb.3:
				; GFX9-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-NEXT: v_mov_b32_e32 v3, 0
				; GFX9-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX9-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_max_f32_e32 v0, v0, v2			; GFX9-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX9-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB3_1			; GFX9-NEXT: s_cbranch_execnz .LBB3_4
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB3_5:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
	; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-NEXT: s_mov_b32 s38, -1			; GFX1064-NEXT: s_mov_b32 s38, -1
	; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-NEXT: s_add_u32 s36, s36, s11			; GFX1064-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-NEXT: s_mov_b32 s12, s8			; GFX1064-NEXT: s_mov_b32 s12, s8
	; GFX1064-NEXT: s_add_u32 s8, s4, 44			; GFX1064-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-NEXT: s_mov_b32 s13, s9			; GFX1064-NEXT: s_mov_b32 s13, s9
	; GFX1064-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-NEXT: s_mov_b32 s14, s10			; GFX1064-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_getpc_b64 s[6:7]			; GFX1064-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-NEXT: s_mov_b32 s14, s10
				; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b32 s32, 0			; GFX1064-NEXT: s_mov_b32 s32, 0
	; GFX1064-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1064-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-NEXT: s_mov_b64 s[0:1], exec
	; GFX1064-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX1064-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1064-NEXT: s_ff1_i32_b32 s2, s1
				; GFX1064-NEXT: s_ff1_i32_b32 s3, s0
				; GFX1064-NEXT: s_add_i32 s2, s2, 32
				; GFX1064-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1064-NEXT: s_min_u32 s2, s3, s2
				; GFX1064-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1064-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1064-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1064-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX1064-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1064-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX1064-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1064-NEXT: s_cbranch_execz .LBB3_5
				; GFX1064-NEXT: ; %bb.3:
				; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-NEXT: v_mov_b32_e32 v3, 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1064-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1064-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1064-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1064-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB3_1			; GFX1064-NEXT: s_cbranch_execnz .LBB3_4
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB3_5:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
	; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-NEXT: s_mov_b32 s38, -1			; GFX1032-NEXT: s_mov_b32 s38, -1
	; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-NEXT: s_add_u32 s36, s36, s11			; GFX1032-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-NEXT: s_mov_b32 s12, s8			; GFX1032-NEXT: s_mov_b32 s12, s8
	; GFX1032-NEXT: s_add_u32 s8, s4, 44			; GFX1032-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-NEXT: s_mov_b32 s13, s9			; GFX1032-NEXT: s_mov_b32 s13, s9
	; GFX1032-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-NEXT: s_mov_b32 s14, s10			; GFX1032-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_getpc_b64 s[6:7]			; GFX1032-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-NEXT: s_mov_b32 s14, s10
				; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b32 s32, 0			; GFX1032-NEXT: s_mov_b32 s32, 0
	; GFX1032-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1032-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-NEXT: s_mov_b32 s0, exec_lo
	; GFX1032-NEXT: s_mov_b32 s0, 0			; GFX1032-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX1032-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1032-NEXT: s_ff1_i32_b32 s1, s0
				; GFX1032-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1032-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1032-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1032-NEXT: s_andn2_b32 s0, s0, s1
				; GFX1032-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1032-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1032-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1032-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX1032-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1032-NEXT: s_cbranch_execz .LBB3_5
				; GFX1032-NEXT: ; %bb.3:
				; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-NEXT: v_mov_b32_e32 v3, 0
				; GFX1032-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1032-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1032-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1032-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB3_1			; GFX1032-NEXT: s_cbranch_execnz .LBB3_4
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB3_5:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-NEXT: s_mov_b32 s12, s8			; GFX1164-NEXT: s_mov_b32 s12, s8
	; GFX1164-NEXT: s_add_u32 s8, s4, 44			; GFX1164-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-NEXT: s_mov_b32 s13, s9			; GFX1164-NEXT: s_mov_b32 s13, s9
	; GFX1164-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-NEXT: s_mov_b32 s14, s10			; GFX1164-NEXT: s_mov_b32 s14, s10
	; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-NEXT: s_mov_b32 s32, 0			; GFX1164-NEXT: s_mov_b32 s32, 0
	; GFX1164-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1164-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-NEXT: s_mov_b64 s[0:1], exec
	; GFX1164-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX1164-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(SKIP_4) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: s_ctz_i32_b32 s2, s1
				; GFX1164-NEXT: s_ctz_i32_b32 s3, s0
				; GFX1164-NEXT: s_add_i32 s2, s2, 32
				; GFX1164-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1164-NEXT: s_min_u32 s2, s3, s2
				; GFX1164-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1164-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1164-NEXT: s_and_not1_b64 s[0:1], s[0:1], s[2:3]
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1164-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX1164-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1164-NEXT: s_cbranch_execz .LBB3_5
				; GFX1164-NEXT: ; %bb.3:
				; GFX1164-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-NEXT: v_mov_b32_e32 v3, 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1164-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1164-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB3_1			; GFX1164-NEXT: s_cbranch_execnz .LBB3_4
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB3_5:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
	; GFX1132-NEXT: s_add_u32 s8, s4, 44			; GFX1132-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-NEXT: s_getpc_b64 s[6:7]			; GFX1132-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-NEXT: s_mov_b32 s12, s13			; GFX1132-NEXT: s_mov_b32 s12, s13
				; GFX1132-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-NEXT: s_mov_b32 s13, s14			; GFX1132-NEXT: s_mov_b32 s13, s14
	; GFX1132-NEXT: s_mov_b32 s14, s15			; GFX1132-NEXT: s_mov_b32 s14, s15
	; GFX1132-NEXT: s_mov_b32 s32, 0			; GFX1132-NEXT: s_mov_b32 s32, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1132-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-NEXT: s_mov_b32 s0, exec_lo
	; GFX1132-NEXT: s_mov_b32 s0, 0			; GFX1132-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX1132-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: s_ctz_i32_b32 s1, s0
				; GFX1132-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1132-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1132-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(SALU_CYCLE_1)
				; GFX1132-NEXT: s_and_not1_b32 s0, s0, s1
				; GFX1132-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1132-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1132-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX1132-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1132-NEXT: s_cbranch_execz .LBB3_5
				; GFX1132-NEXT: ; %bb.3:
				; GFX1132-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-NEXT: v_dual_mov_b32 v3, 0 :: v_dual_max_f32 v2, v2, v2
				; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1132-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1132-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB3_1			; GFX1132-NEXT: s_cbranch_execnz .LBB3_4
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB3_5:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
	; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-DPP-NEXT: s_mov_b32 s38, -1			; GFX9-DPP-NEXT: s_mov_b32 s38, -1
	; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11
	; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-DPP-NEXT: s_mov_b32 s12, s8			; GFX9-DPP-NEXT: s_mov_b32 s12, s8
	; GFX9-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX9-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX9-DPP-NEXT: s_mov_b32 s13, s9			; GFX9-DPP-NEXT: s_mov_b32 s13, s9
	; GFX9-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX9-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]			; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-DPP-NEXT: s_mov_b32 s14, s10			; GFX9-DPP-NEXT: s_mov_b32 s14, s10
	; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-DPP-NEXT: s_mov_b32 s32, 0			; GFX9-DPP-NEXT: s_mov_b32 s32, 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v3, v0
	; GFX9-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX9-DPP-NEXT: s_nop 0
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:1 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:2 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:4 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:8 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_bcast:15 row_mask:0xa bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v4, v3 row_bcast:31 row_mask:0xc bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX9-DPP-NEXT: v_readlane_b32 s4, v3, 63
				; GFX9-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX9-DPP-NEXT: ; %bb.1:
				; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-DPP-NEXT: v_max_f32_e64 v6, s4, s4
				; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX9-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB3_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
	; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-DPP-NEXT: s_mov_b32 s38, -1			; GFX1064-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s12, s8			; GFX1064-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1064-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1064-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-DPP-NEXT: s_mov_b32 s13, s9			; GFX1064-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1064-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s14, s10			; GFX1064-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1064-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b32 s32, 0			; GFX1064-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1064-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1064-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_readlane_b32 s2, v3, 32
				; GFX1064-DPP-NEXT: v_readlane_b32 s3, v3, 0
				; GFX1064-DPP-NEXT: v_max_f32_e64 v3, s2, s2
				; GFX1064-DPP-NEXT: v_max_f32_e64 v4, s3, s3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v0
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX1064-DPP-NEXT: ; %bb.1:
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1064-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1064-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB3_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
	; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-DPP-NEXT: s_mov_b32 s38, -1			; GFX1032-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s12, s8			; GFX1032-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1032-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1032-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-DPP-NEXT: s_mov_b32 s13, s9			; GFX1032-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1032-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s14, s10			; GFX1032-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1032-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b32 s32, 0			; GFX1032-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
	; GFX1032-DPP-NEXT: s_mov_b32 s0, 0			; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1032-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1032-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX1032-DPP-NEXT: ; %bb.1:
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1032-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1032-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB3_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-DPP-NEXT: s_mov_b32 s12, s8			; GFX1164-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1164-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1164-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-DPP-NEXT: s_mov_b32 s13, s9			; GFX1164-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1164-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-DPP-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-DPP-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-DPP-NEXT: s_mov_b32 s14, s10			; GFX1164-DPP-NEXT: s_mov_b32 s14, s10
	; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-DPP-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-DPP-NEXT: s_mov_b32 s32, 0			; GFX1164-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, 0xff800000
	; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1164-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0xff800000
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_waitcnt_depctr 0xfff
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_permlane64_b32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX1164-DPP-NEXT: ; %bb.1:
				; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1164-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1164-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v4, v6
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v4, v5
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1164-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB3_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_div_value_one_as_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
	; GFX1132-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1132-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1132-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-DPP-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b32 s12, s13			; GFX1132-DPP-NEXT: s_mov_b32 s12, s13
				; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-DPP-NEXT: s_mov_b32 s13, s14			; GFX1132-DPP-NEXT: s_mov_b32 s13, s14
	; GFX1132-DPP-NEXT: s_mov_b32 s14, s15			; GFX1132-DPP-NEXT: s_mov_b32 s14, s15
	; GFX1132-DPP-NEXT: s_mov_b32 s32, 0			; GFX1132-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, 0xff800000
	; GFX1132-DPP-NEXT: s_mov_b32 s0, 0			; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1132-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0xff800000
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v2, v2 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v2, v1
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1132-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX1132-DPP-NEXT: ; %bb.1:
				; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1132-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1132-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v4, v6
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v4, v5
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1132-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB3_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%divValue = call float @div.float.value()			%divValue = call float @div.float.value()
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float %divValue syncscope("one-as") monotonic			%result = atomicrmw fmax ptr addrspace(1) %ptr, float %divValue syncscope("one-as") monotonic
	ret void			ret void
	}			}


	define amdgpu_kernel void @global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
				; GFX7LESS-NEXT: v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
				; GFX7LESS-NEXT: v_mbcnt_hi_u32_b32_e32 v0, exec_hi, v0
				; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX7LESS-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX7LESS-NEXT: s_cbranch_execz .LBB4_3
				; GFX7LESS-NEXT: ; %bb.1:
	; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0			; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0
	; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000			; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2
	; GFX7LESS-NEXT: s_mov_b32 s2, -1			; GFX7LESS-NEXT: s_mov_b32 s2, -1
	; GFX7LESS-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX7LESS-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1			; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1
	; GFX7LESS-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX7LESS-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX7LESS-NEXT: s_waitcnt expcnt(0)			; GFX7LESS-NEXT: s_waitcnt expcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1			; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1
	; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0			; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0
	; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc			; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc
	; GFX7LESS-NEXT: s_waitcnt vmcnt(0)			; GFX7LESS-NEXT: s_waitcnt vmcnt(0)
	; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1			; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1
	; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]			; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2
	; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]			; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]
	; GFX7LESS-NEXT: s_cbranch_execnz .LBB4_1			; GFX7LESS-NEXT: s_cbranch_execnz .LBB4_2
	; GFX7LESS-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX7LESS-NEXT: .LBB4_3:
	; GFX7LESS-NEXT: s_endpgm			; GFX7LESS-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX9-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-NEXT: s_cbranch_execz .LBB4_3
				; GFX9-NEXT: ; %bb.1:
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b64 s[2:3], 0			; GFX9-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-NEXT: v_mov_b32_e32 v2, 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s4			; GFX9-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX9-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX9-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB4_1			; GFX9-NEXT: s_cbranch_execnz .LBB4_2
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB4_3:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-NEXT: s_cbranch_execz .LBB4_3
				; GFX1064-NEXT: ; %bb.1:
	; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX1064-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1064-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB4_1			; GFX1064-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB4_3:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-NEXT: s_cbranch_execz .LBB4_3
				; GFX1032-NEXT: ; %bb.1:
	; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-NEXT: s_mov_b32 s2, 0			; GFX1032-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1032-NEXT: .LBB4_1: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1032-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB4_1			; GFX1032-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB4_3:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_cbranch_execz .LBB4_3
				; GFX1164-NEXT: ; %bb.1:
	; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX1164-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1164-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB4_1			; GFX1164-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB4_3:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_cbranch_execz .LBB4_3
				; GFX1132-NEXT: ; %bb.1:
	; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-NEXT: s_mov_b32 s2, 0			; GFX1132-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1132-NEXT: .LBB4_1: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1132-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB4_1			; GFX1132-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB4_3:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
				; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX9-DPP-NEXT: ; %bb.1:
	; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-DPP-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX9-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB4_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX1064-DPP-NEXT: ; %bb.1:
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-DPP-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB4_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX1032-DPP-NEXT: ; %bb.1:
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-DPP-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-DPP-NEXT: s_mov_b32 s2, 0			; GFX1032-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: .LBB4_1: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB4_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX1164-DPP-NEXT: ; %bb.1:
	; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-DPP-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB4_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX1132-DPP-NEXT: ; %bb.1:
	; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-DPP-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-DPP-NEXT: s_mov_b32 s2, 0			; GFX1132-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: .LBB4_1: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, 4.0, v0
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB4_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float 4.0 monotonic, align 4			%result = atomicrmw fmax ptr addrspace(1) %ptr, float 4.0 monotonic, align 4
	ret void			ret void
	}			}

	define amdgpu_kernel void @global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; GFX9-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX9-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-NEXT: s_mov_b32 s38, -1			; GFX9-NEXT: s_mov_b32 s38, -1
	; GFX9-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-NEXT: s_add_u32 s36, s36, s11			; GFX9-NEXT: s_add_u32 s36, s36, s11
	; GFX9-NEXT: s_addc_u32 s37, s37, 0			; GFX9-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-NEXT: s_mov_b32 s12, s8			; GFX9-NEXT: s_mov_b32 s12, s8
	; GFX9-NEXT: s_add_u32 s8, s4, 44			; GFX9-NEXT: s_add_u32 s8, s34, 44
	; GFX9-NEXT: s_mov_b32 s13, s9			; GFX9-NEXT: s_mov_b32 s13, s9
	; GFX9-NEXT: s_addc_u32 s9, s5, 0			; GFX9-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-NEXT: s_getpc_b64 s[4:5]			; GFX9-NEXT: s_getpc_b64 s[4:5]
	; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-NEXT: s_mov_b32 s14, s10			; GFX9-NEXT: s_mov_b32 s14, s10
	; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-NEXT: s_mov_b32 s32, 0			; GFX9-NEXT: s_mov_b32 s32, 0
	; GFX9-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-NEXT: s_mov_b64 s[0:1], exec
	; GFX9-NEXT: s_mov_b64 s[0:1], 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX9-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX9-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX9-NEXT: s_ff1_i32_b32 s2, s1
				; GFX9-NEXT: s_ff1_i32_b32 s3, s0
				; GFX9-NEXT: s_add_i32 s2, s2, 32
				; GFX9-NEXT: s_min_u32 s2, s3, s2
				; GFX9-NEXT: v_readlane_b32 s4, v0, s2
				; GFX9-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX9-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX9-NEXT: v_max_f32_e64 v2, s4, s4
				; GFX9-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX9-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX9-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX9-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX9-NEXT: s_cbranch_execz .LBB5_5
				; GFX9-NEXT: ; %bb.3:
				; GFX9-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-NEXT: v_mov_b32_e32 v3, 0
				; GFX9-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX9-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_max_f32_e32 v0, v0, v2			; GFX9-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX9-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB5_1			; GFX9-NEXT: s_cbranch_execnz .LBB5_4
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB5_5:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
	; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-NEXT: s_mov_b32 s38, -1			; GFX1064-NEXT: s_mov_b32 s38, -1
	; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-NEXT: s_add_u32 s36, s36, s11			; GFX1064-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-NEXT: s_mov_b32 s12, s8			; GFX1064-NEXT: s_mov_b32 s12, s8
	; GFX1064-NEXT: s_add_u32 s8, s4, 44			; GFX1064-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-NEXT: s_mov_b32 s13, s9			; GFX1064-NEXT: s_mov_b32 s13, s9
	; GFX1064-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-NEXT: s_mov_b32 s14, s10			; GFX1064-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_getpc_b64 s[6:7]			; GFX1064-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-NEXT: s_mov_b32 s14, s10
				; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b32 s32, 0			; GFX1064-NEXT: s_mov_b32 s32, 0
	; GFX1064-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1064-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-NEXT: s_mov_b64 s[0:1], exec
	; GFX1064-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX1064-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1064-NEXT: s_ff1_i32_b32 s2, s1
				; GFX1064-NEXT: s_ff1_i32_b32 s3, s0
				; GFX1064-NEXT: s_add_i32 s2, s2, 32
				; GFX1064-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1064-NEXT: s_min_u32 s2, s3, s2
				; GFX1064-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1064-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1064-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1064-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX1064-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1064-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX1064-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1064-NEXT: s_cbranch_execz .LBB5_5
				; GFX1064-NEXT: ; %bb.3:
				; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-NEXT: v_mov_b32_e32 v3, 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1064-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1064-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1064-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1064-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB5_1			; GFX1064-NEXT: s_cbranch_execnz .LBB5_4
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB5_5:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
	; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-NEXT: s_mov_b32 s38, -1			; GFX1032-NEXT: s_mov_b32 s38, -1
	; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-NEXT: s_add_u32 s36, s36, s11			; GFX1032-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-NEXT: s_mov_b32 s12, s8			; GFX1032-NEXT: s_mov_b32 s12, s8
	; GFX1032-NEXT: s_add_u32 s8, s4, 44			; GFX1032-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-NEXT: s_mov_b32 s13, s9			; GFX1032-NEXT: s_mov_b32 s13, s9
	; GFX1032-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-NEXT: s_mov_b32 s14, s10			; GFX1032-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_getpc_b64 s[6:7]			; GFX1032-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-NEXT: s_mov_b32 s14, s10
				; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b32 s32, 0			; GFX1032-NEXT: s_mov_b32 s32, 0
	; GFX1032-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1032-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-NEXT: s_mov_b32 s0, exec_lo
	; GFX1032-NEXT: s_mov_b32 s0, 0			; GFX1032-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX1032-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1032-NEXT: s_ff1_i32_b32 s1, s0
				; GFX1032-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1032-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1032-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1032-NEXT: s_andn2_b32 s0, s0, s1
				; GFX1032-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1032-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1032-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1032-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX1032-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1032-NEXT: s_cbranch_execz .LBB5_5
				; GFX1032-NEXT: ; %bb.3:
				; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-NEXT: v_mov_b32_e32 v3, 0
				; GFX1032-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1032-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1032-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1032-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB5_1			; GFX1032-NEXT: s_cbranch_execnz .LBB5_4
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB5_5:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-NEXT: s_mov_b32 s12, s8			; GFX1164-NEXT: s_mov_b32 s12, s8
	; GFX1164-NEXT: s_add_u32 s8, s4, 44			; GFX1164-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-NEXT: s_mov_b32 s13, s9			; GFX1164-NEXT: s_mov_b32 s13, s9
	; GFX1164-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-NEXT: s_mov_b32 s14, s10			; GFX1164-NEXT: s_mov_b32 s14, s10
	; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-NEXT: s_mov_b32 s32, 0			; GFX1164-NEXT: s_mov_b32 s32, 0
	; GFX1164-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1164-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-NEXT: s_mov_b64 s[0:1], exec
	; GFX1164-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX1164-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(SKIP_4) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: s_ctz_i32_b32 s2, s1
				; GFX1164-NEXT: s_ctz_i32_b32 s3, s0
				; GFX1164-NEXT: s_add_i32 s2, s2, 32
				; GFX1164-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1164-NEXT: s_min_u32 s2, s3, s2
				; GFX1164-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1164-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1164-NEXT: s_and_not1_b64 s[0:1], s[0:1], s[2:3]
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1164-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX1164-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1164-NEXT: s_cbranch_execz .LBB5_5
				; GFX1164-NEXT: ; %bb.3:
				; GFX1164-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-NEXT: v_mov_b32_e32 v3, 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1164-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1164-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB5_1			; GFX1164-NEXT: s_cbranch_execnz .LBB5_4
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB5_5:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
	; GFX1132-NEXT: s_add_u32 s8, s4, 44			; GFX1132-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-NEXT: s_getpc_b64 s[6:7]			; GFX1132-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-NEXT: s_mov_b32 s12, s13			; GFX1132-NEXT: s_mov_b32 s12, s13
				; GFX1132-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-NEXT: s_mov_b32 s13, s14			; GFX1132-NEXT: s_mov_b32 s13, s14
	; GFX1132-NEXT: s_mov_b32 s14, s15			; GFX1132-NEXT: s_mov_b32 s14, s15
	; GFX1132-NEXT: s_mov_b32 s32, 0			; GFX1132-NEXT: s_mov_b32 s32, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-NEXT: v_mov_b32_e32 v2, 0xff800000
	; GFX1132-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-NEXT: s_mov_b32 s0, exec_lo
	; GFX1132-NEXT: s_mov_b32 s0, 0			; GFX1132-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX1132-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: s_ctz_i32_b32 s1, s0
				; GFX1132-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1132-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1132-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(SALU_CYCLE_1)
				; GFX1132-NEXT: s_and_not1_b32 s0, s0, s1
				; GFX1132-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1132-NEXT: v_max_f32_e32 v2, v1, v2
				; GFX1132-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX1132-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1132-NEXT: s_cbranch_execz .LBB5_5
				; GFX1132-NEXT: ; %bb.3:
				; GFX1132-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-NEXT: v_dual_mov_b32 v3, 0 :: v_dual_max_f32 v2, v2, v2
				; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1132-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1132-NEXT: v_max_f32_e32 v0, v0, v2
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB5_1			; GFX1132-NEXT: s_cbranch_execnz .LBB5_4
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB5_5:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
	; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-DPP-NEXT: s_mov_b32 s38, -1			; GFX9-DPP-NEXT: s_mov_b32 s38, -1
	; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11
	; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-DPP-NEXT: s_mov_b32 s12, s8			; GFX9-DPP-NEXT: s_mov_b32 s12, s8
	; GFX9-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX9-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX9-DPP-NEXT: s_mov_b32 s13, s9			; GFX9-DPP-NEXT: s_mov_b32 s13, s9
	; GFX9-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX9-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]			; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-DPP-NEXT: s_mov_b32 s14, s10			; GFX9-DPP-NEXT: s_mov_b32 s14, s10
	; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-DPP-NEXT: s_mov_b32 s32, 0			; GFX9-DPP-NEXT: s_mov_b32 s32, 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v3, v0
	; GFX9-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX9-DPP-NEXT: s_nop 0
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:1 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:2 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:4 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:8 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_bcast:15 row_mask:0xa bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v4, v3 row_bcast:31 row_mask:0xc bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX9-DPP-NEXT: v_readlane_b32 s4, v3, 63
				; GFX9-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX9-DPP-NEXT: ; %bb.1:
				; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-DPP-NEXT: v_max_f32_e64 v6, s4, s4
				; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX9-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB5_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
	; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-DPP-NEXT: s_mov_b32 s38, -1			; GFX1064-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s12, s8			; GFX1064-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1064-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1064-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-DPP-NEXT: s_mov_b32 s13, s9			; GFX1064-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1064-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s14, s10			; GFX1064-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1064-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b32 s32, 0			; GFX1064-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1064-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1064-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_readlane_b32 s2, v3, 32
				; GFX1064-DPP-NEXT: v_readlane_b32 s3, v3, 0
				; GFX1064-DPP-NEXT: v_max_f32_e64 v3, s2, s2
				; GFX1064-DPP-NEXT: v_max_f32_e64 v4, s3, s3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v0
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX1064-DPP-NEXT: ; %bb.1:
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1064-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1064-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB5_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
	; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-DPP-NEXT: s_mov_b32 s38, -1			; GFX1032-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s12, s8			; GFX1032-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1032-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1032-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-DPP-NEXT: s_mov_b32 s13, s9			; GFX1032-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1032-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s14, s10			; GFX1032-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1032-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b32 s32, 0			; GFX1032-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
	; GFX1032-DPP-NEXT: s_mov_b32 s0, 0			; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1032-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, 0xff800000
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v4, v3
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0xff800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1032-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX1032-DPP-NEXT: ; %bb.1:
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1032-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1032-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v0, v6
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB5_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-DPP-NEXT: s_mov_b32 s12, s8			; GFX1164-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1164-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1164-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-DPP-NEXT: s_mov_b32 s13, s9			; GFX1164-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1164-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-DPP-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-DPP-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-DPP-NEXT: s_mov_b32 s14, s10			; GFX1164-DPP-NEXT: s_mov_b32 s14, s10
	; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-DPP-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-DPP-NEXT: s_mov_b32 s32, 0			; GFX1164-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, 0xff800000
	; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1164-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0xff800000
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_waitcnt_depctr 0xfff
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0xff800000
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_permlane64_b32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX1164-DPP-NEXT: ; %bb.1:
				; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1164-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1164-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v4, v6
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v4, v5
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1164-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB5_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmax_uni_address_div_value_defalut_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
	; GFX1132-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1132-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1132-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-DPP-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b32 s12, s13			; GFX1132-DPP-NEXT: s_mov_b32 s12, s13
				; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-DPP-NEXT: s_mov_b32 s13, s14			; GFX1132-DPP-NEXT: s_mov_b32 s13, s14
	; GFX1132-DPP-NEXT: s_mov_b32 s14, s15			; GFX1132-DPP-NEXT: s_mov_b32 s14, s15
	; GFX1132-DPP-NEXT: s_mov_b32 s32, 0			; GFX1132-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, 0xff800000
	; GFX1132-DPP-NEXT: s_mov_b32 s0, 0			; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1132-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0xff800000
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v2, v2 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v2, v1
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0xff800000
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1132-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX1132-DPP-NEXT: ; %bb.1:
				; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1132-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1132-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v0, v2			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v4, v6
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v4, v5
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1132-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB5_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%divValue = call float @div.float.value()			%divValue = call float @div.float.value()
	%result = atomicrmw fmax ptr addrspace(1) %ptr, float %divValue monotonic, align 4			%result = atomicrmw fmax ptr addrspace(1) %ptr, float %divValue monotonic, align 4
	ret void			ret void
	}			}

	attributes #0 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "amdgpu-unsafe-fp-atomics"="true" }			attributes #0 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "amdgpu-unsafe-fp-atomics"="true" }

llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmin.ll

	Show All 11 Lines
	; RUN: llc -march=amdgcn -mcpu=gfx1100 -mattr=-wavefrontsize32,+wavefrontsize64 -amdgpu-atomic-optimizer-strategy=DPP -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GFX1164-DPP %s			; RUN: llc -march=amdgcn -mcpu=gfx1100 -mattr=-wavefrontsize32,+wavefrontsize64 -amdgpu-atomic-optimizer-strategy=DPP -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GFX1164-DPP %s
	; RUN: llc -march=amdgcn -mcpu=gfx1100 -mattr=+wavefrontsize32,-wavefrontsize64 -amdgpu-atomic-optimizer-strategy=DPP -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GFX1132-DPP %s			; RUN: llc -march=amdgcn -mcpu=gfx1100 -mattr=+wavefrontsize32,-wavefrontsize64 -amdgpu-atomic-optimizer-strategy=DPP -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GFX1132-DPP %s

	declare float @div.float.value()			declare float @div.float.value()

	define amdgpu_kernel void @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
				; GFX7LESS-NEXT: v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
				; GFX7LESS-NEXT: v_mbcnt_hi_u32_b32_e32 v0, exec_hi, v0
				; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX7LESS-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX7LESS-NEXT: s_cbranch_execz .LBB0_3
				; GFX7LESS-NEXT: ; %bb.1:
	; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0			; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0
	; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000			; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2
	; GFX7LESS-NEXT: s_mov_b32 s2, -1			; GFX7LESS-NEXT: s_mov_b32 s2, -1
	; GFX7LESS-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX7LESS-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1			; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1
	; GFX7LESS-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX7LESS-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX7LESS-NEXT: s_waitcnt expcnt(0)			; GFX7LESS-NEXT: s_waitcnt expcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1			; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1
	; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0			; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0
	; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc			; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc
	; GFX7LESS-NEXT: s_waitcnt vmcnt(0)			; GFX7LESS-NEXT: s_waitcnt vmcnt(0)
	; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1			; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1
	; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]			; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2
	; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]			; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]
	; GFX7LESS-NEXT: s_cbranch_execnz .LBB0_1			; GFX7LESS-NEXT: s_cbranch_execnz .LBB0_2
	; GFX7LESS-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX7LESS-NEXT: .LBB0_3:
	; GFX7LESS-NEXT: s_endpgm			; GFX7LESS-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX9-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-NEXT: s_cbranch_execz .LBB0_3
				; GFX9-NEXT: ; %bb.1:
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b64 s[2:3], 0			; GFX9-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-NEXT: v_mov_b32_e32 v2, 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s4			; GFX9-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX9-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX9-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB0_1			; GFX9-NEXT: s_cbranch_execnz .LBB0_2
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB0_3:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-NEXT: s_cbranch_execz .LBB0_3
				; GFX1064-NEXT: ; %bb.1:
	; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX1064-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1064-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB0_1			; GFX1064-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB0_3:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-NEXT: s_cbranch_execz .LBB0_3
				; GFX1032-NEXT: ; %bb.1:
	; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-NEXT: s_mov_b32 s2, 0			; GFX1032-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1032-NEXT: .LBB0_1: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1032-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB0_1			; GFX1032-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB0_3:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_cbranch_execz .LBB0_3
				; GFX1164-NEXT: ; %bb.1:
	; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX1164-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1164-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB0_1			; GFX1164-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB0_3:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_cbranch_execz .LBB0_3
				; GFX1132-NEXT: ; %bb.1:
	; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-NEXT: s_mov_b32 s2, 0			; GFX1132-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1132-NEXT: .LBB0_1: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1132-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB0_1			; GFX1132-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB0_3:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
				; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX9-DPP-NEXT: ; %bb.1:
	; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-DPP-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX9-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB0_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX1064-DPP-NEXT: ; %bb.1:
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-DPP-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1064-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB0_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX1032-DPP-NEXT: ; %bb.1:
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-DPP-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-DPP-NEXT: s_mov_b32 s2, 0			; GFX1032-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: .LBB0_1: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1032-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB0_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX1164-DPP-NEXT: ; %bb.1:
	; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-DPP-NEXT: .LBB0_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1164-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB0_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_agent_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB0_3
				; GFX1132-DPP-NEXT: ; %bb.1:
	; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-DPP-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-DPP-NEXT: s_mov_b32 s2, 0			; GFX1132-DPP-NEXT: .LBB0_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: .LBB0_1: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1132-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB0_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB0_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB0_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float 4.0 syncscope("agent") monotonic, align 4			%result = atomicrmw fmin ptr addrspace(1) %ptr, float 4.0 syncscope("agent") monotonic, align 4
	ret void			ret void
	}			}

	define amdgpu_kernel void @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmin_uni_address_div_value_agent_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; GFX9-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX9-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-NEXT: s_mov_b32 s38, -1			; GFX9-NEXT: s_mov_b32 s38, -1
	; GFX9-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-NEXT: s_add_u32 s36, s36, s11			; GFX9-NEXT: s_add_u32 s36, s36, s11
	; GFX9-NEXT: s_addc_u32 s37, s37, 0			; GFX9-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-NEXT: s_mov_b32 s12, s8			; GFX9-NEXT: s_mov_b32 s12, s8
	; GFX9-NEXT: s_add_u32 s8, s4, 44			; GFX9-NEXT: s_add_u32 s8, s34, 44
	; GFX9-NEXT: s_mov_b32 s13, s9			; GFX9-NEXT: s_mov_b32 s13, s9
	; GFX9-NEXT: s_addc_u32 s9, s5, 0			; GFX9-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-NEXT: s_getpc_b64 s[4:5]			; GFX9-NEXT: s_getpc_b64 s[4:5]
	; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-NEXT: s_mov_b32 s14, s10			; GFX9-NEXT: s_mov_b32 s14, s10
	; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-NEXT: s_mov_b32 s32, 0			; GFX9-NEXT: s_mov_b32 s32, 0
	; GFX9-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-NEXT: s_mov_b64 s[0:1], exec
	; GFX9-NEXT: s_mov_b64 s[0:1], 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX9-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX9-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX9-NEXT: s_ff1_i32_b32 s2, s1
				; GFX9-NEXT: s_ff1_i32_b32 s3, s0
				; GFX9-NEXT: s_add_i32 s2, s2, 32
				; GFX9-NEXT: s_min_u32 s2, s3, s2
				; GFX9-NEXT: v_readlane_b32 s4, v0, s2
				; GFX9-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX9-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX9-NEXT: v_max_f32_e64 v2, s4, s4
				; GFX9-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX9-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX9-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX9-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX9-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX9-NEXT: s_cbranch_execz .LBB1_5
				; GFX9-NEXT: ; %bb.3:
				; GFX9-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-NEXT: v_mov_b32_e32 v3, 0
				; GFX9-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX9-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_min_f32_e32 v0, v0, v2			; GFX9-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX9-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB1_1			; GFX9-NEXT: s_cbranch_execnz .LBB1_4
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB1_5:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
	; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-NEXT: s_mov_b32 s38, -1			; GFX1064-NEXT: s_mov_b32 s38, -1
	; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-NEXT: s_add_u32 s36, s36, s11			; GFX1064-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-NEXT: s_mov_b32 s12, s8			; GFX1064-NEXT: s_mov_b32 s12, s8
	; GFX1064-NEXT: s_add_u32 s8, s4, 44			; GFX1064-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-NEXT: s_mov_b32 s13, s9			; GFX1064-NEXT: s_mov_b32 s13, s9
	; GFX1064-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-NEXT: s_mov_b32 s14, s10			; GFX1064-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_getpc_b64 s[6:7]			; GFX1064-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-NEXT: s_mov_b32 s14, s10
				; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b32 s32, 0			; GFX1064-NEXT: s_mov_b32 s32, 0
	; GFX1064-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1064-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-NEXT: s_mov_b64 s[0:1], exec
	; GFX1064-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX1064-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1064-NEXT: s_ff1_i32_b32 s2, s1
				; GFX1064-NEXT: s_ff1_i32_b32 s3, s0
				; GFX1064-NEXT: s_add_i32 s2, s2, 32
				; GFX1064-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1064-NEXT: s_min_u32 s2, s3, s2
				; GFX1064-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1064-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1064-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1064-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX1064-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1064-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1064-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX1064-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1064-NEXT: s_cbranch_execz .LBB1_5
				; GFX1064-NEXT: ; %bb.3:
				; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-NEXT: v_mov_b32_e32 v3, 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1064-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1064-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1064-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1064-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB1_1			; GFX1064-NEXT: s_cbranch_execnz .LBB1_4
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB1_5:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
	; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-NEXT: s_mov_b32 s38, -1			; GFX1032-NEXT: s_mov_b32 s38, -1
	; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-NEXT: s_add_u32 s36, s36, s11			; GFX1032-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-NEXT: s_mov_b32 s12, s8			; GFX1032-NEXT: s_mov_b32 s12, s8
	; GFX1032-NEXT: s_add_u32 s8, s4, 44			; GFX1032-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-NEXT: s_mov_b32 s13, s9			; GFX1032-NEXT: s_mov_b32 s13, s9
	; GFX1032-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-NEXT: s_mov_b32 s14, s10			; GFX1032-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_getpc_b64 s[6:7]			; GFX1032-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-NEXT: s_mov_b32 s14, s10
				; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b32 s32, 0			; GFX1032-NEXT: s_mov_b32 s32, 0
	; GFX1032-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1032-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-NEXT: s_mov_b32 s0, exec_lo
	; GFX1032-NEXT: s_mov_b32 s0, 0			; GFX1032-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX1032-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1032-NEXT: s_ff1_i32_b32 s1, s0
				; GFX1032-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1032-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1032-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1032-NEXT: s_andn2_b32 s0, s0, s1
				; GFX1032-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1032-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1032-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1032-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX1032-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1032-NEXT: s_cbranch_execz .LBB1_5
				; GFX1032-NEXT: ; %bb.3:
				; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-NEXT: v_mov_b32_e32 v3, 0
				; GFX1032-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1032-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1032-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1032-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB1_1			; GFX1032-NEXT: s_cbranch_execnz .LBB1_4
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB1_5:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-NEXT: s_mov_b32 s12, s8			; GFX1164-NEXT: s_mov_b32 s12, s8
	; GFX1164-NEXT: s_add_u32 s8, s4, 44			; GFX1164-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-NEXT: s_mov_b32 s13, s9			; GFX1164-NEXT: s_mov_b32 s13, s9
	; GFX1164-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-NEXT: s_mov_b32 s14, s10			; GFX1164-NEXT: s_mov_b32 s14, s10
	; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-NEXT: s_mov_b32 s32, 0			; GFX1164-NEXT: s_mov_b32 s32, 0
	; GFX1164-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1164-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-NEXT: s_mov_b64 s[0:1], exec
	; GFX1164-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX1164-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(SKIP_4) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: s_ctz_i32_b32 s2, s1
				; GFX1164-NEXT: s_ctz_i32_b32 s3, s0
				; GFX1164-NEXT: s_add_i32 s2, s2, 32
				; GFX1164-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1164-NEXT: s_min_u32 s2, s3, s2
				; GFX1164-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1164-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1164-NEXT: s_and_not1_b64 s[0:1], s[0:1], s[2:3]
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1164-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1164-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX1164-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1164-NEXT: s_cbranch_execz .LBB1_5
				; GFX1164-NEXT: ; %bb.3:
				; GFX1164-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-NEXT: v_mov_b32_e32 v3, 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1164-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1164-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB1_1			; GFX1164-NEXT: s_cbranch_execnz .LBB1_4
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB1_5:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
	; GFX1132-NEXT: s_add_u32 s8, s4, 44			; GFX1132-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-NEXT: s_getpc_b64 s[6:7]			; GFX1132-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-NEXT: s_mov_b32 s12, s13			; GFX1132-NEXT: s_mov_b32 s12, s13
				; GFX1132-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-NEXT: s_mov_b32 s13, s14			; GFX1132-NEXT: s_mov_b32 s13, s14
	; GFX1132-NEXT: s_mov_b32 s14, s15			; GFX1132-NEXT: s_mov_b32 s14, s15
	; GFX1132-NEXT: s_mov_b32 s32, 0			; GFX1132-NEXT: s_mov_b32 s32, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1132-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-NEXT: s_mov_b32 s0, exec_lo
	; GFX1132-NEXT: s_mov_b32 s0, 0			; GFX1132-NEXT: .LBB1_1: ; %ComputeLoop
	; GFX1132-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: s_ctz_i32_b32 s1, s0
				; GFX1132-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1132-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1132-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(SALU_CYCLE_1)
				; GFX1132-NEXT: s_and_not1_b32 s0, s0, s1
				; GFX1132-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1132-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1132-NEXT: s_cbranch_scc1 .LBB1_1
				; GFX1132-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1132-NEXT: s_cbranch_execz .LBB1_5
				; GFX1132-NEXT: ; %bb.3:
				; GFX1132-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-NEXT: v_dual_mov_b32 v3, 0 :: v_dual_max_f32 v2, v2, v2
				; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1132-NEXT: .LBB1_4: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1132-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB1_1			; GFX1132-NEXT: s_cbranch_execnz .LBB1_4
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB1_5:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
	; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-DPP-NEXT: s_mov_b32 s38, -1			; GFX9-DPP-NEXT: s_mov_b32 s38, -1
	; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11
	; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-DPP-NEXT: s_mov_b32 s12, s8			; GFX9-DPP-NEXT: s_mov_b32 s12, s8
	; GFX9-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX9-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX9-DPP-NEXT: s_mov_b32 s13, s9			; GFX9-DPP-NEXT: s_mov_b32 s13, s9
	; GFX9-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX9-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]			; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-DPP-NEXT: s_mov_b32 s14, s10			; GFX9-DPP-NEXT: s_mov_b32 s14, s10
	; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-DPP-NEXT: s_mov_b32 s32, 0			; GFX9-DPP-NEXT: s_mov_b32 s32, 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v3, v0
	; GFX9-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 0
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:1 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:2 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:4 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:8 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_bcast:15 row_mask:0xa bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v4, v3 row_bcast:31 row_mask:0xc bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX9-DPP-NEXT: v_readlane_b32 s4, v3, 63
				; GFX9-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX9-DPP-NEXT: ; %bb.1:
				; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-DPP-NEXT: v_max_f32_e64 v6, s4, s4
				; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX9-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX9-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB1_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
	; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-DPP-NEXT: s_mov_b32 s38, -1			; GFX1064-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s12, s8			; GFX1064-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1064-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1064-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-DPP-NEXT: s_mov_b32 s13, s9			; GFX1064-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1064-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s14, s10			; GFX1064-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1064-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b32 s32, 0			; GFX1064-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1064-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1064-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_readlane_b32 s2, v3, 32
				; GFX1064-DPP-NEXT: v_readlane_b32 s3, v3, 0
				; GFX1064-DPP-NEXT: v_max_f32_e64 v3, s2, s2
				; GFX1064-DPP-NEXT: v_max_f32_e64 v4, s3, s3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v0
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX1064-DPP-NEXT: ; %bb.1:
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1064-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1064-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1064-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB1_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
	; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-DPP-NEXT: s_mov_b32 s38, -1			; GFX1032-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s12, s8			; GFX1032-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1032-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1032-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-DPP-NEXT: s_mov_b32 s13, s9			; GFX1032-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1032-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s14, s10			; GFX1032-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1032-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b32 s32, 0			; GFX1032-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
	; GFX1032-DPP-NEXT: s_mov_b32 s0, 0			; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1032-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1032-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX1032-DPP-NEXT: ; %bb.1:
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1032-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1032-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1032-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB1_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-DPP-NEXT: s_mov_b32 s12, s8			; GFX1164-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1164-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1164-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-DPP-NEXT: s_mov_b32 s13, s9			; GFX1164-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1164-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-DPP-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-DPP-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-DPP-NEXT: s_mov_b32 s14, s10			; GFX1164-DPP-NEXT: s_mov_b32 s14, s10
	; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-DPP-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-DPP-NEXT: s_mov_b32 s32, 0			; GFX1164-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, 0x7f800000
	; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1164-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0x7f800000
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_waitcnt_depctr 0xfff
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_permlane64_b32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX1164-DPP-NEXT: ; %bb.1:
				; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1164-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1164-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1164-DPP-NEXT: v_min_f32_e32 v4, v4, v6
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v4, v5
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1164-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB1_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_div_value_agent_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
	; GFX1132-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1132-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1132-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-DPP-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b32 s12, s13			; GFX1132-DPP-NEXT: s_mov_b32 s12, s13
				; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-DPP-NEXT: s_mov_b32 s13, s14			; GFX1132-DPP-NEXT: s_mov_b32 s13, s14
	; GFX1132-DPP-NEXT: s_mov_b32 s14, s15			; GFX1132-DPP-NEXT: s_mov_b32 s14, s15
	; GFX1132-DPP-NEXT: s_mov_b32 s32, 0			; GFX1132-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, 0x7f800000
	; GFX1132-DPP-NEXT: s_mov_b32 s0, 0			; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1132-DPP-NEXT: .LBB1_1: ; %atomicrmw.start			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0x7f800000
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v2, v2 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v2, v1
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1132-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB1_3
				; GFX1132-DPP-NEXT: ; %bb.1:
				; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1132-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1132-DPP-NEXT: .LBB1_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1132-DPP-NEXT: v_min_f32_e32 v4, v4, v6
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v4, v5
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1132-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB1_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB1_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB1_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%divValue = call float @div.float.value()			%divValue = call float @div.float.value()
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float %divValue syncscope("agent") monotonic, align 4			%result = atomicrmw fmin ptr addrspace(1) %ptr, float %divValue syncscope("agent") monotonic, align 4
	ret void			ret void
	}			}

	define amdgpu_kernel void @global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
				; GFX7LESS-NEXT: v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
				; GFX7LESS-NEXT: v_mbcnt_hi_u32_b32_e32 v0, exec_hi, v0
				; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX7LESS-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX7LESS-NEXT: s_cbranch_execz .LBB2_3
				; GFX7LESS-NEXT: ; %bb.1:
	; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0			; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0
	; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000			; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2
	; GFX7LESS-NEXT: s_mov_b32 s2, -1			; GFX7LESS-NEXT: s_mov_b32 s2, -1
	; GFX7LESS-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX7LESS-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1			; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1
	; GFX7LESS-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX7LESS-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX7LESS-NEXT: s_waitcnt expcnt(0)			; GFX7LESS-NEXT: s_waitcnt expcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1			; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1
	; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0			; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0
	; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc			; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc
	; GFX7LESS-NEXT: s_waitcnt vmcnt(0)			; GFX7LESS-NEXT: s_waitcnt vmcnt(0)
	; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1			; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1
	; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]			; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2
	; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]			; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]
	; GFX7LESS-NEXT: s_cbranch_execnz .LBB2_1			; GFX7LESS-NEXT: s_cbranch_execnz .LBB2_2
	; GFX7LESS-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX7LESS-NEXT: .LBB2_3:
	; GFX7LESS-NEXT: s_endpgm			; GFX7LESS-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX9-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-NEXT: s_cbranch_execz .LBB2_3
				; GFX9-NEXT: ; %bb.1:
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b64 s[2:3], 0			; GFX9-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-NEXT: v_mov_b32_e32 v2, 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s4			; GFX9-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX9-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX9-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB2_1			; GFX9-NEXT: s_cbranch_execnz .LBB2_2
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB2_3:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-NEXT: s_cbranch_execz .LBB2_3
				; GFX1064-NEXT: ; %bb.1:
	; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX1064-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1064-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB2_1			; GFX1064-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB2_3:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-NEXT: s_cbranch_execz .LBB2_3
				; GFX1032-NEXT: ; %bb.1:
	; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-NEXT: s_mov_b32 s2, 0			; GFX1032-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1032-NEXT: .LBB2_1: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1032-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB2_1			; GFX1032-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB2_3:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_cbranch_execz .LBB2_3
				; GFX1164-NEXT: ; %bb.1:
	; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX1164-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1164-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB2_1			; GFX1164-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB2_3:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_cbranch_execz .LBB2_3
				; GFX1132-NEXT: ; %bb.1:
	; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-NEXT: s_mov_b32 s2, 0			; GFX1132-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1132-NEXT: .LBB2_1: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1132-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB2_1			; GFX1132-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB2_3:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
				; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX9-DPP-NEXT: ; %bb.1:
	; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-DPP-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX9-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB2_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX1064-DPP-NEXT: ; %bb.1:
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-DPP-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1064-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB2_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX1032-DPP-NEXT: ; %bb.1:
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-DPP-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-DPP-NEXT: s_mov_b32 s2, 0			; GFX1032-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: .LBB2_1: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1032-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB2_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX1164-DPP-NEXT: ; %bb.1:
	; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-DPP-NEXT: .LBB2_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1164-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB2_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_one_as_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB2_3
				; GFX1132-DPP-NEXT: ; %bb.1:
	; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-DPP-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-DPP-NEXT: s_mov_b32 s2, 0			; GFX1132-DPP-NEXT: .LBB2_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: .LBB2_1: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1132-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB2_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB2_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB2_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float 4.0 syncscope("one-as") monotonic			%result = atomicrmw fmin ptr addrspace(1) %ptr, float 4.0 syncscope("one-as") monotonic
	ret void			ret void
	}			}


	define amdgpu_kernel void @global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; GFX9-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX9-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-NEXT: s_mov_b32 s38, -1			; GFX9-NEXT: s_mov_b32 s38, -1
	; GFX9-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-NEXT: s_add_u32 s36, s36, s11			; GFX9-NEXT: s_add_u32 s36, s36, s11
	; GFX9-NEXT: s_addc_u32 s37, s37, 0			; GFX9-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-NEXT: s_mov_b32 s12, s8			; GFX9-NEXT: s_mov_b32 s12, s8
	; GFX9-NEXT: s_add_u32 s8, s4, 44			; GFX9-NEXT: s_add_u32 s8, s34, 44
	; GFX9-NEXT: s_mov_b32 s13, s9			; GFX9-NEXT: s_mov_b32 s13, s9
	; GFX9-NEXT: s_addc_u32 s9, s5, 0			; GFX9-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-NEXT: s_getpc_b64 s[4:5]			; GFX9-NEXT: s_getpc_b64 s[4:5]
	; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-NEXT: s_mov_b32 s14, s10			; GFX9-NEXT: s_mov_b32 s14, s10
	; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-NEXT: s_mov_b32 s32, 0			; GFX9-NEXT: s_mov_b32 s32, 0
	; GFX9-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-NEXT: s_mov_b64 s[0:1], exec
	; GFX9-NEXT: s_mov_b64 s[0:1], 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX9-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX9-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX9-NEXT: s_ff1_i32_b32 s2, s1
				; GFX9-NEXT: s_ff1_i32_b32 s3, s0
				; GFX9-NEXT: s_add_i32 s2, s2, 32
				; GFX9-NEXT: s_min_u32 s2, s3, s2
				; GFX9-NEXT: v_readlane_b32 s4, v0, s2
				; GFX9-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX9-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX9-NEXT: v_max_f32_e64 v2, s4, s4
				; GFX9-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX9-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX9-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX9-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX9-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX9-NEXT: s_cbranch_execz .LBB3_5
				; GFX9-NEXT: ; %bb.3:
				; GFX9-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-NEXT: v_mov_b32_e32 v3, 0
				; GFX9-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX9-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_min_f32_e32 v0, v0, v2			; GFX9-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX9-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB3_1			; GFX9-NEXT: s_cbranch_execnz .LBB3_4
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB3_5:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
	; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-NEXT: s_mov_b32 s38, -1			; GFX1064-NEXT: s_mov_b32 s38, -1
	; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-NEXT: s_add_u32 s36, s36, s11			; GFX1064-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-NEXT: s_mov_b32 s12, s8			; GFX1064-NEXT: s_mov_b32 s12, s8
	; GFX1064-NEXT: s_add_u32 s8, s4, 44			; GFX1064-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-NEXT: s_mov_b32 s13, s9			; GFX1064-NEXT: s_mov_b32 s13, s9
	; GFX1064-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-NEXT: s_mov_b32 s14, s10			; GFX1064-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_getpc_b64 s[6:7]			; GFX1064-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-NEXT: s_mov_b32 s14, s10
				; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b32 s32, 0			; GFX1064-NEXT: s_mov_b32 s32, 0
	; GFX1064-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1064-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-NEXT: s_mov_b64 s[0:1], exec
	; GFX1064-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX1064-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1064-NEXT: s_ff1_i32_b32 s2, s1
				; GFX1064-NEXT: s_ff1_i32_b32 s3, s0
				; GFX1064-NEXT: s_add_i32 s2, s2, 32
				; GFX1064-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1064-NEXT: s_min_u32 s2, s3, s2
				; GFX1064-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1064-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1064-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1064-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX1064-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1064-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1064-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX1064-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1064-NEXT: s_cbranch_execz .LBB3_5
				; GFX1064-NEXT: ; %bb.3:
				; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-NEXT: v_mov_b32_e32 v3, 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1064-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1064-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1064-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1064-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB3_1			; GFX1064-NEXT: s_cbranch_execnz .LBB3_4
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB3_5:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
	; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-NEXT: s_mov_b32 s38, -1			; GFX1032-NEXT: s_mov_b32 s38, -1
	; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-NEXT: s_add_u32 s36, s36, s11			; GFX1032-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-NEXT: s_mov_b32 s12, s8			; GFX1032-NEXT: s_mov_b32 s12, s8
	; GFX1032-NEXT: s_add_u32 s8, s4, 44			; GFX1032-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-NEXT: s_mov_b32 s13, s9			; GFX1032-NEXT: s_mov_b32 s13, s9
	; GFX1032-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-NEXT: s_mov_b32 s14, s10			; GFX1032-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_getpc_b64 s[6:7]			; GFX1032-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-NEXT: s_mov_b32 s14, s10
				; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b32 s32, 0			; GFX1032-NEXT: s_mov_b32 s32, 0
	; GFX1032-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1032-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-NEXT: s_mov_b32 s0, exec_lo
	; GFX1032-NEXT: s_mov_b32 s0, 0			; GFX1032-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX1032-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1032-NEXT: s_ff1_i32_b32 s1, s0
				; GFX1032-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1032-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1032-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1032-NEXT: s_andn2_b32 s0, s0, s1
				; GFX1032-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1032-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1032-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1032-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX1032-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1032-NEXT: s_cbranch_execz .LBB3_5
				; GFX1032-NEXT: ; %bb.3:
				; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-NEXT: v_mov_b32_e32 v3, 0
				; GFX1032-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1032-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1032-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1032-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB3_1			; GFX1032-NEXT: s_cbranch_execnz .LBB3_4
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB3_5:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-NEXT: s_mov_b32 s12, s8			; GFX1164-NEXT: s_mov_b32 s12, s8
	; GFX1164-NEXT: s_add_u32 s8, s4, 44			; GFX1164-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-NEXT: s_mov_b32 s13, s9			; GFX1164-NEXT: s_mov_b32 s13, s9
	; GFX1164-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-NEXT: s_mov_b32 s14, s10			; GFX1164-NEXT: s_mov_b32 s14, s10
	; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-NEXT: s_mov_b32 s32, 0			; GFX1164-NEXT: s_mov_b32 s32, 0
	; GFX1164-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1164-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-NEXT: s_mov_b64 s[0:1], exec
	; GFX1164-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX1164-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(SKIP_4) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: s_ctz_i32_b32 s2, s1
				; GFX1164-NEXT: s_ctz_i32_b32 s3, s0
				; GFX1164-NEXT: s_add_i32 s2, s2, 32
				; GFX1164-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1164-NEXT: s_min_u32 s2, s3, s2
				; GFX1164-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1164-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1164-NEXT: s_and_not1_b64 s[0:1], s[0:1], s[2:3]
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1164-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1164-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX1164-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1164-NEXT: s_cbranch_execz .LBB3_5
				; GFX1164-NEXT: ; %bb.3:
				; GFX1164-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-NEXT: v_mov_b32_e32 v3, 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1164-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1164-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB3_1			; GFX1164-NEXT: s_cbranch_execnz .LBB3_4
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB3_5:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
	; GFX1132-NEXT: s_add_u32 s8, s4, 44			; GFX1132-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-NEXT: s_getpc_b64 s[6:7]			; GFX1132-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-NEXT: s_mov_b32 s12, s13			; GFX1132-NEXT: s_mov_b32 s12, s13
				; GFX1132-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-NEXT: s_mov_b32 s13, s14			; GFX1132-NEXT: s_mov_b32 s13, s14
	; GFX1132-NEXT: s_mov_b32 s14, s15			; GFX1132-NEXT: s_mov_b32 s14, s15
	; GFX1132-NEXT: s_mov_b32 s32, 0			; GFX1132-NEXT: s_mov_b32 s32, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1132-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-NEXT: s_mov_b32 s0, exec_lo
	; GFX1132-NEXT: s_mov_b32 s0, 0			; GFX1132-NEXT: .LBB3_1: ; %ComputeLoop
	; GFX1132-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: s_ctz_i32_b32 s1, s0
				; GFX1132-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1132-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1132-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(SALU_CYCLE_1)
				; GFX1132-NEXT: s_and_not1_b32 s0, s0, s1
				; GFX1132-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1132-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1132-NEXT: s_cbranch_scc1 .LBB3_1
				; GFX1132-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1132-NEXT: s_cbranch_execz .LBB3_5
				; GFX1132-NEXT: ; %bb.3:
				; GFX1132-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-NEXT: v_dual_mov_b32 v3, 0 :: v_dual_max_f32 v2, v2, v2
				; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1132-NEXT: .LBB3_4: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1132-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB3_1			; GFX1132-NEXT: s_cbranch_execnz .LBB3_4
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB3_5:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
	; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-DPP-NEXT: s_mov_b32 s38, -1			; GFX9-DPP-NEXT: s_mov_b32 s38, -1
	; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11
	; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-DPP-NEXT: s_mov_b32 s12, s8			; GFX9-DPP-NEXT: s_mov_b32 s12, s8
	; GFX9-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX9-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX9-DPP-NEXT: s_mov_b32 s13, s9			; GFX9-DPP-NEXT: s_mov_b32 s13, s9
	; GFX9-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX9-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]			; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-DPP-NEXT: s_mov_b32 s14, s10			; GFX9-DPP-NEXT: s_mov_b32 s14, s10
	; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-DPP-NEXT: s_mov_b32 s32, 0			; GFX9-DPP-NEXT: s_mov_b32 s32, 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v3, v0
	; GFX9-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 0
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:1 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:2 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:4 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:8 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_bcast:15 row_mask:0xa bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v4, v3 row_bcast:31 row_mask:0xc bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX9-DPP-NEXT: v_readlane_b32 s4, v3, 63
				; GFX9-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX9-DPP-NEXT: ; %bb.1:
				; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-DPP-NEXT: v_max_f32_e64 v6, s4, s4
				; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX9-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX9-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB3_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
	; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-DPP-NEXT: s_mov_b32 s38, -1			; GFX1064-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s12, s8			; GFX1064-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1064-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1064-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-DPP-NEXT: s_mov_b32 s13, s9			; GFX1064-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1064-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s14, s10			; GFX1064-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1064-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b32 s32, 0			; GFX1064-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1064-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1064-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_readlane_b32 s2, v3, 32
				; GFX1064-DPP-NEXT: v_readlane_b32 s3, v3, 0
				; GFX1064-DPP-NEXT: v_max_f32_e64 v3, s2, s2
				; GFX1064-DPP-NEXT: v_max_f32_e64 v4, s3, s3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v0
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX1064-DPP-NEXT: ; %bb.1:
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1064-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1064-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1064-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB3_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
	; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-DPP-NEXT: s_mov_b32 s38, -1			; GFX1032-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s12, s8			; GFX1032-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1032-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1032-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-DPP-NEXT: s_mov_b32 s13, s9			; GFX1032-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1032-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s14, s10			; GFX1032-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1032-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b32 s32, 0			; GFX1032-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
	; GFX1032-DPP-NEXT: s_mov_b32 s0, 0			; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1032-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1032-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX1032-DPP-NEXT: ; %bb.1:
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1032-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1032-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1032-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB3_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-DPP-NEXT: s_mov_b32 s12, s8			; GFX1164-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1164-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1164-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-DPP-NEXT: s_mov_b32 s13, s9			; GFX1164-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1164-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-DPP-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-DPP-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-DPP-NEXT: s_mov_b32 s14, s10			; GFX1164-DPP-NEXT: s_mov_b32 s14, s10
	; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-DPP-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-DPP-NEXT: s_mov_b32 s32, 0			; GFX1164-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, 0x7f800000
	; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1164-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0x7f800000
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_waitcnt_depctr 0xfff
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_permlane64_b32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX1164-DPP-NEXT: ; %bb.1:
				; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1164-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1164-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1164-DPP-NEXT: v_min_f32_e32 v4, v4, v6
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v4, v5
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1164-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB3_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_div_value_one_as_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
	; GFX1132-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1132-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1132-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-DPP-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b32 s12, s13			; GFX1132-DPP-NEXT: s_mov_b32 s12, s13
				; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-DPP-NEXT: s_mov_b32 s13, s14			; GFX1132-DPP-NEXT: s_mov_b32 s13, s14
	; GFX1132-DPP-NEXT: s_mov_b32 s14, s15			; GFX1132-DPP-NEXT: s_mov_b32 s14, s15
	; GFX1132-DPP-NEXT: s_mov_b32 s32, 0			; GFX1132-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, 0x7f800000
	; GFX1132-DPP-NEXT: s_mov_b32 s0, 0			; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1132-DPP-NEXT: .LBB3_1: ; %atomicrmw.start			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0x7f800000
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v2, v2 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v2, v1
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1132-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB3_3
				; GFX1132-DPP-NEXT: ; %bb.1:
				; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1132-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1132-DPP-NEXT: .LBB3_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1132-DPP-NEXT: v_min_f32_e32 v4, v4, v6
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v4, v5
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1132-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB3_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB3_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB3_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%divValue = call float @div.float.value()			%divValue = call float @div.float.value()
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float %divValue syncscope("one-as") monotonic			%result = atomicrmw fmin ptr addrspace(1) %ptr, float %divValue syncscope("one-as") monotonic
	ret void			ret void
	}			}


	define amdgpu_kernel void @global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
				; GFX7LESS-NEXT: v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
				; GFX7LESS-NEXT: v_mbcnt_hi_u32_b32_e32 v0, exec_hi, v0
				; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX7LESS-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX7LESS-NEXT: s_cbranch_execz .LBB4_3
				; GFX7LESS-NEXT: ; %bb.1:
	; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX7LESS-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX7LESS-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0			; GFX7LESS-NEXT: s_mov_b64 s[4:5], 0
	; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000			; GFX7LESS-NEXT: s_mov_b32 s3, 0xf000
	; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)			; GFX7LESS-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, s2
	; GFX7LESS-NEXT: s_mov_b32 s2, -1			; GFX7LESS-NEXT: s_mov_b32 s2, -1
	; GFX7LESS-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX7LESS-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX7LESS-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1			; GFX7LESS-NEXT: v_mul_f32_e32 v0, 1.0, v1
	; GFX7LESS-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX7LESS-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX7LESS-NEXT: s_waitcnt expcnt(0)			; GFX7LESS-NEXT: s_waitcnt expcnt(0)
	; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1			; GFX7LESS-NEXT: v_mov_b32_e32 v3, v1
	; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0			; GFX7LESS-NEXT: v_mov_b32_e32 v2, v0
	; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc			; GFX7LESS-NEXT: buffer_atomic_cmpswap v[2:3], off, s[0:3], 0 glc
	; GFX7LESS-NEXT: s_waitcnt vmcnt(0)			; GFX7LESS-NEXT: s_waitcnt vmcnt(0)
	; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1			; GFX7LESS-NEXT: v_cmp_eq_u32_e32 vcc, v2, v1
	; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]			; GFX7LESS-NEXT: s_or_b64 s[4:5], vcc, s[4:5]
	; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2			; GFX7LESS-NEXT: v_mov_b32_e32 v1, v2
	; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]			; GFX7LESS-NEXT: s_andn2_b64 exec, exec, s[4:5]
	; GFX7LESS-NEXT: s_cbranch_execnz .LBB4_1			; GFX7LESS-NEXT: s_cbranch_execnz .LBB4_2
	; GFX7LESS-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX7LESS-NEXT: .LBB4_3:
	; GFX7LESS-NEXT: s_endpgm			; GFX7LESS-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX9-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-NEXT: s_cbranch_execz .LBB4_3
				; GFX9-NEXT: ; %bb.1:
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b64 s[2:3], 0			; GFX9-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-NEXT: v_mov_b32_e32 v2, 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s4			; GFX9-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX9-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX9-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB4_1			; GFX9-NEXT: s_cbranch_execnz .LBB4_2
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB4_3:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-NEXT: s_cbranch_execz .LBB4_3
				; GFX1064-NEXT: ; %bb.1:
	; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX1064-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1064-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB4_1			; GFX1064-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB4_3:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-NEXT: s_cbranch_execz .LBB4_3
				; GFX1032-NEXT: ; %bb.1:
	; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-NEXT: s_mov_b32 s2, 0			; GFX1032-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1032-NEXT: .LBB4_1: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1032-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB4_1			; GFX1032-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB4_3:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_cbranch_execz .LBB4_3
				; GFX1164-NEXT: ; %bb.1:
	; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX1164-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1164-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB4_1			; GFX1164-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB4_3:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_cbranch_execz .LBB4_3
				; GFX1132-NEXT: ; %bb.1:
	; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-NEXT: s_mov_b32 s2, 0			; GFX1132-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1132-NEXT: .LBB4_1: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1132-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB4_1			; GFX1132-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB4_3:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
				; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX9-DPP-NEXT: ; %bb.1:
	; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0			; GFX9-DPP-NEXT: s_load_dword s4, s[0:1], 0x0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, s4
	; GFX9-DPP-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX9-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB4_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[2:3], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX1064-DPP-NEXT: ; %bb.1:
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1064-DPP-NEXT: s_load_dword s2, s[0:1], 0x0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1064-DPP-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1064-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB4_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s3, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX1032-DPP-NEXT: ; %bb.1:
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_load_dword s2, s[0:1], 0x0			; GFX1032-DPP-NEXT: s_load_dword s3, s[0:1], 0x0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1032-DPP-NEXT: s_mov_b32 s2, 0			; GFX1032-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: .LBB4_1: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1032-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB4_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], exec
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX1164-DPP-NEXT: ; %bb.1:
	; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1164-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, s2
	; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0			; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
	; GFX1164-DPP-NEXT: .LBB4_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1164-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB4_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_uni_value_defalut_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s3, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB4_3
				; GFX1132-DPP-NEXT: ; %bb.1:
	; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24			; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_load_b32 s2, s[0:1], 0x0			; GFX1132-DPP-NEXT: s_load_b32 s3, s[0:1], 0x0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s2			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, s3
	; GFX1132-DPP-NEXT: s_mov_b32 s2, 0			; GFX1132-DPP-NEXT: .LBB4_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: .LBB4_1: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0			; GFX1132-DPP-NEXT: v_min_f32_e32 v0, 4.0, v0
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v2, v[0:1], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB4_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB4_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB4_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float 4.0 monotonic, align 4			%result = atomicrmw fmin ptr addrspace(1) %ptr, float 4.0 monotonic, align 4
	ret void			ret void
	}			}

	define amdgpu_kernel void @global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe(ptr addrspace(1) %ptr) #0 {			define amdgpu_kernel void @global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe(ptr addrspace(1) %ptr) #0 {
	; GFX7LESS-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX7LESS-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX7LESS: ; %bb.0:			; GFX7LESS: ; %bb.0:
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; GFX9-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX9-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-NEXT: s_mov_b32 s38, -1			; GFX9-NEXT: s_mov_b32 s38, -1
	; GFX9-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-NEXT: s_add_u32 s36, s36, s11			; GFX9-NEXT: s_add_u32 s36, s36, s11
	; GFX9-NEXT: s_addc_u32 s37, s37, 0			; GFX9-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-NEXT: s_mov_b32 s12, s8			; GFX9-NEXT: s_mov_b32 s12, s8
	; GFX9-NEXT: s_add_u32 s8, s4, 44			; GFX9-NEXT: s_add_u32 s8, s34, 44
	; GFX9-NEXT: s_mov_b32 s13, s9			; GFX9-NEXT: s_mov_b32 s13, s9
	; GFX9-NEXT: s_addc_u32 s9, s5, 0			; GFX9-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-NEXT: s_getpc_b64 s[4:5]			; GFX9-NEXT: s_getpc_b64 s[4:5]
	; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-NEXT: s_mov_b32 s14, s10			; GFX9-NEXT: s_mov_b32 s14, s10
	; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-NEXT: s_mov_b32 s32, 0			; GFX9-NEXT: s_mov_b32 s32, 0
	; GFX9-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-NEXT: s_mov_b64 s[0:1], exec
	; GFX9-NEXT: s_mov_b64 s[0:1], 0			; GFX9-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX9-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX9-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX9-NEXT: s_ff1_i32_b32 s2, s1
				; GFX9-NEXT: s_ff1_i32_b32 s3, s0
				; GFX9-NEXT: s_add_i32 s2, s2, 32
				; GFX9-NEXT: s_min_u32 s2, s3, s2
				; GFX9-NEXT: v_readlane_b32 s4, v0, s2
				; GFX9-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX9-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX9-NEXT: v_max_f32_e64 v2, s4, s4
				; GFX9-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX9-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX9-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX9-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX9-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX9-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX9-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX9-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX9-NEXT: s_cbranch_execz .LBB5_5
				; GFX9-NEXT: ; %bb.3:
				; GFX9-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-NEXT: v_mov_b32_e32 v3, 0
				; GFX9-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX9-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-NEXT: v_min_f32_e32 v0, v0, v2			; GFX9-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX9-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-NEXT: v_mov_b32_e32 v1, v0			; GFX9-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-NEXT: s_cbranch_execnz .LBB5_1			; GFX9-NEXT: s_cbranch_execnz .LBB5_4
	; GFX9-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-NEXT: .LBB5_5:
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX1064-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX1064: ; %bb.0:			; GFX1064: ; %bb.0:
	; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-NEXT: s_mov_b32 s38, -1			; GFX1064-NEXT: s_mov_b32 s38, -1
	; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-NEXT: s_add_u32 s36, s36, s11			; GFX1064-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-NEXT: s_mov_b32 s12, s8			; GFX1064-NEXT: s_mov_b32 s12, s8
	; GFX1064-NEXT: s_add_u32 s8, s4, 44			; GFX1064-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-NEXT: s_mov_b32 s13, s9			; GFX1064-NEXT: s_mov_b32 s13, s9
	; GFX1064-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-NEXT: s_mov_b32 s14, s10			; GFX1064-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_getpc_b64 s[6:7]			; GFX1064-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-NEXT: s_mov_b32 s14, s10
				; GFX1064-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-NEXT: s_mov_b32 s32, 0			; GFX1064-NEXT: s_mov_b32 s32, 0
	; GFX1064-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1064-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-NEXT: s_mov_b64 s[0:1], exec
	; GFX1064-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX1064-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1064-NEXT: s_ff1_i32_b32 s2, s1
				; GFX1064-NEXT: s_ff1_i32_b32 s3, s0
				; GFX1064-NEXT: s_add_i32 s2, s2, 32
				; GFX1064-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1064-NEXT: s_min_u32 s2, s3, s2
				; GFX1064-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1064-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1064-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1064-NEXT: s_andn2_b64 s[0:1], s[0:1], s[2:3]
				; GFX1064-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1064-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1064-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX1064-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1064-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
				; GFX1064-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1064-NEXT: s_cbranch_execz .LBB5_5
				; GFX1064-NEXT: ; %bb.3:
				; GFX1064-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-NEXT: v_mov_b32_e32 v3, 0
				; GFX1064-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1064-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1064-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1064-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1064-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-NEXT: s_cbranch_execnz .LBB5_1			; GFX1064-NEXT: s_cbranch_execnz .LBB5_4
	; GFX1064-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-NEXT: .LBB5_5:
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX1032-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX1032: ; %bb.0:			; GFX1032: ; %bb.0:
	; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-NEXT: s_mov_b32 s38, -1			; GFX1032-NEXT: s_mov_b32 s38, -1
	; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-NEXT: s_add_u32 s36, s36, s11			; GFX1032-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-NEXT: s_mov_b32 s12, s8			; GFX1032-NEXT: s_mov_b32 s12, s8
	; GFX1032-NEXT: s_add_u32 s8, s4, 44			; GFX1032-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-NEXT: s_mov_b32 s13, s9			; GFX1032-NEXT: s_mov_b32 s13, s9
	; GFX1032-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-NEXT: s_mov_b32 s14, s10			; GFX1032-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_getpc_b64 s[6:7]			; GFX1032-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-NEXT: s_mov_b32 s14, s10
				; GFX1032-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-NEXT: s_mov_b32 s32, 0			; GFX1032-NEXT: s_mov_b32 s32, 0
	; GFX1032-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1032-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-NEXT: s_mov_b32 s0, exec_lo
	; GFX1032-NEXT: s_mov_b32 s0, 0			; GFX1032-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX1032-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1032-NEXT: s_ff1_i32_b32 s1, s0
				; GFX1032-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1032-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1032-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1032-NEXT: s_andn2_b32 s0, s0, s1
				; GFX1032-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1032-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1032-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1032-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX1032-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1032-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1032-NEXT: s_mov_b32 s2, 0
				; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
				; GFX1032-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1032-NEXT: s_cbranch_execz .LBB5_5
				; GFX1032-NEXT: ; %bb.3:
				; GFX1032-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-NEXT: v_mov_b32_e32 v3, 0
				; GFX1032-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1032-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-NEXT: global_load_dword v1, v3, s[0:1]
				; GFX1032-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1032-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1032-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-NEXT: global_atomic_cmpswap v0, v3, v[0:1], s[0:1] glc
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-NEXT: s_cbranch_execnz .LBB5_1			; GFX1032-NEXT: s_cbranch_execnz .LBB5_4
	; GFX1032-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-NEXT: .LBB5_5:
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	;			;
	; GFX1164-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX1164-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX1164: ; %bb.0:			; GFX1164: ; %bb.0:
				; GFX1164-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-NEXT: s_mov_b32 s12, s8			; GFX1164-NEXT: s_mov_b32 s12, s8
	; GFX1164-NEXT: s_add_u32 s8, s4, 44			; GFX1164-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-NEXT: s_mov_b32 s13, s9			; GFX1164-NEXT: s_mov_b32 s13, s9
	; GFX1164-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-NEXT: s_mov_b32 s14, s10			; GFX1164-NEXT: s_mov_b32 s14, s10
	; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-NEXT: s_mov_b32 s32, 0			; GFX1164-NEXT: s_mov_b32 s32, 0
	; GFX1164-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1164-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-NEXT: s_mov_b64 s[0:1], exec
	; GFX1164-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX1164-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(SKIP_4) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: s_ctz_i32_b32 s2, s1
				; GFX1164-NEXT: s_ctz_i32_b32 s3, s0
				; GFX1164-NEXT: s_add_i32 s2, s2, 32
				; GFX1164-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1164-NEXT: s_min_u32 s2, s3, s2
				; GFX1164-NEXT: v_readlane_b32 s3, v0, s2
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-NEXT: v_max_f32_e64 v2, s3, s3
				; GFX1164-NEXT: s_lshl_b64 s[2:3], 1, s2
				; GFX1164-NEXT: s_and_not1_b64 s[0:1], s[0:1], s[2:3]
				; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: s_cmp_lg_u64 s[0:1], 0
				; GFX1164-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1164-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX1164-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1164-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
				; GFX1164-NEXT: s_cbranch_execz .LBB5_5
				; GFX1164-NEXT: ; %bb.3:
				; GFX1164-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-NEXT: v_mov_b32_e32 v3, 0
				; GFX1164-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1164-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1164-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1164-NEXT: s_waitcnt vmcnt(0)			; GFX1164-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1164-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-NEXT: v_mov_b32_e32 v1, v0
	; GFX1164-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-NEXT: s_cbranch_execnz .LBB5_1			; GFX1164-NEXT: s_cbranch_execnz .LBB5_4
	; GFX1164-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-NEXT: .LBB5_5:
	; GFX1164-NEXT: s_endpgm			; GFX1164-NEXT: s_endpgm
	;			;
	; GFX1132-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX1132-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX1132: ; %bb.0:			; GFX1132: ; %bb.0:
	; GFX1132-NEXT: s_add_u32 s8, s4, 44			; GFX1132-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-NEXT: s_getpc_b64 s[6:7]			; GFX1132-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-NEXT: s_mov_b32 s12, s13			; GFX1132-NEXT: s_mov_b32 s12, s13
				; GFX1132-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-NEXT: s_mov_b32 s13, s14			; GFX1132-NEXT: s_mov_b32 s13, s14
	; GFX1132-NEXT: s_mov_b32 s14, s15			; GFX1132-NEXT: s_mov_b32 s14, s15
	; GFX1132-NEXT: s_mov_b32 s32, 0			; GFX1132-NEXT: s_mov_b32 s32, 0
	; GFX1132-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GFX1132-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-NEXT: s_mov_b32 s0, exec_lo
	; GFX1132-NEXT: s_mov_b32 s0, 0			; GFX1132-NEXT: .LBB5_1: ; %ComputeLoop
	; GFX1132-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: s_ctz_i32_b32 s1, s0
				; GFX1132-NEXT: v_max_f32_e32 v1, v2, v2
				; GFX1132-NEXT: v_readlane_b32 s2, v0, s1
				; GFX1132-NEXT: s_lshl_b32 s1, 1, s1
				; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(SALU_CYCLE_1)
				; GFX1132-NEXT: s_and_not1_b32 s0, s0, s1
				; GFX1132-NEXT: s_cmp_lg_u32 s0, 0
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-NEXT: v_max_f32_e64 v2, s2, s2
				; GFX1132-NEXT: v_min_f32_e32 v2, v1, v2
				; GFX1132-NEXT: s_cbranch_scc1 .LBB5_1
				; GFX1132-NEXT: ; %bb.2: ; %ComputeEnd
				; GFX1132-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-NEXT: s_mov_b32 s2, 0
				; GFX1132-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX1132-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-NEXT: s_xor_b32 s0, exec_lo, s0
				; GFX1132-NEXT: s_cbranch_execz .LBB5_5
				; GFX1132-NEXT: ; %bb.3:
				; GFX1132-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-NEXT: v_dual_mov_b32 v3, 0 :: v_dual_max_f32 v2, v2, v2
				; GFX1132-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-NEXT: global_load_b32 v1, v3, s[0:1]
				; GFX1132-NEXT: .LBB5_4: ; %atomicrmw.start
	; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1132-NEXT: v_min_f32_e32 v0, v0, v2
	; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-NEXT: global_atomic_cmpswap_b32 v0, v3, v[0:1], s[0:1] glc
	; GFX1132-NEXT: s_waitcnt vmcnt(0)			; GFX1132-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1132-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-NEXT: v_mov_b32_e32 v1, v0
	; GFX1132-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-NEXT: s_cbranch_execnz .LBB5_1			; GFX1132-NEXT: s_cbranch_execnz .LBB5_4
	; GFX1132-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-NEXT: .LBB5_5:
	; GFX1132-NEXT: s_endpgm			; GFX1132-NEXT: s_endpgm
	;			;
	; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX9-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX9-DPP: ; %bb.0:			; GFX9-DPP: ; %bb.0:
	; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX9-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX9-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX9-DPP-NEXT: s_mov_b32 s38, -1			; GFX9-DPP-NEXT: s_mov_b32 s38, -1
	; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000			; GFX9-DPP-NEXT: s_mov_b32 s39, 0xe00000
	; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX9-DPP-NEXT: s_add_u32 s36, s36, s11
	; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX9-DPP-NEXT: s_addc_u32 s37, s37, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX9-DPP-NEXT: s_mov_b32 s12, s8			; GFX9-DPP-NEXT: s_mov_b32 s12, s8
	; GFX9-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX9-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX9-DPP-NEXT: s_mov_b32 s13, s9			; GFX9-DPP-NEXT: s_mov_b32 s13, s9
	; GFX9-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX9-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX9-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]			; GFX9-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4			; GFX9-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12			; GFX9-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0			; GFX9-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX9-DPP-NEXT: s_mov_b32 s14, s10			; GFX9-DPP-NEXT: s_mov_b32 s14, s10
	; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX9-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
	; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX9-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
	; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX9-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX9-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX9-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2			; GFX9-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX9-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX9-DPP-NEXT: s_mov_b32 s32, 0			; GFX9-DPP-NEXT: s_mov_b32 s32, 0
	; GFX9-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX9-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX9-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX9-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
	; GFX9-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX9-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v1
	; GFX9-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v3, v0
	; GFX9-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX9-DPP-NEXT: s_not_b64 exec, exec
				; GFX9-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 0
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:1 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:2 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:4 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_shr:8 row_mask:0xf bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v5, v3 row_bcast:15 row_mask:0xa bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v5, v5, v5
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v5
				; GFX9-DPP-NEXT: s_nop 1
				; GFX9-DPP-NEXT: v_mov_b32_dpp v4, v3 row_bcast:31 row_mask:0xc bank_mask:0xf
				; GFX9-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX9-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX9-DPP-NEXT: v_readlane_b32 s4, v3, 63
				; GFX9-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX9-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX9-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX9-DPP-NEXT: ; %bb.1:
				; GFX9-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX9-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX9-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX9-DPP-NEXT: v_max_f32_e64 v6, s4, s4
				; GFX9-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX9-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX9-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX9-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX9-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX9-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX9-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX9-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX9-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX9-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX9-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX9-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX9-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX9-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX9-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX9-DPP-NEXT: .LBB5_3:
	; GFX9-DPP-NEXT: s_endpgm			; GFX9-DPP-NEXT: s_endpgm
	;			;
	; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX1064-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX1064-DPP: ; %bb.0:			; GFX1064-DPP: ; %bb.0:
	; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1064-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1064-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1064-DPP-NEXT: s_mov_b32 s38, -1			; GFX1064-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000			; GFX1064-DPP-NEXT: s_mov_b32 s39, 0x31e16000
	; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1064-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1064-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1064-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s12, s8			; GFX1064-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1064-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1064-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1064-DPP-NEXT: s_mov_b32 s13, s9			; GFX1064-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1064-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1064-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1064-DPP-NEXT: s_mov_b32 s14, s10			; GFX1064-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1064-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1064-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1064-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1064-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1064-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1064-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1064-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1064-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1064-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1064-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1064-DPP-NEXT: s_mov_b32 s32, 0			; GFX1064-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1064-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1064-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1064-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
	; GFX1064-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1064-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX1064-DPP-NEXT: s_not_b64 exec, exec
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1064-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1064-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1064-DPP-NEXT: v_readlane_b32 s2, v3, 32
				; GFX1064-DPP-NEXT: v_readlane_b32 s3, v3, 0
				; GFX1064-DPP-NEXT: v_max_f32_e64 v3, s2, s2
				; GFX1064-DPP-NEXT: v_max_f32_e64 v4, s3, s3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1064-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1064-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1064-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1064-DPP-NEXT: v_mbcnt_hi_u32_b32 v1, exec_hi, v0
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
				; GFX1064-DPP-NEXT: s_and_saveexec_b64 s[0:1], vcc
				; GFX1064-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX1064-DPP-NEXT: ; %bb.1:
				; GFX1064-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1064-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1064-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1064-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1064-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1064-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1064-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1064-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1064-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1064-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1064-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1064-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1064-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1064-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1
	; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1064-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1064-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1064-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GFX1064-DPP-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX1064-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX1064-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1064-DPP-NEXT: .LBB5_3:
	; GFX1064-DPP-NEXT: s_endpgm			; GFX1064-DPP-NEXT: s_endpgm
	;			;
	; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX1032-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX1032-DPP: ; %bb.0:			; GFX1032-DPP: ; %bb.0:
	; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0			; GFX1032-DPP-NEXT: s_mov_b32 s36, SCRATCH_RSRC_DWORD0
	; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1			; GFX1032-DPP-NEXT: s_mov_b32 s37, SCRATCH_RSRC_DWORD1
	; GFX1032-DPP-NEXT: s_mov_b32 s38, -1			; GFX1032-DPP-NEXT: s_mov_b32 s38, -1
	; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000			; GFX1032-DPP-NEXT: s_mov_b32 s39, 0x31c16000
	; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11			; GFX1032-DPP-NEXT: s_add_u32 s36, s36, s11
				; GFX1032-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0			; GFX1032-DPP-NEXT: s_addc_u32 s37, s37, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s12, s8			; GFX1032-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1032-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1032-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1032-DPP-NEXT: s_mov_b32 s13, s9			; GFX1032-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1032-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1032-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1032-DPP-NEXT: s_mov_b32 s14, s10			; GFX1032-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1032-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1032-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1032-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[6:7], 0x0
	; GFX1032-DPP-NEXT: s_load_dwordx2 s[34:35], s[4:5], 0x24
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v2, 20, v2
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[16:17], s[4:5], 0x0
	; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1			; GFX1032-DPP-NEXT: v_lshlrev_b32_e32 v1, 10, v1
				; GFX1032-DPP-NEXT: s_mov_b32 s14, s10
				; GFX1032-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1032-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1032-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
				; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]			; GFX1032-DPP-NEXT: s_mov_b64 s[0:1], s[36:37]
	; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]			; GFX1032-DPP-NEXT: s_mov_b64 s[2:3], s[38:39]
	; GFX1032-DPP-NEXT: v_or3_b32 v31, v0, v1, v2
	; GFX1032-DPP-NEXT: s_mov_b32 s32, 0			; GFX1032-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1032-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1032-DPP-NEXT: global_load_dword v1, v40, s[34:35]			; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1032-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
	; GFX1032-DPP-NEXT: s_mov_b32 s0, 0			; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1032-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v0
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, 0x7f800000
				; GFX1032-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1032-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v3, v4 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_max_f32_e32 v3, v3, v3
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v4, v3
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v5, 0x7f800000
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_dpp v5, v3 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v5, v5
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v4, v3
				; GFX1032-DPP-NEXT: v_permlanex16_b32 v4, v4, -1, -1
				; GFX1032-DPP-NEXT: v_max_f32_e32 v4, v4, v4
				; GFX1032-DPP-NEXT: v_min_f32_e32 v3, v3, v4
				; GFX1032-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1032-DPP-NEXT: v_mbcnt_lo_u32_b32 v1, exec_lo, 0
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v0, v3
				; GFX1032-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
				; GFX1032-DPP-NEXT: s_and_saveexec_b32 s0, vcc_lo
				; GFX1032-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX1032-DPP-NEXT: ; %bb.1:
				; GFX1032-DPP-NEXT: s_load_dwordx2 s[0:1], s[34:35], 0x24
				; GFX1032-DPP-NEXT: v_mov_b32_e32 v2, 0
				; GFX1032-DPP-NEXT: v_max_f32_e32 v6, v0, v0
				; GFX1032-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1032-DPP-NEXT: global_load_dword v1, v2, s[0:1]
				; GFX1032-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1032-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1032-DPP-NEXT: v_max_f32_e32 v0, v1, v1
	; GFX1032-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1032-DPP-NEXT: v_min_f32_e32 v0, v0, v6
	; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v40, v[0:1], s[34:35] glc			; GFX1032-DPP-NEXT: global_atomic_cmpswap v0, v2, v[0:1], s[0:1] glc
	; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1032-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1032-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1
	; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1032-DPP-NEXT: v_mov_b32_e32 v1, v0
	; GFX1032-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1032-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GFX1032-DPP-NEXT: s_andn2_b32 exec_lo, exec_lo, s2
	; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX1032-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX1032-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1032-DPP-NEXT: .LBB5_3:
	; GFX1032-DPP-NEXT: s_endpgm			; GFX1032-DPP-NEXT: s_endpgm
	;			;
	; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX1164-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX1164-DPP: ; %bb.0:			; GFX1164-DPP: ; %bb.0:
				; GFX1164-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1164-DPP-NEXT: s_mov_b32 s12, s8			; GFX1164-DPP-NEXT: s_mov_b32 s12, s8
	; GFX1164-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1164-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1164-DPP-NEXT: s_mov_b32 s13, s9			; GFX1164-DPP-NEXT: s_mov_b32 s13, s9
	; GFX1164-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1164-DPP-NEXT: s_addc_u32 s9, s35, 0
				; GFX1164-DPP-NEXT: s_getpc_b64 s[4:5]
				; GFX1164-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
				; GFX1164-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
				; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
	; GFX1164-DPP-NEXT: s_mov_b32 s14, s10			; GFX1164-DPP-NEXT: s_mov_b32 s14, s10
	; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1164-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1164-DPP-NEXT: s_getpc_b64 s[6:7]
	; GFX1164-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4
	; GFX1164-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12
	; GFX1164-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0
	; GFX1164-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1164-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1164-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1164-DPP-NEXT: s_mov_b32 s32, 0			; GFX1164-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v40, 0
	; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1164-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1164-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
	; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, 0x7f800000
	; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], 0			; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
	; GFX1164-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, 0x7f800000
				; GFX1164-DPP-NEXT: s_not_b64 exec, exec
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_waitcnt_depctr 0xfff
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v3, 0x7f800000
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: v_permlane64_b32 v2, v1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1164-DPP-NEXT: s_or_saveexec_b64 s[0:1], -1
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1164-DPP-NEXT: s_mov_b64 exec, s[0:1]
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instid1(SALU_CYCLE_1)
				; GFX1164-DPP-NEXT: v_mbcnt_hi_u32_b32 v0, exec_hi, v0
				; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1164-DPP-NEXT: s_mov_b64 s[0:1], exec
				; GFX1164-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1164-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX1164-DPP-NEXT: ; %bb.1:
				; GFX1164-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1164-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1164-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1164-DPP-NEXT: s_mov_b64 s[2:3], 0
				; GFX1164-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1164-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1164-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1164-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1164-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1164-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1164-DPP-NEXT: v_min_f32_e32 v4, v4, v6
	; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1164-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1164-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v0, v1			; GFX1164-DPP-NEXT: v_cmp_eq_u32_e32 vcc, v4, v5
	; GFX1164-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1164-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1164-DPP-NEXT: s_or_b64 s[0:1], vcc, s[0:1]			; GFX1164-DPP-NEXT: s_or_b64 s[2:3], vcc, s[2:3]
	; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1164-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[0:1]			; GFX1164-DPP-NEXT: s_and_not1_b64 exec, exec, s[2:3]
	; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX1164-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX1164-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1164-DPP-NEXT: .LBB5_3:
	; GFX1164-DPP-NEXT: s_endpgm			; GFX1164-DPP-NEXT: s_endpgm
	;			;
	; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:			; GFX1132-DPP-LABEL: global_atomic_fmin_uni_address_div_value_defalut_scope_unsafe:
	; GFX1132-DPP: ; %bb.0:			; GFX1132-DPP: ; %bb.0:
	; GFX1132-DPP-NEXT: s_add_u32 s8, s4, 44			; GFX1132-DPP-NEXT: s_mov_b64 s[34:35], s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s9, s5, 0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]			; GFX1132-DPP-NEXT: s_add_u32 s8, s34, 44
	; GFX1132-DPP-NEXT: s_getpc_b64 s[6:7]			; GFX1132-DPP-NEXT: s_addc_u32 s9, s35, 0
	; GFX1132-DPP-NEXT: s_add_u32 s6, s6, div.float.value@gotpcrel32@lo+4			; GFX1132-DPP-NEXT: s_getpc_b64 s[4:5]
	; GFX1132-DPP-NEXT: s_addc_u32 s7, s7, div.float.value@gotpcrel32@hi+12			; GFX1132-DPP-NEXT: s_add_u32 s4, s4, div.float.value@gotpcrel32@lo+4
	; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[6:7], 0x0			; GFX1132-DPP-NEXT: s_addc_u32 s5, s5, div.float.value@gotpcrel32@hi+12
	; GFX1132-DPP-NEXT: s_load_b64 s[34:35], s[4:5], 0x24
	; GFX1132-DPP-NEXT: v_dual_mov_b32 v40, 0 :: v_dual_mov_b32 v31, v0
	; GFX1132-DPP-NEXT: s_mov_b32 s12, s13			; GFX1132-DPP-NEXT: s_mov_b32 s12, s13
				; GFX1132-DPP-NEXT: s_load_b64 s[16:17], s[4:5], 0x0
				; GFX1132-DPP-NEXT: s_mov_b64 s[10:11], s[6:7]
	; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]			; GFX1132-DPP-NEXT: s_mov_b64 s[4:5], s[0:1]
	; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]			; GFX1132-DPP-NEXT: s_mov_b64 s[6:7], s[2:3]
	; GFX1132-DPP-NEXT: s_mov_b32 s13, s14			; GFX1132-DPP-NEXT: s_mov_b32 s13, s14
	; GFX1132-DPP-NEXT: s_mov_b32 s14, s15			; GFX1132-DPP-NEXT: s_mov_b32 s14, s15
	; GFX1132-DPP-NEXT: s_mov_b32 s32, 0			; GFX1132-DPP-NEXT: s_mov_b32 s32, 0
	; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
	; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GFX1132-DPP-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GFX1132-DPP-NEXT: global_load_b32 v1, v40, s[34:35]			; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
	; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v0, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, 0x7f800000
	; GFX1132-DPP-NEXT: s_mov_b32 s0, 0			; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
	; GFX1132-DPP-NEXT: .LBB5_1: ; %atomicrmw.start			; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v0
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, 0x7f800000
				; GFX1132-DPP-NEXT: s_not_b32 exec_lo, exec_lo
				; GFX1132-DPP-NEXT: s_or_saveexec_b32 s0, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v1, v2 row_xmask:1 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v2, v2 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: v_max_f32_e32 v1, v1, v1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v2, v1
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:2 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:4 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: v_dual_max_f32 v2, v3, v3 :: v_dual_mov_b32 v3, 0x7f800000
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: v_mov_b32_dpp v3, v1 row_xmask:8 row_mask:0xf bank_mask:0xf
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v3, v3
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v2, v1
				; GFX1132-DPP-NEXT: v_permlanex16_b32 v2, v2, -1, -1
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX1132-DPP-NEXT: v_max_f32_e32 v2, v2, v2
				; GFX1132-DPP-NEXT: v_min_f32_e32 v1, v1, v2
				; GFX1132-DPP-NEXT: s_mov_b32 exec_lo, s0
				; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_mbcnt_lo_u32_b32 v0, exec_lo, 0
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v4, v1
				; GFX1132-DPP-NEXT: s_mov_b32 s2, 0
				; GFX1132-DPP-NEXT: s_mov_b32 s0, exec_lo
				; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX1132-DPP-NEXT: v_cmpx_eq_u32_e32 0, v0
				; GFX1132-DPP-NEXT: s_cbranch_execz .LBB5_3
				; GFX1132-DPP-NEXT: ; %bb.1:
				; GFX1132-DPP-NEXT: s_load_b64 s[0:1], s[34:35], 0x24
				; GFX1132-DPP-NEXT: v_mov_b32_e32 v0, 0
				; GFX1132-DPP-NEXT: v_max_f32_e32 v6, v4, v4
				; GFX1132-DPP-NEXT: s_waitcnt lgkmcnt(0)
				; GFX1132-DPP-NEXT: global_load_b32 v5, v0, s[0:1]
				; GFX1132-DPP-NEXT: .LBB5_2: ; %atomicrmw.start
	; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX1132-DPP-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_max_f32_e32 v0, v1, v1			; GFX1132-DPP-NEXT: v_max_f32_e32 v4, v5, v5
	; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX1132-DPP-NEXT: v_min_f32_e32 v0, v0, v2			; GFX1132-DPP-NEXT: v_min_f32_e32 v4, v4, v6
	; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v0, v40, v[0:1], s[34:35] glc			; GFX1132-DPP-NEXT: global_atomic_cmpswap_b32 v4, v0, v[4:5], s[0:1] glc
	; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)			; GFX1132-DPP-NEXT: s_waitcnt vmcnt(0)
	; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v0, v1			; GFX1132-DPP-NEXT: v_cmp_eq_u32_e32 vcc_lo, v4, v5
	; GFX1132-DPP-NEXT: v_mov_b32_e32 v1, v0			; GFX1132-DPP-NEXT: v_mov_b32_e32 v5, v4
	; GFX1132-DPP-NEXT: s_or_b32 s0, vcc_lo, s0			; GFX1132-DPP-NEXT: s_or_b32 s2, vcc_lo, s2
	; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)			; GFX1132-DPP-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
	; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s0			; GFX1132-DPP-NEXT: s_and_not1_b32 exec_lo, exec_lo, s2
	; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB5_1			; GFX1132-DPP-NEXT: s_cbranch_execnz .LBB5_2
	; GFX1132-DPP-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX1132-DPP-NEXT: .LBB5_3:
	; GFX1132-DPP-NEXT: s_endpgm			; GFX1132-DPP-NEXT: s_endpgm
	%divValue = call float @div.float.value()			%divValue = call float @div.float.value()
	%result = atomicrmw fmin ptr addrspace(1) %ptr, float %divValue monotonic, align 4			%result = atomicrmw fmin ptr addrspace(1) %ptr, float %divValue monotonic, align 4
	ret void			ret void
	}			}

	attributes #0 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "amdgpu-unsafe-fp-atomics"="true" }			attributes #0 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "amdgpu-unsafe-fp-atomics"="true" }

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Support FMin/FMax in AMDGPUAtomicOptimizer.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 554748

llvm/lib/Target/AMDGPU/AMDGPUAtomicOptimizer.cpp

llvm/test/CodeGen/AMDGPU/global_atomic_optimizer_fp_rtn.ll

llvm/test/CodeGen/AMDGPU/global_atomics_optimizer_fp_no_rtn.ll

llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmax.ll

llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmin.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Support FMin/FMax in AMDGPUAtomicOptimizer.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 554748

llvm/lib/Target/AMDGPU/AMDGPUAtomicOptimizer.cpp

llvm/test/CodeGen/AMDGPU/global_atomic_optimizer_fp_rtn.ll

llvm/test/CodeGen/AMDGPU/global_atomics_optimizer_fp_no_rtn.ll

llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmax.ll

llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmin.ll

[AMDGPU] Support FMin/FMax in AMDGPUAtomicOptimizer.
ClosedPublic