This is an archive of the discontinued LLVM Phabricator instance.

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
2469	The comment says 33 if Hi and Lo have the same sign, but the expression gives 33 if they have different sign. Do you want `33 - ((Lo ^ Hi) >> 31)`?

Fix the calculation of MaxShAmt.

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
2469	Good catch. That's wrong. Corrected in the latest revision.

Harbormaster completed remote builds in B118307: Diff 364683.Aug 5 2021, 8:52 PM

LGTM, thanks!

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
2496–2498	Another possible micro-optimization is to push the -1 into the umin, to shorten the critical path: `umin((ffbh hi)-1, ((hi^lo) ashr 31)+32)`

This revision is now accepted and ready to land.Aug 6 2021, 2:09 AM

Closed by commit rG05783e1cfe40: [amdgpu] Revise the conversion from i64 to f32. (authored by hliao). · Explain WhyAug 6 2021, 2:02 PM

This revision was automatically updated to reflect the committed changes.

hliao added a commit: rG05783e1cfe40: [amdgpu] Revise the conversion from i64 to f32..

hliao marked an inline comment as done.Aug 6 2021, 2:02 PM

Revision Contents

Path

Size

llvm/

lib/

Target/

AMDGPU/

AMDGPUISelLowering.cpp

49 lines

AMDGPULegalizerInfo.cpp

18 lines

test/

CodeGen/

AMDGPU/

GlobalISel/

30 lines

236 lines

94 lines

774 lines

288 lines

Diff 364883

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp

Show First 20 Lines • Show All 2,451 Lines • ▼ Show 20 Lines	SDValue AMDGPUTargetLowering::LowerINT_TO_FP32(SDValue Op, SelectionDAG &DAG,
//		//
// The signed one follows the same principle but uses 'ffbh_i32' to count its		// The signed one follows the same principle but uses 'ffbh_i32' to count its
// sign bits instead. If 'ffbh_i32' is not available, its absolute value is		// sign bits instead. If 'ffbh_i32' is not available, its absolute value is
// converted instead followed by negation based its sign bit.		// converted instead followed by negation based its sign bit.

SDLoc SL(Op);		SDLoc SL(Op);
SDValue Src = Op.getOperand(0);		SDValue Src = Op.getOperand(0);

EVT SetCCVT =
getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), MVT::i32);
SDValue ZeroI32 = DAG.getConstant(0, SL, MVT::i32);

SDValue Lo, Hi;		SDValue Lo, Hi;
std::tie(Lo, Hi) = split64BitValue(Src, DAG);		std::tie(Lo, Hi) = split64BitValue(Src, DAG);
SDValue Sign;		SDValue Sign;
SDValue ShAmt;		SDValue ShAmt;
if (Signed && Subtarget->isGCN()) {		if (Signed && Subtarget->isGCN()) {
// We also need to consider the sign bit in Lo if Hi has just sign bits,		// We also need to consider the sign bit in Lo if Hi has just sign bits,
// i.e. Hi is 0 or -1. However, that only needs to take the MSB into		// i.e. Hi is 0 or -1. However, that only needs to take the MSB into
// account.		// account. That is, the maximal shift is
SDValue HasSameSign =		// - 32 if Lo and Hi have opposite signs;
DAG.getSetCC(SL, SetCCVT, DAG.getNode(ISD::XOR, SL, MVT::i32, Lo, Hi),		// - 33 if Lo and Hi have the same sign.
		foadUnsubmitted Done Reply Inline Actions The comment says 33 if Hi and Lo have the same sign, but the expression gives 33 if they have different sign. Do you want `33 - ((Lo ^ Hi) >> 31)`? foad: The comment says 33 if Hi and Lo have the same sign, but the expression gives 33 if they have…
		hliaoAuthorUnsubmitted Done Reply Inline Actions Good catch. That's wrong. Corrected in the latest revision. hliao: Good catch. That's wrong. Corrected in the latest revision.
ZeroI32, ISD::SETGE);		//
SDValue MaxShAmt = DAG.getSelect(SL, MVT::i32, HasSameSign,		// Or, MaxShAmt = 33 + OppositeSign, where
DAG.getConstant(33, SL, MVT::i32),		//
DAG.getConstant(32, SL, MVT::i32));		// OppositeSign is defined as ((Lo ^ Hi) >> 31), which is
		// - -1 if Lo and Hi have opposite signs; and
		// - 0 otherwise.
		//
		// All in all, ShAmt is calculated as
		//
		// umin(sffbh(Hi), 33 + (Lo^Hi)>>31) - 1.
		//
		// or
		//
		// umin(sffbh(Hi) - 1, 32 + (Lo^Hi)>>31).
		//
		// to reduce the critical path.
		SDValue OppositeSign = DAG.getNode(
		ISD::SRA, SL, MVT::i32, DAG.getNode(ISD::XOR, SL, MVT::i32, Lo, Hi),
		DAG.getConstant(31, SL, MVT::i32));
		SDValue MaxShAmt =
		DAG.getNode(ISD::ADD, SL, MVT::i32, DAG.getConstant(32, SL, MVT::i32),
		OppositeSign);
// Count the leading sign bits.		// Count the leading sign bits.
ShAmt = DAG.getNode(AMDGPUISD::FFBH_I32, SL, MVT::i32, Hi);		ShAmt = DAG.getNode(AMDGPUISD::FFBH_I32, SL, MVT::i32, Hi);
ShAmt = DAG.getSelect(SL, MVT::i32,
DAG.getSetCC(SL, SetCCVT, ShAmt,
DAG.getAllOnesConstant(SL, MVT::i32),
ISD::SETNE),
ShAmt, MaxShAmt);
// The shift amount for signed integers is [1, 33].
// Different from unsigned conversion, the shift should be one bit less to		// Different from unsigned conversion, the shift should be one bit less to
// preserve the sign bit.		// preserve the sign bit.
ShAmt = DAG.getNode(ISD::SUB, SL, MVT::i32, ShAmt,		ShAmt = DAG.getNode(ISD::SUB, SL, MVT::i32, ShAmt,
DAG.getConstant(1, SL, MVT::i32));		DAG.getConstant(1, SL, MVT::i32));
		ShAmt = DAG.getNode(ISD::UMIN, SL, MVT::i32, ShAmt, MaxShAmt);
		foadUnsubmitted Not Done Reply Inline Actions Another possible micro-optimization is to push the -1 into the umin, to shorten the critical path: `umin((ffbh hi)-1, ((hi^lo) ashr 31)+32)` foad: Another possible micro-optimization is to push the -1 into the umin, to shorten the critical…
} else {		} else {
if (Signed) {		if (Signed) {
// Without 'ffbh_i32', only leading zeros could be counted. Take the		// Without 'ffbh_i32', only leading zeros could be counted. Take the
// absolute value first.		// absolute value first.
Sign = DAG.getNode(ISD::SRA, SL, MVT::i64, Src,		Sign = DAG.getNode(ISD::SRA, SL, MVT::i64, Src,
DAG.getConstant(63, SL, MVT::i64));		DAG.getConstant(63, SL, MVT::i64));
SDValue Abs =		SDValue Abs =
DAG.getNode(ISD::XOR, SL, MVT::i64,		DAG.getNode(ISD::XOR, SL, MVT::i64,
DAG.getNode(ISD::ADD, SL, MVT::i64, Src, Sign), Sign);		DAG.getNode(ISD::ADD, SL, MVT::i64, Src, Sign), Sign);
std::tie(Lo, Hi) = split64BitValue(Abs, DAG);		std::tie(Lo, Hi) = split64BitValue(Abs, DAG);
}		}
// Count the leading zeros.		// Count the leading zeros.
ShAmt = DAG.getNode(ISD::CTLZ, SL, MVT::i32, Hi);		ShAmt = DAG.getNode(ISD::CTLZ, SL, MVT::i32, Hi);
// The shift amount for signed integers is [0, 32].		// The shift amount for signed integers is [0, 32].
}		}
// Normalize the given 64-bit integer.		// Normalize the given 64-bit integer.
SDValue Norm = DAG.getNode(ISD::SHL, SL, MVT::i64, Src, ShAmt);		SDValue Norm = DAG.getNode(ISD::SHL, SL, MVT::i64, Src, ShAmt);
// Split it again.		// Split it again.
std::tie(Lo, Hi) = split64BitValue(Norm, DAG);		std::tie(Lo, Hi) = split64BitValue(Norm, DAG);
// Calculate the adjust bit for rounding.		// Calculate the adjust bit for rounding.
SDValue Adjust = DAG.getSelect(		// (lo != 0) ? 1 : 0 => (lo >= 1) ? 1 : 0 => umin(1, lo)
SL, MVT::i32, DAG.getSetCC(SL, SetCCVT, Lo, ZeroI32, ISD::SETNE),		SDValue Adjust = DAG.getNode(ISD::UMIN, SL, MVT::i32,
DAG.getConstant(1, SL, MVT::i32), ZeroI32);		DAG.getConstant(1, SL, MVT::i32), Lo);
// Get the 32-bit normalized integer.		// Get the 32-bit normalized integer.
Norm = DAG.getNode(ISD::OR, SL, MVT::i32, Hi, Adjust);		Norm = DAG.getNode(ISD::OR, SL, MVT::i32, Hi, Adjust);
// Convert the normalized 32-bit integer into f32.		// Convert the normalized 32-bit integer into f32.
unsigned Opc =		unsigned Opc =
(Signed && Subtarget->isGCN()) ? ISD::SINT_TO_FP : ISD::UINT_TO_FP;		(Signed && Subtarget->isGCN()) ? ISD::SINT_TO_FP : ISD::UINT_TO_FP;
SDValue FVal = DAG.getNode(Opc, SL, MVT::f32, Norm);		SDValue FVal = DAG.getNode(Opc, SL, MVT::f32, Norm);

// Finally, need to scale back the converted floating number as the original		// Finally, need to scale back the converted floating number as the original
▲ Show 20 Lines • Show All 2,333 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.cpp

Show First 20 Lines • Show All 2,059 Lines • ▼ Show 20 Lines	bool AMDGPULegalizerInfo::legalizeITOFP(
MachineInstr &MI, MachineRegisterInfo &MRI,		MachineInstr &MI, MachineRegisterInfo &MRI,
MachineIRBuilder &B, bool Signed) const {		MachineIRBuilder &B, bool Signed) const {

Register Dst = MI.getOperand(0).getReg();		Register Dst = MI.getOperand(0).getReg();
Register Src = MI.getOperand(1).getReg();		Register Src = MI.getOperand(1).getReg();

const LLT S64 = LLT::scalar(64);		const LLT S64 = LLT::scalar(64);
const LLT S32 = LLT::scalar(32);		const LLT S32 = LLT::scalar(32);
const LLT S1 = LLT::scalar(1);

assert(MRI.getType(Src) == S64);		assert(MRI.getType(Src) == S64);

auto Unmerge = B.buildUnmerge({S32, S32}, Src);		auto Unmerge = B.buildUnmerge({S32, S32}, Src);
auto ThirtyTwo = B.buildConstant(S32, 32);		auto ThirtyTwo = B.buildConstant(S32, 32);

if (MRI.getType(Dst) == S64) {		if (MRI.getType(Dst) == S64) {
auto CvtHi = Signed ? B.buildSITOFP(S64, Unmerge.getReg(1))		auto CvtHi = Signed ? B.buildSITOFP(S64, Unmerge.getReg(1))
: B.buildUITOFP(S64, Unmerge.getReg(1));		: B.buildUITOFP(S64, Unmerge.getReg(1));

auto CvtLo = B.buildUITOFP(S64, Unmerge.getReg(0));		auto CvtLo = B.buildUITOFP(S64, Unmerge.getReg(0));
auto LdExp = B.buildIntrinsic(Intrinsic::amdgcn_ldexp, {S64}, false)		auto LdExp = B.buildIntrinsic(Intrinsic::amdgcn_ldexp, {S64}, false)
.addUse(CvtHi.getReg(0))		.addUse(CvtHi.getReg(0))
.addUse(ThirtyTwo.getReg(0));		.addUse(ThirtyTwo.getReg(0));

// TODO: Should this propagate fast-math-flags?		// TODO: Should this propagate fast-math-flags?
B.buildFAdd(Dst, LdExp, CvtLo);		B.buildFAdd(Dst, LdExp, CvtLo);
MI.eraseFromParent();		MI.eraseFromParent();
return true;		return true;
}		}

assert(MRI.getType(Dst) == S32);		assert(MRI.getType(Dst) == S32);

auto Zero = B.buildConstant(S32, 0);
auto One = B.buildConstant(S32, 1);		auto One = B.buildConstant(S32, 1);
auto AllOnes = B.buildConstant(S32, -1);

MachineInstrBuilder ShAmt;		MachineInstrBuilder ShAmt;
if (Signed) {		if (Signed) {
auto ThirtyThree = B.buildConstant(S32, 33);		auto ThirtyOne = B.buildConstant(S32, 31);
auto X = B.buildXor(S32, Unmerge.getReg(0), Unmerge.getReg(1));		auto X = B.buildXor(S32, Unmerge.getReg(0), Unmerge.getReg(1));
auto HasSameSign = B.buildICmp(CmpInst::ICMP_SGE, S1, X, Zero);		auto OppositeSign = B.buildAShr(S32, X, ThirtyOne);
auto MaxShAmt = B.buildSelect(S32, HasSameSign, ThirtyThree, ThirtyTwo);		auto MaxShAmt = B.buildAdd(S32, ThirtyTwo, OppositeSign);
auto LS = B.buildIntrinsic(Intrinsic::amdgcn_sffbh, {S32},		auto LS = B.buildIntrinsic(Intrinsic::amdgcn_sffbh, {S32},
/HasSideEffects=/false)		/HasSideEffects=/false)
.addUse(Unmerge.getReg(1));		.addUse(Unmerge.getReg(1));
auto NotAllSameBits = B.buildICmp(CmpInst::ICMP_NE, S1, LS, AllOnes);		auto LS2 = B.buildSub(S32, LS, One);
auto LS2 = B.buildSelect(S32, NotAllSameBits, LS, MaxShAmt);		ShAmt = B.buildUMin(S32, LS2, MaxShAmt);
ShAmt = B.buildSub(S32, LS2, One);
} else		} else
ShAmt = B.buildCTLZ(S32, Unmerge.getReg(1));		ShAmt = B.buildCTLZ(S32, Unmerge.getReg(1));
auto Norm = B.buildShl(S64, Src, ShAmt);		auto Norm = B.buildShl(S64, Src, ShAmt);
auto Unmerge2 = B.buildUnmerge({S32, S32}, Norm);		auto Unmerge2 = B.buildUnmerge({S32, S32}, Norm);
auto NotAllZeros =		auto Adjust = B.buildUMin(S32, One, Unmerge2.getReg(0));
B.buildICmp(CmpInst::ICMP_NE, S1, Unmerge2.getReg(0), Zero);
auto Adjust = B.buildSelect(S32, NotAllZeros, One, Zero);
auto Norm2 = B.buildOr(S32, Unmerge2.getReg(1), Adjust);		auto Norm2 = B.buildOr(S32, Unmerge2.getReg(1), Adjust);
auto FVal = Signed ? B.buildSITOFP(S32, Norm2) : B.buildUITOFP(S32, Norm2);		auto FVal = Signed ? B.buildSITOFP(S32, Norm2) : B.buildUITOFP(S32, Norm2);
auto Scale = B.buildSub(S32, ThirtyTwo, ShAmt);		auto Scale = B.buildSub(S32, ThirtyTwo, ShAmt);
B.buildIntrinsic(Intrinsic::amdgcn_ldexp, ArrayRef<Register>{Dst},		B.buildIntrinsic(Intrinsic::amdgcn_ldexp, ArrayRef<Register>{Dst},
/HasSideEffects=/false)		/HasSideEffects=/false)
.addUse(FVal.getReg(0))		.addUse(FVal.getReg(0))
.addUse(Scale.getReg(0));		.addUse(Scale.getReg(0));
MI.eraseFromParent();		MI.eraseFromParent();
▲ Show 20 Lines • Show All 3,006 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/cvt_f32_ubyte.ll

Show First 20 Lines • Show All 1,076 Lines • ▼ Show 20 Lines	bb:
store float %add, float addrspace(1)* %out		store float %add, float addrspace(1)* %out
ret void		ret void
}		}

define float @v_test_sitofp_i64_byte_to_f32(i64 %arg0) {		define float @v_test_sitofp_i64_byte_to_f32(i64 %arg0) {
; SI-LABEL: v_test_sitofp_i64_byte_to_f32:		; SI-LABEL: v_test_sitofp_i64_byte_to_f32:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; SI-NEXT: v_ffbh_i32_e32 v2, 0
; SI-NEXT: v_cmp_ne_u32_e32 vcc, -1, v2
; SI-NEXT: v_cndmask_b32_e32 v2, 33, v2, vcc
; SI-NEXT: v_and_b32_e32 v0, 0xff, v0		; SI-NEXT: v_and_b32_e32 v0, 0xff, v0
		; SI-NEXT: v_ashrrev_i32_e32 v2, 31, v0
		; SI-NEXT: v_ffbh_i32_e32 v3, 0
		; SI-NEXT: v_add_i32_e32 v2, vcc, 32, v2
		; SI-NEXT: v_subrev_i32_e32 v3, vcc, 1, v3
; SI-NEXT: v_mov_b32_e32 v1, 0		; SI-NEXT: v_mov_b32_e32 v1, 0
; SI-NEXT: v_subrev_i32_e32 v2, vcc, 1, v2		; SI-NEXT: v_min_u32_e32 v2, v3, v2
; SI-NEXT: v_lshl_b64 v[0:1], v[0:1], v2		; SI-NEXT: v_lshl_b64 v[0:1], v[0:1], v2
; SI-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0		; SI-NEXT: v_min_u32_e32 v0, 1, v0
; SI-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
; SI-NEXT: v_or_b32_e32 v0, v1, v0		; SI-NEXT: v_or_b32_e32 v0, v1, v0
; SI-NEXT: v_cvt_f32_i32_e32 v0, v0		; SI-NEXT: v_cvt_f32_i32_e32 v0, v0
; SI-NEXT: v_sub_i32_e32 v1, vcc, 32, v2		; SI-NEXT: v_sub_i32_e32 v1, vcc, 32, v2
; SI-NEXT: v_ldexp_f32_e32 v0, v0, v1		; SI-NEXT: v_ldexp_f32_e32 v0, v0, v1
; SI-NEXT: s_setpc_b64 s[30:31]		; SI-NEXT: s_setpc_b64 s[30:31]
;		;
; VI-LABEL: v_test_sitofp_i64_byte_to_f32:		; VI-LABEL: v_test_sitofp_i64_byte_to_f32:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; VI-NEXT: v_ffbh_i32_e32 v2, 0
; VI-NEXT: v_cmp_ne_u32_e32 vcc, -1, v2
; VI-NEXT: v_cndmask_b32_e32 v2, 33, v2, vcc
; VI-NEXT: v_and_b32_e32 v0, 0xff, v0		; VI-NEXT: v_and_b32_e32 v0, 0xff, v0
		; VI-NEXT: v_ashrrev_i32_e32 v2, 31, v0
		; VI-NEXT: v_ffbh_i32_e32 v3, 0
		; VI-NEXT: v_add_u32_e32 v2, vcc, 32, v2
		; VI-NEXT: v_subrev_u32_e32 v3, vcc, 1, v3
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: v_subrev_u32_e32 v2, vcc, 1, v2		; VI-NEXT: v_min_u32_e32 v2, v3, v2
; VI-NEXT: v_lshlrev_b64 v[0:1], v2, v[0:1]		; VI-NEXT: v_lshlrev_b64 v[0:1], v2, v[0:1]
; VI-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0		; VI-NEXT: v_min_u32_e32 v0, 1, v0
; VI-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
; VI-NEXT: v_or_b32_e32 v0, v1, v0		; VI-NEXT: v_or_b32_e32 v0, v1, v0
; VI-NEXT: v_cvt_f32_i32_e32 v0, v0		; VI-NEXT: v_cvt_f32_i32_e32 v0, v0
; VI-NEXT: v_sub_u32_e32 v1, vcc, 32, v2		; VI-NEXT: v_sub_u32_e32 v1, vcc, 32, v2
; VI-NEXT: v_ldexp_f32 v0, v0, v1		; VI-NEXT: v_ldexp_f32 v0, v0, v1
; VI-NEXT: s_setpc_b64 s[30:31]		; VI-NEXT: s_setpc_b64 s[30:31]
%masked = and i64 %arg0, 255		%masked = and i64 %arg0, 255
%itofp = sitofp i64 %masked to float		%itofp = sitofp i64 %masked to float
ret float %itofp		ret float %itofp
}		}

define float @v_test_uitofp_i64_byte_to_f32(i64 %arg0) {		define float @v_test_uitofp_i64_byte_to_f32(i64 %arg0) {
; SI-LABEL: v_test_uitofp_i64_byte_to_f32:		; SI-LABEL: v_test_uitofp_i64_byte_to_f32:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; SI-NEXT: v_ffbh_u32_e32 v2, 0		; SI-NEXT: v_ffbh_u32_e32 v2, 0
; SI-NEXT: v_and_b32_e32 v0, 0xff, v0		; SI-NEXT: v_and_b32_e32 v0, 0xff, v0
; SI-NEXT: v_mov_b32_e32 v1, 0		; SI-NEXT: v_mov_b32_e32 v1, 0
; SI-NEXT: v_min_u32_e32 v2, 32, v2		; SI-NEXT: v_min_u32_e32 v2, 32, v2
; SI-NEXT: v_lshl_b64 v[0:1], v[0:1], v2		; SI-NEXT: v_lshl_b64 v[0:1], v[0:1], v2
; SI-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0		; SI-NEXT: v_min_u32_e32 v0, 1, v0
; SI-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
; SI-NEXT: v_or_b32_e32 v0, v1, v0		; SI-NEXT: v_or_b32_e32 v0, v1, v0
; SI-NEXT: v_cvt_f32_u32_e32 v0, v0		; SI-NEXT: v_cvt_f32_u32_e32 v0, v0
; SI-NEXT: v_sub_i32_e32 v1, vcc, 32, v2		; SI-NEXT: v_sub_i32_e32 v1, vcc, 32, v2
; SI-NEXT: v_ldexp_f32_e32 v0, v0, v1		; SI-NEXT: v_ldexp_f32_e32 v0, v0, v1
; SI-NEXT: s_setpc_b64 s[30:31]		; SI-NEXT: s_setpc_b64 s[30:31]
;		;
; VI-LABEL: v_test_uitofp_i64_byte_to_f32:		; VI-LABEL: v_test_uitofp_i64_byte_to_f32:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; VI-NEXT: v_ffbh_u32_e32 v2, 0		; VI-NEXT: v_ffbh_u32_e32 v2, 0
; VI-NEXT: v_and_b32_e32 v0, 0xff, v0		; VI-NEXT: v_and_b32_e32 v0, 0xff, v0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: v_min_u32_e32 v2, 32, v2		; VI-NEXT: v_min_u32_e32 v2, 32, v2
; VI-NEXT: v_lshlrev_b64 v[0:1], v2, v[0:1]		; VI-NEXT: v_lshlrev_b64 v[0:1], v2, v[0:1]
; VI-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0		; VI-NEXT: v_min_u32_e32 v0, 1, v0
; VI-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
; VI-NEXT: v_or_b32_e32 v0, v1, v0		; VI-NEXT: v_or_b32_e32 v0, v1, v0
; VI-NEXT: v_cvt_f32_u32_e32 v0, v0		; VI-NEXT: v_cvt_f32_u32_e32 v0, v0
; VI-NEXT: v_sub_u32_e32 v1, vcc, 32, v2		; VI-NEXT: v_sub_u32_e32 v1, vcc, 32, v2
; VI-NEXT: v_ldexp_f32 v0, v0, v1		; VI-NEXT: v_ldexp_f32 v0, v0, v1
; VI-NEXT: s_setpc_b64 s[30:31]		; VI-NEXT: s_setpc_b64 s[30:31]
%masked = and i64 %arg0, 255		%masked = and i64 %arg0, 255
%itofp = uitofp i64 %masked to float		%itofp = uitofp i64 %masked to float
ret float %itofp		ret float %itofp
▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-sitofp.mir

Show First 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_sitofp_s64_to_s32		; GFX6-LABEL: name: test_sitofp_s64_to_s32
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 -1
; GFX6: [[C4:%[0-9]+]]:_(s32) = G_CONSTANT i32 33
; GFX6: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX6: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR]](s32), [[C1]]		; GFX6: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C4]], [[C]]		; GFX6: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT]](s32), [[C3]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[INT]], [[SELECT]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C2]]		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[SUB]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C2]], [[C1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT2]]
; GFX6: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX6: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB]]		; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)
; GFX6: $vgpr0 = COPY [[INT1]](s32)		; GFX6: $vgpr0 = COPY [[INT1]](s32)
; GFX8-LABEL: name: test_sitofp_s64_to_s32		; GFX8-LABEL: name: test_sitofp_s64_to_s32
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 -1
; GFX8: [[C4:%[0-9]+]]:_(s32) = G_CONSTANT i32 33
; GFX8: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX8: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR]](s32), [[C1]]		; GFX8: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C4]], [[C]]		; GFX8: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT]](s32), [[C3]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[INT]], [[SELECT]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C2]]		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[SUB]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C2]], [[C1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT2]]
; GFX8: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX8: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB]]		; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)
; GFX8: $vgpr0 = COPY [[INT1]](s32)		; GFX8: $vgpr0 = COPY [[INT1]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s32) = G_SITOFP %0		%1:_(s32) = G_SITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

---		---
▲ Show 20 Lines • Show All 262 Lines • ▼ Show 20 Lines	bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_sitofp_s33_to_s32		; GFX6-LABEL: name: test_sitofp_s33_to_s32
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)		; GFX6: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)
; GFX6: [[SEXT_INREG:%[0-9]+]]:_(s64) = G_SEXT_INREG [[COPY1]], 33		; GFX6: [[SEXT_INREG:%[0-9]+]]:_(s64) = G_SEXT_INREG [[COPY1]], 33
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SEXT_INREG]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SEXT_INREG]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 -1
; GFX6: [[C4:%[0-9]+]]:_(s32) = G_CONSTANT i32 33
; GFX6: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX6: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR]](s32), [[C1]]		; GFX6: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C4]], [[C]]		; GFX6: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT]](s32), [[C3]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[INT]], [[SELECT]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C2]]		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[SEXT_INREG]], [[UMIN]](s32)
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[SEXT_INREG]], [[SUB]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C2]], [[C1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT2]]
; GFX6: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX6: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB]]		; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)
; GFX6: $vgpr0 = COPY [[INT1]](s32)		; GFX6: $vgpr0 = COPY [[INT1]](s32)
; GFX8-LABEL: name: test_sitofp_s33_to_s32		; GFX8-LABEL: name: test_sitofp_s33_to_s32
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)		; GFX8: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)
; GFX8: [[SEXT_INREG:%[0-9]+]]:_(s64) = G_SEXT_INREG [[COPY1]], 33		; GFX8: [[SEXT_INREG:%[0-9]+]]:_(s64) = G_SEXT_INREG [[COPY1]], 33
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SEXT_INREG]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SEXT_INREG]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 -1
; GFX8: [[C4:%[0-9]+]]:_(s32) = G_CONSTANT i32 33
; GFX8: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX8: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR]](s32), [[C1]]		; GFX8: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C4]], [[C]]		; GFX8: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT]](s32), [[C3]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[INT]], [[SELECT]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C2]]		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[SEXT_INREG]], [[UMIN]](s32)
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[SEXT_INREG]], [[SUB]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C2]], [[C1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT2]]
; GFX8: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX8: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB]]		; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)
; GFX8: $vgpr0 = COPY [[INT1]](s32)		; GFX8: $vgpr0 = COPY [[INT1]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s33) = G_TRUNC %0		%1:_(s33) = G_TRUNC %0
%2:_(s32) = G_SITOFP %1		%2:_(s32) = G_SITOFP %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: test_sitofp_s64_to_s16		name: test_sitofp_s64_to_s16
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_sitofp_s64_to_s16		; GFX6-LABEL: name: test_sitofp_s64_to_s16
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 -1
; GFX6: [[C4:%[0-9]+]]:_(s32) = G_CONSTANT i32 33
; GFX6: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX6: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR]](s32), [[C1]]		; GFX6: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C4]], [[C]]		; GFX6: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT]](s32), [[C3]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[INT]], [[SELECT]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C2]]		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[SUB]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C2]], [[C1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT2]]
; GFX6: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX6: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB]]		; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)
; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)
; GFX6: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX6: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX6: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX6: $vgpr0 = COPY [[ANYEXT]](s32)
; GFX8-LABEL: name: test_sitofp_s64_to_s16		; GFX8-LABEL: name: test_sitofp_s64_to_s16
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 -1
; GFX8: [[C4:%[0-9]+]]:_(s32) = G_CONSTANT i32 33
; GFX8: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX8: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR]](s32), [[C1]]		; GFX8: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C4]], [[C]]		; GFX8: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT]](s32), [[C3]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[INT]], [[SELECT]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C2]]		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[SUB]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C2]], [[C1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT2]]
; GFX8: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX8: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB]]		; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)
; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)
; GFX8: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX8: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX8: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX8: $vgpr0 = COPY [[ANYEXT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s16) = G_SITOFP %0		%1:_(s16) = G_SITOFP %0
%2:_(s32) = G_ANYEXT %1		%2:_(s32) = G_ANYEXT %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: test_sitofp_v2s64_to_v2s16		name: test_sitofp_v2s64_to_v2s16
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1_vgpr2_vgpr3		liveins: $vgpr0_vgpr1_vgpr2_vgpr3

; GFX6-LABEL: name: test_sitofp_v2s64_to_v2s16		; GFX6-LABEL: name: test_sitofp_v2s64_to_v2s16
; GFX6: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		; GFX6: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
; GFX6: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)		; GFX6: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 -1
; GFX6: [[C4:%[0-9]+]]:_(s32) = G_CONSTANT i32 33
; GFX6: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV2]], [[UV3]]		; GFX6: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV2]], [[UV3]]
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR]](s32), [[C1]]		; GFX6: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C4]], [[C]]		; GFX6: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV3]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV3]](s32)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT]](s32), [[C3]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[INT]], [[SELECT]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C2]]		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[SUB]](s32)
; GFX6: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV4]](s32), [[C1]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]
; GFX6: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C2]], [[C1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[SELECT2]]
; GFX6: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX6: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB]]		; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)
; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)
; GFX6: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX6: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX6: [[XOR1:%[0-9]+]]:_(s32) = G_XOR [[UV6]], [[UV7]]		; GFX6: [[XOR1:%[0-9]+]]:_(s32) = G_XOR [[UV6]], [[UV7]]
; GFX6: [[ICMP3:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR1]](s32), [[C1]]		; GFX6: [[ASHR1:%[0-9]+]]:_(s32) = G_ASHR [[XOR1]], [[C2]](s32)
; GFX6: [[SELECT3:%[0-9]+]]:_(s32) = G_SELECT [[ICMP3]](s1), [[C4]], [[C]]		; GFX6: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR1]]
; GFX6: [[INT2:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV7]](s32)		; GFX6: [[INT2:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV7]](s32)
; GFX6: [[ICMP4:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT2]](s32), [[C3]]		; GFX6: [[SUB2:%[0-9]+]]:_(s32) = G_SUB [[INT2]], [[C1]]
; GFX6: [[SELECT4:%[0-9]+]]:_(s32) = G_SELECT [[ICMP4]](s1), [[INT2]], [[SELECT3]]		; GFX6: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[SUB2]], [[ADD1]]
; GFX6: [[SUB2:%[0-9]+]]:_(s32) = G_SUB [[SELECT4]], [[C2]]		; GFX6: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)
; GFX6: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[SUB2]](s32)
; GFX6: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX6: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX6: [[ICMP5:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV8]](s32), [[C1]]		; GFX6: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]
; GFX6: [[SELECT5:%[0-9]+]]:_(s32) = G_SELECT [[ICMP5]](s1), [[C2]], [[C1]]		; GFX6: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]
; GFX6: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[SELECT5]]
; GFX6: [[SITOFP1:%[0-9]+]]:_(s32) = G_SITOFP [[OR1]](s32)		; GFX6: [[SITOFP1:%[0-9]+]]:_(s32) = G_SITOFP [[OR1]](s32)
; GFX6: [[SUB3:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB2]]		; GFX6: [[SUB3:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]
; GFX6: [[INT3:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP1]](s32), [[SUB3]](s32)		; GFX6: [[INT3:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP1]](s32), [[SUB3]](s32)
; GFX6: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT3]](s32)		; GFX6: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT3]](s32)
; GFX6: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX6: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX6: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX6: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX6: [[C5:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX6: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C5]](s32)		; GFX6: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)
; GFX6: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX6: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX6: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX6: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX6: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX6: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16		; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16
; GFX8: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		; GFX8: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
; GFX8: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)		; GFX8: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 -1
; GFX8: [[C4:%[0-9]+]]:_(s32) = G_CONSTANT i32 33
; GFX8: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV2]], [[UV3]]		; GFX8: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV2]], [[UV3]]
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR]](s32), [[C1]]		; GFX8: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C4]], [[C]]		; GFX8: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV3]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV3]](s32)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT]](s32), [[C3]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[INT]], [[SELECT]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C2]]		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[SUB]](s32)
; GFX8: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV4]](s32), [[C1]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]
; GFX8: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C2]], [[C1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[SELECT2]]
; GFX8: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX8: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB]]		; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)
; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)
; GFX8: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX8: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX8: [[XOR1:%[0-9]+]]:_(s32) = G_XOR [[UV6]], [[UV7]]		; GFX8: [[XOR1:%[0-9]+]]:_(s32) = G_XOR [[UV6]], [[UV7]]
; GFX8: [[ICMP3:%[0-9]+]]:_(s1) = G_ICMP intpred(sge), [[XOR1]](s32), [[C1]]		; GFX8: [[ASHR1:%[0-9]+]]:_(s32) = G_ASHR [[XOR1]], [[C2]](s32)
; GFX8: [[SELECT3:%[0-9]+]]:_(s32) = G_SELECT [[ICMP3]](s1), [[C4]], [[C]]		; GFX8: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR1]]
; GFX8: [[INT2:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV7]](s32)		; GFX8: [[INT2:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV7]](s32)
; GFX8: [[ICMP4:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[INT2]](s32), [[C3]]		; GFX8: [[SUB2:%[0-9]+]]:_(s32) = G_SUB [[INT2]], [[C1]]
; GFX8: [[SELECT4:%[0-9]+]]:_(s32) = G_SELECT [[ICMP4]](s1), [[INT2]], [[SELECT3]]		; GFX8: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[SUB2]], [[ADD1]]
; GFX8: [[SUB2:%[0-9]+]]:_(s32) = G_SUB [[SELECT4]], [[C2]]		; GFX8: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)
; GFX8: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[SUB2]](s32)
; GFX8: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX8: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX8: [[ICMP5:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV8]](s32), [[C1]]		; GFX8: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]
; GFX8: [[SELECT5:%[0-9]+]]:_(s32) = G_SELECT [[ICMP5]](s1), [[C2]], [[C1]]		; GFX8: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]
; GFX8: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[SELECT5]]
; GFX8: [[SITOFP1:%[0-9]+]]:_(s32) = G_SITOFP [[OR1]](s32)		; GFX8: [[SITOFP1:%[0-9]+]]:_(s32) = G_SITOFP [[OR1]](s32)
; GFX8: [[SUB3:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SUB2]]		; GFX8: [[SUB3:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]
; GFX8: [[INT3:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP1]](s32), [[SUB3]](s32)		; GFX8: [[INT3:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP1]](s32), [[SUB3]](s32)
; GFX8: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT3]](s32)		; GFX8: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT3]](s32)
; GFX8: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX8: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX8: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX8: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX8: [[C5:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX8: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C5]](s32)		; GFX8: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)
; GFX8: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX8: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX8: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX8: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX8: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX8: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
%1:_(<2 x s16>) = G_SITOFP %0		%1:_(<2 x s16>) = G_SITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-uitofp.mir

Show First 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_uitofp_s64_to_s32		; GFX6-LABEL: name: test_uitofp_s64_to_s32
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX6: $vgpr0 = COPY [[INT]](s32)		; GFX6: $vgpr0 = COPY [[INT]](s32)
; GFX8-LABEL: name: test_uitofp_s64_to_s32		; GFX8-LABEL: name: test_uitofp_s64_to_s32
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX8: $vgpr0 = COPY [[INT]](s32)		; GFX8: $vgpr0 = COPY [[INT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s32) = G_UITOFP %0		%1:_(s32) = G_UITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...
▲ Show 20 Lines • Show All 276 Lines • ▼ Show 20 Lines	bb.0:

; GFX6-LABEL: name: test_uitofp_s33_to_s32		; GFX6-LABEL: name: test_uitofp_s33_to_s32
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591		; GFX6: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591
; GFX6: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)		; GFX6: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)
; GFX6: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]		; GFX6: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C2]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C2]], [[UV2]]
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C3]], [[C2]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX6: $vgpr0 = COPY [[INT]](s32)		; GFX6: $vgpr0 = COPY [[INT]](s32)
; GFX8-LABEL: name: test_uitofp_s33_to_s32		; GFX8-LABEL: name: test_uitofp_s33_to_s32
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591		; GFX8: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591
; GFX8: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)		; GFX8: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)
; GFX8: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]		; GFX8: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C2]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C2]], [[UV2]]
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C3]], [[C2]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX8: $vgpr0 = COPY [[INT]](s32)		; GFX8: $vgpr0 = COPY [[INT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s33) = G_TRUNC %0		%1:_(s33) = G_TRUNC %0
%2:_(s32) = G_UITOFP %1		%2:_(s32) = G_UITOFP %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: test_uitofp_s64_to_s16		name: test_uitofp_s64_to_s16
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_uitofp_s64_to_s16		; GFX6-LABEL: name: test_uitofp_s64_to_s16
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)
; GFX6: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX6: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX6: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX6: $vgpr0 = COPY [[ANYEXT]](s32)
; GFX8-LABEL: name: test_uitofp_s64_to_s16		; GFX8-LABEL: name: test_uitofp_s64_to_s16
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)
; GFX8: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX8: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX8: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX8: $vgpr0 = COPY [[ANYEXT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s16) = G_UITOFP %0		%1:_(s16) = G_UITOFP %0
%2:_(s32) = G_ANYEXT %1		%2:_(s32) = G_ANYEXT %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: test_sitofp_v2s64_to_v2s16		name: test_sitofp_v2s64_to_v2s16
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1_vgpr2_vgpr3		liveins: $vgpr0_vgpr1_vgpr2_vgpr3

; GFX6-LABEL: name: test_sitofp_v2s64_to_v2s16		; GFX6-LABEL: name: test_sitofp_v2s64_to_v2s16
; GFX6: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		; GFX6: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
; GFX6: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)		; GFX6: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)		; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)
; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX6: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV4]](s32), [[C1]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[SELECT]]
; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)
; GFX6: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX6: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX6: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)		; GFX6: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)
; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]		; GFX6: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]
; GFX6: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN1]](s32)		; GFX6: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)
; GFX6: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX6: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV8]](s32), [[C1]]		; GFX6: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]		; GFX6: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]
; GFX6: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[SELECT1]]
; GFX6: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)		; GFX6: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)
; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN1]]		; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]
; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)		; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)
; GFX6: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX6: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)
; GFX6: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX6: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX6: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX6: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX6: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)		; GFX6: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C2]](s32)
; GFX6: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX6: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX6: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX6: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX6: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX6: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16		; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16
; GFX8: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		; GFX8: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
; GFX8: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)		; GFX8: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)		; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)
; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX8: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV4]](s32), [[C1]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[SELECT]]
; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)
; GFX8: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX8: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX8: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)		; GFX8: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)
; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]		; GFX8: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]
; GFX8: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN1]](s32)		; GFX8: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)
; GFX8: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX8: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV8]](s32), [[C1]]		; GFX8: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]		; GFX8: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]
; GFX8: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[SELECT1]]
; GFX8: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)		; GFX8: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)
; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN1]]		; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]
; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)		; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)
; GFX8: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX8: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)
; GFX8: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX8: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX8: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX8: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX8: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)		; GFX8: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C2]](s32)
; GFX8: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX8: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX8: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX8: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX8: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX8: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
%1:_(<2 x s16>) = G_UITOFP %0		%1:_(<2 x s16>) = G_UITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

llvm/test/CodeGen/AMDGPU/sint_to_fp.i64.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck --check-prefixes=GFX6 %s			; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck --check-prefixes=GFX6 %s
	; RUN: llc -march=amdgcn -mcpu=tonga -verify-machineinstrs < %s \| FileCheck --check-prefixes=GFX8 %s			; RUN: llc -march=amdgcn -mcpu=tonga -verify-machineinstrs < %s \| FileCheck --check-prefixes=GFX8 %s

	; FIXME: This should be merged with sint_to_fp.ll, but s_sint_to_fp_v2i64 crashes on r600			; FIXME: This should be merged with sint_to_fp.ll, but s_sint_to_fp_v2i64 crashes on r600

	define amdgpu_kernel void @s_sint_to_fp_i64_to_f16(half addrspace(1)* %out, i64 %in) #0 {			define amdgpu_kernel void @s_sint_to_fp_i64_to_f16(half addrspace(1)* %out, i64 %in) #0 {
	; GFX6-LABEL: s_sint_to_fp_i64_to_f16:			; GFX6-LABEL: s_sint_to_fp_i64_to_f16:
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9			; GFX6-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
	; GFX6-NEXT: s_mov_b32 s7, 0xf000			; GFX6-NEXT: s_mov_b32 s7, 0xf000
	; GFX6-NEXT: s_mov_b32 s6, -1			; GFX6-NEXT: s_mov_b32 s6, -1
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_mov_b32 s4, s0			; GFX6-NEXT: s_mov_b32 s4, s0
	; GFX6-NEXT: s_mov_b32 s5, s1			; GFX6-NEXT: s_mov_b32 s5, s1
	; GFX6-NEXT: s_xor_b32 s0, s2, s3			; GFX6-NEXT: s_flbit_i32 s0, s3
	; GFX6-NEXT: s_flbit_i32 s8, s3			; GFX6-NEXT: s_xor_b32 s1, s2, s3
	; GFX6-NEXT: v_cmp_gt_i32_e64 s[0:1], s0, -1			; GFX6-NEXT: s_add_i32 s0, s0, -1
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 32, 33, s[0:1]			; GFX6-NEXT: s_ashr_i32 s1, s1, 31
	; GFX6-NEXT: v_mov_b32_e32 v1, s8			; GFX6-NEXT: s_add_i32 s1, s1, 32
	; GFX6-NEXT: v_cmp_ne_u32_e64 vcc, s8, -1			; GFX6-NEXT: s_min_u32 s8, s0, s1
	; GFX6-NEXT: v_cndmask_b32_e32 v2, v0, v1, vcc			; GFX6-NEXT: s_lshl_b64 s[0:1], s[2:3], s8
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, -1, v2			; GFX6-NEXT: s_min_u32 s0, s0, 1
	; GFX6-NEXT: v_lshl_b64 v[0:1], s[2:3], v0			; GFX6-NEXT: s_or_b32 s0, s1, s0
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX6-NEXT: v_cvt_f32_i32_e32 v0, s0
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc			; GFX6-NEXT: s_sub_i32 s0, 32, s8
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0			; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s0
	; GFX6-NEXT: v_cvt_f32_i32_e32 v0, v0
	; GFX6-NEXT: v_sub_i32_e32 v1, vcc, 33, v2
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v0, v1
	; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
	; GFX6-NEXT: buffer_store_short v0, off, s[4:7], 0			; GFX6-NEXT: buffer_store_short v0, off, s[4:7], 0
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: s_sint_to_fp_i64_to_f16:			; GFX8-LABEL: s_sint_to_fp_i64_to_f16:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_xor_b32 s4, s2, s3			; GFX8-NEXT: s_xor_b32 s5, s2, s3
	; GFX8-NEXT: s_cmp_gt_i32 s4, -1			; GFX8-NEXT: s_flbit_i32 s4, s3
	; GFX8-NEXT: s_flbit_i32 s5, s3			; GFX8-NEXT: s_ashr_i32 s5, s5, 31
	; GFX8-NEXT: s_cselect_b32 s4, 33, 32			; GFX8-NEXT: s_add_i32 s4, s4, -1
	; GFX8-NEXT: s_cmp_lg_u32 s5, -1			; GFX8-NEXT: s_add_i32 s5, s5, 32
	; GFX8-NEXT: s_cselect_b32 s6, s5, s4			; GFX8-NEXT: s_min_u32 s4, s4, s5
	; GFX8-NEXT: s_add_i32 s4, s6, -1
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s4			; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s4
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[4:5], s2, 0			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[4:5]			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_or_b32_e32 v0, s3, v0			; GFX8-NEXT: v_cvt_f32_i32_e32 v0, s2
	; GFX8-NEXT: v_cvt_f32_i32_e32 v0, v0			; GFX8-NEXT: s_sub_i32 s2, 32, s4
	; GFX8-NEXT: s_sub_i32 s2, 33, s6
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: v_ldexp_f32 v0, v0, s2			; GFX8-NEXT: v_ldexp_f32 v0, v0, s2
	; GFX8-NEXT: v_cvt_f16_f32_e32 v2, v0			; GFX8-NEXT: v_cvt_f16_f32_e32 v2, v0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: flat_store_short v[0:1], v2			; GFX8-NEXT: flat_store_short v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%result = sitofp i64 %in to half			%result = sitofp i64 %in to half
	store half %result, half addrspace(1)* %out			store half %result, half addrspace(1)* %out
	Show All 11 Lines
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_mov_b64 s[4:5], s[2:3]			; GFX6-NEXT: s_mov_b64 s[4:5], s[2:3]
	; GFX6-NEXT: buffer_load_dwordx2 v[3:4], v[1:2], s[4:7], 0 addr64			; GFX6-NEXT: buffer_load_dwordx2 v[3:4], v[1:2], s[4:7], 0 addr64
	; GFX6-NEXT: v_lshlrev_b32_e32 v1, 1, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v1, 1, v0
	; GFX6-NEXT: s_mov_b64 s[2:3], s[6:7]			; GFX6-NEXT: s_mov_b64 s[2:3], s[6:7]
	; GFX6-NEXT: s_waitcnt vmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0)
	; GFX6-NEXT: v_xor_b32_e32 v0, v3, v4			; GFX6-NEXT: v_xor_b32_e32 v0, v3, v4
	; GFX6-NEXT: v_ffbh_i32_e32 v5, v4			; GFX6-NEXT: v_ffbh_i32_e32 v5, v4
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v0			; GFX6-NEXT: v_ashrrev_i32_e32 v0, 31, v0
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v5, vcc, -1, v5
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v5			; GFX6-NEXT: v_add_i32_e32 v0, vcc, 32, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v5, vcc			; GFX6-NEXT: v_min_u32_e32 v0, v5, v0
	; GFX6-NEXT: v_add_i32_e32 v5, vcc, -1, v0			; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0
	; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v5			; GFX6-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
	; GFX6-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v3, v4, v3			; GFX6-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX6-NEXT: v_cvt_f32_i32_e32 v3, v3			; GFX6-NEXT: v_cvt_f32_i32_e32 v3, v3
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, 33, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, 32, v0
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v3, v0			; GFX6-NEXT: v_ldexp_f32_e32 v0, v3, v0
	; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
	; GFX6-NEXT: buffer_store_short v0, v[1:2], s[0:3], 0 addr64			; GFX6-NEXT: buffer_store_short v0, v[1:2], s[0:3], 0 addr64
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: v_sint_to_fp_i64_to_f16:			; GFX8-LABEL: v_sint_to_fp_i64_to_f16:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 3, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 3, v0
	; GFX8-NEXT: v_mov_b32_e32 v3, 0
	; GFX8-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_mov_b32_e32 v2, s3			; GFX8-NEXT: v_mov_b32_e32 v2, s3
	; GFX8-NEXT: v_add_u32_e32 v1, vcc, s2, v1			; GFX8-NEXT: v_add_u32_e32 v1, vcc, s2, v1
	; GFX8-NEXT: v_addc_u32_e32 v2, vcc, v2, v3, vcc			; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
	; GFX8-NEXT: flat_load_dwordx2 v[1:2], v[1:2]			; GFX8-NEXT: flat_load_dwordx2 v[1:2], v[1:2]
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_xor_b32_e32 v4, v1, v2			; GFX8-NEXT: v_xor_b32_e32 v3, v1, v2
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v4			; GFX8-NEXT: v_ffbh_i32_e32 v4, v2
	; GFX8-NEXT: v_ffbh_i32_e32 v5, v2			; GFX8-NEXT: v_ashrrev_i32_e32 v3, 31, v3
	; GFX8-NEXT: v_cndmask_b32_e64 v4, 32, 33, vcc			; GFX8-NEXT: v_add_u32_e32 v4, vcc, -1, v4
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v5			; GFX8-NEXT: v_add_u32_e32 v3, vcc, 32, v3
	; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v5, vcc			; GFX8-NEXT: v_min_u32_e32 v3, v4, v3
	; GFX8-NEXT: v_add_u32_e32 v5, vcc, -1, v4			; GFX8-NEXT: v_lshlrev_b64 v[1:2], v3, v[1:2]
	; GFX8-NEXT: v_lshlrev_b64 v[1:2], v5, v[1:2]			; GFX8-NEXT: v_sub_u32_e32 v3, vcc, 32, v3
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v1			; GFX8-NEXT: v_min_u32_e32 v1, 1, v1
	; GFX8-NEXT: v_cndmask_b32_e64 v1, 0, 1, vcc
	; GFX8-NEXT: v_or_b32_e32 v1, v2, v1			; GFX8-NEXT: v_or_b32_e32 v1, v2, v1
	; GFX8-NEXT: v_cvt_f32_i32_e32 v1, v1			; GFX8-NEXT: v_cvt_f32_i32_e32 v1, v1
	; GFX8-NEXT: v_sub_u32_e32 v4, vcc, 33, v4
	; GFX8-NEXT: v_mov_b32_e32 v2, s1			; GFX8-NEXT: v_mov_b32_e32 v2, s1
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v0			; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v0
	; GFX8-NEXT: v_ldexp_f32 v1, v1, v4			; GFX8-NEXT: v_ldexp_f32 v1, v1, v3
	; GFX8-NEXT: v_cvt_f16_f32_e32 v4, v1			; GFX8-NEXT: v_cvt_f16_f32_e32 v3, v1
	; GFX8-NEXT: v_addc_u32_e32 v1, vcc, v2, v3, vcc			; GFX8-NEXT: v_addc_u32_e32 v1, vcc, 0, v2, vcc
	; GFX8-NEXT: flat_store_short v[0:1], v4			; GFX8-NEXT: flat_store_short v[0:1], v3
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid			%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr half, half addrspace(1)* %out, i32 %tid			%out.gep = getelementptr half, half addrspace(1)* %out, i32 %tid
	%val = load i64, i64 addrspace(1)* %in.gep			%val = load i64, i64 addrspace(1)* %in.gep
	%result = sitofp i64 %val to half			%result = sitofp i64 %val to half
	store half %result, half addrspace(1)* %out.gep			store half %result, half addrspace(1)* %out.gep
	ret void			ret void
	}			}

	define amdgpu_kernel void @s_sint_to_fp_i64_to_f32(float addrspace(1)* %out, i64 %in) #0 {			define amdgpu_kernel void @s_sint_to_fp_i64_to_f32(float addrspace(1)* %out, i64 %in) #0 {
	; GFX6-LABEL: s_sint_to_fp_i64_to_f32:			; GFX6-LABEL: s_sint_to_fp_i64_to_f32:
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9			; GFX6-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
	; GFX6-NEXT: s_mov_b32 s7, 0xf000			; GFX6-NEXT: s_mov_b32 s7, 0xf000
	; GFX6-NEXT: s_mov_b32 s6, -1			; GFX6-NEXT: s_mov_b32 s6, -1
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_mov_b32 s4, s0			; GFX6-NEXT: s_mov_b32 s4, s0
	; GFX6-NEXT: s_mov_b32 s5, s1			; GFX6-NEXT: s_mov_b32 s5, s1
	; GFX6-NEXT: s_xor_b32 s0, s2, s3			; GFX6-NEXT: s_flbit_i32 s0, s3
	; GFX6-NEXT: s_flbit_i32 s8, s3			; GFX6-NEXT: s_xor_b32 s1, s2, s3
	; GFX6-NEXT: v_cmp_gt_i32_e64 s[0:1], s0, -1			; GFX6-NEXT: s_add_i32 s0, s0, -1
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 32, 33, s[0:1]			; GFX6-NEXT: s_ashr_i32 s1, s1, 31
	; GFX6-NEXT: v_mov_b32_e32 v1, s8			; GFX6-NEXT: s_add_i32 s1, s1, 32
	; GFX6-NEXT: v_cmp_ne_u32_e64 vcc, s8, -1			; GFX6-NEXT: s_min_u32 s8, s0, s1
	; GFX6-NEXT: v_cndmask_b32_e32 v2, v0, v1, vcc			; GFX6-NEXT: s_lshl_b64 s[0:1], s[2:3], s8
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, -1, v2			; GFX6-NEXT: s_min_u32 s0, s0, 1
	; GFX6-NEXT: v_lshl_b64 v[0:1], s[2:3], v0			; GFX6-NEXT: s_or_b32 s0, s1, s0
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX6-NEXT: v_cvt_f32_i32_e32 v0, s0
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc			; GFX6-NEXT: s_sub_i32 s0, 32, s8
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0			; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s0
	; GFX6-NEXT: v_cvt_f32_i32_e32 v0, v0
	; GFX6-NEXT: v_sub_i32_e32 v1, vcc, 33, v2
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v0, v1
	; GFX6-NEXT: buffer_store_dword v0, off, s[4:7], 0			; GFX6-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: s_sint_to_fp_i64_to_f32:			; GFX8-LABEL: s_sint_to_fp_i64_to_f32:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_xor_b32 s4, s2, s3			; GFX8-NEXT: s_xor_b32 s5, s2, s3
	; GFX8-NEXT: s_cmp_gt_i32 s4, -1			; GFX8-NEXT: s_flbit_i32 s4, s3
	; GFX8-NEXT: s_flbit_i32 s5, s3			; GFX8-NEXT: s_ashr_i32 s5, s5, 31
	; GFX8-NEXT: s_cselect_b32 s4, 33, 32			; GFX8-NEXT: s_add_i32 s4, s4, -1
	; GFX8-NEXT: s_cmp_lg_u32 s5, -1			; GFX8-NEXT: s_add_i32 s5, s5, 32
	; GFX8-NEXT: s_cselect_b32 s6, s5, s4			; GFX8-NEXT: s_min_u32 s4, s4, s5
	; GFX8-NEXT: s_add_i32 s4, s6, -1
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s4			; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s4
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[4:5], s2, 0			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[4:5]			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_or_b32_e32 v0, s3, v0			; GFX8-NEXT: v_cvt_f32_i32_e32 v2, s2
	; GFX8-NEXT: v_cvt_f32_i32_e32 v2, v0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: s_sub_i32 s0, 33, s6			; GFX8-NEXT: s_sub_i32 s0, 32, s4
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: v_ldexp_f32 v2, v2, s0			; GFX8-NEXT: v_ldexp_f32 v2, v2, s0
	; GFX8-NEXT: flat_store_dword v[0:1], v2			; GFX8-NEXT: flat_store_dword v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%result = sitofp i64 %in to float			%result = sitofp i64 %in to float
	store float %result, float addrspace(1)* %out			store float %result, float addrspace(1)* %out
	ret void			ret void
	}			}
	Show All 9 Lines
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_mov_b64 s[4:5], s[2:3]			; GFX6-NEXT: s_mov_b64 s[4:5], s[2:3]
	; GFX6-NEXT: buffer_load_dwordx2 v[3:4], v[1:2], s[4:7], 0 addr64			; GFX6-NEXT: buffer_load_dwordx2 v[3:4], v[1:2], s[4:7], 0 addr64
	; GFX6-NEXT: v_lshlrev_b32_e32 v1, 2, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v1, 2, v0
	; GFX6-NEXT: s_mov_b64 s[2:3], s[6:7]			; GFX6-NEXT: s_mov_b64 s[2:3], s[6:7]
	; GFX6-NEXT: s_waitcnt vmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0)
	; GFX6-NEXT: v_xor_b32_e32 v0, v3, v4			; GFX6-NEXT: v_xor_b32_e32 v0, v3, v4
	; GFX6-NEXT: v_ffbh_i32_e32 v5, v4			; GFX6-NEXT: v_ffbh_i32_e32 v5, v4
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v0			; GFX6-NEXT: v_ashrrev_i32_e32 v0, 31, v0
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v5, vcc, -1, v5
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v5			; GFX6-NEXT: v_add_i32_e32 v0, vcc, 32, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v5, vcc			; GFX6-NEXT: v_min_u32_e32 v0, v5, v0
	; GFX6-NEXT: v_add_i32_e32 v5, vcc, -1, v0			; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0
	; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v5			; GFX6-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
	; GFX6-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v3, v4, v3			; GFX6-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX6-NEXT: v_cvt_f32_i32_e32 v3, v3			; GFX6-NEXT: v_cvt_f32_i32_e32 v3, v3
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, 33, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, 32, v0
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v3, v0			; GFX6-NEXT: v_ldexp_f32_e32 v0, v3, v0
	; GFX6-NEXT: buffer_store_dword v0, v[1:2], s[0:3], 0 addr64			; GFX6-NEXT: buffer_store_dword v0, v[1:2], s[0:3], 0 addr64
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: v_sint_to_fp_i64_to_f32:			; GFX8-LABEL: v_sint_to_fp_i64_to_f32:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 3, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 3, v0
	; GFX8-NEXT: v_mov_b32_e32 v3, 0			; GFX8-NEXT: v_lshlrev_b32_e32 v3, 2, v0
	; GFX8-NEXT: v_lshlrev_b32_e32 v4, 2, v0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_mov_b32_e32 v2, s3			; GFX8-NEXT: v_mov_b32_e32 v2, s3
	; GFX8-NEXT: v_add_u32_e32 v1, vcc, s2, v1			; GFX8-NEXT: v_add_u32_e32 v1, vcc, s2, v1
	; GFX8-NEXT: v_addc_u32_e32 v2, vcc, v2, v3, vcc			; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
	; GFX8-NEXT: flat_load_dwordx2 v[1:2], v[1:2]			; GFX8-NEXT: flat_load_dwordx2 v[1:2], v[1:2]
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_xor_b32_e32 v0, v1, v2			; GFX8-NEXT: v_xor_b32_e32 v0, v1, v2
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v0			; GFX8-NEXT: v_ffbh_i32_e32 v4, v2
	; GFX8-NEXT: v_ffbh_i32_e32 v5, v2			; GFX8-NEXT: v_ashrrev_i32_e32 v0, 31, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 32, 33, vcc			; GFX8-NEXT: v_add_u32_e32 v4, vcc, -1, v4
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v5			; GFX8-NEXT: v_add_u32_e32 v0, vcc, 32, v0
	; GFX8-NEXT: v_cndmask_b32_e32 v5, v0, v5, vcc			; GFX8-NEXT: v_min_u32_e32 v4, v4, v0
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, -1, v5			; GFX8-NEXT: v_lshlrev_b64 v[0:1], v4, v[1:2]
	; GFX8-NEXT: v_lshlrev_b64 v[0:1], v0, v[1:2]
	; GFX8-NEXT: v_mov_b32_e32 v2, s1			; GFX8-NEXT: v_mov_b32_e32 v2, s1
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX8-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
	; GFX8-NEXT: v_or_b32_e32 v0, v1, v0			; GFX8-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX8-NEXT: v_cvt_f32_i32_e32 v6, v0			; GFX8-NEXT: v_cvt_f32_i32_e32 v5, v0
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v4			; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v3
	; GFX8-NEXT: v_addc_u32_e32 v1, vcc, v2, v3, vcc			; GFX8-NEXT: v_addc_u32_e32 v1, vcc, 0, v2, vcc
	; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 33, v5			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v4
	; GFX8-NEXT: v_ldexp_f32 v2, v6, v2			; GFX8-NEXT: v_ldexp_f32 v2, v5, v2
	; GFX8-NEXT: flat_store_dword v[0:1], v2			; GFX8-NEXT: flat_store_dword v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid			%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr float, float addrspace(1)* %out, i32 %tid			%out.gep = getelementptr float, float addrspace(1)* %out, i32 %tid
	%val = load i64, i64 addrspace(1)* %in.gep			%val = load i64, i64 addrspace(1)* %in.gep
	%result = sitofp i64 %val to float			%result = sitofp i64 %val to float
	store float %result, float addrspace(1)* %out.gep			store float %result, float addrspace(1)* %out.gep
	ret void			ret void
	}			}

	define amdgpu_kernel void @s_sint_to_fp_v2i64_to_v2f32(<2 x float> addrspace(1)* %out, <2 x i64> %in) #0{			define amdgpu_kernel void @s_sint_to_fp_v2i64_to_v2f32(<2 x float> addrspace(1)* %out, <2 x i64> %in) #0{
	; GFX6-LABEL: s_sint_to_fp_v2i64_to_v2f32:			; GFX6-LABEL: s_sint_to_fp_v2i64_to_v2f32:
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xd			; GFX6-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xd
	; GFX6-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX6-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX6-NEXT: s_mov_b32 s3, 0xf000			; GFX6-NEXT: s_mov_b32 s3, 0xf000
	; GFX6-NEXT: s_mov_b32 s2, -1			; GFX6-NEXT: s_mov_b32 s2, -1
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_xor_b32 s8, s6, s7			; GFX6-NEXT: s_flbit_i32 s8, s7
	; GFX6-NEXT: s_flbit_i32 s10, s7			; GFX6-NEXT: s_xor_b32 s9, s6, s7
				; GFX6-NEXT: s_flbit_i32 s10, s5
	; GFX6-NEXT: s_xor_b32 s11, s4, s5			; GFX6-NEXT: s_xor_b32 s11, s4, s5
	; GFX6-NEXT: s_flbit_i32 s12, s5			; GFX6-NEXT: s_add_i32 s8, s8, -1
	; GFX6-NEXT: v_cmp_gt_i32_e64 s[8:9], s8, -1			; GFX6-NEXT: s_ashr_i32 s9, s9, 31
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 32, 33, s[8:9]			; GFX6-NEXT: s_add_i32 s10, s10, -1
	; GFX6-NEXT: v_mov_b32_e32 v1, s10			; GFX6-NEXT: s_ashr_i32 s11, s11, 31
	; GFX6-NEXT: v_cmp_gt_i32_e64 s[8:9], s11, -1			; GFX6-NEXT: s_add_i32 s9, s9, 32
	; GFX6-NEXT: v_cndmask_b32_e64 v2, 32, 33, s[8:9]			; GFX6-NEXT: s_add_i32 s11, s11, 32
	; GFX6-NEXT: v_mov_b32_e32 v3, s12			; GFX6-NEXT: s_min_u32 s8, s8, s9
	; GFX6-NEXT: v_cmp_ne_u32_e64 vcc, s10, -1			; GFX6-NEXT: s_min_u32 s9, s10, s11
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX6-NEXT: s_lshl_b64 s[6:7], s[6:7], s8
	; GFX6-NEXT: v_cmp_ne_u32_e64 vcc, s12, -1			; GFX6-NEXT: s_sub_i32 s8, 32, s8
	; GFX6-NEXT: v_cndmask_b32_e32 v1, v2, v3, vcc			; GFX6-NEXT: s_lshl_b64 s[4:5], s[4:5], s9
	; GFX6-NEXT: v_add_i32_e32 v2, vcc, -1, v0			; GFX6-NEXT: s_sub_i32 s9, 32, s9
	; GFX6-NEXT: v_sub_i32_e32 v4, vcc, 33, v0			; GFX6-NEXT: s_min_u32 s6, s6, 1
	; GFX6-NEXT: v_add_i32_e32 v3, vcc, -1, v1			; GFX6-NEXT: s_min_u32 s4, s4, 1
	; GFX6-NEXT: v_sub_i32_e32 v5, vcc, 33, v1			; GFX6-NEXT: s_or_b32 s6, s7, s6
	; GFX6-NEXT: v_lshl_b64 v[0:1], s[6:7], v2			; GFX6-NEXT: s_or_b32 s4, s5, s4
	; GFX6-NEXT: v_lshl_b64 v[2:3], s[4:5], v3			; GFX6-NEXT: v_cvt_f32_i32_e32 v0, s6
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX6-NEXT: v_cvt_f32_i32_e32 v2, s4
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc			; GFX6-NEXT: v_ldexp_f32_e64 v1, v0, s8
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v2			; GFX6-NEXT: v_ldexp_f32_e64 v0, v2, s9
	; GFX6-NEXT: v_cndmask_b32_e64 v2, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX6-NEXT: v_or_b32_e32 v1, v3, v2
	; GFX6-NEXT: v_cvt_f32_i32_e32 v0, v0
	; GFX6-NEXT: v_cvt_f32_i32_e32 v2, v1
	; GFX6-NEXT: v_ldexp_f32_e32 v1, v0, v4
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v2, v5
	; GFX6-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0			; GFX6-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: s_sint_to_fp_v2i64_to_v2f32:			; GFX8-LABEL: s_sint_to_fp_v2i64_to_v2f32:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x34
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_xor_b32 s2, s6, s7			; GFX8-NEXT: s_xor_b32 s7, s2, s3
	; GFX8-NEXT: s_cmp_gt_i32 s2, -1			; GFX8-NEXT: s_flbit_i32 s6, s3
	; GFX8-NEXT: s_flbit_i32 s3, s7			; GFX8-NEXT: s_ashr_i32 s7, s7, 31
	; GFX8-NEXT: s_cselect_b32 s2, 33, 32			; GFX8-NEXT: s_add_i32 s6, s6, -1
	; GFX8-NEXT: s_cmp_lg_u32 s3, -1			; GFX8-NEXT: s_add_i32 s7, s7, 32
	; GFX8-NEXT: s_cselect_b32 s2, s3, s2			; GFX8-NEXT: s_min_u32 s6, s6, s7
	; GFX8-NEXT: s_add_i32 s3, s2, -1			; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s6
	; GFX8-NEXT: s_sub_i32 s8, 33, s2			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[6:7], s3			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[6:7], s2, 0			; GFX8-NEXT: v_cvt_f32_i32_e32 v0, s2
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[6:7]			; GFX8-NEXT: s_xor_b32 s2, s0, s1
	; GFX8-NEXT: s_xor_b32 s2, s4, s5			; GFX8-NEXT: s_flbit_i32 s8, s1
	; GFX8-NEXT: v_or_b32_e32 v0, s3, v0			; GFX8-NEXT: s_ashr_i32 s2, s2, 31
	; GFX8-NEXT: s_cmp_gt_i32 s2, -1			; GFX8-NEXT: s_add_i32 s8, s8, -1
	; GFX8-NEXT: s_flbit_i32 s3, s5			; GFX8-NEXT: s_add_i32 s2, s2, 32
	; GFX8-NEXT: s_cselect_b32 s2, 33, 32			; GFX8-NEXT: s_min_u32 s2, s8, s2
	; GFX8-NEXT: s_cmp_lg_u32 s3, -1			; GFX8-NEXT: s_lshl_b64 s[0:1], s[0:1], s2
	; GFX8-NEXT: s_cselect_b32 s6, s3, s2			; GFX8-NEXT: s_min_u32 s0, s0, 1
	; GFX8-NEXT: s_add_i32 s2, s6, -1			; GFX8-NEXT: s_or_b32 s0, s1, s0
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[4:5], s2			; GFX8-NEXT: v_cvt_f32_i32_e32 v2, s0
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[4:5], s2, 0			; GFX8-NEXT: s_sub_i32 s0, 32, s6
	; GFX8-NEXT: v_cndmask_b32_e64 v1, 0, 1, s[4:5]			; GFX8-NEXT: v_ldexp_f32 v1, v0, s0
	; GFX8-NEXT: v_or_b32_e32 v1, s3, v1			; GFX8-NEXT: s_sub_i32 s0, 32, s2
	; GFX8-NEXT: v_cvt_f32_i32_e32 v0, v0			; GFX8-NEXT: v_ldexp_f32 v0, v2, s0
	; GFX8-NEXT: v_cvt_f32_i32_e32 v2, v1			; GFX8-NEXT: v_mov_b32_e32 v2, s4
	; GFX8-NEXT: s_sub_i32 s2, 33, s6			; GFX8-NEXT: v_mov_b32_e32 v3, s5
	; GFX8-NEXT: v_ldexp_f32 v1, v0, s8
	; GFX8-NEXT: v_ldexp_f32 v0, v2, s2
	; GFX8-NEXT: v_mov_b32_e32 v3, s1
	; GFX8-NEXT: v_mov_b32_e32 v2, s0
	; GFX8-NEXT: flat_store_dwordx2 v[2:3], v[0:1]			; GFX8-NEXT: flat_store_dwordx2 v[2:3], v[0:1]
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%result = sitofp <2 x i64> %in to <2 x float>			%result = sitofp <2 x i64> %in to <2 x float>
	store <2 x float> %result, <2 x float> addrspace(1)* %out			store <2 x float> %result, <2 x float> addrspace(1)* %out
	ret void			ret void
	}			}

	define amdgpu_kernel void @v_sint_to_fp_v4i64_to_v4f32(<4 x float> addrspace(1)* %out, <4 x i64> addrspace(1)* %in) #0 {			define amdgpu_kernel void @v_sint_to_fp_v4i64_to_v4f32(<4 x float> addrspace(1)* %out, <4 x i64> addrspace(1)* %in) #0 {
	Show All 16 Lines
	; GFX6-NEXT: v_ffbh_i32_e32 v9, v4			; GFX6-NEXT: v_ffbh_i32_e32 v9, v4
	; GFX6-NEXT: v_xor_b32_e32 v12, v1, v2			; GFX6-NEXT: v_xor_b32_e32 v12, v1, v2
	; GFX6-NEXT: v_ffbh_i32_e32 v13, v2			; GFX6-NEXT: v_ffbh_i32_e32 v13, v2
	; GFX6-NEXT: s_waitcnt vmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0)
	; GFX6-NEXT: v_xor_b32_e32 v14, v7, v8			; GFX6-NEXT: v_xor_b32_e32 v14, v7, v8
	; GFX6-NEXT: v_ffbh_i32_e32 v15, v8			; GFX6-NEXT: v_ffbh_i32_e32 v15, v8
	; GFX6-NEXT: v_xor_b32_e32 v16, v5, v6			; GFX6-NEXT: v_xor_b32_e32 v16, v5, v6
	; GFX6-NEXT: v_ffbh_i32_e32 v17, v6			; GFX6-NEXT: v_ffbh_i32_e32 v17, v6
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v0			; GFX6-NEXT: v_ashrrev_i32_e32 v0, 31, v0
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v9, vcc, -1, v9
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v12			; GFX6-NEXT: v_ashrrev_i32_e32 v12, 31, v12
	; GFX6-NEXT: v_cndmask_b32_e64 v12, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v13, vcc, -1, v13
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v14			; GFX6-NEXT: v_ashrrev_i32_e32 v14, 31, v14
	; GFX6-NEXT: v_cndmask_b32_e64 v14, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v15, vcc, -1, v15
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v16			; GFX6-NEXT: v_ashrrev_i32_e32 v16, 31, v16
	; GFX6-NEXT: v_cndmask_b32_e64 v16, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v17, vcc, -1, v17
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v9			; GFX6-NEXT: v_add_i32_e32 v0, vcc, 32, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v9, vcc			; GFX6-NEXT: v_add_i32_e32 v12, vcc, 32, v12
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v13			; GFX6-NEXT: v_add_i32_e32 v14, vcc, 32, v14
	; GFX6-NEXT: v_cndmask_b32_e32 v9, v12, v13, vcc			; GFX6-NEXT: v_add_i32_e32 v16, vcc, 32, v16
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v15			; GFX6-NEXT: v_min_u32_e32 v0, v9, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v12, v14, v15, vcc			; GFX6-NEXT: v_min_u32_e32 v9, v13, v12
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v17			; GFX6-NEXT: v_min_u32_e32 v12, v15, v14
	; GFX6-NEXT: v_cndmask_b32_e32 v13, v16, v17, vcc			; GFX6-NEXT: v_min_u32_e32 v13, v17, v16
	; GFX6-NEXT: v_add_i32_e32 v14, vcc, -1, v0			; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0
	; GFX6-NEXT: v_sub_i32_e32 v15, vcc, 33, v0			; GFX6-NEXT: v_sub_i32_e32 v14, vcc, 32, v0
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, -1, v9			; GFX6-NEXT: v_lshl_b64 v[0:1], v[1:2], v9
	; GFX6-NEXT: v_sub_i32_e32 v9, vcc, 33, v9			; GFX6-NEXT: v_sub_i32_e32 v2, vcc, 32, v9
	; GFX6-NEXT: v_add_i32_e32 v16, vcc, -1, v12			; GFX6-NEXT: v_lshl_b64 v[7:8], v[7:8], v12
	; GFX6-NEXT: v_sub_i32_e32 v12, vcc, 33, v12			; GFX6-NEXT: v_sub_i32_e32 v9, vcc, 32, v12
	; GFX6-NEXT: v_add_i32_e32 v17, vcc, -1, v13			; GFX6-NEXT: v_lshl_b64 v[5:6], v[5:6], v13
	; GFX6-NEXT: v_sub_i32_e32 v13, vcc, 33, v13			; GFX6-NEXT: v_sub_i32_e32 v12, vcc, 32, v13
	; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v14			; GFX6-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX6-NEXT: v_lshl_b64 v[0:1], v[1:2], v0			; GFX6-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX6-NEXT: v_lshl_b64 v[7:8], v[7:8], v16			; GFX6-NEXT: v_min_u32_e32 v7, 1, v7
	; GFX6-NEXT: v_lshl_b64 v[5:6], v[5:6], v17			; GFX6-NEXT: v_min_u32_e32 v5, 1, v5
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3			; GFX6-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX6-NEXT: v_cndmask_b32_e64 v2, 0, 1, vcc
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v7
	; GFX6-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	; GFX6-NEXT: v_cndmask_b32_e64 v5, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v2, v4, v2
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0			; GFX6-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX6-NEXT: v_or_b32_e32 v1, v8, v3			; GFX6-NEXT: v_or_b32_e32 v1, v8, v7
	; GFX6-NEXT: v_or_b32_e32 v3, v6, v5			; GFX6-NEXT: v_or_b32_e32 v4, v6, v5
	; GFX6-NEXT: v_cvt_f32_i32_e32 v2, v2			; GFX6-NEXT: v_cvt_f32_i32_e32 v3, v3
	; GFX6-NEXT: v_cvt_f32_i32_e32 v0, v0			; GFX6-NEXT: v_cvt_f32_i32_e32 v0, v0
	; GFX6-NEXT: v_cvt_f32_i32_e32 v1, v1			; GFX6-NEXT: v_cvt_f32_i32_e32 v1, v1
	; GFX6-NEXT: v_cvt_f32_i32_e32 v4, v3			; GFX6-NEXT: v_cvt_f32_i32_e32 v4, v4
	; GFX6-NEXT: v_ldexp_f32_e32 v3, v2, v15			; GFX6-NEXT: v_ldexp_f32_e32 v3, v3, v14
	; GFX6-NEXT: v_ldexp_f32_e32 v2, v0, v9			; GFX6-NEXT: v_ldexp_f32_e32 v2, v0, v2
	; GFX6-NEXT: v_ldexp_f32_e32 v1, v1, v12			; GFX6-NEXT: v_ldexp_f32_e32 v1, v1, v9
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v4, v13			; GFX6-NEXT: v_ldexp_f32_e32 v0, v4, v12
	; GFX6-NEXT: buffer_store_dwordx4 v[0:3], v[10:11], s[0:3], 0 addr64			; GFX6-NEXT: buffer_store_dwordx4 v[0:3], v[10:11], s[0:3], 0 addr64
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: v_sint_to_fp_v4i64_to_v4f32:			; GFX8-LABEL: v_sint_to_fp_v4i64_to_v4f32:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 5, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 5, v0
	; GFX8-NEXT: v_mov_b32_e32 v10, 0
	; GFX8-NEXT: v_lshlrev_b32_e32 v0, 4, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v0, 4, v0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_mov_b32_e32 v2, s3			; GFX8-NEXT: v_mov_b32_e32 v2, s3
	; GFX8-NEXT: v_add_u32_e32 v5, vcc, s2, v1			; GFX8-NEXT: v_add_u32_e32 v5, vcc, s2, v1
	; GFX8-NEXT: v_addc_u32_e32 v6, vcc, v2, v10, vcc			; GFX8-NEXT: v_addc_u32_e32 v6, vcc, 0, v2, vcc
	; GFX8-NEXT: v_add_u32_e32 v1, vcc, 16, v5			; GFX8-NEXT: v_add_u32_e32 v1, vcc, 16, v5
	; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v6, vcc			; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v6, vcc
	; GFX8-NEXT: flat_load_dwordx4 v[1:4], v[1:2]			; GFX8-NEXT: flat_load_dwordx4 v[1:4], v[1:2]
	; GFX8-NEXT: flat_load_dwordx4 v[5:8], v[5:6]			; GFX8-NEXT: flat_load_dwordx4 v[5:8], v[5:6]
	; GFX8-NEXT: v_add_u32_e32 v9, vcc, s0, v0			; GFX8-NEXT: v_add_u32_e32 v9, vcc, s0, v0
	; GFX8-NEXT: v_mov_b32_e32 v11, s1			; GFX8-NEXT: v_mov_b32_e32 v10, s1
	; GFX8-NEXT: v_addc_u32_e32 v10, vcc, v11, v10, vcc			; GFX8-NEXT: v_addc_u32_e32 v10, vcc, 0, v10, vcc
	; GFX8-NEXT: s_waitcnt vmcnt(1)			; GFX8-NEXT: s_waitcnt vmcnt(1)
	; GFX8-NEXT: v_xor_b32_e32 v14, v3, v4			; GFX8-NEXT: v_xor_b32_e32 v14, v3, v4
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_xor_b32_e32 v0, v7, v8			; GFX8-NEXT: v_xor_b32_e32 v0, v7, v8
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v0
	; GFX8-NEXT: v_xor_b32_e32 v12, v5, v6			; GFX8-NEXT: v_xor_b32_e32 v12, v5, v6
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 32, 33, vcc
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v12
	; GFX8-NEXT: v_cndmask_b32_e64 v12, 32, 33, vcc
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v14
	; GFX8-NEXT: v_xor_b32_e32 v16, v1, v2			; GFX8-NEXT: v_xor_b32_e32 v16, v1, v2
	; GFX8-NEXT: v_cndmask_b32_e64 v14, 32, 33, vcc
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v16
	; GFX8-NEXT: v_ffbh_i32_e32 v11, v8			; GFX8-NEXT: v_ffbh_i32_e32 v11, v8
	; GFX8-NEXT: v_cndmask_b32_e64 v16, 32, 33, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v11
	; GFX8-NEXT: v_ffbh_i32_e32 v13, v6			; GFX8-NEXT: v_ffbh_i32_e32 v13, v6
	; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v11, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v13
	; GFX8-NEXT: v_ffbh_i32_e32 v15, v4			; GFX8-NEXT: v_ffbh_i32_e32 v15, v4
	; GFX8-NEXT: v_cndmask_b32_e32 v11, v12, v13, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v15
	; GFX8-NEXT: v_ffbh_i32_e32 v17, v2			; GFX8-NEXT: v_ffbh_i32_e32 v17, v2
	; GFX8-NEXT: v_cndmask_b32_e32 v12, v14, v15, vcc			; GFX8-NEXT: v_ashrrev_i32_e32 v0, 31, v0
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v17			; GFX8-NEXT: v_ashrrev_i32_e32 v12, 31, v12
	; GFX8-NEXT: v_cndmask_b32_e32 v13, v16, v17, vcc			; GFX8-NEXT: v_ashrrev_i32_e32 v14, 31, v14
	; GFX8-NEXT: v_add_u32_e32 v14, vcc, -1, v0			; GFX8-NEXT: v_ashrrev_i32_e32 v16, 31, v16
	; GFX8-NEXT: v_sub_u32_e32 v15, vcc, 33, v0			; GFX8-NEXT: v_add_u32_e32 v11, vcc, -1, v11
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, -1, v11			; GFX8-NEXT: v_add_u32_e32 v0, vcc, 32, v0
	; GFX8-NEXT: v_lshlrev_b64 v[7:8], v14, v[7:8]			; GFX8-NEXT: v_add_u32_e32 v13, vcc, -1, v13
	; GFX8-NEXT: v_add_u32_e32 v16, vcc, -1, v12			; GFX8-NEXT: v_add_u32_e32 v15, vcc, -1, v15
	; GFX8-NEXT: v_add_u32_e32 v17, vcc, -1, v13			; GFX8-NEXT: v_add_u32_e32 v17, vcc, -1, v17
	; GFX8-NEXT: v_lshlrev_b64 v[5:6], v0, v[5:6]			; GFX8-NEXT: v_add_u32_e32 v12, vcc, 32, v12
	; GFX8-NEXT: v_sub_u32_e32 v11, vcc, 33, v11			; GFX8-NEXT: v_add_u32_e32 v14, vcc, 32, v14
	; GFX8-NEXT: v_sub_u32_e32 v12, vcc, 33, v12			; GFX8-NEXT: v_add_u32_e32 v16, vcc, 32, v16
	; GFX8-NEXT: v_sub_u32_e32 v13, vcc, 33, v13			; GFX8-NEXT: v_min_u32_e32 v0, v11, v0
	; GFX8-NEXT: v_lshlrev_b64 v[3:4], v16, v[3:4]			; GFX8-NEXT: v_min_u32_e32 v11, v13, v12
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v7			; GFX8-NEXT: v_min_u32_e32 v12, v15, v14
	; GFX8-NEXT: v_lshlrev_b64 v[0:1], v17, v[1:2]			; GFX8-NEXT: v_min_u32_e32 v13, v17, v16
	; GFX8-NEXT: v_cndmask_b32_e64 v2, 0, 1, vcc			; GFX8-NEXT: v_lshlrev_b64 v[5:6], v11, v[5:6]
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5			; GFX8-NEXT: v_lshlrev_b64 v[3:4], v12, v[3:4]
	; GFX8-NEXT: v_cndmask_b32_e64 v5, 0, 1, vcc			; GFX8-NEXT: v_lshlrev_b64 v[7:8], v0, v[7:8]
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3			; GFX8-NEXT: v_sub_u32_e32 v14, vcc, 32, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc			; GFX8-NEXT: v_lshlrev_b64 v[0:1], v13, v[1:2]
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX8-NEXT: v_min_u32_e32 v7, 1, v7
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc			; GFX8-NEXT: v_min_u32_e32 v5, 1, v5
				; GFX8-NEXT: v_min_u32_e32 v3, 1, v3
				; GFX8-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX8-NEXT: v_or_b32_e32 v3, v4, v3			; GFX8-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX8-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX8-NEXT: v_or_b32_e32 v2, v8, v2
	; GFX8-NEXT: v_or_b32_e32 v5, v6, v5			; GFX8-NEXT: v_or_b32_e32 v5, v6, v5
	; GFX8-NEXT: v_cvt_f32_i32_e32 v1, v2			; GFX8-NEXT: v_or_b32_e32 v7, v8, v7
				; GFX8-NEXT: v_or_b32_e32 v0, v1, v0
				; GFX8-NEXT: v_cvt_f32_i32_e32 v1, v7
				; GFX8-NEXT: v_cvt_f32_i32_e32 v4, v5
	; GFX8-NEXT: v_cvt_f32_i32_e32 v3, v3			; GFX8-NEXT: v_cvt_f32_i32_e32 v3, v3
	; GFX8-NEXT: v_cvt_f32_i32_e32 v2, v5			; GFX8-NEXT: v_cvt_f32_i32_e32 v5, v0
	; GFX8-NEXT: v_cvt_f32_i32_e32 v4, v0			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v13
	; GFX8-NEXT: v_ldexp_f32 v1, v1, v15			; GFX8-NEXT: v_sub_u32_e32 v11, vcc, 32, v11
				; GFX8-NEXT: v_sub_u32_e32 v12, vcc, 32, v12
				; GFX8-NEXT: v_ldexp_f32 v1, v1, v14
				; GFX8-NEXT: v_ldexp_f32 v0, v4, v11
	; GFX8-NEXT: v_ldexp_f32 v3, v3, v12			; GFX8-NEXT: v_ldexp_f32 v3, v3, v12
	; GFX8-NEXT: v_ldexp_f32 v0, v2, v11			; GFX8-NEXT: v_ldexp_f32 v2, v5, v2
	; GFX8-NEXT: v_ldexp_f32 v2, v4, v13
	; GFX8-NEXT: flat_store_dwordx4 v[9:10], v[0:3]			; GFX8-NEXT: flat_store_dwordx4 v[9:10], v[0:3]
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr <4 x i64>, <4 x i64> addrspace(1)* %in, i32 %tid			%in.gep = getelementptr <4 x i64>, <4 x i64> addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr <4 x float>, <4 x float> addrspace(1)* %out, i32 %tid			%out.gep = getelementptr <4 x float>, <4 x float> addrspace(1)* %out, i32 %tid
	%value = load <4 x i64>, <4 x i64> addrspace(1)* %in.gep			%value = load <4 x i64>, <4 x i64> addrspace(1)* %in.gep
	%result = sitofp <4 x i64> %value to <4 x float>			%result = sitofp <4 x i64> %value to <4 x float>
	store <4 x float> %result, <4 x float> addrspace(1)* %out.gep			store <4 x float> %result, <4 x float> addrspace(1)* %out.gep
	ret void			ret void
	}			}

	define amdgpu_kernel void @s_sint_to_fp_v2i64_to_v2f16(<2 x half> addrspace(1)* %out, <2 x i64> %in) #0{			define amdgpu_kernel void @s_sint_to_fp_v2i64_to_v2f16(<2 x half> addrspace(1)* %out, <2 x i64> %in) #0{
	; GFX6-LABEL: s_sint_to_fp_v2i64_to_v2f16:			; GFX6-LABEL: s_sint_to_fp_v2i64_to_v2f16:
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xd			; GFX6-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xd
	; GFX6-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX6-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX6-NEXT: s_mov_b32 s3, 0xf000			; GFX6-NEXT: s_mov_b32 s3, 0xf000
	; GFX6-NEXT: s_mov_b32 s2, -1			; GFX6-NEXT: s_mov_b32 s2, -1
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_xor_b32 s8, s6, s7			; GFX6-NEXT: s_flbit_i32 s8, s7
	; GFX6-NEXT: s_flbit_i32 s10, s7			; GFX6-NEXT: s_xor_b32 s9, s6, s7
				; GFX6-NEXT: s_flbit_i32 s10, s5
	; GFX6-NEXT: s_xor_b32 s11, s4, s5			; GFX6-NEXT: s_xor_b32 s11, s4, s5
	; GFX6-NEXT: s_flbit_i32 s12, s5			; GFX6-NEXT: s_add_i32 s8, s8, -1
	; GFX6-NEXT: v_cmp_gt_i32_e64 s[8:9], s8, -1			; GFX6-NEXT: s_ashr_i32 s9, s9, 31
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 32, 33, s[8:9]			; GFX6-NEXT: s_add_i32 s10, s10, -1
	; GFX6-NEXT: v_mov_b32_e32 v1, s10			; GFX6-NEXT: s_ashr_i32 s11, s11, 31
	; GFX6-NEXT: v_cmp_gt_i32_e64 s[8:9], s11, -1			; GFX6-NEXT: s_add_i32 s9, s9, 32
	; GFX6-NEXT: v_cndmask_b32_e64 v2, 32, 33, s[8:9]			; GFX6-NEXT: s_add_i32 s11, s11, 32
	; GFX6-NEXT: v_mov_b32_e32 v3, s12			; GFX6-NEXT: s_min_u32 s8, s8, s9
	; GFX6-NEXT: v_cmp_ne_u32_e64 vcc, s10, -1			; GFX6-NEXT: s_min_u32 s9, s10, s11
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX6-NEXT: s_lshl_b64 s[6:7], s[6:7], s8
	; GFX6-NEXT: v_cmp_ne_u32_e64 vcc, s12, -1			; GFX6-NEXT: s_sub_i32 s8, 32, s8
	; GFX6-NEXT: v_cndmask_b32_e32 v1, v2, v3, vcc			; GFX6-NEXT: s_lshl_b64 s[4:5], s[4:5], s9
	; GFX6-NEXT: v_add_i32_e32 v2, vcc, -1, v0			; GFX6-NEXT: s_sub_i32 s9, 32, s9
	; GFX6-NEXT: v_sub_i32_e32 v4, vcc, 33, v0			; GFX6-NEXT: s_min_u32 s6, s6, 1
	; GFX6-NEXT: v_add_i32_e32 v3, vcc, -1, v1			; GFX6-NEXT: s_min_u32 s4, s4, 1
	; GFX6-NEXT: v_sub_i32_e32 v5, vcc, 33, v1			; GFX6-NEXT: s_or_b32 s6, s7, s6
	; GFX6-NEXT: v_lshl_b64 v[0:1], s[6:7], v2			; GFX6-NEXT: s_or_b32 s4, s5, s4
	; GFX6-NEXT: v_lshl_b64 v[2:3], s[4:5], v3			; GFX6-NEXT: v_cvt_f32_i32_e32 v0, s6
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX6-NEXT: v_cvt_f32_i32_e32 v1, s4
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc			; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s8
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v2			; GFX6-NEXT: v_ldexp_f32_e64 v1, v1, s9
	; GFX6-NEXT: v_cndmask_b32_e64 v2, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX6-NEXT: v_or_b32_e32 v1, v3, v2
	; GFX6-NEXT: v_cvt_f32_i32_e32 v0, v0
	; GFX6-NEXT: v_cvt_f32_i32_e32 v1, v1
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v0, v4
	; GFX6-NEXT: v_ldexp_f32_e32 v1, v1, v5
	; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
	; GFX6-NEXT: v_lshlrev_b32_e32 v0, 16, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v0, 16, v0
	; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1			; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0			; GFX6-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX6-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX6-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: s_sint_to_fp_v2i64_to_v2f16:			; GFX8-LABEL: s_sint_to_fp_v2i64_to_v2f16:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x34
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_xor_b32 s2, s6, s7			; GFX8-NEXT: s_xor_b32 s3, s6, s7
	; GFX8-NEXT: s_cmp_gt_i32 s2, -1			; GFX8-NEXT: s_flbit_i32 s2, s7
	; GFX8-NEXT: s_flbit_i32 s3, s7			; GFX8-NEXT: s_ashr_i32 s3, s3, 31
	; GFX8-NEXT: s_cselect_b32 s2, 33, 32			; GFX8-NEXT: s_add_i32 s2, s2, -1
	; GFX8-NEXT: s_cmp_lg_u32 s3, -1			; GFX8-NEXT: s_add_i32 s3, s3, 32
	; GFX8-NEXT: s_cselect_b32 s2, s3, s2			; GFX8-NEXT: s_min_u32 s9, s2, s3
	; GFX8-NEXT: s_add_i32 s3, s2, -1			; GFX8-NEXT: s_lshl_b64 s[2:3], s[6:7], s9
	; GFX8-NEXT: s_sub_i32 s8, 33, s2			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[6:7], s3			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[6:7], s2, 0			; GFX8-NEXT: v_cvt_f32_i32_e32 v0, s2
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[6:7]
	; GFX8-NEXT: s_xor_b32 s2, s4, s5			; GFX8-NEXT: s_xor_b32 s2, s4, s5
	; GFX8-NEXT: v_or_b32_e32 v0, s3, v0			; GFX8-NEXT: s_flbit_i32 s8, s5
	; GFX8-NEXT: s_cmp_gt_i32 s2, -1			; GFX8-NEXT: s_ashr_i32 s2, s2, 31
	; GFX8-NEXT: s_flbit_i32 s3, s5			; GFX8-NEXT: s_add_i32 s8, s8, -1
	; GFX8-NEXT: s_cselect_b32 s2, 33, 32			; GFX8-NEXT: s_add_i32 s2, s2, 32
	; GFX8-NEXT: s_cmp_lg_u32 s3, -1			; GFX8-NEXT: s_min_u32 s7, s8, s2
	; GFX8-NEXT: s_cselect_b32 s6, s3, s2			; GFX8-NEXT: s_lshl_b64 s[2:3], s[4:5], s7
	; GFX8-NEXT: s_add_i32 s2, s6, -1			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[4:5], s2			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[4:5], s2, 0			; GFX8-NEXT: v_cvt_f32_i32_e32 v1, s2
	; GFX8-NEXT: v_cndmask_b32_e64 v1, 0, 1, s[4:5]			; GFX8-NEXT: s_sub_i32 s6, 32, s9
	; GFX8-NEXT: v_or_b32_e32 v1, s3, v1			; GFX8-NEXT: s_sub_i32 s2, 32, s7
	; GFX8-NEXT: v_cvt_f32_i32_e32 v0, v0			; GFX8-NEXT: v_ldexp_f32 v0, v0, s6
	; GFX8-NEXT: v_cvt_f32_i32_e32 v1, v1
	; GFX8-NEXT: s_sub_i32 s2, 33, s6
	; GFX8-NEXT: v_ldexp_f32 v0, v0, s8
	; GFX8-NEXT: v_ldexp_f32 v1, v1, s2			; GFX8-NEXT: v_ldexp_f32 v1, v1, s2
	; GFX8-NEXT: v_cvt_f16_f32_sdwa v0, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD			; GFX8-NEXT: v_cvt_f16_f32_sdwa v0, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD
	; GFX8-NEXT: v_cvt_f16_f32_e32 v1, v1			; GFX8-NEXT: v_cvt_f16_f32_e32 v1, v1
	; GFX8-NEXT: v_or_b32_e32 v2, v1, v0			; GFX8-NEXT: v_or_b32_e32 v2, v1, v0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_store_dword v[0:1], v2			; GFX8-NEXT: flat_store_dword v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	Show All 22 Lines
	; GFX6-NEXT: v_ffbh_i32_e32 v9, v4			; GFX6-NEXT: v_ffbh_i32_e32 v9, v4
	; GFX6-NEXT: v_xor_b32_e32 v12, v1, v2			; GFX6-NEXT: v_xor_b32_e32 v12, v1, v2
	; GFX6-NEXT: v_ffbh_i32_e32 v13, v2			; GFX6-NEXT: v_ffbh_i32_e32 v13, v2
	; GFX6-NEXT: s_waitcnt vmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0)
	; GFX6-NEXT: v_xor_b32_e32 v14, v7, v8			; GFX6-NEXT: v_xor_b32_e32 v14, v7, v8
	; GFX6-NEXT: v_ffbh_i32_e32 v15, v8			; GFX6-NEXT: v_ffbh_i32_e32 v15, v8
	; GFX6-NEXT: v_xor_b32_e32 v16, v5, v6			; GFX6-NEXT: v_xor_b32_e32 v16, v5, v6
	; GFX6-NEXT: v_ffbh_i32_e32 v17, v6			; GFX6-NEXT: v_ffbh_i32_e32 v17, v6
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v0			; GFX6-NEXT: v_ashrrev_i32_e32 v0, 31, v0
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v9, vcc, -1, v9
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v12			; GFX6-NEXT: v_ashrrev_i32_e32 v12, 31, v12
	; GFX6-NEXT: v_cndmask_b32_e64 v12, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v13, vcc, -1, v13
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v14			; GFX6-NEXT: v_ashrrev_i32_e32 v14, 31, v14
	; GFX6-NEXT: v_cndmask_b32_e64 v14, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v15, vcc, -1, v15
	; GFX6-NEXT: v_cmp_lt_i32_e32 vcc, -1, v16			; GFX6-NEXT: v_ashrrev_i32_e32 v16, 31, v16
	; GFX6-NEXT: v_cndmask_b32_e64 v16, 32, 33, vcc			; GFX6-NEXT: v_add_i32_e32 v17, vcc, -1, v17
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v9			; GFX6-NEXT: v_add_i32_e32 v0, vcc, 32, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v9, vcc			; GFX6-NEXT: v_add_i32_e32 v12, vcc, 32, v12
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v13			; GFX6-NEXT: v_add_i32_e32 v14, vcc, 32, v14
	; GFX6-NEXT: v_cndmask_b32_e32 v9, v12, v13, vcc			; GFX6-NEXT: v_add_i32_e32 v16, vcc, 32, v16
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v15			; GFX6-NEXT: v_min_u32_e32 v0, v9, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v12, v14, v15, vcc			; GFX6-NEXT: v_min_u32_e32 v9, v13, v12
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, -1, v17			; GFX6-NEXT: v_min_u32_e32 v12, v15, v14
	; GFX6-NEXT: v_cndmask_b32_e32 v13, v16, v17, vcc			; GFX6-NEXT: v_min_u32_e32 v13, v17, v16
	; GFX6-NEXT: v_add_i32_e32 v14, vcc, -1, v0			; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0
	; GFX6-NEXT: v_sub_i32_e32 v15, vcc, 33, v0			; GFX6-NEXT: v_sub_i32_e32 v14, vcc, 32, v0
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, -1, v9			; GFX6-NEXT: v_lshl_b64 v[0:1], v[1:2], v9
	; GFX6-NEXT: v_sub_i32_e32 v9, vcc, 33, v9			; GFX6-NEXT: v_sub_i32_e32 v2, vcc, 32, v9
	; GFX6-NEXT: v_add_i32_e32 v16, vcc, -1, v12			; GFX6-NEXT: v_lshl_b64 v[7:8], v[7:8], v12
	; GFX6-NEXT: v_sub_i32_e32 v12, vcc, 33, v12			; GFX6-NEXT: v_sub_i32_e32 v9, vcc, 32, v12
	; GFX6-NEXT: v_add_i32_e32 v17, vcc, -1, v13			; GFX6-NEXT: v_lshl_b64 v[5:6], v[5:6], v13
	; GFX6-NEXT: v_sub_i32_e32 v13, vcc, 33, v13			; GFX6-NEXT: v_sub_i32_e32 v12, vcc, 32, v13
	; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v14			; GFX6-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX6-NEXT: v_lshl_b64 v[0:1], v[1:2], v0			; GFX6-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX6-NEXT: v_lshl_b64 v[7:8], v[7:8], v16			; GFX6-NEXT: v_min_u32_e32 v7, 1, v7
	; GFX6-NEXT: v_lshl_b64 v[5:6], v[5:6], v17			; GFX6-NEXT: v_min_u32_e32 v5, 1, v5
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3			; GFX6-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX6-NEXT: v_cndmask_b32_e64 v2, 0, 1, vcc
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v7
	; GFX6-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	; GFX6-NEXT: v_cndmask_b32_e64 v5, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v2, v4, v2
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0			; GFX6-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX6-NEXT: v_or_b32_e32 v1, v8, v3			; GFX6-NEXT: v_or_b32_e32 v1, v8, v7
	; GFX6-NEXT: v_or_b32_e32 v3, v6, v5			; GFX6-NEXT: v_or_b32_e32 v4, v6, v5
	; GFX6-NEXT: v_cvt_f32_i32_e32 v2, v2			; GFX6-NEXT: v_cvt_f32_i32_e32 v3, v3
	; GFX6-NEXT: v_cvt_f32_i32_e32 v0, v0			; GFX6-NEXT: v_cvt_f32_i32_e32 v0, v0
	; GFX6-NEXT: v_cvt_f32_i32_e32 v1, v1			; GFX6-NEXT: v_cvt_f32_i32_e32 v1, v1
	; GFX6-NEXT: v_cvt_f32_i32_e32 v3, v3			; GFX6-NEXT: v_cvt_f32_i32_e32 v4, v4
	; GFX6-NEXT: v_ldexp_f32_e32 v2, v2, v15			; GFX6-NEXT: v_ldexp_f32_e32 v3, v3, v14
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v0, v9			; GFX6-NEXT: v_ldexp_f32_e32 v0, v0, v2
	; GFX6-NEXT: v_ldexp_f32_e32 v1, v1, v12			; GFX6-NEXT: v_ldexp_f32_e32 v1, v1, v9
	; GFX6-NEXT: v_ldexp_f32_e32 v3, v3, v13			; GFX6-NEXT: v_ldexp_f32_e32 v2, v4, v12
	; GFX6-NEXT: v_cvt_f16_f32_e32 v2, v2			; GFX6-NEXT: v_cvt_f16_f32_e32 v3, v3
	; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
	; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1			; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1
	; GFX6-NEXT: v_cvt_f16_f32_e32 v3, v3			; GFX6-NEXT: v_cvt_f16_f32_e32 v2, v2
	; GFX6-NEXT: v_lshlrev_b32_e32 v2, 16, v2			; GFX6-NEXT: v_lshlrev_b32_e32 v3, 16, v3
	; GFX6-NEXT: v_lshlrev_b32_e32 v4, 16, v1			; GFX6-NEXT: v_lshlrev_b32_e32 v4, 16, v1
	; GFX6-NEXT: v_or_b32_e32 v1, v0, v2			; GFX6-NEXT: v_or_b32_e32 v1, v0, v3
	; GFX6-NEXT: v_or_b32_e32 v0, v3, v4			; GFX6-NEXT: v_or_b32_e32 v0, v2, v4
	; GFX6-NEXT: buffer_store_dwordx2 v[0:1], v[10:11], s[0:3], 0 addr64			; GFX6-NEXT: buffer_store_dwordx2 v[0:1], v[10:11], s[0:3], 0 addr64
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: v_sint_to_fp_v4i64_to_v4f16:			; GFX8-LABEL: v_sint_to_fp_v4i64_to_v4f16:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 5, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 5, v0
	; GFX8-NEXT: v_mov_b32_e32 v9, 0			; GFX8-NEXT: v_lshlrev_b32_e32 v9, 3, v0
	; GFX8-NEXT: v_lshlrev_b32_e32 v10, 3, v0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_mov_b32_e32 v2, s3			; GFX8-NEXT: v_mov_b32_e32 v2, s3
	; GFX8-NEXT: v_add_u32_e32 v5, vcc, s2, v1			; GFX8-NEXT: v_add_u32_e32 v5, vcc, s2, v1
	; GFX8-NEXT: v_addc_u32_e32 v6, vcc, v2, v9, vcc			; GFX8-NEXT: v_addc_u32_e32 v6, vcc, 0, v2, vcc
	; GFX8-NEXT: v_add_u32_e32 v1, vcc, 16, v5			; GFX8-NEXT: v_add_u32_e32 v1, vcc, 16, v5
	; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v6, vcc			; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v6, vcc
	; GFX8-NEXT: flat_load_dwordx4 v[1:4], v[1:2]			; GFX8-NEXT: flat_load_dwordx4 v[1:4], v[1:2]
	; GFX8-NEXT: flat_load_dwordx4 v[5:8], v[5:6]			; GFX8-NEXT: flat_load_dwordx4 v[5:8], v[5:6]
	; GFX8-NEXT: v_mov_b32_e32 v11, s1			; GFX8-NEXT: v_mov_b32_e32 v10, s1
	; GFX8-NEXT: s_waitcnt vmcnt(1)			; GFX8-NEXT: s_waitcnt vmcnt(1)
	; GFX8-NEXT: v_xor_b32_e32 v15, v3, v4			; GFX8-NEXT: v_xor_b32_e32 v14, v3, v4
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_xor_b32_e32 v0, v7, v8			; GFX8-NEXT: v_xor_b32_e32 v0, v7, v8
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v0			; GFX8-NEXT: v_xor_b32_e32 v12, v5, v6
	; GFX8-NEXT: v_xor_b32_e32 v13, v5, v6			; GFX8-NEXT: v_xor_b32_e32 v16, v1, v2
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 32, 33, vcc			; GFX8-NEXT: v_ffbh_i32_e32 v11, v8
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v13			; GFX8-NEXT: v_ffbh_i32_e32 v13, v6
	; GFX8-NEXT: v_cndmask_b32_e64 v13, 32, 33, vcc			; GFX8-NEXT: v_ffbh_i32_e32 v15, v4
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v15			; GFX8-NEXT: v_ffbh_i32_e32 v17, v2
	; GFX8-NEXT: v_xor_b32_e32 v17, v1, v2			; GFX8-NEXT: v_ashrrev_i32_e32 v0, 31, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v15, 32, 33, vcc			; GFX8-NEXT: v_ashrrev_i32_e32 v12, 31, v12
	; GFX8-NEXT: v_cmp_lt_i32_e32 vcc, -1, v17			; GFX8-NEXT: v_ashrrev_i32_e32 v14, 31, v14
	; GFX8-NEXT: v_ffbh_i32_e32 v12, v8			; GFX8-NEXT: v_ashrrev_i32_e32 v16, 31, v16
	; GFX8-NEXT: v_cndmask_b32_e64 v17, 32, 33, vcc			; GFX8-NEXT: v_add_u32_e32 v11, vcc, -1, v11
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v12			; GFX8-NEXT: v_add_u32_e32 v0, vcc, 32, v0
	; GFX8-NEXT: v_ffbh_i32_e32 v14, v6			; GFX8-NEXT: v_add_u32_e32 v13, vcc, -1, v13
	; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v12, vcc			; GFX8-NEXT: v_add_u32_e32 v15, vcc, -1, v15
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v14			; GFX8-NEXT: v_add_u32_e32 v17, vcc, -1, v17
	; GFX8-NEXT: v_ffbh_i32_e32 v16, v4			; GFX8-NEXT: v_add_u32_e32 v12, vcc, 32, v12
	; GFX8-NEXT: v_cndmask_b32_e32 v12, v13, v14, vcc			; GFX8-NEXT: v_add_u32_e32 v14, vcc, 32, v14
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v16			; GFX8-NEXT: v_add_u32_e32 v16, vcc, 32, v16
	; GFX8-NEXT: v_ffbh_i32_e32 v18, v2			; GFX8-NEXT: v_min_u32_e32 v0, v11, v0
	; GFX8-NEXT: v_cndmask_b32_e32 v13, v15, v16, vcc			; GFX8-NEXT: v_min_u32_e32 v11, v13, v12
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, -1, v18			; GFX8-NEXT: v_min_u32_e32 v12, v15, v14
	; GFX8-NEXT: v_cndmask_b32_e32 v14, v17, v18, vcc			; GFX8-NEXT: v_min_u32_e32 v13, v17, v16
	; GFX8-NEXT: v_add_u32_e32 v15, vcc, -1, v0			; GFX8-NEXT: v_lshlrev_b64 v[5:6], v11, v[5:6]
	; GFX8-NEXT: v_sub_u32_e32 v16, vcc, 33, v0			; GFX8-NEXT: v_lshlrev_b64 v[3:4], v12, v[3:4]
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, -1, v12			; GFX8-NEXT: v_lshlrev_b64 v[7:8], v0, v[7:8]
	; GFX8-NEXT: v_lshlrev_b64 v[7:8], v15, v[7:8]			; GFX8-NEXT: v_sub_u32_e32 v14, vcc, 32, v0
	; GFX8-NEXT: v_add_u32_e32 v17, vcc, -1, v13			; GFX8-NEXT: v_lshlrev_b64 v[0:1], v13, v[1:2]
	; GFX8-NEXT: v_add_u32_e32 v18, vcc, -1, v14			; GFX8-NEXT: v_min_u32_e32 v7, 1, v7
	; GFX8-NEXT: v_lshlrev_b64 v[5:6], v0, v[5:6]			; GFX8-NEXT: v_min_u32_e32 v5, 1, v5
	; GFX8-NEXT: v_sub_u32_e32 v12, vcc, 33, v12			; GFX8-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX8-NEXT: v_sub_u32_e32 v13, vcc, 33, v13			; GFX8-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX8-NEXT: v_sub_u32_e32 v14, vcc, 33, v14
	; GFX8-NEXT: v_lshlrev_b64 v[3:4], v17, v[3:4]
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v7
	; GFX8-NEXT: v_lshlrev_b64 v[0:1], v18, v[1:2]
	; GFX8-NEXT: v_cndmask_b32_e64 v2, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	; GFX8-NEXT: v_cndmask_b32_e64 v5, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
	; GFX8-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
	; GFX8-NEXT: v_or_b32_e32 v3, v4, v3			; GFX8-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX8-NEXT: v_or_b32_e32 v0, v1, v0			; GFX8-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX8-NEXT: v_or_b32_e32 v2, v8, v2			; GFX8-NEXT: v_or_b32_e32 v7, v8, v7
	; GFX8-NEXT: v_or_b32_e32 v5, v6, v5			; GFX8-NEXT: v_or_b32_e32 v5, v6, v5
	; GFX8-NEXT: v_cvt_f32_i32_e32 v1, v2			; GFX8-NEXT: v_cvt_f32_i32_e32 v1, v7
	; GFX8-NEXT: v_cvt_f32_i32_e32 v2, v5			; GFX8-NEXT: v_cvt_f32_i32_e32 v4, v5
	; GFX8-NEXT: v_cvt_f32_i32_e32 v3, v3			; GFX8-NEXT: v_cvt_f32_i32_e32 v3, v3
	; GFX8-NEXT: v_cvt_f32_i32_e32 v0, v0			; GFX8-NEXT: v_cvt_f32_i32_e32 v0, v0
	; GFX8-NEXT: v_ldexp_f32 v1, v1, v16			; GFX8-NEXT: v_sub_u32_e32 v11, vcc, 32, v11
	; GFX8-NEXT: v_ldexp_f32 v2, v2, v12			; GFX8-NEXT: v_sub_u32_e32 v12, vcc, 32, v12
	; GFX8-NEXT: v_ldexp_f32 v3, v3, v13			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v13
	; GFX8-NEXT: v_ldexp_f32 v0, v0, v14			; GFX8-NEXT: v_ldexp_f32 v4, v4, v11
				; GFX8-NEXT: v_ldexp_f32 v3, v3, v12
				; GFX8-NEXT: v_ldexp_f32 v0, v0, v2
				; GFX8-NEXT: v_ldexp_f32 v1, v1, v14
	; GFX8-NEXT: v_cvt_f16_f32_e32 v5, v0			; GFX8-NEXT: v_cvt_f16_f32_e32 v5, v0
	; GFX8-NEXT: v_cvt_f16_f32_sdwa v3, v3 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD			; GFX8-NEXT: v_cvt_f16_f32_sdwa v3, v3 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD
	; GFX8-NEXT: v_cvt_f16_f32_sdwa v4, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD			; GFX8-NEXT: v_cvt_f16_f32_sdwa v2, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD
	; GFX8-NEXT: v_cvt_f16_f32_e32 v2, v2			; GFX8-NEXT: v_cvt_f16_f32_e32 v4, v4
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v10			; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v9
	; GFX8-NEXT: v_addc_u32_e32 v1, vcc, v11, v9, vcc			; GFX8-NEXT: v_addc_u32_e32 v1, vcc, 0, v10, vcc
	; GFX8-NEXT: v_or_b32_e32 v3, v5, v3			; GFX8-NEXT: v_or_b32_e32 v3, v5, v3
	; GFX8-NEXT: v_or_b32_e32 v2, v2, v4			; GFX8-NEXT: v_or_b32_e32 v2, v4, v2
	; GFX8-NEXT: flat_store_dwordx2 v[0:1], v[2:3]			; GFX8-NEXT: flat_store_dwordx2 v[0:1], v[2:3]
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr <4 x i64>, <4 x i64> addrspace(1)* %in, i32 %tid			%in.gep = getelementptr <4 x i64>, <4 x i64> addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr <4 x half>, <4 x half> addrspace(1)* %out, i32 %tid			%out.gep = getelementptr <4 x half>, <4 x half> addrspace(1)* %out, i32 %tid
	%value = load <4 x i64>, <4 x i64> addrspace(1)* %in.gep			%value = load <4 x i64>, <4 x i64> addrspace(1)* %in.gep
	%result = sitofp <4 x i64> %value to <4 x half>			%result = sitofp <4 x i64> %value to <4 x half>
	store <4 x half> %result, <4 x half> addrspace(1)* %out.gep			store <4 x half> %result, <4 x half> addrspace(1)* %out.gep
	ret void			ret void
	}			}

	declare i32 @llvm.amdgcn.workitem.id.x() #1			declare i32 @llvm.amdgcn.workitem.id.x() #1

	attributes #0 = { nounwind }			attributes #0 = { nounwind }
	attributes #1 = { nounwind readnone }			attributes #1 = { nounwind readnone }

llvm/test/CodeGen/AMDGPU/uint_to_fp.i64.ll

	Show All 10 Lines
	; GFX6-NEXT: s_mov_b32 s7, 0xf000			; GFX6-NEXT: s_mov_b32 s7, 0xf000
	; GFX6-NEXT: s_mov_b32 s6, -1			; GFX6-NEXT: s_mov_b32 s6, -1
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_mov_b32 s4, s0			; GFX6-NEXT: s_mov_b32 s4, s0
	; GFX6-NEXT: s_mov_b32 s5, s1			; GFX6-NEXT: s_mov_b32 s5, s1
	; GFX6-NEXT: s_flbit_i32_b32 s0, s3			; GFX6-NEXT: s_flbit_i32_b32 s0, s3
	; GFX6-NEXT: s_min_u32 s8, s0, 32			; GFX6-NEXT: s_min_u32 s8, s0, 32
	; GFX6-NEXT: s_lshl_b64 s[0:1], s[2:3], s8			; GFX6-NEXT: s_lshl_b64 s[0:1], s[2:3], s8
	; GFX6-NEXT: v_cmp_ne_u32_e64 s[2:3], s0, 0			; GFX6-NEXT: s_min_u32 s0, s0, 1
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[2:3]			; GFX6-NEXT: s_or_b32 s0, s1, s0
	; GFX6-NEXT: v_or_b32_e32 v0, s1, v0			; GFX6-NEXT: v_cvt_f32_u32_e32 v0, s0
	; GFX6-NEXT: v_cvt_f32_u32_e32 v0, v0
	; GFX6-NEXT: s_sub_i32 s0, 32, s8			; GFX6-NEXT: s_sub_i32 s0, 32, s8
	; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s0			; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s0
	; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
	; GFX6-NEXT: buffer_store_short v0, off, s[4:7], 0			; GFX6-NEXT: buffer_store_short v0, off, s[4:7], 0
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: s_uint_to_fp_i64_to_f16:			; GFX8-LABEL: s_uint_to_fp_i64_to_f16:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_flbit_i32_b32 s4, s3			; GFX8-NEXT: s_flbit_i32_b32 s4, s3
	; GFX8-NEXT: s_min_u32 s6, s4, 32			; GFX8-NEXT: s_min_u32 s4, s4, 32
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s6			; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s4
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[4:5], s2, 0			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[4:5]			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_or_b32_e32 v0, s3, v0			; GFX8-NEXT: v_cvt_f32_u32_e32 v0, s2
	; GFX8-NEXT: v_cvt_f32_u32_e32 v0, v0			; GFX8-NEXT: s_sub_i32 s2, 32, s4
	; GFX8-NEXT: s_sub_i32 s2, 32, s6
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: v_ldexp_f32 v0, v0, s2			; GFX8-NEXT: v_ldexp_f32 v0, v0, s2
	; GFX8-NEXT: v_cvt_f16_f32_e32 v2, v0			; GFX8-NEXT: v_cvt_f16_f32_e32 v2, v0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: flat_store_short v[0:1], v2			; GFX8-NEXT: flat_store_short v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%result = uitofp i64 %in to half			%result = uitofp i64 %in to half
	store half %result, half addrspace(1)* %out			store half %result, half addrspace(1)* %out
	Show All 12 Lines
	; GFX6-NEXT: s_mov_b64 s[4:5], s[2:3]			; GFX6-NEXT: s_mov_b64 s[4:5], s[2:3]
	; GFX6-NEXT: buffer_load_dwordx2 v[3:4], v[1:2], s[4:7], 0 addr64			; GFX6-NEXT: buffer_load_dwordx2 v[3:4], v[1:2], s[4:7], 0 addr64
	; GFX6-NEXT: v_lshlrev_b32_e32 v1, 1, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v1, 1, v0
	; GFX6-NEXT: s_mov_b64 s[2:3], s[6:7]			; GFX6-NEXT: s_mov_b64 s[2:3], s[6:7]
	; GFX6-NEXT: s_waitcnt vmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0)
	; GFX6-NEXT: v_ffbh_u32_e32 v0, v4			; GFX6-NEXT: v_ffbh_u32_e32 v0, v4
	; GFX6-NEXT: v_min_u32_e32 v0, 32, v0			; GFX6-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0			; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3			; GFX6-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX6-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v3, v4, v3			; GFX6-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX6-NEXT: v_cvt_f32_u32_e32 v3, v3			; GFX6-NEXT: v_cvt_f32_u32_e32 v3, v3
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, 32, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, 32, v0
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v3, v0			; GFX6-NEXT: v_ldexp_f32_e32 v0, v3, v0
	; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
	; GFX6-NEXT: buffer_store_short v0, v[1:2], s[0:3], 0 addr64			; GFX6-NEXT: buffer_store_short v0, v[1:2], s[0:3], 0 addr64
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: v_uint_to_fp_i64_to_f16:			; GFX8-LABEL: v_uint_to_fp_i64_to_f16:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 3, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 3, v0
	; GFX8-NEXT: v_mov_b32_e32 v3, 0
	; GFX8-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_mov_b32_e32 v2, s3			; GFX8-NEXT: v_mov_b32_e32 v2, s3
	; GFX8-NEXT: v_add_u32_e32 v1, vcc, s2, v1			; GFX8-NEXT: v_add_u32_e32 v1, vcc, s2, v1
	; GFX8-NEXT: v_addc_u32_e32 v2, vcc, v2, v3, vcc			; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
	; GFX8-NEXT: flat_load_dwordx2 v[1:2], v[1:2]			; GFX8-NEXT: flat_load_dwordx2 v[1:2], v[1:2]
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_ffbh_u32_e32 v4, v2			; GFX8-NEXT: v_ffbh_u32_e32 v3, v2
	; GFX8-NEXT: v_min_u32_e32 v4, 32, v4			; GFX8-NEXT: v_min_u32_e32 v3, 32, v3
	; GFX8-NEXT: v_lshlrev_b64 v[1:2], v4, v[1:2]			; GFX8-NEXT: v_lshlrev_b64 v[1:2], v3, v[1:2]
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v1			; GFX8-NEXT: v_sub_u32_e32 v3, vcc, 32, v3
	; GFX8-NEXT: v_cndmask_b32_e64 v1, 0, 1, vcc			; GFX8-NEXT: v_min_u32_e32 v1, 1, v1
	; GFX8-NEXT: v_or_b32_e32 v1, v2, v1			; GFX8-NEXT: v_or_b32_e32 v1, v2, v1
	; GFX8-NEXT: v_cvt_f32_u32_e32 v1, v1			; GFX8-NEXT: v_cvt_f32_u32_e32 v1, v1
	; GFX8-NEXT: v_sub_u32_e32 v4, vcc, 32, v4
	; GFX8-NEXT: v_mov_b32_e32 v2, s1			; GFX8-NEXT: v_mov_b32_e32 v2, s1
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v0			; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v0
	; GFX8-NEXT: v_ldexp_f32 v1, v1, v4			; GFX8-NEXT: v_ldexp_f32 v1, v1, v3
	; GFX8-NEXT: v_cvt_f16_f32_e32 v4, v1			; GFX8-NEXT: v_cvt_f16_f32_e32 v3, v1
	; GFX8-NEXT: v_addc_u32_e32 v1, vcc, v2, v3, vcc			; GFX8-NEXT: v_addc_u32_e32 v1, vcc, 0, v2, vcc
	; GFX8-NEXT: flat_store_short v[0:1], v4			; GFX8-NEXT: flat_store_short v[0:1], v3
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid			%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr half, half addrspace(1)* %out, i32 %tid			%out.gep = getelementptr half, half addrspace(1)* %out, i32 %tid
	%val = load i64, i64 addrspace(1)* %in.gep			%val = load i64, i64 addrspace(1)* %in.gep
	%result = uitofp i64 %val to half			%result = uitofp i64 %val to half
	store half %result, half addrspace(1)* %out.gep			store half %result, half addrspace(1)* %out.gep
	ret void			ret void
	}			}

	define amdgpu_kernel void @s_uint_to_fp_i64_to_f32(float addrspace(1)* %out, i64 %in) #0 {			define amdgpu_kernel void @s_uint_to_fp_i64_to_f32(float addrspace(1)* %out, i64 %in) #0 {
	; GFX6-LABEL: s_uint_to_fp_i64_to_f32:			; GFX6-LABEL: s_uint_to_fp_i64_to_f32:
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9			; GFX6-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
	; GFX6-NEXT: s_mov_b32 s7, 0xf000			; GFX6-NEXT: s_mov_b32 s7, 0xf000
	; GFX6-NEXT: s_mov_b32 s6, -1			; GFX6-NEXT: s_mov_b32 s6, -1
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_mov_b32 s4, s0			; GFX6-NEXT: s_mov_b32 s4, s0
	; GFX6-NEXT: s_mov_b32 s5, s1			; GFX6-NEXT: s_mov_b32 s5, s1
	; GFX6-NEXT: s_flbit_i32_b32 s0, s3			; GFX6-NEXT: s_flbit_i32_b32 s0, s3
	; GFX6-NEXT: s_min_u32 s8, s0, 32			; GFX6-NEXT: s_min_u32 s8, s0, 32
	; GFX6-NEXT: s_lshl_b64 s[0:1], s[2:3], s8			; GFX6-NEXT: s_lshl_b64 s[0:1], s[2:3], s8
	; GFX6-NEXT: v_cmp_ne_u32_e64 s[2:3], s0, 0			; GFX6-NEXT: s_min_u32 s0, s0, 1
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[2:3]			; GFX6-NEXT: s_or_b32 s0, s1, s0
	; GFX6-NEXT: v_or_b32_e32 v0, s1, v0			; GFX6-NEXT: v_cvt_f32_u32_e32 v0, s0
	; GFX6-NEXT: v_cvt_f32_u32_e32 v0, v0
	; GFX6-NEXT: s_sub_i32 s0, 32, s8			; GFX6-NEXT: s_sub_i32 s0, 32, s8
	; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s0			; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s0
	; GFX6-NEXT: buffer_store_dword v0, off, s[4:7], 0			; GFX6-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: s_uint_to_fp_i64_to_f32:			; GFX8-LABEL: s_uint_to_fp_i64_to_f32:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_flbit_i32_b32 s4, s3			; GFX8-NEXT: s_flbit_i32_b32 s4, s3
	; GFX8-NEXT: s_min_u32 s6, s4, 32			; GFX8-NEXT: s_min_u32 s4, s4, 32
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s6			; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s4
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[4:5], s2, 0			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[4:5]			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_or_b32_e32 v0, s3, v0			; GFX8-NEXT: v_cvt_f32_u32_e32 v2, s2
	; GFX8-NEXT: v_cvt_f32_u32_e32 v2, v0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: s_sub_i32 s0, 32, s6			; GFX8-NEXT: s_sub_i32 s0, 32, s4
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: v_ldexp_f32 v2, v2, s0			; GFX8-NEXT: v_ldexp_f32 v2, v2, s0
	; GFX8-NEXT: flat_store_dword v[0:1], v2			; GFX8-NEXT: flat_store_dword v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%result = uitofp i64 %in to float			%result = uitofp i64 %in to float
	store float %result, float addrspace(1)* %out			store float %result, float addrspace(1)* %out
	ret void			ret void
	}			}
	Show All 10 Lines
	; GFX6-NEXT: s_mov_b64 s[4:5], s[2:3]			; GFX6-NEXT: s_mov_b64 s[4:5], s[2:3]
	; GFX6-NEXT: buffer_load_dwordx2 v[3:4], v[1:2], s[4:7], 0 addr64			; GFX6-NEXT: buffer_load_dwordx2 v[3:4], v[1:2], s[4:7], 0 addr64
	; GFX6-NEXT: v_lshlrev_b32_e32 v1, 2, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v1, 2, v0
	; GFX6-NEXT: s_mov_b64 s[2:3], s[6:7]			; GFX6-NEXT: s_mov_b64 s[2:3], s[6:7]
	; GFX6-NEXT: s_waitcnt vmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0)
	; GFX6-NEXT: v_ffbh_u32_e32 v0, v4			; GFX6-NEXT: v_ffbh_u32_e32 v0, v4
	; GFX6-NEXT: v_min_u32_e32 v0, 32, v0			; GFX6-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0			; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3			; GFX6-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX6-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v3, v4, v3			; GFX6-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX6-NEXT: v_cvt_f32_u32_e32 v3, v3			; GFX6-NEXT: v_cvt_f32_u32_e32 v3, v3
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, 32, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, 32, v0
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v3, v0			; GFX6-NEXT: v_ldexp_f32_e32 v0, v3, v0
	; GFX6-NEXT: buffer_store_dword v0, v[1:2], s[0:3], 0 addr64			; GFX6-NEXT: buffer_store_dword v0, v[1:2], s[0:3], 0 addr64
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: v_uint_to_fp_i64_to_f32:			; GFX8-LABEL: v_uint_to_fp_i64_to_f32:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 3, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 3, v0
	; GFX8-NEXT: v_mov_b32_e32 v3, 0			; GFX8-NEXT: v_lshlrev_b32_e32 v3, 2, v0
	; GFX8-NEXT: v_lshlrev_b32_e32 v4, 2, v0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_mov_b32_e32 v2, s3			; GFX8-NEXT: v_mov_b32_e32 v2, s3
	; GFX8-NEXT: v_add_u32_e32 v1, vcc, s2, v1			; GFX8-NEXT: v_add_u32_e32 v1, vcc, s2, v1
	; GFX8-NEXT: v_addc_u32_e32 v2, vcc, v2, v3, vcc			; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
	; GFX8-NEXT: flat_load_dwordx2 v[1:2], v[1:2]			; GFX8-NEXT: flat_load_dwordx2 v[1:2], v[1:2]
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_ffbh_u32_e32 v0, v2			; GFX8-NEXT: v_ffbh_u32_e32 v0, v2
	; GFX8-NEXT: v_min_u32_e32 v5, 32, v0			; GFX8-NEXT: v_min_u32_e32 v4, 32, v0
	; GFX8-NEXT: v_lshlrev_b64 v[0:1], v5, v[1:2]			; GFX8-NEXT: v_lshlrev_b64 v[0:1], v4, v[1:2]
	; GFX8-NEXT: v_mov_b32_e32 v2, s1			; GFX8-NEXT: v_mov_b32_e32 v2, s1
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX8-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
	; GFX8-NEXT: v_or_b32_e32 v0, v1, v0			; GFX8-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX8-NEXT: v_cvt_f32_u32_e32 v6, v0			; GFX8-NEXT: v_cvt_f32_u32_e32 v5, v0
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v4			; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v3
	; GFX8-NEXT: v_addc_u32_e32 v1, vcc, v2, v3, vcc			; GFX8-NEXT: v_addc_u32_e32 v1, vcc, 0, v2, vcc
	; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v5			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v4
	; GFX8-NEXT: v_ldexp_f32 v2, v6, v2			; GFX8-NEXT: v_ldexp_f32 v2, v5, v2
	; GFX8-NEXT: flat_store_dword v[0:1], v2			; GFX8-NEXT: flat_store_dword v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid			%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr float, float addrspace(1)* %out, i32 %tid			%out.gep = getelementptr float, float addrspace(1)* %out, i32 %tid
	%val = load i64, i64 addrspace(1)* %in.gep			%val = load i64, i64 addrspace(1)* %in.gep
	%result = uitofp i64 %val to float			%result = uitofp i64 %val to float
	store float %result, float addrspace(1)* %out.gep			store float %result, float addrspace(1)* %out.gep
	ret void			ret void
	}			}

	define amdgpu_kernel void @s_uint_to_fp_v2i64_to_v2f32(<2 x float> addrspace(1)* %out, <2 x i64> %in) #0{			define amdgpu_kernel void @s_uint_to_fp_v2i64_to_v2f32(<2 x float> addrspace(1)* %out, <2 x i64> %in) #0{
	; GFX6-LABEL: s_uint_to_fp_v2i64_to_v2f32:			; GFX6-LABEL: s_uint_to_fp_v2i64_to_v2f32:
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xd			; GFX6-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xd
	; GFX6-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9			; GFX6-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
	; GFX6-NEXT: s_mov_b32 s3, 0xf000			; GFX6-NEXT: s_mov_b32 s3, 0xf000
	; GFX6-NEXT: s_mov_b32 s2, -1			; GFX6-NEXT: s_mov_b32 s2, -1
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_flbit_i32_b32 s8, s7			; GFX6-NEXT: s_flbit_i32_b32 s8, s7
	; GFX6-NEXT: s_flbit_i32_b32 s9, s5			; GFX6-NEXT: s_flbit_i32_b32 s9, s5
	; GFX6-NEXT: s_min_u32 s8, s8, 32			; GFX6-NEXT: s_min_u32 s8, s8, 32
	; GFX6-NEXT: s_min_u32 s9, s9, 32			; GFX6-NEXT: s_min_u32 s9, s9, 32
	; GFX6-NEXT: s_lshl_b64 s[6:7], s[6:7], s8			; GFX6-NEXT: s_lshl_b64 s[6:7], s[6:7], s8
	; GFX6-NEXT: s_sub_i32 s10, 32, s8			; GFX6-NEXT: s_sub_i32 s8, 32, s8
	; GFX6-NEXT: s_lshl_b64 s[4:5], s[4:5], s9			; GFX6-NEXT: s_lshl_b64 s[4:5], s[4:5], s9
	; GFX6-NEXT: s_sub_i32 s11, 32, s9			; GFX6-NEXT: s_sub_i32 s9, 32, s9
	; GFX6-NEXT: v_cmp_ne_u32_e64 s[8:9], s6, 0			; GFX6-NEXT: s_min_u32 s6, s6, 1
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[8:9]			; GFX6-NEXT: s_min_u32 s4, s4, 1
	; GFX6-NEXT: v_cmp_ne_u32_e64 s[8:9], s4, 0			; GFX6-NEXT: s_or_b32 s6, s7, s6
	; GFX6-NEXT: v_cndmask_b32_e64 v1, 0, 1, s[8:9]			; GFX6-NEXT: s_or_b32 s4, s5, s4
	; GFX6-NEXT: v_or_b32_e32 v0, s7, v0			; GFX6-NEXT: v_cvt_f32_u32_e32 v0, s6
	; GFX6-NEXT: v_or_b32_e32 v1, s5, v1			; GFX6-NEXT: v_cvt_f32_u32_e32 v2, s4
	; GFX6-NEXT: v_cvt_f32_u32_e32 v0, v0			; GFX6-NEXT: v_ldexp_f32_e64 v1, v0, s8
	; GFX6-NEXT: v_cvt_f32_u32_e32 v2, v1			; GFX6-NEXT: v_ldexp_f32_e64 v0, v2, s9
	; GFX6-NEXT: v_ldexp_f32_e64 v1, v0, s10
	; GFX6-NEXT: v_ldexp_f32_e64 v0, v2, s11
	; GFX6-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0			; GFX6-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: s_uint_to_fp_v2i64_to_v2f32:			; GFX8-LABEL: s_uint_to_fp_v2i64_to_v2f32:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x34
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_flbit_i32_b32 s6, s3			; GFX8-NEXT: s_flbit_i32_b32 s6, s3
	; GFX8-NEXT: s_min_u32 s8, s6, 32
	; GFX8-NEXT: s_flbit_i32_b32 s7, s1			; GFX8-NEXT: s_flbit_i32_b32 s7, s1
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s8			; GFX8-NEXT: s_min_u32 s6, s6, 32
	; GFX8-NEXT: s_min_u32 s9, s7, 32			; GFX8-NEXT: s_lshl_b64 s[2:3], s[2:3], s6
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[6:7], s2, 0			; GFX8-NEXT: s_min_u32 s7, s7, 32
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[6:7]			; GFX8-NEXT: s_lshl_b64 s[0:1], s[0:1], s7
	; GFX8-NEXT: s_lshl_b64 s[0:1], s[0:1], s9			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: v_or_b32_e32 v0, s3, v0			; GFX8-NEXT: s_min_u32 s0, s0, 1
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[2:3], s0, 0			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_cndmask_b32_e64 v1, 0, 1, s[2:3]			; GFX8-NEXT: s_or_b32 s0, s1, s0
	; GFX8-NEXT: v_or_b32_e32 v1, s1, v1			; GFX8-NEXT: v_cvt_f32_u32_e32 v0, s2
	; GFX8-NEXT: v_cvt_f32_u32_e32 v0, v0			; GFX8-NEXT: v_cvt_f32_u32_e32 v2, s0
	; GFX8-NEXT: v_cvt_f32_u32_e32 v2, v1			; GFX8-NEXT: s_sub_i32 s0, 32, s6
	; GFX8-NEXT: s_sub_i32 s0, 32, s8
	; GFX8-NEXT: v_ldexp_f32 v1, v0, s0			; GFX8-NEXT: v_ldexp_f32 v1, v0, s0
	; GFX8-NEXT: s_sub_i32 s0, 32, s9			; GFX8-NEXT: s_sub_i32 s0, 32, s7
	; GFX8-NEXT: v_ldexp_f32 v0, v2, s0			; GFX8-NEXT: v_ldexp_f32 v0, v2, s0
	; GFX8-NEXT: v_mov_b32_e32 v2, s4			; GFX8-NEXT: v_mov_b32_e32 v2, s4
	; GFX8-NEXT: v_mov_b32_e32 v3, s5			; GFX8-NEXT: v_mov_b32_e32 v3, s5
	; GFX8-NEXT: flat_store_dwordx2 v[2:3], v[0:1]			; GFX8-NEXT: flat_store_dwordx2 v[2:3], v[0:1]
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%result = uitofp <2 x i64> %in to <2 x float>			%result = uitofp <2 x i64> %in to <2 x float>
	store <2 x float> %result, <2 x float> addrspace(1)* %out			store <2 x float> %result, <2 x float> addrspace(1)* %out
	ret void			ret void
	Show All 27 Lines
	; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0			; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0
	; GFX6-NEXT: v_sub_i32_e32 v14, vcc, 32, v0			; GFX6-NEXT: v_sub_i32_e32 v14, vcc, 32, v0
	; GFX6-NEXT: v_lshl_b64 v[0:1], v[1:2], v9			; GFX6-NEXT: v_lshl_b64 v[0:1], v[1:2], v9
	; GFX6-NEXT: v_sub_i32_e32 v2, vcc, 32, v9			; GFX6-NEXT: v_sub_i32_e32 v2, vcc, 32, v9
	; GFX6-NEXT: v_lshl_b64 v[7:8], v[7:8], v12			; GFX6-NEXT: v_lshl_b64 v[7:8], v[7:8], v12
	; GFX6-NEXT: v_sub_i32_e32 v9, vcc, 32, v12			; GFX6-NEXT: v_sub_i32_e32 v9, vcc, 32, v12
	; GFX6-NEXT: v_lshl_b64 v[5:6], v[5:6], v13			; GFX6-NEXT: v_lshl_b64 v[5:6], v[5:6], v13
	; GFX6-NEXT: v_sub_i32_e32 v12, vcc, 32, v13			; GFX6-NEXT: v_sub_i32_e32 v12, vcc, 32, v13
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3			; GFX6-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX6-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc			; GFX6-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX6-NEXT: v_min_u32_e32 v7, 1, v7
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc			; GFX6-NEXT: v_min_u32_e32 v5, 1, v5
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v7
	; GFX6-NEXT: v_cndmask_b32_e64 v7, 0, 1, vcc
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	; GFX6-NEXT: v_cndmask_b32_e64 v5, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v3, v4, v3			; GFX6-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0			; GFX6-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX6-NEXT: v_or_b32_e32 v1, v8, v7			; GFX6-NEXT: v_or_b32_e32 v1, v8, v7
	; GFX6-NEXT: v_or_b32_e32 v4, v6, v5			; GFX6-NEXT: v_or_b32_e32 v4, v6, v5
	; GFX6-NEXT: v_cvt_f32_u32_e32 v3, v3			; GFX6-NEXT: v_cvt_f32_u32_e32 v3, v3
	; GFX6-NEXT: v_cvt_f32_u32_e32 v0, v0			; GFX6-NEXT: v_cvt_f32_u32_e32 v0, v0
	; GFX6-NEXT: v_cvt_f32_u32_e32 v1, v1			; GFX6-NEXT: v_cvt_f32_u32_e32 v1, v1
	; GFX6-NEXT: v_cvt_f32_u32_e32 v4, v4			; GFX6-NEXT: v_cvt_f32_u32_e32 v4, v4
	; GFX6-NEXT: v_ldexp_f32_e32 v3, v3, v14			; GFX6-NEXT: v_ldexp_f32_e32 v3, v3, v14
	; GFX6-NEXT: v_ldexp_f32_e32 v2, v0, v2			; GFX6-NEXT: v_ldexp_f32_e32 v2, v0, v2
	; GFX6-NEXT: v_ldexp_f32_e32 v1, v1, v9			; GFX6-NEXT: v_ldexp_f32_e32 v1, v1, v9
	; GFX6-NEXT: v_ldexp_f32_e32 v0, v4, v12			; GFX6-NEXT: v_ldexp_f32_e32 v0, v4, v12
	; GFX6-NEXT: buffer_store_dwordx4 v[0:3], v[10:11], s[0:3], 0 addr64			; GFX6-NEXT: buffer_store_dwordx4 v[0:3], v[10:11], s[0:3], 0 addr64
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: v_uint_to_fp_v4i64_to_v4f32:			; GFX8-LABEL: v_uint_to_fp_v4i64_to_v4f32:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 5, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 5, v0
	; GFX8-NEXT: v_mov_b32_e32 v10, 0
	; GFX8-NEXT: v_lshlrev_b32_e32 v0, 4, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v0, 4, v0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_mov_b32_e32 v2, s3			; GFX8-NEXT: v_mov_b32_e32 v2, s3
	; GFX8-NEXT: v_add_u32_e32 v5, vcc, s2, v1			; GFX8-NEXT: v_add_u32_e32 v5, vcc, s2, v1
	; GFX8-NEXT: v_addc_u32_e32 v6, vcc, v2, v10, vcc			; GFX8-NEXT: v_addc_u32_e32 v6, vcc, 0, v2, vcc
	; GFX8-NEXT: v_add_u32_e32 v1, vcc, 16, v5			; GFX8-NEXT: v_add_u32_e32 v1, vcc, 16, v5
	; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v6, vcc			; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v6, vcc
	; GFX8-NEXT: flat_load_dwordx4 v[1:4], v[1:2]			; GFX8-NEXT: flat_load_dwordx4 v[1:4], v[1:2]
	; GFX8-NEXT: flat_load_dwordx4 v[5:8], v[5:6]			; GFX8-NEXT: flat_load_dwordx4 v[5:8], v[5:6]
	; GFX8-NEXT: v_add_u32_e32 v9, vcc, s0, v0			; GFX8-NEXT: v_add_u32_e32 v9, vcc, s0, v0
	; GFX8-NEXT: v_mov_b32_e32 v11, s1			; GFX8-NEXT: v_mov_b32_e32 v10, s1
	; GFX8-NEXT: v_addc_u32_e32 v10, vcc, v11, v10, vcc			; GFX8-NEXT: v_addc_u32_e32 v10, vcc, 0, v10, vcc
	; GFX8-NEXT: s_waitcnt vmcnt(1)			; GFX8-NEXT: s_waitcnt vmcnt(1)
	; GFX8-NEXT: v_ffbh_u32_e32 v12, v4			; GFX8-NEXT: v_ffbh_u32_e32 v12, v4
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_ffbh_u32_e32 v0, v8			; GFX8-NEXT: v_ffbh_u32_e32 v0, v8
	; GFX8-NEXT: v_ffbh_u32_e32 v11, v6			; GFX8-NEXT: v_ffbh_u32_e32 v11, v6
	; GFX8-NEXT: v_ffbh_u32_e32 v13, v2			; GFX8-NEXT: v_ffbh_u32_e32 v13, v2
	; GFX8-NEXT: v_min_u32_e32 v0, 32, v0			; GFX8-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX8-NEXT: v_min_u32_e32 v11, 32, v11			; GFX8-NEXT: v_min_u32_e32 v11, 32, v11
	; GFX8-NEXT: v_min_u32_e32 v12, 32, v12			; GFX8-NEXT: v_min_u32_e32 v12, 32, v12
	; GFX8-NEXT: v_min_u32_e32 v13, 32, v13			; GFX8-NEXT: v_min_u32_e32 v13, 32, v13
	; GFX8-NEXT: v_lshlrev_b64 v[7:8], v0, v[7:8]
	; GFX8-NEXT: v_sub_u32_e32 v14, vcc, 32, v0
	; GFX8-NEXT: v_lshlrev_b64 v[5:6], v11, v[5:6]			; GFX8-NEXT: v_lshlrev_b64 v[5:6], v11, v[5:6]
	; GFX8-NEXT: v_lshlrev_b64 v[3:4], v12, v[3:4]			; GFX8-NEXT: v_lshlrev_b64 v[3:4], v12, v[3:4]
				; GFX8-NEXT: v_lshlrev_b64 v[7:8], v0, v[7:8]
				; GFX8-NEXT: v_sub_u32_e32 v14, vcc, 32, v0
	; GFX8-NEXT: v_lshlrev_b64 v[0:1], v13, v[1:2]			; GFX8-NEXT: v_lshlrev_b64 v[0:1], v13, v[1:2]
	; GFX8-NEXT: v_sub_u32_e32 v11, vcc, 32, v11			; GFX8-NEXT: v_min_u32_e32 v7, 1, v7
	; GFX8-NEXT: v_sub_u32_e32 v12, vcc, 32, v12			; GFX8-NEXT: v_min_u32_e32 v5, 1, v5
	; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v13			; GFX8-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v7			; GFX8-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v7, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	; GFX8-NEXT: v_cndmask_b32_e64 v5, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
	; GFX8-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
	; GFX8-NEXT: v_or_b32_e32 v3, v4, v3			; GFX8-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX8-NEXT: v_or_b32_e32 v5, v6, v5			; GFX8-NEXT: v_or_b32_e32 v5, v6, v5
	; GFX8-NEXT: v_or_b32_e32 v7, v8, v7			; GFX8-NEXT: v_or_b32_e32 v7, v8, v7
	; GFX8-NEXT: v_or_b32_e32 v0, v1, v0			; GFX8-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX8-NEXT: v_cvt_f32_u32_e32 v1, v7			; GFX8-NEXT: v_cvt_f32_u32_e32 v1, v7
	; GFX8-NEXT: v_cvt_f32_u32_e32 v3, v3
	; GFX8-NEXT: v_cvt_f32_u32_e32 v4, v5			; GFX8-NEXT: v_cvt_f32_u32_e32 v4, v5
				; GFX8-NEXT: v_cvt_f32_u32_e32 v3, v3
	; GFX8-NEXT: v_cvt_f32_u32_e32 v5, v0			; GFX8-NEXT: v_cvt_f32_u32_e32 v5, v0
				; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v13
				; GFX8-NEXT: v_sub_u32_e32 v11, vcc, 32, v11
				; GFX8-NEXT: v_sub_u32_e32 v12, vcc, 32, v12
	; GFX8-NEXT: v_ldexp_f32 v1, v1, v14			; GFX8-NEXT: v_ldexp_f32 v1, v1, v14
	; GFX8-NEXT: v_ldexp_f32 v3, v3, v12
	; GFX8-NEXT: v_ldexp_f32 v0, v4, v11			; GFX8-NEXT: v_ldexp_f32 v0, v4, v11
				; GFX8-NEXT: v_ldexp_f32 v3, v3, v12
	; GFX8-NEXT: v_ldexp_f32 v2, v5, v2			; GFX8-NEXT: v_ldexp_f32 v2, v5, v2
	; GFX8-NEXT: flat_store_dwordx4 v[9:10], v[0:3]			; GFX8-NEXT: flat_store_dwordx4 v[9:10], v[0:3]
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr <4 x i64>, <4 x i64> addrspace(1)* %in, i32 %tid			%in.gep = getelementptr <4 x i64>, <4 x i64> addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr <4 x float>, <4 x float> addrspace(1)* %out, i32 %tid			%out.gep = getelementptr <4 x float>, <4 x float> addrspace(1)* %out, i32 %tid
	%value = load <4 x i64>, <4 x i64> addrspace(1)* %in.gep			%value = load <4 x i64>, <4 x i64> addrspace(1)* %in.gep
	%result = uitofp <4 x i64> %value to <4 x float>			%result = uitofp <4 x i64> %value to <4 x float>
	Show All 9 Lines
	; GFX6-NEXT: s_mov_b32 s3, 0xf000			; GFX6-NEXT: s_mov_b32 s3, 0xf000
	; GFX6-NEXT: s_mov_b32 s2, -1			; GFX6-NEXT: s_mov_b32 s2, -1
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_flbit_i32_b32 s8, s7			; GFX6-NEXT: s_flbit_i32_b32 s8, s7
	; GFX6-NEXT: s_flbit_i32_b32 s9, s5			; GFX6-NEXT: s_flbit_i32_b32 s9, s5
	; GFX6-NEXT: s_min_u32 s8, s8, 32			; GFX6-NEXT: s_min_u32 s8, s8, 32
	; GFX6-NEXT: s_min_u32 s9, s9, 32			; GFX6-NEXT: s_min_u32 s9, s9, 32
	; GFX6-NEXT: s_lshl_b64 s[6:7], s[6:7], s8			; GFX6-NEXT: s_lshl_b64 s[6:7], s[6:7], s8
	; GFX6-NEXT: s_sub_i32 s10, 32, s8			; GFX6-NEXT: s_sub_i32 s8, 32, s8
	; GFX6-NEXT: s_lshl_b64 s[4:5], s[4:5], s9			; GFX6-NEXT: s_lshl_b64 s[4:5], s[4:5], s9
	; GFX6-NEXT: s_sub_i32 s11, 32, s9			; GFX6-NEXT: s_sub_i32 s9, 32, s9
	; GFX6-NEXT: v_cmp_ne_u32_e64 s[8:9], s6, 0			; GFX6-NEXT: s_min_u32 s6, s6, 1
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[8:9]			; GFX6-NEXT: s_min_u32 s4, s4, 1
	; GFX6-NEXT: v_cmp_ne_u32_e64 s[8:9], s4, 0			; GFX6-NEXT: s_or_b32 s6, s7, s6
	; GFX6-NEXT: v_cndmask_b32_e64 v1, 0, 1, s[8:9]			; GFX6-NEXT: s_or_b32 s4, s5, s4
	; GFX6-NEXT: v_or_b32_e32 v0, s7, v0			; GFX6-NEXT: v_cvt_f32_u32_e32 v0, s6
	; GFX6-NEXT: v_or_b32_e32 v1, s5, v1			; GFX6-NEXT: v_cvt_f32_u32_e32 v1, s4
	; GFX6-NEXT: v_cvt_f32_u32_e32 v0, v0			; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s8
	; GFX6-NEXT: v_cvt_f32_u32_e32 v1, v1			; GFX6-NEXT: v_ldexp_f32_e64 v1, v1, s9
	; GFX6-NEXT: v_ldexp_f32_e64 v0, v0, s10
	; GFX6-NEXT: v_ldexp_f32_e64 v1, v1, s11
	; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
	; GFX6-NEXT: v_lshlrev_b32_e32 v0, 16, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v0, 16, v0
	; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1			; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0			; GFX6-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX6-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX6-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: s_uint_to_fp_v2i64_to_v2f16:			; GFX8-LABEL: s_uint_to_fp_v2i64_to_v2f16:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x34
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_flbit_i32_b32 s2, s7			; GFX8-NEXT: s_flbit_i32_b32 s2, s7
	; GFX8-NEXT: s_flbit_i32_b32 s3, s5			; GFX8-NEXT: s_flbit_i32_b32 s3, s5
	; GFX8-NEXT: s_min_u32 s8, s2, 32			; GFX8-NEXT: s_min_u32 s8, s2, 32
	; GFX8-NEXT: s_min_u32 s9, s3, 32			; GFX8-NEXT: s_min_u32 s9, s3, 32
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[6:7], s8			; GFX8-NEXT: s_lshl_b64 s[2:3], s[6:7], s8
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[6:7], s2, 0			; GFX8-NEXT: s_min_u32 s2, s2, 1
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[6:7]			; GFX8-NEXT: s_or_b32 s2, s3, s2
	; GFX8-NEXT: v_or_b32_e32 v0, s3, v0			; GFX8-NEXT: s_lshl_b64 s[4:5], s[4:5], s9
	; GFX8-NEXT: s_lshl_b64 s[2:3], s[4:5], s9			; GFX8-NEXT: v_cvt_f32_u32_e32 v0, s2
	; GFX8-NEXT: v_cmp_ne_u32_e64 s[4:5], s2, 0			; GFX8-NEXT: s_min_u32 s2, s4, 1
	; GFX8-NEXT: v_cndmask_b32_e64 v1, 0, 1, s[4:5]			; GFX8-NEXT: s_or_b32 s2, s5, s2
	; GFX8-NEXT: v_or_b32_e32 v1, s3, v1			; GFX8-NEXT: v_cvt_f32_u32_e32 v1, s2
	; GFX8-NEXT: v_cvt_f32_u32_e32 v0, v0			; GFX8-NEXT: s_sub_i32 s6, 32, s8
	; GFX8-NEXT: v_cvt_f32_u32_e32 v1, v1
	; GFX8-NEXT: s_sub_i32 s8, 32, s8
	; GFX8-NEXT: s_sub_i32 s2, 32, s9			; GFX8-NEXT: s_sub_i32 s2, 32, s9
	; GFX8-NEXT: v_ldexp_f32 v0, v0, s8			; GFX8-NEXT: v_ldexp_f32 v0, v0, s6
	; GFX8-NEXT: v_ldexp_f32 v1, v1, s2			; GFX8-NEXT: v_ldexp_f32 v1, v1, s2
	; GFX8-NEXT: v_cvt_f16_f32_sdwa v0, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD			; GFX8-NEXT: v_cvt_f16_f32_sdwa v0, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD
	; GFX8-NEXT: v_cvt_f16_f32_e32 v1, v1			; GFX8-NEXT: v_cvt_f16_f32_e32 v1, v1
	; GFX8-NEXT: v_or_b32_e32 v2, v1, v0			; GFX8-NEXT: v_or_b32_e32 v2, v1, v0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_store_dword v[0:1], v2			; GFX8-NEXT: flat_store_dword v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	Show All 30 Lines
	; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0			; GFX6-NEXT: v_lshl_b64 v[3:4], v[3:4], v0
	; GFX6-NEXT: v_sub_i32_e32 v14, vcc, 32, v0			; GFX6-NEXT: v_sub_i32_e32 v14, vcc, 32, v0
	; GFX6-NEXT: v_lshl_b64 v[0:1], v[1:2], v9			; GFX6-NEXT: v_lshl_b64 v[0:1], v[1:2], v9
	; GFX6-NEXT: v_sub_i32_e32 v2, vcc, 32, v9			; GFX6-NEXT: v_sub_i32_e32 v2, vcc, 32, v9
	; GFX6-NEXT: v_lshl_b64 v[7:8], v[7:8], v12			; GFX6-NEXT: v_lshl_b64 v[7:8], v[7:8], v12
	; GFX6-NEXT: v_sub_i32_e32 v9, vcc, 32, v12			; GFX6-NEXT: v_sub_i32_e32 v9, vcc, 32, v12
	; GFX6-NEXT: v_lshl_b64 v[5:6], v[5:6], v13			; GFX6-NEXT: v_lshl_b64 v[5:6], v[5:6], v13
	; GFX6-NEXT: v_sub_i32_e32 v12, vcc, 32, v13			; GFX6-NEXT: v_sub_i32_e32 v12, vcc, 32, v13
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3			; GFX6-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX6-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc			; GFX6-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0			; GFX6-NEXT: v_min_u32_e32 v7, 1, v7
	; GFX6-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc			; GFX6-NEXT: v_min_u32_e32 v5, 1, v5
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v7
	; GFX6-NEXT: v_cndmask_b32_e64 v7, 0, 1, vcc
	; GFX6-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	; GFX6-NEXT: v_cndmask_b32_e64 v5, 0, 1, vcc
	; GFX6-NEXT: v_or_b32_e32 v3, v4, v3			; GFX6-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX6-NEXT: v_or_b32_e32 v0, v1, v0			; GFX6-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX6-NEXT: v_or_b32_e32 v1, v8, v7			; GFX6-NEXT: v_or_b32_e32 v1, v8, v7
	; GFX6-NEXT: v_or_b32_e32 v4, v6, v5			; GFX6-NEXT: v_or_b32_e32 v4, v6, v5
	; GFX6-NEXT: v_cvt_f32_u32_e32 v3, v3			; GFX6-NEXT: v_cvt_f32_u32_e32 v3, v3
	; GFX6-NEXT: v_cvt_f32_u32_e32 v0, v0			; GFX6-NEXT: v_cvt_f32_u32_e32 v0, v0
	; GFX6-NEXT: v_cvt_f32_u32_e32 v1, v1			; GFX6-NEXT: v_cvt_f32_u32_e32 v1, v1
	; GFX6-NEXT: v_cvt_f32_u32_e32 v4, v4			; GFX6-NEXT: v_cvt_f32_u32_e32 v4, v4
	Show All 11 Lines
	; GFX6-NEXT: v_or_b32_e32 v0, v2, v4			; GFX6-NEXT: v_or_b32_e32 v0, v2, v4
	; GFX6-NEXT: buffer_store_dwordx2 v[0:1], v[10:11], s[0:3], 0 addr64			; GFX6-NEXT: buffer_store_dwordx2 v[0:1], v[10:11], s[0:3], 0 addr64
	; GFX6-NEXT: s_endpgm			; GFX6-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: v_uint_to_fp_v4i64_to_v4f16:			; GFX8-LABEL: v_uint_to_fp_v4i64_to_v4f16:
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 5, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 5, v0
	; GFX8-NEXT: v_mov_b32_e32 v9, 0			; GFX8-NEXT: v_lshlrev_b32_e32 v9, 3, v0
	; GFX8-NEXT: v_lshlrev_b32_e32 v10, 3, v0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_mov_b32_e32 v2, s3			; GFX8-NEXT: v_mov_b32_e32 v2, s3
	; GFX8-NEXT: v_add_u32_e32 v5, vcc, s2, v1			; GFX8-NEXT: v_add_u32_e32 v5, vcc, s2, v1
	; GFX8-NEXT: v_addc_u32_e32 v6, vcc, v2, v9, vcc			; GFX8-NEXT: v_addc_u32_e32 v6, vcc, 0, v2, vcc
	; GFX8-NEXT: v_add_u32_e32 v1, vcc, 16, v5			; GFX8-NEXT: v_add_u32_e32 v1, vcc, 16, v5
	; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v6, vcc			; GFX8-NEXT: v_addc_u32_e32 v2, vcc, 0, v6, vcc
	; GFX8-NEXT: flat_load_dwordx4 v[1:4], v[1:2]			; GFX8-NEXT: flat_load_dwordx4 v[1:4], v[1:2]
	; GFX8-NEXT: flat_load_dwordx4 v[5:8], v[5:6]			; GFX8-NEXT: flat_load_dwordx4 v[5:8], v[5:6]
	; GFX8-NEXT: v_mov_b32_e32 v11, s1			; GFX8-NEXT: v_mov_b32_e32 v10, s1
	; GFX8-NEXT: s_waitcnt vmcnt(1)			; GFX8-NEXT: s_waitcnt vmcnt(1)
	; GFX8-NEXT: v_ffbh_u32_e32 v13, v4			; GFX8-NEXT: v_ffbh_u32_e32 v12, v4
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_ffbh_u32_e32 v0, v8			; GFX8-NEXT: v_ffbh_u32_e32 v0, v8
	; GFX8-NEXT: v_ffbh_u32_e32 v12, v6			; GFX8-NEXT: v_ffbh_u32_e32 v11, v6
	; GFX8-NEXT: v_ffbh_u32_e32 v14, v2			; GFX8-NEXT: v_ffbh_u32_e32 v13, v2
	; GFX8-NEXT: v_min_u32_e32 v0, 32, v0			; GFX8-NEXT: v_min_u32_e32 v0, 32, v0
				; GFX8-NEXT: v_min_u32_e32 v11, 32, v11
	; GFX8-NEXT: v_min_u32_e32 v12, 32, v12			; GFX8-NEXT: v_min_u32_e32 v12, 32, v12
	; GFX8-NEXT: v_min_u32_e32 v13, 32, v13			; GFX8-NEXT: v_min_u32_e32 v13, 32, v13
	; GFX8-NEXT: v_min_u32_e32 v14, 32, v14			; GFX8-NEXT: v_lshlrev_b64 v[5:6], v11, v[5:6]
				; GFX8-NEXT: v_lshlrev_b64 v[3:4], v12, v[3:4]
	; GFX8-NEXT: v_lshlrev_b64 v[7:8], v0, v[7:8]			; GFX8-NEXT: v_lshlrev_b64 v[7:8], v0, v[7:8]
	; GFX8-NEXT: v_sub_u32_e32 v15, vcc, 32, v0			; GFX8-NEXT: v_sub_u32_e32 v14, vcc, 32, v0
	; GFX8-NEXT: v_lshlrev_b64 v[5:6], v12, v[5:6]			; GFX8-NEXT: v_lshlrev_b64 v[0:1], v13, v[1:2]
	; GFX8-NEXT: v_lshlrev_b64 v[3:4], v13, v[3:4]			; GFX8-NEXT: v_min_u32_e32 v7, 1, v7
	; GFX8-NEXT: v_lshlrev_b64 v[0:1], v14, v[1:2]			; GFX8-NEXT: v_min_u32_e32 v5, 1, v5
	; GFX8-NEXT: v_sub_u32_e32 v12, vcc, 32, v12			; GFX8-NEXT: v_min_u32_e32 v3, 1, v3
	; GFX8-NEXT: v_sub_u32_e32 v13, vcc, 32, v13			; GFX8-NEXT: v_min_u32_e32 v0, 1, v0
	; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v14
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v7
	; GFX8-NEXT: v_cndmask_b32_e64 v7, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	; GFX8-NEXT: v_cndmask_b32_e64 v5, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
	; GFX8-NEXT: v_cndmask_b32_e64 v3, 0, 1, vcc
	; GFX8-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0
	; GFX8-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
	; GFX8-NEXT: v_or_b32_e32 v3, v4, v3			; GFX8-NEXT: v_or_b32_e32 v3, v4, v3
	; GFX8-NEXT: v_or_b32_e32 v0, v1, v0			; GFX8-NEXT: v_or_b32_e32 v0, v1, v0
	; GFX8-NEXT: v_or_b32_e32 v7, v8, v7			; GFX8-NEXT: v_or_b32_e32 v7, v8, v7
	; GFX8-NEXT: v_or_b32_e32 v5, v6, v5			; GFX8-NEXT: v_or_b32_e32 v5, v6, v5
	; GFX8-NEXT: v_cvt_f32_u32_e32 v1, v7			; GFX8-NEXT: v_cvt_f32_u32_e32 v1, v7
	; GFX8-NEXT: v_cvt_f32_u32_e32 v4, v5			; GFX8-NEXT: v_cvt_f32_u32_e32 v4, v5
	; GFX8-NEXT: v_cvt_f32_u32_e32 v3, v3			; GFX8-NEXT: v_cvt_f32_u32_e32 v3, v3
	; GFX8-NEXT: v_cvt_f32_u32_e32 v0, v0			; GFX8-NEXT: v_cvt_f32_u32_e32 v0, v0
	; GFX8-NEXT: v_ldexp_f32 v1, v1, v15			; GFX8-NEXT: v_sub_u32_e32 v11, vcc, 32, v11
	; GFX8-NEXT: v_ldexp_f32 v4, v4, v12			; GFX8-NEXT: v_sub_u32_e32 v12, vcc, 32, v12
	; GFX8-NEXT: v_ldexp_f32 v3, v3, v13			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, 32, v13
				; GFX8-NEXT: v_ldexp_f32 v4, v4, v11
				; GFX8-NEXT: v_ldexp_f32 v3, v3, v12
	; GFX8-NEXT: v_ldexp_f32 v0, v0, v2			; GFX8-NEXT: v_ldexp_f32 v0, v0, v2
				; GFX8-NEXT: v_ldexp_f32 v1, v1, v14
	; GFX8-NEXT: v_cvt_f16_f32_e32 v5, v0			; GFX8-NEXT: v_cvt_f16_f32_e32 v5, v0
	; GFX8-NEXT: v_cvt_f16_f32_sdwa v3, v3 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD			; GFX8-NEXT: v_cvt_f16_f32_sdwa v3, v3 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD
	; GFX8-NEXT: v_cvt_f16_f32_sdwa v2, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD			; GFX8-NEXT: v_cvt_f16_f32_sdwa v2, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD
	; GFX8-NEXT: v_cvt_f16_f32_e32 v4, v4			; GFX8-NEXT: v_cvt_f16_f32_e32 v4, v4
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v10			; GFX8-NEXT: v_add_u32_e32 v0, vcc, s0, v9
	; GFX8-NEXT: v_addc_u32_e32 v1, vcc, v11, v9, vcc			; GFX8-NEXT: v_addc_u32_e32 v1, vcc, 0, v10, vcc
	; GFX8-NEXT: v_or_b32_e32 v3, v5, v3			; GFX8-NEXT: v_or_b32_e32 v3, v5, v3
	; GFX8-NEXT: v_or_b32_e32 v2, v4, v2			; GFX8-NEXT: v_or_b32_e32 v2, v4, v2
	; GFX8-NEXT: flat_store_dwordx2 v[0:1], v[2:3]			; GFX8-NEXT: flat_store_dwordx2 v[0:1], v[2:3]
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr <4 x i64>, <4 x i64> addrspace(1)* %in, i32 %tid			%in.gep = getelementptr <4 x i64>, <4 x i64> addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr <4 x half>, <4 x half> addrspace(1)* %out, i32 %tid			%out.gep = getelementptr <4 x half>, <4 x half> addrspace(1)* %out, i32 %tid
	%value = load <4 x i64>, <4 x i64> addrspace(1)* %in.gep			%value = load <4 x i64>, <4 x i64> addrspace(1)* %in.gep
	Show All 9 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[amdgpu] Revise the conversion from i64 to f32.ClosedPublic

Details

Diff Detail

Event Timeline