This is an archive of the discontinued LLVM Phabricator instance.

llvm/test/CodeGen/AMDGPU/GlobalISel/cvt_f32_ubyte.ll
1126–1136	This is unfortunate. The problem is that when CTLZ is expanded using FFBH, `AMDGPUPostLegalizerCombinerHelper::matchUCharToFloat` can no longer see that CTLZ of the high half of `%masked = and i64 %arg0, 255` is known to be 32. It seems like we would need a whole bunch of extra constant folds and/or known bits logic to make this work again.

This revision was landed with ongoing or failed builds.Aug 6 2021, 1:43 AM

Closed by commit rG83610d4eb025: [AMDGPU][GlobalISel] Better legalization of 32-bit ctlz/cttz (authored by foad). · Explain Why

This revision was automatically updated to reflect the committed changes.

foad added a commit: rG83610d4eb025: [AMDGPU][GlobalISel] Better legalization of 32-bit ctlz/cttz.

RKSimon added a subscriber: RKSimon.Aug 11 2021, 3:18 AM

RKSimon added inline comments.

llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp
2542	@foad Coverity is complaining that you've repeated the 'Opc == AMDGPU::G_CTLZ_ZERO_UNDEF' check (which is dead code) - should the second one be 'Opc == AMDGPU::G_CTTZ_ZERO_UNDEF' ?

RKSimon mentioned this in D108210: [AMDGPU] Fix lowering of AMDGPU::G_CTTZ_ZERO_UNDEF to AMDGPU::G_AMDGPU_FFBL_B32.Aug 17 2021, 8:28 AM

RKSimon mentioned this in rGfb81271e8b44: [AMDGPU] Fix lowering of AMDGPU::G_CTTZ_ZERO_UNDEF to AMDGPU::G_AMDGPU_FFBL_B32.Aug 17 2021, 10:10 AM

foad added inline comments.Aug 22 2021, 12:44 PM

llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp
2542	Yes, and I see you fixed it in D108210 - thanks!

Revision Contents

Path

Size

llvm/

lib/

Target/

AMDGPU/

AMDGPULegalizerInfo.h

2 lines

AMDGPULegalizerInfo.cpp

26 lines

AMDGPURegisterBankInfo.cpp

24 lines

test/

CodeGen/

AMDGPU/

GlobalISel/

25 lines

129 lines

74 lines

150 lines

regbankselect-amdgpu-ffbh-u32.mir

3 lines

regbankselect-amdgpu-ffbl-b32.mir

3 lines

regbankselect-cttz-zero-undef.mir

8 lines

ctlz.ll

119 lines

cttz.ll

93 lines

cttz_zero_undef.ll

12 lines

Diff 364723

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.h

Show First 20 Lines • Show All 83 Lines • ▼ Show 20 Lines	bool legalizeFlog(MachineInstr &MI, MachineIRBuilder &B,
double Log2BaseInverted) const;		double Log2BaseInverted) const;
bool legalizeFExp(MachineInstr &MI, MachineIRBuilder &B) const;		bool legalizeFExp(MachineInstr &MI, MachineIRBuilder &B) const;
bool legalizeFPow(MachineInstr &MI, MachineIRBuilder &B) const;		bool legalizeFPow(MachineInstr &MI, MachineIRBuilder &B) const;
bool legalizeFFloor(MachineInstr &MI, MachineRegisterInfo &MRI,		bool legalizeFFloor(MachineInstr &MI, MachineRegisterInfo &MRI,
MachineIRBuilder &B) const;		MachineIRBuilder &B) const;

bool legalizeBuildVector(MachineInstr &MI, MachineRegisterInfo &MRI,		bool legalizeBuildVector(MachineInstr &MI, MachineRegisterInfo &MRI,
MachineIRBuilder &B) const;		MachineIRBuilder &B) const;
		bool legalizeCTLZ_CTTZ(MachineInstr &MI, MachineRegisterInfo &MRI,
		MachineIRBuilder &B) const;

bool loadInputValue(Register DstReg, MachineIRBuilder &B,		bool loadInputValue(Register DstReg, MachineIRBuilder &B,
const ArgDescriptor *Arg,		const ArgDescriptor *Arg,
const TargetRegisterClass *ArgRC, LLT ArgTy) const;		const TargetRegisterClass *ArgRC, LLT ArgTy) const;
bool loadInputValue(Register DstReg, MachineIRBuilder &B,		bool loadInputValue(Register DstReg, MachineIRBuilder &B,
AMDGPUFunctionArgInfo::PreloadedValue ArgType) const;		AMDGPUFunctionArgInfo::PreloadedValue ArgType) const;
bool legalizePreloadedArgIntrin(		bool legalizePreloadedArgIntrin(
MachineInstr &MI, MachineRegisterInfo &MRI, MachineIRBuilder &B,		MachineInstr &MI, MachineRegisterInfo &MRI, MachineIRBuilder &B,
▲ Show 20 Lines • Show All 97 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.cpp

Show First 20 Lines • Show All 934 Lines • ▼ Show 20 Lines	AMDGPULegalizerInfo::AMDGPULegalizerInfo(const GCNSubtarget &ST_,
// instructions expect. The hardware produces -1, but these produce the		// instructions expect. The hardware produces -1, but these produce the
// bitwidth.		// bitwidth.
getActionDefinitionsBuilder({G_CTLZ, G_CTTZ})		getActionDefinitionsBuilder({G_CTLZ, G_CTTZ})
.scalarize(0)		.scalarize(0)
.clampScalar(0, S32, S32)		.clampScalar(0, S32, S32)
.clampScalar(1, S32, S64)		.clampScalar(1, S32, S64)
.widenScalarToNextPow2(0, 32)		.widenScalarToNextPow2(0, 32)
.widenScalarToNextPow2(1, 32)		.widenScalarToNextPow2(1, 32)
.lower();		.custom();

// The 64-bit versions produce 32-bit results, but only on the SALU.		// The 64-bit versions produce 32-bit results, but only on the SALU.
getActionDefinitionsBuilder({G_CTLZ_ZERO_UNDEF, G_CTTZ_ZERO_UNDEF})		getActionDefinitionsBuilder({G_CTLZ_ZERO_UNDEF, G_CTTZ_ZERO_UNDEF})
.legalFor({{S32, S32}, {S32, S64}})		.legalFor({{S32, S32}, {S32, S64}})
.clampScalar(0, S32, S32)		.clampScalar(0, S32, S32)
.clampScalar(1, S32, S64)		.clampScalar(1, S32, S64)
.scalarize(0)		.scalarize(0)
.widenScalarToNextPow2(0, 32)		.widenScalarToNextPow2(0, 32)
▲ Show 20 Lines • Show All 801 Lines • ▼ Show 20 Lines	bool AMDGPULegalizerInfo::legalizeCustom(LegalizerHelper &Helper,
case TargetOpcode::G_FEXP:		case TargetOpcode::G_FEXP:
return legalizeFExp(MI, B);		return legalizeFExp(MI, B);
case TargetOpcode::G_FPOW:		case TargetOpcode::G_FPOW:
return legalizeFPow(MI, B);		return legalizeFPow(MI, B);
case TargetOpcode::G_FFLOOR:		case TargetOpcode::G_FFLOOR:
return legalizeFFloor(MI, MRI, B);		return legalizeFFloor(MI, MRI, B);
case TargetOpcode::G_BUILD_VECTOR:		case TargetOpcode::G_BUILD_VECTOR:
return legalizeBuildVector(MI, MRI, B);		return legalizeBuildVector(MI, MRI, B);
		case TargetOpcode::G_CTLZ:
		case TargetOpcode::G_CTTZ:
		return legalizeCTLZ_CTTZ(MI, MRI, B);
default:		default:
return false;		return false;
}		}

llvm_unreachable("expected switch to return");		llvm_unreachable("expected switch to return");
}		}

Register AMDGPULegalizerInfo::getSegmentAperture(		Register AMDGPULegalizerInfo::getSegmentAperture(
▲ Show 20 Lines • Show All 1,005 Lines • ▼ Show 20 Lines	bool AMDGPULegalizerInfo::legalizeBuildVector(

auto Merge = B.buildMerge(S32, {Src0, Src1});		auto Merge = B.buildMerge(S32, {Src0, Src1});
B.buildBitcast(Dst, Merge);		B.buildBitcast(Dst, Merge);

MI.eraseFromParent();		MI.eraseFromParent();
return true;		return true;
}		}

		// Legalize ctlz/cttz to ffbh/ffbl instead of the default legalization to
		// ctlz/cttz_zero_undef. This allows us to fix up the result for the zero input
		// case with a single min instruction instead of a compare+select.
		bool AMDGPULegalizerInfo::legalizeCTLZ_CTTZ(MachineInstr &MI,
		MachineRegisterInfo &MRI,
		MachineIRBuilder &B) const {
		Register Dst = MI.getOperand(0).getReg();
		Register Src = MI.getOperand(1).getReg();
		LLT DstTy = MRI.getType(Dst);
		LLT SrcTy = MRI.getType(Src);

		unsigned NewOpc = MI.getOpcode() == AMDGPU::G_CTLZ
		? AMDGPU::G_AMDGPU_FFBH_U32
		: AMDGPU::G_AMDGPU_FFBL_B32;
		auto Tmp = B.buildInstr(NewOpc, {DstTy}, {Src});
		B.buildUMin(Dst, Tmp, B.buildConstant(DstTy, SrcTy.getSizeInBits()));

		MI.eraseFromParent();
		return true;
		}

// Check that this is a G_XOR x, -1		// Check that this is a G_XOR x, -1
static bool isNot(const MachineRegisterInfo &MRI, const MachineInstr &MI) {		static bool isNot(const MachineRegisterInfo &MRI, const MachineInstr &MI) {
if (MI.getOpcode() != TargetOpcode::G_XOR)		if (MI.getOpcode() != TargetOpcode::G_XOR)
return false;		return false;
auto ConstVal = getConstantVRegSExtVal(MI.getOperand(2).getReg(), MRI);		auto ConstVal = getConstantVRegSExtVal(MI.getOperand(2).getReg(), MRI);
return ConstVal && *ConstVal == -1;		return ConstVal && *ConstVal == -1;
}		}

▲ Show 20 Lines • Show All 2,315 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp

Show First 20 Lines • Show All 2,507 Lines • ▼ Show 20 Lines	case AMDGPU::G_BITREVERSE: {

MachineFunction &MF = B.getMF();		MachineFunction &MF = B.getMF();
LegalizerHelper Helper(MF, ApplyVALU, B);		LegalizerHelper Helper(MF, ApplyVALU, B);

if (Helper.narrowScalar(MI, 1, S32) != LegalizerHelper::Legalized)		if (Helper.narrowScalar(MI, 1, S32) != LegalizerHelper::Legalized)
llvm_unreachable("narrowScalar should have succeeded");		llvm_unreachable("narrowScalar should have succeeded");
return;		return;
}		}
		case AMDGPU::G_AMDGPU_FFBH_U32:
		case AMDGPU::G_AMDGPU_FFBL_B32:
case AMDGPU::G_CTLZ_ZERO_UNDEF:		case AMDGPU::G_CTLZ_ZERO_UNDEF:
case AMDGPU::G_CTTZ_ZERO_UNDEF: {		case AMDGPU::G_CTTZ_ZERO_UNDEF: {
const RegisterBank *DstBank =		const RegisterBank *DstBank =
OpdMapper.getInstrMapping().getOperandMapping(0).BreakDown[0].RegBank;		OpdMapper.getInstrMapping().getOperandMapping(0).BreakDown[0].RegBank;
if (DstBank == &AMDGPU::SGPRRegBank)		if (DstBank == &AMDGPU::SGPRRegBank)
break;		break;

Register SrcReg = MI.getOperand(1).getReg();		Register SrcReg = MI.getOperand(1).getReg();
const LLT S32 = LLT::scalar(32);		const LLT S32 = LLT::scalar(32);
LLT Ty = MRI.getType(SrcReg);		LLT Ty = MRI.getType(SrcReg);
if (Ty == S32)		if (Ty == S32)
break;		break;

// We can narrow this more efficiently than Helper can by using ffbh/ffbl		// We can narrow this more efficiently than Helper can by using ffbh/ffbl
// which return -1 when the input is zero:		// which return -1 when the input is zero:
// (ctlz_zero_undef hi:lo) -> (umin (ffbh hi), 32 + (ffbh lo))		// (ctlz_zero_undef hi:lo) -> (umin (ffbh hi), (add (ffbh lo), 32))
// (cttz_zero_undef hi:lo) -> (umin 32 + (ffbl hi), (ffbl lo))		// (cttz_zero_undef hi:lo) -> (umin (add (ffbl hi), 32), (ffbl lo))
		// (ffbh hi:lo) -> (umin (ffbh hi), (uaddsat (ffbh lo), 32))
		// (ffbl hi:lo) -> (umin (uaddsat (ffbh hi), 32), (ffbh lo))
ApplyRegBankMapping ApplyVALU(*this, MRI, &AMDGPU::VGPRRegBank);		ApplyRegBankMapping ApplyVALU(*this, MRI, &AMDGPU::VGPRRegBank);
MachineIRBuilder B(MI, ApplyVALU);		MachineIRBuilder B(MI, ApplyVALU);
SmallVector<Register, 2> SrcRegs(OpdMapper.getVRegs(1));		SmallVector<Register, 2> SrcRegs(OpdMapper.getVRegs(1));
unsigned NewOpc = Opc == AMDGPU::G_CTLZ_ZERO_UNDEF		unsigned NewOpc = Opc == AMDGPU::G_CTLZ_ZERO_UNDEF
? AMDGPU::G_AMDGPU_FFBH_U32		? AMDGPU::G_AMDGPU_FFBH_U32
: AMDGPU::G_AMDGPU_FFBL_B32;		: Opc == AMDGPU::G_CTLZ_ZERO_UNDEF
		RKSimonUnsubmitted Not Done Reply Inline Actions @foad Coverity is complaining that you've repeated the 'Opc == AMDGPU::G_CTLZ_ZERO_UNDEF' check (which is dead code) - should the second one be 'Opc == AMDGPU::G_CTTZ_ZERO_UNDEF' ? RKSimon: @foad Coverity is complaining that you've repeated the 'Opc == AMDGPU::G_CTLZ_ZERO_UNDEF' check…
		foadAuthorUnsubmitted Done Reply Inline Actions Yes, and I see you fixed it in D108210 - thanks! foad: Yes, and I see you fixed it in D108210 - thanks!
unsigned Idx = Opc == AMDGPU::G_CTLZ_ZERO_UNDEF;		? AMDGPU::G_AMDGPU_FFBL_B32
		: Opc;
		unsigned Idx = NewOpc == AMDGPU::G_AMDGPU_FFBH_U32;
auto X = B.buildInstr(NewOpc, {S32}, {SrcRegs[Idx]});		auto X = B.buildInstr(NewOpc, {S32}, {SrcRegs[Idx]});
auto Y = B.buildInstr(NewOpc, {S32}, {SrcRegs[Idx ^ 1]});		auto Y = B.buildInstr(NewOpc, {S32}, {SrcRegs[Idx ^ 1]});
Y = B.buildAdd(S32, Y, B.buildConstant(S32, 32));		unsigned AddOpc =
		Opc == AMDGPU::G_CTLZ_ZERO_UNDEF \|\| Opc == AMDGPU::G_CTTZ_ZERO_UNDEF
		? AMDGPU::G_ADD
		: AMDGPU::G_UADDSAT;
		Y = B.buildInstr(AddOpc, {S32}, {Y, B.buildConstant(S32, 32)});
Register DstReg = MI.getOperand(0).getReg();		Register DstReg = MI.getOperand(0).getReg();
B.buildUMin(DstReg, X, Y);		B.buildUMin(DstReg, X, Y);
MI.eraseFromParent();		MI.eraseFromParent();
return;		return;
}		}
case AMDGPU::G_SEXT:		case AMDGPU::G_SEXT:
case AMDGPU::G_ZEXT:		case AMDGPU::G_ZEXT:
case AMDGPU::G_ANYEXT: {		case AMDGPU::G_ANYEXT: {
▲ Show 20 Lines • Show All 1,095 Lines • ▼ Show 20 Lines	AMDGPURegisterBankInfo::getInstrMapping(const MachineInstr &MI) const {
case AMDGPU::G_FMINNUM:		case AMDGPU::G_FMINNUM:
case AMDGPU::G_FMAXNUM:		case AMDGPU::G_FMAXNUM:
case AMDGPU::G_FMINNUM_IEEE:		case AMDGPU::G_FMINNUM_IEEE:
case AMDGPU::G_FMAXNUM_IEEE:		case AMDGPU::G_FMAXNUM_IEEE:
case AMDGPU::G_FCANONICALIZE:		case AMDGPU::G_FCANONICALIZE:
case AMDGPU::G_INTRINSIC_TRUNC:		case AMDGPU::G_INTRINSIC_TRUNC:
case AMDGPU::G_BSWAP: // TODO: Somehow expand for scalar?		case AMDGPU::G_BSWAP: // TODO: Somehow expand for scalar?
case AMDGPU::G_FSHR: // TODO: Expand for scalar		case AMDGPU::G_FSHR: // TODO: Expand for scalar
case AMDGPU::G_AMDGPU_FFBH_U32:
case AMDGPU::G_AMDGPU_FFBL_B32:
case AMDGPU::G_AMDGPU_FMIN_LEGACY:		case AMDGPU::G_AMDGPU_FMIN_LEGACY:
case AMDGPU::G_AMDGPU_FMAX_LEGACY:		case AMDGPU::G_AMDGPU_FMAX_LEGACY:
case AMDGPU::G_AMDGPU_RCP_IFLAG:		case AMDGPU::G_AMDGPU_RCP_IFLAG:
case AMDGPU::G_AMDGPU_CVT_F32_UBYTE0:		case AMDGPU::G_AMDGPU_CVT_F32_UBYTE0:
case AMDGPU::G_AMDGPU_CVT_F32_UBYTE1:		case AMDGPU::G_AMDGPU_CVT_F32_UBYTE1:
case AMDGPU::G_AMDGPU_CVT_F32_UBYTE2:		case AMDGPU::G_AMDGPU_CVT_F32_UBYTE2:
case AMDGPU::G_AMDGPU_CVT_F32_UBYTE3:		case AMDGPU::G_AMDGPU_CVT_F32_UBYTE3:
case AMDGPU::G_AMDGPU_CVT_PK_I16_I32:		case AMDGPU::G_AMDGPU_CVT_PK_I16_I32:
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	AMDGPURegisterBankInfo::getInstrMapping(const MachineInstr &MI) const {
case AMDGPU::G_PTRTOINT:		case AMDGPU::G_PTRTOINT:
case AMDGPU::G_FABS:		case AMDGPU::G_FABS:
case AMDGPU::G_FNEG: {		case AMDGPU::G_FNEG: {
unsigned Size = MRI.getType(MI.getOperand(0).getReg()).getSizeInBits();		unsigned Size = MRI.getType(MI.getOperand(0).getReg()).getSizeInBits();
unsigned BankID = getRegBankID(MI.getOperand(1).getReg(), MRI);		unsigned BankID = getRegBankID(MI.getOperand(1).getReg(), MRI);
OpdsMapping[0] = OpdsMapping[1] = AMDGPU::getValueMapping(BankID, Size);		OpdsMapping[0] = OpdsMapping[1] = AMDGPU::getValueMapping(BankID, Size);
break;		break;
}		}
		case AMDGPU::G_AMDGPU_FFBH_U32:
		case AMDGPU::G_AMDGPU_FFBL_B32:
case AMDGPU::G_CTLZ_ZERO_UNDEF:		case AMDGPU::G_CTLZ_ZERO_UNDEF:
case AMDGPU::G_CTTZ_ZERO_UNDEF: {		case AMDGPU::G_CTTZ_ZERO_UNDEF: {
unsigned Size = MRI.getType(MI.getOperand(1).getReg()).getSizeInBits();		unsigned Size = MRI.getType(MI.getOperand(1).getReg()).getSizeInBits();
unsigned BankID = getRegBankID(MI.getOperand(1).getReg(), MRI);		unsigned BankID = getRegBankID(MI.getOperand(1).getReg(), MRI);
OpdsMapping[0] = AMDGPU::getValueMapping(BankID, 32);		OpdsMapping[0] = AMDGPU::getValueMapping(BankID, 32);
OpdsMapping[1] = AMDGPU::getValueMappingSGPR64Only(BankID, Size);		OpdsMapping[1] = AMDGPU::getValueMappingSGPR64Only(BankID, Size);
break;		break;
}		}
▲ Show 20 Lines • Show All 777 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/cvt_f32_ubyte.ll

Show First 20 Lines • Show All 1,117 Lines • ▼ Show 20 Lines	; VI-NEXT: s_setpc_b64 s[30:31]
%itofp = sitofp i64 %masked to float		%itofp = sitofp i64 %masked to float
ret float %itofp		ret float %itofp
}		}

define float @v_test_uitofp_i64_byte_to_f32(i64 %arg0) {		define float @v_test_uitofp_i64_byte_to_f32(i64 %arg0) {
; SI-LABEL: v_test_uitofp_i64_byte_to_f32:		; SI-LABEL: v_test_uitofp_i64_byte_to_f32:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; SI-NEXT: v_ffbh_u32_e32 v2, 0
; SI-NEXT: v_and_b32_e32 v0, 0xff, v0		; SI-NEXT: v_and_b32_e32 v0, 0xff, v0
; SI-NEXT: v_cvt_f32_ubyte0_e32 v0, v0		; SI-NEXT: v_mov_b32_e32 v1, 0
; SI-NEXT: v_ldexp_f32_e64 v0, v0, 0		; SI-NEXT: v_min_u32_e32 v2, 32, v2
		; SI-NEXT: v_lshl_b64 v[0:1], v[0:1], v2
		; SI-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0
		; SI-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
		; SI-NEXT: v_or_b32_e32 v0, v1, v0
		; SI-NEXT: v_cvt_f32_u32_e32 v0, v0
		; SI-NEXT: v_sub_i32_e32 v1, vcc, 32, v2
		; SI-NEXT: v_ldexp_f32_e32 v0, v0, v1
		foadAuthorUnsubmitted Done Reply Inline Actions This is unfortunate. The problem is that when CTLZ is expanded using FFBH, `AMDGPUPostLegalizerCombinerHelper::matchUCharToFloat` can no longer see that CTLZ of the high half of `%masked = and i64 %arg0, 255` is known to be 32. It seems like we would need a whole bunch of extra constant folds and/or known bits logic to make this work again. foad: This is unfortunate. The problem is that when CTLZ is expanded using FFBH…
; SI-NEXT: s_setpc_b64 s[30:31]		; SI-NEXT: s_setpc_b64 s[30:31]
;		;
; VI-LABEL: v_test_uitofp_i64_byte_to_f32:		; VI-LABEL: v_test_uitofp_i64_byte_to_f32:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; VI-NEXT: v_cvt_f32_ubyte0_sdwa v0, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0		; VI-NEXT: v_ffbh_u32_e32 v2, 0
; VI-NEXT: v_ldexp_f32 v0, v0, 0		; VI-NEXT: v_and_b32_e32 v0, 0xff, v0
		; VI-NEXT: v_mov_b32_e32 v1, 0
		; VI-NEXT: v_min_u32_e32 v2, 32, v2
		; VI-NEXT: v_lshlrev_b64 v[0:1], v2, v[0:1]
		; VI-NEXT: v_cmp_ne_u32_e32 vcc, 0, v0
		; VI-NEXT: v_cndmask_b32_e64 v0, 0, 1, vcc
		; VI-NEXT: v_or_b32_e32 v0, v1, v0
		; VI-NEXT: v_cvt_f32_u32_e32 v0, v0
		; VI-NEXT: v_sub_u32_e32 v1, vcc, 32, v2
		; VI-NEXT: v_ldexp_f32 v0, v0, v1
; VI-NEXT: s_setpc_b64 s[30:31]		; VI-NEXT: s_setpc_b64 s[30:31]
%masked = and i64 %arg0, 255		%masked = and i64 %arg0, 255
%itofp = uitofp i64 %masked to float		%itofp = uitofp i64 %masked to float
ret float %itofp		ret float %itofp
}		}

define float @v_test_sitofp_i16_byte_to_f32(i16 %arg0) {		define float @v_test_sitofp_i16_byte_to_f32(i16 %arg0) {
; SI-LABEL: v_test_sitofp_i16_byte_to_f32:		; SI-LABEL: v_test_sitofp_i16_byte_to_f32:
Show All 37 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-ctlz.mir

# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py		# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
# RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=fiji -O0 -run-pass=legalizer %s -o - \| FileCheck %s		# RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=fiji -O0 -run-pass=legalizer %s -o - \| FileCheck %s

---		---
name: ctlz_s32_s32		name: ctlz_s32_s32

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0		liveins: $vgpr0
; CHECK-LABEL: name: ctlz_s32_s32		; CHECK-LABEL: name: ctlz_s32_s32
; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0		; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[COPY]](s32)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[COPY]](s32)
; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[COPY]](s32), [[C]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; CHECK: $vgpr0 = COPY [[UMIN]](s32)
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTLZ_ZERO_UNDEF]]
; CHECK: $vgpr0 = COPY [[SELECT]](s32)
%0:_(s32) = COPY $vgpr0		%0:_(s32) = COPY $vgpr0
%1:_(s32) = G_CTLZ %0		%1:_(s32) = G_CTLZ %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

---		---
name: ctlz_s32_s64		name: ctlz_s32_s64

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1
; CHECK-LABEL: name: ctlz_s32_s64		; CHECK-LABEL: name: ctlz_s32_s64
; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[COPY]](s64)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[COPY]](s64)
; CHECK: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 0		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 64
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[COPY]](s64), [[C]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 64		; CHECK: $vgpr0 = COPY [[UMIN]](s32)
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTLZ_ZERO_UNDEF]]
; CHECK: $vgpr0 = COPY [[SELECT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s32) = G_CTLZ %0		%1:_(s32) = G_CTLZ %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

---		---
name: ctlz_s64_s64		name: ctlz_s64_s64

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1
; CHECK-LABEL: name: ctlz_s64_s64		; CHECK-LABEL: name: ctlz_s64_s64
; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[COPY]](s64)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[COPY]](s64)
; CHECK: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 0		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 64
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[COPY]](s64), [[C]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 64		; CHECK: [[ZEXT:%[0-9]+]]:_(s64) = G_ZEXT [[UMIN]](s32)
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTLZ_ZERO_UNDEF]]
; CHECK: [[ZEXT:%[0-9]+]]:_(s64) = G_ZEXT [[SELECT]](s32)
; CHECK: $vgpr0_vgpr1 = COPY [[ZEXT]](s64)		; CHECK: $vgpr0_vgpr1 = COPY [[ZEXT]](s64)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s64) = G_CTLZ %0		%1:_(s64) = G_CTLZ %0
$vgpr0_vgpr1 = COPY %1		$vgpr0_vgpr1 = COPY %1
...		...

---		---
name: ctlz_s16_s32		name: ctlz_s16_s32

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0		liveins: $vgpr0
; CHECK-LABEL: name: ctlz_s16_s32		; CHECK-LABEL: name: ctlz_s16_s32
; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0		; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[COPY]](s32)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[COPY]](s32)
; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[COPY]](s32), [[C]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 65535
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTLZ_ZERO_UNDEF]]		; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[UMIN]](s32)
; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 65535		; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C1]]
; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[SELECT]](s32)
; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C2]]
; CHECK: $vgpr0 = COPY [[AND]](s32)		; CHECK: $vgpr0 = COPY [[AND]](s32)
%0:_(s32) = COPY $vgpr0		%0:_(s32) = COPY $vgpr0
%1:_(s16) = G_CTLZ %0		%1:_(s16) = G_CTLZ %0
%2:_(s32) = G_ZEXT %1		%2:_(s32) = G_ZEXT %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: ctlz_s16_s16		name: ctlz_s16_s16

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0		liveins: $vgpr0
; CHECK-LABEL: name: ctlz_s16_s16		; CHECK-LABEL: name: ctlz_s16_s16
; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0		; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 65535		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 65535
; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[COPY]](s32)		; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[COPY]](s32)
; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C]]		; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C]]
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[AND]](s32)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[AND]](s32)
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[AND]](s32), [[C1]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[CTLZ_ZERO_UNDEF]]		; CHECK: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[UMIN]], [[C2]]
; CHECK: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; CHECK: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT]], [[C3]]
; CHECK: [[COPY2:%[0-9]+]]:_(s32) = COPY [[SUB]](s32)		; CHECK: [[COPY2:%[0-9]+]]:_(s32) = COPY [[SUB]](s32)
; CHECK: [[COPY3:%[0-9]+]]:_(s32) = COPY [[COPY2]](s32)		; CHECK: [[COPY3:%[0-9]+]]:_(s32) = COPY [[COPY2]](s32)
; CHECK: [[AND1:%[0-9]+]]:_(s32) = G_AND [[COPY3]], [[C]]		; CHECK: [[AND1:%[0-9]+]]:_(s32) = G_AND [[COPY3]], [[C]]
; CHECK: $vgpr0 = COPY [[AND1]](s32)		; CHECK: $vgpr0 = COPY [[AND1]](s32)
%0:_(s32) = COPY $vgpr0		%0:_(s32) = COPY $vgpr0
%1:_(s16) = G_TRUNC %0		%1:_(s16) = G_TRUNC %0
%2:_(s16) = G_CTLZ %1		%2:_(s16) = G_CTLZ %1
%3:_(s32) = G_ZEXT %2		%3:_(s32) = G_ZEXT %2
$vgpr0 = COPY %3		$vgpr0 = COPY %3
...		...

---		---
name: ctlz_v2s32_v2s32		name: ctlz_v2s32_v2s32

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1
; CHECK-LABEL: name: ctlz_v2s32_v2s32		; CHECK-LABEL: name: ctlz_v2s32_v2s32
; CHECK: [[COPY:%[0-9]+]]:_(<2 x s32>) = COPY $vgpr0_vgpr1		; CHECK: [[COPY:%[0-9]+]]:_(<2 x s32>) = COPY $vgpr0_vgpr1
; CHECK: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](<2 x s32>)		; CHECK: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](<2 x s32>)
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV]](s32)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV]](s32)
; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV]](s32), [[C]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; CHECK: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTLZ_ZERO_UNDEF]]		; CHECK: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]
; CHECK: [[CTLZ_ZERO_UNDEF1:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV1]](s32)		; CHECK: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[UMIN]](s32), [[UMIN1]](s32)
; CHECK: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s32), [[C]]
; CHECK: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C1]], [[CTLZ_ZERO_UNDEF1]]
; CHECK: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[SELECT]](s32), [[SELECT1]](s32)
; CHECK: $vgpr0_vgpr1 = COPY [[BUILD_VECTOR]](<2 x s32>)		; CHECK: $vgpr0_vgpr1 = COPY [[BUILD_VECTOR]](<2 x s32>)
%0:_(<2 x s32>) = COPY $vgpr0_vgpr1		%0:_(<2 x s32>) = COPY $vgpr0_vgpr1
%1:_(<2 x s32>) = G_CTLZ %0		%1:_(<2 x s32>) = G_CTLZ %0
$vgpr0_vgpr1 = COPY %1		$vgpr0_vgpr1 = COPY %1
...		...

---		---
name: ctlz_v2s32_v2s64		name: ctlz_v2s32_v2s64

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1_vgpr2_vgpr3		liveins: $vgpr0_vgpr1_vgpr2_vgpr3
; CHECK-LABEL: name: ctlz_v2s32_v2s64		; CHECK-LABEL: name: ctlz_v2s32_v2s64
; CHECK: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		; CHECK: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
; CHECK: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)		; CHECK: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV]](s64)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV]](s64)
; CHECK: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 0		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 64
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV]](s64), [[C]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 64		; CHECK: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s64)
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTLZ_ZERO_UNDEF]]		; CHECK: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]
; CHECK: [[CTLZ_ZERO_UNDEF1:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV1]](s64)		; CHECK: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[UMIN]](s32), [[UMIN1]](s32)
; CHECK: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s64), [[C]]
; CHECK: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C1]], [[CTLZ_ZERO_UNDEF1]]
; CHECK: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[SELECT]](s32), [[SELECT1]](s32)
; CHECK: $vgpr0_vgpr1 = COPY [[BUILD_VECTOR]](<2 x s32>)		; CHECK: $vgpr0_vgpr1 = COPY [[BUILD_VECTOR]](<2 x s32>)
%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
%1:_(<2 x s32>) = G_CTLZ %0		%1:_(<2 x s32>) = G_CTLZ %0
$vgpr0_vgpr1 = COPY %1		$vgpr0_vgpr1 = COPY %1
...		...

---		---
name: ctlz_v2s16_v2s16		name: ctlz_v2s16_v2s16

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0		liveins: $vgpr0
; CHECK-LABEL: name: ctlz_v2s16_v2s16		; CHECK-LABEL: name: ctlz_v2s16_v2s16
; CHECK: [[COPY:%[0-9]+]]:_(<2 x s16>) = COPY $vgpr0		; CHECK: [[COPY:%[0-9]+]]:_(<2 x s16>) = COPY $vgpr0
; CHECK: [[BITCAST:%[0-9]+]]:_(s32) = G_BITCAST [[COPY]](<2 x s16>)		; CHECK: [[BITCAST:%[0-9]+]]:_(s32) = G_BITCAST [[COPY]](<2 x s16>)
; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; CHECK: [[LSHR:%[0-9]+]]:_(s32) = G_LSHR [[BITCAST]], [[C]](s32)		; CHECK: [[LSHR:%[0-9]+]]:_(s32) = G_LSHR [[BITCAST]], [[C]](s32)
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 65535		; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 65535
; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[BITCAST]](s32)		; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[BITCAST]](s32)
; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C1]]		; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C1]]
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[AND]](s32)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[AND]](s32)
; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[AND]](s32), [[C2]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C2]]
; CHECK: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; CHECK: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[UMIN]], [[C]]
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C3]], [[CTLZ_ZERO_UNDEF]]
; CHECK: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT]], [[C]]
; CHECK: [[COPY2:%[0-9]+]]:_(s32) = COPY [[SUB]](s32)		; CHECK: [[COPY2:%[0-9]+]]:_(s32) = COPY [[SUB]](s32)
; CHECK: [[COPY3:%[0-9]+]]:_(s32) = COPY [[LSHR]](s32)		; CHECK: [[COPY3:%[0-9]+]]:_(s32) = COPY [[LSHR]](s32)
; CHECK: [[AND1:%[0-9]+]]:_(s32) = G_AND [[COPY3]], [[C1]]		; CHECK: [[AND1:%[0-9]+]]:_(s32) = G_AND [[COPY3]], [[C1]]
; CHECK: [[CTLZ_ZERO_UNDEF1:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[AND1]](s32)		; CHECK: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[AND1]](s32)
; CHECK: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[AND1]](s32), [[C2]]		; CHECK: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C2]]
; CHECK: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C3]], [[CTLZ_ZERO_UNDEF1]]		; CHECK: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[UMIN1]], [[C]]
; CHECK: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[SELECT1]], [[C]]
; CHECK: [[COPY4:%[0-9]+]]:_(s32) = COPY [[SUB1]](s32)		; CHECK: [[COPY4:%[0-9]+]]:_(s32) = COPY [[SUB1]](s32)
; CHECK: [[COPY5:%[0-9]+]]:_(s32) = COPY [[COPY2]](s32)		; CHECK: [[COPY5:%[0-9]+]]:_(s32) = COPY [[COPY2]](s32)
; CHECK: [[AND2:%[0-9]+]]:_(s32) = G_AND [[COPY5]], [[C1]]		; CHECK: [[AND2:%[0-9]+]]:_(s32) = G_AND [[COPY5]], [[C1]]
; CHECK: [[COPY6:%[0-9]+]]:_(s32) = COPY [[COPY4]](s32)		; CHECK: [[COPY6:%[0-9]+]]:_(s32) = COPY [[COPY4]](s32)
; CHECK: [[AND3:%[0-9]+]]:_(s32) = G_AND [[COPY6]], [[C1]]		; CHECK: [[AND3:%[0-9]+]]:_(s32) = G_AND [[COPY6]], [[C1]]
; CHECK: [[SHL:%[0-9]+]]:_(s32) = G_SHL [[AND3]], [[C]](s32)		; CHECK: [[SHL:%[0-9]+]]:_(s32) = G_SHL [[AND3]], [[C]](s32)
; CHECK: [[OR:%[0-9]+]]:_(s32) = G_OR [[AND2]], [[SHL]]		; CHECK: [[OR:%[0-9]+]]:_(s32) = G_OR [[AND2]], [[SHL]]
; CHECK: [[BITCAST1:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR]](s32)		; CHECK: [[BITCAST1:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR]](s32)
Show All 10 Lines	body: \|
bb.0:		bb.0:
liveins: $vgpr0		liveins: $vgpr0

; CHECK-LABEL: name: ctlz_s7_s7		; CHECK-LABEL: name: ctlz_s7_s7
; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0		; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 127		; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 127
; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[COPY]](s32)		; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[COPY]](s32)
; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C]]		; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C]]
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[AND]](s32)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[AND]](s32)
; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[AND]](s32), [[C1]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 25
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[CTLZ_ZERO_UNDEF]]		; CHECK: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[UMIN]], [[C2]]
; CHECK: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 25
; CHECK: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[SELECT]], [[C3]]
; CHECK: [[COPY2:%[0-9]+]]:_(s32) = COPY [[SUB]](s32)		; CHECK: [[COPY2:%[0-9]+]]:_(s32) = COPY [[SUB]](s32)
; CHECK: [[COPY3:%[0-9]+]]:_(s32) = COPY [[COPY2]](s32)		; CHECK: [[COPY3:%[0-9]+]]:_(s32) = COPY [[COPY2]](s32)
; CHECK: [[AND1:%[0-9]+]]:_(s32) = G_AND [[COPY3]], [[C]]		; CHECK: [[AND1:%[0-9]+]]:_(s32) = G_AND [[COPY3]], [[C]]
; CHECK: $vgpr0 = COPY [[AND1]](s32)		; CHECK: $vgpr0 = COPY [[AND1]](s32)
%0:_(s32) = COPY $vgpr0		%0:_(s32) = COPY $vgpr0
%1:_(s7) = G_TRUNC %0		%1:_(s7) = G_TRUNC %0
%2:_(s7) = G_CTLZ %1		%2:_(s7) = G_CTLZ %1
%3:_(s32) = G_ZEXT %2		%3:_(s32) = G_ZEXT %2
$vgpr0 = COPY %3		$vgpr0 = COPY %3
...		...

---		---
name: ctlz_s33_s33		name: ctlz_s33_s33

body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; CHECK-LABEL: name: ctlz_s33_s33		; CHECK-LABEL: name: ctlz_s33_s33
; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; CHECK: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591		; CHECK: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591
; CHECK: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)		; CHECK: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)
; CHECK: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]		; CHECK: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]
; CHECK: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[AND]](s64)		; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[AND]](s64)
; CHECK: [[C1:%[0-9]+]]:_(s64) = G_CONSTANT i64 0		; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 64
; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[AND]](s64), [[C1]]		; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 64		; CHECK: [[ZEXT:%[0-9]+]]:_(s64) = G_ZEXT [[UMIN]](s32)
; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[CTLZ_ZERO_UNDEF]]		; CHECK: [[C2:%[0-9]+]]:_(s64) = G_CONSTANT i64 31
; CHECK: [[ZEXT:%[0-9]+]]:_(s64) = G_ZEXT [[SELECT]](s32)
; CHECK: [[C3:%[0-9]+]]:_(s64) = G_CONSTANT i64 31
; CHECK: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[ZEXT]](s64)		; CHECK: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[ZEXT]](s64)
; CHECK: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[C3]](s64)		; CHECK: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[C2]](s64)
; CHECK: [[USUBO:%[0-9]+]]:_(s32), [[USUBO1:%[0-9]+]]:_(s1) = G_USUBO [[UV]], [[UV2]]		; CHECK: [[USUBO:%[0-9]+]]:_(s32), [[USUBO1:%[0-9]+]]:_(s1) = G_USUBO [[UV]], [[UV2]]
; CHECK: [[USUBE:%[0-9]+]]:_(s32), [[USUBE1:%[0-9]+]]:_(s1) = G_USUBE [[UV1]], [[UV3]], [[USUBO1]]		; CHECK: [[USUBE:%[0-9]+]]:_(s32), [[USUBE1:%[0-9]+]]:_(s1) = G_USUBE [[UV1]], [[UV3]], [[USUBO1]]
; CHECK: [[ZEXT1:%[0-9]+]]:_(s64) = G_ZEXT [[USUBO]](s32)		; CHECK: [[ZEXT1:%[0-9]+]]:_(s64) = G_ZEXT [[USUBO]](s32)
; CHECK: $vgpr0_vgpr1 = COPY [[ZEXT1]](s64)		; CHECK: $vgpr0_vgpr1 = COPY [[ZEXT1]](s64)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s33) = G_TRUNC %0		%1:_(s33) = G_TRUNC %0
%2:_(s33) = G_CTLZ %1		%2:_(s33) = G_CTLZ %1
%3:_(s64) = G_ANYEXT %2		%3:_(s64) = G_ANYEXT %2
Show All 15 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-cttz.mir

	# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py			# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	# RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=fiji -O0 -run-pass=legalizer %s -o - \| FileCheck %s			# RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=fiji -O0 -run-pass=legalizer %s -o - \| FileCheck %s

	---			---
	name: cttz_s32_s32			name: cttz_s32_s32

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $vgpr0			liveins: $vgpr0
	; CHECK-LABEL: name: cttz_s32_s32			; CHECK-LABEL: name: cttz_s32_s32
	; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0			; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
	; CHECK: [[CTTZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTTZ_ZERO_UNDEF [[COPY]](s32)			; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBL_B32 [[COPY]](s32)
	; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 0			; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
	; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[COPY]](s32), [[C]]			; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBL_B32_]], [[C]]
	; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32			; CHECK: $vgpr0 = COPY [[UMIN]](s32)
	; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTTZ_ZERO_UNDEF]]
	; CHECK: $vgpr0 = COPY [[SELECT]](s32)
	%0:_(s32) = COPY $vgpr0			%0:_(s32) = COPY $vgpr0
	%1:_(s32) = G_CTTZ %0			%1:_(s32) = G_CTTZ %0
	$vgpr0 = COPY %1			$vgpr0 = COPY %1
	...			...

	---			---
	name: cttz_s32_s64			name: cttz_s32_s64

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $vgpr0_vgpr1			liveins: $vgpr0_vgpr1
	; CHECK-LABEL: name: cttz_s32_s64			; CHECK-LABEL: name: cttz_s32_s64
	; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1			; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
	; CHECK: [[CTTZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTTZ_ZERO_UNDEF [[COPY]](s64)			; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBL_B32 [[COPY]](s64)
	; CHECK: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 0			; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 64
	; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[COPY]](s64), [[C]]			; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBL_B32_]], [[C]]
	; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 64			; CHECK: $vgpr0 = COPY [[UMIN]](s32)
	; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTTZ_ZERO_UNDEF]]
	; CHECK: $vgpr0 = COPY [[SELECT]](s32)
	%0:_(s64) = COPY $vgpr0_vgpr1			%0:_(s64) = COPY $vgpr0_vgpr1
	%1:_(s32) = G_CTTZ %0			%1:_(s32) = G_CTTZ %0
	$vgpr0 = COPY %1			$vgpr0 = COPY %1
	...			...

	---			---
	name: cttz_s64_s64			name: cttz_s64_s64

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $vgpr0_vgpr1			liveins: $vgpr0_vgpr1
	; CHECK-LABEL: name: cttz_s64_s64			; CHECK-LABEL: name: cttz_s64_s64
	; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1			; CHECK: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
	; CHECK: [[CTTZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTTZ_ZERO_UNDEF [[COPY]](s64)			; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBL_B32 [[COPY]](s64)
	; CHECK: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 0			; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 64
	; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[COPY]](s64), [[C]]			; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBL_B32_]], [[C]]
	; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 64			; CHECK: [[ZEXT:%[0-9]+]]:_(s64) = G_ZEXT [[UMIN]](s32)
	; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTTZ_ZERO_UNDEF]]
	; CHECK: [[ZEXT:%[0-9]+]]:_(s64) = G_ZEXT [[SELECT]](s32)
	; CHECK: $vgpr0_vgpr1 = COPY [[ZEXT]](s64)			; CHECK: $vgpr0_vgpr1 = COPY [[ZEXT]](s64)
	%0:_(s64) = COPY $vgpr0_vgpr1			%0:_(s64) = COPY $vgpr0_vgpr1
	%1:_(s64) = G_CTTZ %0			%1:_(s64) = G_CTTZ %0
	$vgpr0_vgpr1 = COPY %1			$vgpr0_vgpr1 = COPY %1
	...			...

	---			---
	name: cttz_s16_s32			name: cttz_s16_s32

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $vgpr0			liveins: $vgpr0
	; CHECK-LABEL: name: cttz_s16_s32			; CHECK-LABEL: name: cttz_s16_s32
	; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0			; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
	; CHECK: [[CTTZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTTZ_ZERO_UNDEF [[COPY]](s32)			; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBL_B32 [[COPY]](s32)
	; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 0			; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
	; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[COPY]](s32), [[C]]			; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBL_B32_]], [[C]]
	; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32			; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 65535
	; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTTZ_ZERO_UNDEF]]			; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[UMIN]](s32)
	; CHECK: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 65535			; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C1]]
	; CHECK: [[COPY1:%[0-9]+]]:_(s32) = COPY [[SELECT]](s32)
	; CHECK: [[AND:%[0-9]+]]:_(s32) = G_AND [[COPY1]], [[C2]]
	; CHECK: $vgpr0 = COPY [[AND]](s32)			; CHECK: $vgpr0 = COPY [[AND]](s32)
	%0:_(s32) = COPY $vgpr0			%0:_(s32) = COPY $vgpr0
	%1:_(s16) = G_CTTZ %0			%1:_(s16) = G_CTTZ %0
	%2:_(s32) = G_ZEXT %1			%2:_(s32) = G_ZEXT %1
	$vgpr0 = COPY %2			$vgpr0 = COPY %2
	...			...

	---			---
	Show All 25 Lines
	name: cttz_v2s32_v2s32			name: cttz_v2s32_v2s32

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $vgpr0_vgpr1			liveins: $vgpr0_vgpr1
	; CHECK-LABEL: name: cttz_v2s32_v2s32			; CHECK-LABEL: name: cttz_v2s32_v2s32
	; CHECK: [[COPY:%[0-9]+]]:_(<2 x s32>) = COPY $vgpr0_vgpr1			; CHECK: [[COPY:%[0-9]+]]:_(<2 x s32>) = COPY $vgpr0_vgpr1
	; CHECK: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](<2 x s32>)			; CHECK: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](<2 x s32>)
	; CHECK: [[CTTZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTTZ_ZERO_UNDEF [[UV]](s32)			; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBL_B32 [[UV]](s32)
	; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 0			; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
	; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV]](s32), [[C]]			; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBL_B32_]], [[C]]
	; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32			; CHECK: [[AMDGPU_FFBL_B32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBL_B32 [[UV1]](s32)
	; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTTZ_ZERO_UNDEF]]			; CHECK: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBL_B32_1]], [[C]]
	; CHECK: [[CTTZ_ZERO_UNDEF1:%[0-9]+]]:_(s32) = G_CTTZ_ZERO_UNDEF [[UV1]](s32)			; CHECK: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[UMIN]](s32), [[UMIN1]](s32)
	; CHECK: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s32), [[C]]
	; CHECK: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C1]], [[CTTZ_ZERO_UNDEF1]]
	; CHECK: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[SELECT]](s32), [[SELECT1]](s32)
	; CHECK: $vgpr0_vgpr1 = COPY [[BUILD_VECTOR]](<2 x s32>)			; CHECK: $vgpr0_vgpr1 = COPY [[BUILD_VECTOR]](<2 x s32>)
	%0:_(<2 x s32>) = COPY $vgpr0_vgpr1			%0:_(<2 x s32>) = COPY $vgpr0_vgpr1
	%1:_(<2 x s32>) = G_CTTZ %0			%1:_(<2 x s32>) = G_CTTZ %0
	$vgpr0_vgpr1 = COPY %1			$vgpr0_vgpr1 = COPY %1
	...			...

	---			---
	name: cttz_v2s32_v2s64			name: cttz_v2s32_v2s64

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $vgpr0_vgpr1_vgpr2_vgpr3			liveins: $vgpr0_vgpr1_vgpr2_vgpr3
	; CHECK-LABEL: name: cttz_v2s32_v2s64			; CHECK-LABEL: name: cttz_v2s32_v2s64
	; CHECK: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3			; CHECK: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
	; CHECK: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)			; CHECK: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
	; CHECK: [[CTTZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTTZ_ZERO_UNDEF [[UV]](s64)			; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBL_B32 [[UV]](s64)
	; CHECK: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 0			; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 64
	; CHECK: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV]](s64), [[C]]			; CHECK: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBL_B32_]], [[C]]
	; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 64			; CHECK: [[AMDGPU_FFBL_B32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBL_B32 [[UV1]](s64)
	; CHECK: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTTZ_ZERO_UNDEF]]			; CHECK: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBL_B32_1]], [[C]]
	; CHECK: [[CTTZ_ZERO_UNDEF1:%[0-9]+]]:_(s32) = G_CTTZ_ZERO_UNDEF [[UV1]](s64)			; CHECK: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[UMIN]](s32), [[UMIN1]](s32)
	; CHECK: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s64), [[C]]
	; CHECK: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C1]], [[CTTZ_ZERO_UNDEF1]]
	; CHECK: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[SELECT]](s32), [[SELECT1]](s32)
	; CHECK: $vgpr0_vgpr1 = COPY [[BUILD_VECTOR]](<2 x s32>)			; CHECK: $vgpr0_vgpr1 = COPY [[BUILD_VECTOR]](<2 x s32>)
	%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3			%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
	%1:_(<2 x s32>) = G_CTTZ %0			%1:_(<2 x s32>) = G_CTTZ %0
	$vgpr0_vgpr1 = COPY %1			$vgpr0_vgpr1 = COPY %1
	...			...

	---			---
	name: cttz_v2s16_v2s16			name: cttz_v2s16_v2s16
	▲ Show 20 Lines • Show All 88 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-uitofp.mir

Show First 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_uitofp_s64_to_s32		; GFX6-LABEL: name: test_uitofp_s64_to_s32
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV1]](s32)		; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s32), [[C1]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C]], [[CTLZ_ZERO_UNDEF]]		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[SELECT]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]		; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SELECT]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX6: $vgpr0 = COPY [[INT]](s32)		; GFX6: $vgpr0 = COPY [[INT]](s32)
; GFX8-LABEL: name: test_uitofp_s64_to_s32		; GFX8-LABEL: name: test_uitofp_s64_to_s32
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV1]](s32)		; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s32), [[C1]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C]], [[CTLZ_ZERO_UNDEF]]		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[SELECT]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]		; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SELECT]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX8: $vgpr0 = COPY [[INT]](s32)		; GFX8: $vgpr0 = COPY [[INT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s32) = G_UITOFP %0		%1:_(s32) = G_UITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

---		---
▲ Show 20 Lines • Show All 276 Lines • ▼ Show 20 Lines	bb.0:
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591		; GFX6: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591
; GFX6: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)		; GFX6: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)
; GFX6: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]		; GFX6: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 0
; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV1]](s32)		; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s32), [[C2]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTLZ_ZERO_UNDEF]]		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[SELECT]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C2]]		; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C2]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C3]], [[C2]]		; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C3]], [[C2]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[SELECT]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX6: $vgpr0 = COPY [[INT]](s32)		; GFX6: $vgpr0 = COPY [[INT]](s32)
; GFX8-LABEL: name: test_uitofp_s33_to_s32		; GFX8-LABEL: name: test_uitofp_s33_to_s32
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591		; GFX8: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591
; GFX8: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)		; GFX8: [[COPY1:%[0-9]+]]:_(s64) = COPY [[COPY]](s64)
; GFX8: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]		; GFX8: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY1]], [[C]]
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 0
; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV1]](s32)		; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s32), [[C2]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C1]], [[CTLZ_ZERO_UNDEF]]		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[SELECT]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C2]]		; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C2]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C3]], [[C2]]		; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C3]], [[C2]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[SELECT]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX8: $vgpr0 = COPY [[INT]](s32)		; GFX8: $vgpr0 = COPY [[INT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s33) = G_TRUNC %0		%1:_(s33) = G_TRUNC %0
%2:_(s32) = G_UITOFP %1		%2:_(s32) = G_UITOFP %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: test_uitofp_s64_to_s16		name: test_uitofp_s64_to_s16
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_uitofp_s64_to_s16		; GFX6-LABEL: name: test_uitofp_s64_to_s16
; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX6: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV1]](s32)		; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s32), [[C1]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C]], [[CTLZ_ZERO_UNDEF]]		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[SELECT]](s32)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]		; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SELECT]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)
; GFX6: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX6: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX6: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX6: $vgpr0 = COPY [[ANYEXT]](s32)
; GFX8-LABEL: name: test_uitofp_s64_to_s16		; GFX8-LABEL: name: test_uitofp_s64_to_s16
; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV1]](s32)		; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV1]](s32), [[C1]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C]], [[CTLZ_ZERO_UNDEF]]		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[SELECT]](s32)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]		; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV2]](s32), [[C1]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]		; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[SELECT]]
; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SELECT]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)
; GFX8: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX8: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX8: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX8: $vgpr0 = COPY [[ANYEXT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s16) = G_UITOFP %0		%1:_(s16) = G_UITOFP %0
%2:_(s32) = G_ANYEXT %1		%2:_(s32) = G_ANYEXT %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: test_sitofp_v2s64_to_v2s16		name: test_sitofp_v2s64_to_v2s16
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1_vgpr2_vgpr3		liveins: $vgpr0_vgpr1_vgpr2_vgpr3

; GFX6-LABEL: name: test_sitofp_v2s64_to_v2s16		; GFX6-LABEL: name: test_sitofp_v2s64_to_v2s16
; GFX6: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		; GFX6: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
; GFX6: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)		; GFX6: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)		; GFX6: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX6: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0
; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX6: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX6: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV3]](s32)		; GFX6: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)
; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV3]](s32), [[C1]]		; GFX6: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C]], [[CTLZ_ZERO_UNDEF]]		; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX6: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[SELECT]](s32)
; GFX6: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV4]](s32), [[C1]]		; GFX6: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV4]](s32), [[C1]]
; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]		; GFX6: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]
; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[SELECT1]]		; GFX6: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[SELECT]]
; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SELECT]]		; GFX6: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX6: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)
; GFX6: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX6: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX6: [[CTLZ_ZERO_UNDEF1:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV7]](s32)		; GFX6: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)
; GFX6: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV7]](s32), [[C1]]		; GFX6: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]
; GFX6: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C]], [[CTLZ_ZERO_UNDEF1]]		; GFX6: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN1]](s32)
; GFX6: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[SELECT2]](s32)
; GFX6: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX6: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX6: [[ICMP3:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV8]](s32), [[C1]]		; GFX6: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV8]](s32), [[C1]]
; GFX6: [[SELECT3:%[0-9]+]]:_(s32) = G_SELECT [[ICMP3]](s1), [[C2]], [[C1]]		; GFX6: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]
; GFX6: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[SELECT3]]		; GFX6: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[SELECT1]]
; GFX6: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)		; GFX6: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)
; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SELECT2]]		; GFX6: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN1]]
; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)		; GFX6: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)
; GFX6: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX6: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)
; GFX6: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX6: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX6: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX6: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX6: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX6: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)		; GFX6: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)
; GFX6: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX6: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX6: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX6: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX6: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX6: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16		; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16
; GFX8: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		; GFX8: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
; GFX8: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)		; GFX8: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)		; GFX8: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0		; GFX8: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 0
; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8: [[CTLZ_ZERO_UNDEF:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV3]](s32)		; GFX8: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)
; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV3]](s32), [[C1]]		; GFX8: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C]], [[CTLZ_ZERO_UNDEF]]		; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX8: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[SELECT]](s32)
; GFX8: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV4]](s32), [[C1]]		; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV4]](s32), [[C1]]
; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]		; GFX8: [[SELECT:%[0-9]+]]:_(s32) = G_SELECT [[ICMP]](s1), [[C2]], [[C1]]
; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[SELECT1]]		; GFX8: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[SELECT]]
; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SELECT]]		; GFX8: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)
; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX8: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)
; GFX8: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX8: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX8: [[CTLZ_ZERO_UNDEF1:%[0-9]+]]:_(s32) = G_CTLZ_ZERO_UNDEF [[UV7]](s32)		; GFX8: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)
; GFX8: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(eq), [[UV7]](s32), [[C1]]		; GFX8: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]
; GFX8: [[SELECT2:%[0-9]+]]:_(s32) = G_SELECT [[ICMP2]](s1), [[C]], [[CTLZ_ZERO_UNDEF1]]		; GFX8: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN1]](s32)
; GFX8: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[SELECT2]](s32)
; GFX8: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX8: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX8: [[ICMP3:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV8]](s32), [[C1]]		; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[UV8]](s32), [[C1]]
; GFX8: [[SELECT3:%[0-9]+]]:_(s32) = G_SELECT [[ICMP3]](s1), [[C2]], [[C1]]		; GFX8: [[SELECT1:%[0-9]+]]:_(s32) = G_SELECT [[ICMP1]](s1), [[C2]], [[C1]]
; GFX8: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[SELECT3]]		; GFX8: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[SELECT1]]
; GFX8: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)		; GFX8: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)
; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[SELECT2]]		; GFX8: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN1]]
; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)		; GFX8: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)
; GFX8: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX8: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)
; GFX8: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX8: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX8: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX8: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX8: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX8: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)		; GFX8: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)
; GFX8: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX8: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX8: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX8: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX8: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX8: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
%1:_(<2 x s16>) = G_UITOFP %0		%1:_(<2 x s16>) = G_UITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgpu-ffbh-u32.mir

	# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py			# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-fast \| FileCheck %s			# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-fast \| FileCheck %s
	# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-greedy \| FileCheck %s			# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-greedy \| FileCheck %s

	---			---
	name: ffbh_u32_s			name: ffbh_u32_s
	legalized: true			legalized: true

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $sgpr0			liveins: $sgpr0

	; CHECK-LABEL: name: ffbh_u32_s			; CHECK-LABEL: name: ffbh_u32_s
	; CHECK: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0			; CHECK: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
	; CHECK: [[COPY1:%[0-9]+]]:vgpr(s32) = COPY [[COPY]](s32)			; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:sgpr(s32) = G_AMDGPU_FFBH_U32 [[COPY]](s32)
	; CHECK: [[AMDGPU_FFBH_U32_:%[0-9]+]]:vgpr(s32) = G_AMDGPU_FFBH_U32 [[COPY1]](s32)
	%0:_(s32) = COPY $sgpr0			%0:_(s32) = COPY $sgpr0
	%1:_(s32) = G_AMDGPU_FFBH_U32 %0			%1:_(s32) = G_AMDGPU_FFBH_U32 %0
	...			...

	---			---
	name: ffbh_u32_v			name: ffbh_u32_v
	legalized: true			legalized: true

	Show All 9 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgpu-ffbl-b32.mir

	# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py			# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-fast \| FileCheck %s			# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-fast \| FileCheck %s
	# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-greedy \| FileCheck %s			# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-greedy \| FileCheck %s

	---			---
	name: ffbl_b32_s			name: ffbl_b32_s
	legalized: true			legalized: true

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $sgpr0			liveins: $sgpr0

	; CHECK-LABEL: name: ffbl_b32_s			; CHECK-LABEL: name: ffbl_b32_s
	; CHECK: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0			; CHECK: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
	; CHECK: [[COPY1:%[0-9]+]]:vgpr(s32) = COPY [[COPY]](s32)			; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:sgpr(s32) = G_AMDGPU_FFBL_B32 [[COPY]](s32)
	; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:vgpr(s32) = G_AMDGPU_FFBL_B32 [[COPY1]](s32)
	%0:_(s32) = COPY $sgpr0			%0:_(s32) = COPY $sgpr0
	%1:_(s32) = G_AMDGPU_FFBL_B32 %0			%1:_(s32) = G_AMDGPU_FFBL_B32 %0
	...			...

	---			---
	name: ffbl_b32_v			name: ffbl_b32_v
	legalized: true			legalized: true

	Show All 9 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-cttz-zero-undef.mir

	Show First 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	legalized: true			legalized: true

	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $vgpr0_vgpr1			liveins: $vgpr0_vgpr1
	; CHECK-LABEL: name: cttz_zero_undef_s64_v			; CHECK-LABEL: name: cttz_zero_undef_s64_v
	; CHECK: [[COPY:%[0-9]+]]:vgpr(s64) = COPY $vgpr0_vgpr1			; CHECK: [[COPY:%[0-9]+]]:vgpr(s64) = COPY $vgpr0_vgpr1
	; CHECK: [[UV:%[0-9]+]]:vgpr(s32), [[UV1:%[0-9]+]]:vgpr(s32) = G_UNMERGE_VALUES [[COPY]](s64)			; CHECK: [[UV:%[0-9]+]]:vgpr(s32), [[UV1:%[0-9]+]]:vgpr(s32) = G_UNMERGE_VALUES [[COPY]](s64)
	; CHECK: [[AMDGPU_FFBL_B32_:%[0-9]+]]:vgpr(s32) = G_AMDGPU_FFBL_B32 [[UV]](s32)			; CHECK: [[CTTZ_ZERO_UNDEF:%[0-9]+]]:vgpr(s32) = G_CTTZ_ZERO_UNDEF [[UV]](s32)
	; CHECK: [[AMDGPU_FFBL_B32_1:%[0-9]+]]:vgpr(s32) = G_AMDGPU_FFBL_B32 [[UV1]](s32)			; CHECK: [[CTTZ_ZERO_UNDEF1:%[0-9]+]]:vgpr(s32) = G_CTTZ_ZERO_UNDEF [[UV1]](s32)
	; CHECK: [[C:%[0-9]+]]:vgpr(s32) = G_CONSTANT i32 32			; CHECK: [[C:%[0-9]+]]:vgpr(s32) = G_CONSTANT i32 32
	; CHECK: [[ADD:%[0-9]+]]:vgpr(s32) = G_ADD [[AMDGPU_FFBL_B32_1]], [[C]]			; CHECK: [[ADD:%[0-9]+]]:vgpr(s32) = G_ADD [[CTTZ_ZERO_UNDEF1]], [[C]]
	; CHECK: [[UMIN:%[0-9]+]]:vgpr(s32) = G_UMIN [[AMDGPU_FFBL_B32_]], [[ADD]]			; CHECK: [[UMIN:%[0-9]+]]:vgpr(s32) = G_UMIN [[CTTZ_ZERO_UNDEF]], [[ADD]]
	; CHECK: S_ENDPGM 0, implicit [[UMIN]](s32)			; CHECK: S_ENDPGM 0, implicit [[UMIN]](s32)
	%0:_(s64) = COPY $vgpr0_vgpr1			%0:_(s64) = COPY $vgpr0_vgpr1
	%1:_(s32) = G_CTTZ_ZERO_UNDEF %0			%1:_(s32) = G_CTTZ_ZERO_UNDEF %0
	S_ENDPGM 0, implicit %1			S_ENDPGM 0, implicit %1
	...			...

llvm/test/CodeGen/AMDGPU/ctlz.ll

	Show First 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: s_ctlz_i32:			; GFX10-GISEL-LABEL: s_ctlz_i32:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_clause 0x1			; GFX10-GISEL-NEXT: s_clause 0x1
	; GFX10-GISEL-NEXT: s_load_dword s4, s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dword s4, s[0:1], 0x2c
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: s_flbit_i32_b32 s0, s4			; GFX10-GISEL-NEXT: s_flbit_i32_b32 s0, s4
	; GFX10-GISEL-NEXT: s_cmp_eq_u32 s4, 0			; GFX10-GISEL-NEXT: s_min_u32 s0, s0, 32
	; GFX10-GISEL-NEXT: s_cselect_b32 s0, 32, s0
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[2:3]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone
	store i32 %ctlz, i32 addrspace(1)* %out, align 4			store i32 %ctlz, i32 addrspace(1)* %out, align 4
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_ctlz_i32:			; GFX10-GISEL-LABEL: v_ctlz_i32:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep, align 4			%val = load i32, i32 addrspace(1)* %in.gep, align 4
	%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone
	store i32 %ctlz, i32 addrspace(1)* %out, align 4			store i32 %ctlz, i32 addrspace(1)* %out, align 4
	ret void			ret void
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]			; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_ctlz_v2i32:			; GFX10-GISEL-LABEL: v_ctlz_v2i32:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 3, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 3, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dwordx2 v[0:1], v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dwordx2 v[0:1], v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v2, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v1
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v3, v1			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v2, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, 0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v3, 32, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]			; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr <2 x i32>, <2 x i32> addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr <2 x i32>, <2 x i32> addrspace(1)* %valptr, i32 %tid
	%val = load <2 x i32>, <2 x i32> addrspace(1)* %in.gep, align 8			%val = load <2 x i32>, <2 x i32> addrspace(1)* %in.gep, align 8
	%ctlz = call <2 x i32> @llvm.ctlz.v2i32(<2 x i32> %val, i1 false) nounwind readnone			%ctlz = call <2 x i32> @llvm.ctlz.v2i32(<2 x i32> %val, i1 false) nounwind readnone
	store <2 x i32> %ctlz, <2 x i32> addrspace(1)* %out, align 8			store <2 x i32> %ctlz, <2 x i32> addrspace(1)* %out, align 8
	ret void			ret void
	▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dwordx4 v4, v[0:3], s[0:1]			; GFX10-NEXT: global_store_dwordx4 v4, v[0:3], s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_ctlz_v4i32:			; GFX10-GISEL-LABEL: v_ctlz_v4i32:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 4, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 4, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v4, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dwordx4 v[0:3], v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dwordx4 v[0:3], v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v4, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v1
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v5, v1			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v2, v2
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v6, v2			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v3, v3
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v7, v3			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v4, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1			; GFX10-GISEL-NEXT: v_min_u32_e32 v2, 32, v2
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v4, 0			; GFX10-GISEL-NEXT: v_min_u32_e32 v3, 32, v3
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v5, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v2
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v2, v6, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v3
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v3, v7, 32, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dwordx4 v4, v[0:3], s[0:1]			; GFX10-GISEL-NEXT: global_store_dwordx4 v4, v[0:3], s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr <4 x i32>, <4 x i32> addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr <4 x i32>, <4 x i32> addrspace(1)* %valptr, i32 %tid
	%val = load <4 x i32>, <4 x i32> addrspace(1)* %in.gep, align 16			%val = load <4 x i32>, <4 x i32> addrspace(1)* %in.gep, align 16
	%ctlz = call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %val, i1 false) nounwind readnone			%ctlz = call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %val, i1 false) nounwind readnone
	store <4 x i32> %ctlz, <4 x i32> addrspace(1)* %out, align 16			store <4 x i32> %ctlz, <4 x i32> addrspace(1)* %out, align 16
	ret void			ret void
	▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: v_ctlz_i8:			; GFX10-GISEL-LABEL: v_ctlz_i8:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, 0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_ubyte v1, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_ubyte v1, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_and_b32_e32 v1, 0xff, v1			; GFX10-GISEL-NEXT: v_ffbh_u32_sdwa v1, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v2, v1			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v2, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_subrev_nc_u32_e32 v1, 24, v1			; GFX10-GISEL-NEXT: v_subrev_nc_u32_e32 v1, 24, v1
	; GFX10-GISEL-NEXT: global_store_byte v0, v1, s[0:1]			; GFX10-GISEL-NEXT: global_store_byte v0, v1, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%val = load i8, i8 addrspace(1)* %valptr			%val = load i8, i8 addrspace(1)* %valptr
	%ctlz = call i8 @llvm.ctlz.i8(i8 %val, i1 false) nounwind readnone			%ctlz = call i8 @llvm.ctlz.i8(i8 %val, i1 false) nounwind readnone
	store i8 %ctlz, i8 addrspace(1)* %out			store i8 %ctlz, i8 addrspace(1)* %out
	ret void			ret void
	}			}
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: s_ctlz_i64:			; GFX10-GISEL-LABEL: s_ctlz_i64:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_clause 0x1			; GFX10-GISEL-NEXT: s_clause 0x1
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x4c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x4c
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: s_flbit_i32_b64 s0, s[2:3]			; GFX10-GISEL-NEXT: s_flbit_i32_b64 s0, s[2:3]
	; GFX10-GISEL-NEXT: s_cmp_eq_u64 s[2:3], 0			; GFX10-GISEL-NEXT: s_min_u32 s0, s0, 64
	; GFX10-GISEL-NEXT: s_cselect_b32 s0, 64, s0
	; GFX10-GISEL-NEXT: s_bfe_u64 s[0:1], s[0:1], 0x200000			; GFX10-GISEL-NEXT: s_bfe_u64 s[0:1], s[0:1], 0x200000
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, s1			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, s1
	; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[4:5]			; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[4:5]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%ctlz = call i64 @llvm.ctlz.i64(i64 %val, i1 false)			%ctlz = call i64 @llvm.ctlz.i64(i64 %val, i1 false)
	store i64 %ctlz, i64 addrspace(1)* %out			store i64 %ctlz, i64 addrspace(1)* %out
	ret void			ret void
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: s_ctlz_i64_trunc:			; GFX10-GISEL-LABEL: s_ctlz_i64_trunc:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_clause 0x1			; GFX10-GISEL-NEXT: s_clause 0x1
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: s_flbit_i32_b64 s0, s[2:3]			; GFX10-GISEL-NEXT: s_flbit_i32_b64 s0, s[2:3]
	; GFX10-GISEL-NEXT: s_cmp_eq_u64 s[2:3], 0			; GFX10-GISEL-NEXT: s_min_u32 s0, s0, 64
	; GFX10-GISEL-NEXT: s_cselect_b32 s0, 64, s0
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[4:5]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[4:5]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%ctlz = call i64 @llvm.ctlz.i64(i64 %val, i1 false)			%ctlz = call i64 @llvm.ctlz.i64(i64 %val, i1 false)
	%trunc = trunc i64 %ctlz to i32			%trunc = trunc i64 %ctlz to i32
	store i32 %trunc, i32 addrspace(1)* %out			store i32 %trunc, i32 addrspace(1)* %out
	ret void			ret void
	}			}
	▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: v_ctlz_i64:			; GFX10-GISEL-LABEL: v_ctlz_i64:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v2, 3, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v2, 3, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dwordx2 v[0:1], v2, s[2:3]			; GFX10-GISEL-NEXT: global_load_dwordx2 v[0:1], v2, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v3, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v4, v1			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v1
	; GFX10-GISEL-NEXT: v_cmp_eq_u64_e32 vcc_lo, 0, v[0:1]			; GFX10-GISEL-NEXT: v_add_nc_u32_e64 v0, v0, 32 clamp
				; GFX10-GISEL-NEXT: v_min_u32_e32 v0, v1, v0
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_add_nc_u32_e32 v3, 32, v3			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 64, v0
	; GFX10-GISEL-NEXT: v_min_u32_e32 v3, v4, v3
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v3, 64, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]			; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid			%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr i64, i64 addrspace(1)* %out, i32 %tid			%out.gep = getelementptr i64, i64 addrspace(1)* %out, i32 %tid
	%val = load i64, i64 addrspace(1)* %in.gep			%val = load i64, i64 addrspace(1)* %in.gep
	%ctlz = call i64 @llvm.ctlz.i64(i64 %val, i1 false)			%ctlz = call i64 @llvm.ctlz.i64(i64 %val, i1 false)
	store i64 %ctlz, i64 addrspace(1)* %out.gep			store i64 %ctlz, i64 addrspace(1)* %out.gep
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v1, 3, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v1, 3, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dwordx2 v[1:2], v1, s[2:3]			; GFX10-GISEL-NEXT: global_load_dwordx2 v[1:2], v1, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v3, v1			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v1
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v4, v2			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v2, v2
	; GFX10-GISEL-NEXT: v_cmp_eq_u64_e32 vcc_lo, 0, v[1:2]			; GFX10-GISEL-NEXT: v_add_nc_u32_e64 v1, v1, 32 clamp
	; GFX10-GISEL-NEXT: v_add_nc_u32_e32 v3, 32, v3			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, v2, v1
	; GFX10-GISEL-NEXT: v_min_u32_e32 v3, v4, v3			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 64, v1
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v3, 64, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dword v0, v1, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v0, v1, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid			%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr i32, i32 addrspace(1)* %out, i32 %tid			%out.gep = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
	%val = load i64, i64 addrspace(1)* %in.gep			%val = load i64, i64 addrspace(1)* %in.gep
	%ctlz = call i64 @llvm.ctlz.i64(i64 %val, i1 false)			%ctlz = call i64 @llvm.ctlz.i64(i64 %val, i1 false)
	%trunc = trunc i64 %ctlz to i32			%trunc = trunc i64 %ctlz to i32
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
				; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, -1, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v0, -1, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep			%val = load i32, i32 addrspace(1)* %in.gep
	%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone
	%cmp = icmp eq i32 %val, 0			%cmp = icmp eq i32 %val, 0
	%sel = select i1 %cmp, i32 -1, i32 %ctlz			%sel = select i1 %cmp, i32 -1, i32 %ctlz
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v1, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_cmp_ne_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_cmp_ne_u32_e32 vcc_lo, 0, v0
				; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
	; GFX10-GISEL-NEXT: v_cndmask_b32_e32 v0, -1, v1, vcc_lo			; GFX10-GISEL-NEXT: v_cndmask_b32_e32 v0, -1, v1, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep			%val = load i32, i32 addrspace(1)* %in.gep
	%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_ctlz_i32_sel_eq_bitwidth:			; GFX10-GISEL-LABEL: v_ctlz_i32_sel_eq_bitwidth:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 32, v0			; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v0, -1, vcc_lo			; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v0, -1, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep			%val = load i32, i32 addrspace(1)* %in.gep
	%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone
	▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_ctlz_i32_sel_ne_bitwidth:			; GFX10-GISEL-LABEL: v_ctlz_i32_sel_ne_bitwidth:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_cmp_ne_u32_e32 vcc_lo, 32, v0			; GFX10-GISEL-NEXT: v_cmp_ne_u32_e32 vcc_lo, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e32 v0, -1, v0, vcc_lo			; GFX10-GISEL-NEXT: v_cndmask_b32_e32 v0, -1, v0, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep			%val = load i32, i32 addrspace(1)* %in.gep
	%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.ctlz.i32(i32 %val, i1 false) nounwind readnone
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, s3			; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, s3
	; GFX10-GISEL-NEXT: v_add_co_u32 v0, vcc_lo, v1, v0			; GFX10-GISEL-NEXT: v_add_co_u32 v0, vcc_lo, v1, v0
	; GFX10-GISEL-NEXT: v_add_co_ci_u32_e32 v1, vcc_lo, v2, v3, vcc_lo			; GFX10-GISEL-NEXT: v_add_co_ci_u32_e32 v1, vcc_lo, v2, v3, vcc_lo
	; GFX10-GISEL-NEXT: global_load_ubyte v0, v[0:1], off			; GFX10-GISEL-NEXT: global_load_ubyte v0, v[0:1], off
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_and_b32_e32 v0, 0xff, v0			; GFX10-GISEL-NEXT: v_and_b32_e32 v0, 0xff, v0
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
				; GFX10-GISEL-NEXT: v_subrev_nc_u32_e32 v1, 24, v1
				; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, -1, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_subrev_nc_u32_e32 v0, 24, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v0, -1, vcc_lo
	; GFX10-GISEL-NEXT: global_store_byte v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_byte v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%valptr.gep = getelementptr i8, i8 addrspace(1)* %valptr, i32 %tid			%valptr.gep = getelementptr i8, i8 addrspace(1)* %valptr, i32 %tid
	%val = load i8, i8 addrspace(1)* %valptr.gep			%val = load i8, i8 addrspace(1)* %valptr.gep
	%ctlz = call i8 @llvm.ctlz.i8(i8 %val, i1 false) nounwind readnone			%ctlz = call i8 @llvm.ctlz.i8(i8 %val, i1 false) nounwind readnone
	%cmp = icmp eq i8 %val, 0			%cmp = icmp eq i8 %val, 0
	%sel = select i1 %cmp, i8 -1, i8 %ctlz			%sel = select i1 %cmp, i8 -1, i8 %ctlz
	▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_ushort v1, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_ushort v1, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt_depctr 0xffe3			; GFX10-GISEL-NEXT: s_waitcnt_depctr 0xffe3
	; GFX10-GISEL-NEXT: s_mov_b32 s2, 0xffff			; GFX10-GISEL-NEXT: s_mov_b32 s2, 0xffff
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v2, v1			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v2, v1
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1			; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v2, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v2, 32, v2
	; GFX10-GISEL-NEXT: v_subrev_nc_u32_e32 v1, 16, v1			; GFX10-GISEL-NEXT: v_subrev_nc_u32_e32 v2, 16, v2
	; GFX10-GISEL-NEXT: v_and_b32_e32 v1, s2, v1			; GFX10-GISEL-NEXT: v_and_b32_e32 v2, s2, v2
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v1, s2, vcc_lo			; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v2, s2, vcc_lo
	; GFX10-GISEL-NEXT: global_store_short v0, v1, s[0:1]			; GFX10-GISEL-NEXT: global_store_short v0, v1, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%val = load i16, i16 addrspace(1)* %valptr			%val = load i16, i16 addrspace(1)* %valptr
	%ctlz = call i16 @llvm.ctlz.i16(i16 %val, i1 false) nounwind readnone			%ctlz = call i16 @llvm.ctlz.i16(i16 %val, i1 false) nounwind readnone
	%cmp = icmp eq i16 %val, 0			%cmp = icmp eq i16 %val, 0
	%sel = select i1 %cmp, i16 -1, i16 %ctlz			%sel = select i1 %cmp, i16 -1, i16 %ctlz
	store i16 %sel, i16 addrspace(1)* %out			store i16 %sel, i16 addrspace(1)* %out
	ret void			ret void
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-NEXT: s_movk_i32 s2, 0x7f			; GFX10-GISEL-NEXT: s_movk_i32 s2, 0x7f
	; GFX10-GISEL-NEXT: v_add_co_u32 v0, vcc_lo, v1, v0			; GFX10-GISEL-NEXT: v_add_co_u32 v0, vcc_lo, v1, v0
	; GFX10-GISEL-NEXT: v_add_co_ci_u32_e32 v1, vcc_lo, v2, v3, vcc_lo			; GFX10-GISEL-NEXT: v_add_co_ci_u32_e32 v1, vcc_lo, v2, v3, vcc_lo
	; GFX10-GISEL-NEXT: global_load_ubyte v0, v[0:1], off			; GFX10-GISEL-NEXT: global_load_ubyte v0, v[0:1], off
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_and_b32_e32 v0, s2, v0			; GFX10-GISEL-NEXT: v_and_b32_e32 v0, s2, v0
	; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbh_u32_e32 v1, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
				; GFX10-GISEL-NEXT: v_subrev_nc_u32_e32 v1, 25, v1
				; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 0x7f, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_subrev_nc_u32_e32 v0, 25, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v0, 0x7f, vcc_lo
	; GFX10-GISEL-NEXT: v_and_b32_e32 v0, s2, v0			; GFX10-GISEL-NEXT: v_and_b32_e32 v0, s2, v0
	; GFX10-GISEL-NEXT: global_store_byte v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_byte v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%valptr.gep = getelementptr i7, i7 addrspace(1)* %valptr, i32 %tid			%valptr.gep = getelementptr i7, i7 addrspace(1)* %valptr, i32 %tid
	%val = load i7, i7 addrspace(1)* %valptr.gep			%val = load i7, i7 addrspace(1)* %valptr.gep
	%ctlz = call i7 @llvm.ctlz.i7(i7 %val, i1 false) nounwind readnone			%ctlz = call i7 @llvm.ctlz.i7(i7 %val, i1 false) nounwind readnone
	%cmp = icmp eq i7 %val, 0			%cmp = icmp eq i7 %val, 0
	%sel = select i1 %cmp, i7 -1, i7 %ctlz			%sel = select i1 %cmp, i7 -1, i7 %ctlz
	store i7 %sel, i7 addrspace(1)* %out			store i7 %sel, i7 addrspace(1)* %out
	ret void			ret void
	}			}

llvm/test/CodeGen/AMDGPU/cttz.ll

	Show First 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: s_cttz_i32:			; GFX10-GISEL-LABEL: s_cttz_i32:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_clause 0x1			; GFX10-GISEL-NEXT: s_clause 0x1
	; GFX10-GISEL-NEXT: s_load_dword s4, s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dword s4, s[0:1], 0x2c
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: s_ff1_i32_b32 s0, s4			; GFX10-GISEL-NEXT: s_ff1_i32_b32 s0, s4
	; GFX10-GISEL-NEXT: s_cmp_eq_u32 s4, 0			; GFX10-GISEL-NEXT: s_min_u32 s0, s0, 32
	; GFX10-GISEL-NEXT: s_cselect_b32 s0, 32, s0
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[2:3]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	store i32 %cttz, i32 addrspace(1)* %out, align 4			store i32 %cttz, i32 addrspace(1)* %out, align 4
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_cttz_i32:			; GFX10-GISEL-LABEL: v_cttz_i32:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep, align 4			%val = load i32, i32 addrspace(1)* %in.gep, align 4
	%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	store i32 %cttz, i32 addrspace(1)* %out, align 4			store i32 %cttz, i32 addrspace(1)* %out, align 4
	ret void			ret void
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]			; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_cttz_v2i32:			; GFX10-GISEL-LABEL: v_cttz_v2i32:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 3, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 3, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dwordx2 v[0:1], v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dwordx2 v[0:1], v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v2, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v1
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v3, v1			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v2, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, 0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v3, 32, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]			; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr <2 x i32>, <2 x i32> addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr <2 x i32>, <2 x i32> addrspace(1)* %valptr, i32 %tid
	%val = load <2 x i32>, <2 x i32> addrspace(1)* %in.gep, align 8			%val = load <2 x i32>, <2 x i32> addrspace(1)* %in.gep, align 8
	%cttz = call <2 x i32> @llvm.cttz.v2i32(<2 x i32> %val, i1 false) nounwind readnone			%cttz = call <2 x i32> @llvm.cttz.v2i32(<2 x i32> %val, i1 false) nounwind readnone
	store <2 x i32> %cttz, <2 x i32> addrspace(1)* %out, align 8			store <2 x i32> %cttz, <2 x i32> addrspace(1)* %out, align 8
	ret void			ret void
	▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dwordx4 v4, v[0:3], s[0:1]			; GFX10-NEXT: global_store_dwordx4 v4, v[0:3], s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_cttz_v4i32:			; GFX10-GISEL-LABEL: v_cttz_v4i32:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 4, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 4, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v4, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dwordx4 v[0:3], v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dwordx4 v[0:3], v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v4, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v1
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v5, v1			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v2, v2
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v6, v2			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v3, v3
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v7, v3			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v4, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v1			; GFX10-GISEL-NEXT: v_min_u32_e32 v2, 32, v2
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v4, 0			; GFX10-GISEL-NEXT: v_min_u32_e32 v3, 32, v3
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v5, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v2
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v2, v6, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v3
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v3, v7, 32, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dwordx4 v4, v[0:3], s[0:1]			; GFX10-GISEL-NEXT: global_store_dwordx4 v4, v[0:3], s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr <4 x i32>, <4 x i32> addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr <4 x i32>, <4 x i32> addrspace(1)* %valptr, i32 %tid
	%val = load <4 x i32>, <4 x i32> addrspace(1)* %in.gep, align 16			%val = load <4 x i32>, <4 x i32> addrspace(1)* %in.gep, align 16
	%cttz = call <4 x i32> @llvm.cttz.v4i32(<4 x i32> %val, i1 false) nounwind readnone			%cttz = call <4 x i32> @llvm.cttz.v4i32(<4 x i32> %val, i1 false) nounwind readnone
	store <4 x i32> %cttz, <4 x i32> addrspace(1)* %out, align 16			store <4 x i32> %cttz, <4 x i32> addrspace(1)* %out, align 16
	ret void			ret void
	▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: s_cttz_i64:			; GFX10-GISEL-LABEL: s_cttz_i64:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_clause 0x1			; GFX10-GISEL-NEXT: s_clause 0x1
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x4c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x4c
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v2, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: s_ff1_i32_b64 s0, s[2:3]			; GFX10-GISEL-NEXT: s_ff1_i32_b64 s0, s[2:3]
	; GFX10-GISEL-NEXT: s_cmp_eq_u64 s[2:3], 0			; GFX10-GISEL-NEXT: s_min_u32 s0, s0, 64
	; GFX10-GISEL-NEXT: s_cselect_b32 s0, 64, s0
	; GFX10-GISEL-NEXT: s_bfe_u64 s[0:1], s[0:1], 0x200000			; GFX10-GISEL-NEXT: s_bfe_u64 s[0:1], s[0:1], 0x200000
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, s1			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, s1
	; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[4:5]			; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[4:5]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%cttz = call i64 @llvm.cttz.i64(i64 %val, i1 false)			%cttz = call i64 @llvm.cttz.i64(i64 %val, i1 false)
	store i64 %cttz, i64 addrspace(1)* %out			store i64 %cttz, i64 addrspace(1)* %out
	ret void			ret void
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: s_cttz_i64_trunc:			; GFX10-GISEL-LABEL: s_cttz_i64_trunc:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_clause 0x1			; GFX10-GISEL-NEXT: s_clause 0x1
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: s_ff1_i32_b64 s0, s[2:3]			; GFX10-GISEL-NEXT: s_ff1_i32_b64 s0, s[2:3]
	; GFX10-GISEL-NEXT: s_cmp_eq_u64 s[2:3], 0			; GFX10-GISEL-NEXT: s_min_u32 s0, s0, 64
	; GFX10-GISEL-NEXT: s_cselect_b32 s0, 64, s0
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v0, s0
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[4:5]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[4:5]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%cttz = call i64 @llvm.cttz.i64(i64 %val, i1 false)			%cttz = call i64 @llvm.cttz.i64(i64 %val, i1 false)
	%trunc = trunc i64 %cttz to i32			%trunc = trunc i64 %cttz to i32
	store i32 %trunc, i32 addrspace(1)* %out			store i32 %trunc, i32 addrspace(1)* %out
	ret void			ret void
	}			}
	▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-LABEL: v_cttz_i64:			; GFX10-GISEL-LABEL: v_cttz_i64:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v2, 3, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v2, 3, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dwordx2 v[0:1], v2, s[2:3]			; GFX10-GISEL-NEXT: global_load_dwordx2 v[0:1], v2, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v3, v1			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v1
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v4, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u64_e32 vcc_lo, 0, v[0:1]			; GFX10-GISEL-NEXT: v_add_nc_u32_e64 v1, v1, 32 clamp
				; GFX10-GISEL-NEXT: v_min_u32_e32 v0, v0, v1
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_add_nc_u32_e32 v3, 32, v3			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 64, v0
	; GFX10-GISEL-NEXT: v_min_u32_e32 v3, v4, v3
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v3, 64, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]			; GFX10-GISEL-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid			%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr i64, i64 addrspace(1)* %out, i32 %tid			%out.gep = getelementptr i64, i64 addrspace(1)* %out, i32 %tid
	%val = load i64, i64 addrspace(1)* %in.gep			%val = load i64, i64 addrspace(1)* %in.gep
	%cttz = call i64 @llvm.cttz.i64(i64 %val, i1 false)			%cttz = call i64 @llvm.cttz.i64(i64 %val, i1 false)
	store i64 %cttz, i64 addrspace(1)* %out.gep			store i64 %cttz, i64 addrspace(1)* %out.gep
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v1, 3, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v1, 3, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dwordx2 v[1:2], v1, s[2:3]			; GFX10-GISEL-NEXT: global_load_dwordx2 v[1:2], v1, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v3, v2			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v2, v2
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v4, v1			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v1
	; GFX10-GISEL-NEXT: v_cmp_eq_u64_e32 vcc_lo, 0, v[1:2]			; GFX10-GISEL-NEXT: v_add_nc_u32_e64 v2, v2, 32 clamp
	; GFX10-GISEL-NEXT: v_add_nc_u32_e32 v3, 32, v3			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, v1, v2
	; GFX10-GISEL-NEXT: v_min_u32_e32 v3, v4, v3			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 64, v1
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v3, 64, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dword v0, v1, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v0, v1, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid			%in.gep = getelementptr i64, i64 addrspace(1)* %in, i32 %tid
	%out.gep = getelementptr i32, i32 addrspace(1)* %out, i32 %tid			%out.gep = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
	%val = load i64, i64 addrspace(1)* %in.gep			%val = load i64, i64 addrspace(1)* %in.gep
	%cttz = call i64 @llvm.cttz.i64(i64 %val, i1 false)			%cttz = call i64 @llvm.cttz.i64(i64 %val, i1 false)
	%trunc = trunc i64 %cttz to i32			%trunc = trunc i64 %cttz to i32
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo			; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
				; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, -1, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v0, -1, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep			%val = load i32, i32 addrspace(1)* %in.gep
	%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	%cmp = icmp eq i32 %val, 0			%cmp = icmp eq i32 %val, 0
	%sel = select i1 %cmp, i32 -1, i32 %cttz			%sel = select i1 %cmp, i32 -1, i32 %cttz
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v1, v1, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_cmp_ne_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_cmp_ne_u32_e32 vcc_lo, 0, v0
				; GFX10-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
	; GFX10-GISEL-NEXT: v_cndmask_b32_e32 v0, -1, v1, vcc_lo			; GFX10-GISEL-NEXT: v_cndmask_b32_e32 v0, -1, v1, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0			; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep			%val = load i32, i32 addrspace(1)* %in.gep
	%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_cttz_i32_sel_eq_bitwidth:			; GFX10-GISEL-LABEL: v_cttz_i32_sel_eq_bitwidth:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 32, v0			; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v0, -1, vcc_lo			; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v0, -1, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep			%val = load i32, i32 addrspace(1)* %in.gep
	%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	;			;
	; GFX10-GISEL-LABEL: v_cttz_i32_sel_ne_bitwidth:			; GFX10-GISEL-LABEL: v_cttz_i32_sel_ne_bitwidth:
	; GFX10-GISEL: ; %bb.0:			; GFX10-GISEL: ; %bb.0:
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c			; GFX10-GISEL-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x2c
	; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GFX10-GISEL-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24			; GFX10-GISEL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
				; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]			; GFX10-GISEL-NEXT: global_load_dword v0, v0, s[2:3]
	; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX10-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v1, v0			; GFX10-GISEL-NEXT: v_ffbl_b32_e32 v0, v0
	; GFX10-GISEL-NEXT: v_cmp_eq_u32_e32 vcc_lo, 0, v0			; GFX10-GISEL-NEXT: v_min_u32_e32 v0, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e64 v0, v1, 32, vcc_lo
	; GFX10-GISEL-NEXT: v_mov_b32_e32 v1, 0
	; GFX10-GISEL-NEXT: v_cmp_ne_u32_e32 vcc_lo, 32, v0			; GFX10-GISEL-NEXT: v_cmp_ne_u32_e32 vcc_lo, 32, v0
	; GFX10-GISEL-NEXT: v_cndmask_b32_e32 v0, -1, v0, vcc_lo			; GFX10-GISEL-NEXT: v_cndmask_b32_e32 v0, -1, v0, vcc_lo
	; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]			; GFX10-GISEL-NEXT: global_store_dword v1, v0, s[0:1]
	; GFX10-GISEL-NEXT: s_endpgm			; GFX10-GISEL-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid			%in.gep = getelementptr i32, i32 addrspace(1)* %valptr, i32 %tid
	%val = load i32, i32 addrspace(1)* %in.gep			%val = load i32, i32 addrspace(1)* %in.gep
	%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%cttz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	▲ Show 20 Lines • Show All 322 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/cttz_zero_undef.ll

	Show First 20 Lines • Show All 1,192 Lines • ▼ Show 20 Lines
	; GFX9-GISEL-NEXT: v_and_b32_e32 v3, s0, v3			; GFX9-GISEL-NEXT: v_and_b32_e32 v3, s0, v3
	; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-GISEL-NEXT: v_and_b32_e32 v4, s0, v4			; GFX9-GISEL-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX9-GISEL-NEXT: v_and_or_b32 v1, v1, s0, v2			; GFX9-GISEL-NEXT: v_and_or_b32 v1, v1, s0, v2
	; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v2, 16, v3			; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v2, 16, v3
	; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v3, 24, v4			; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v3, 24, v4
	; GFX9-GISEL-NEXT: v_or3_b32 v1, v1, v2, v3			; GFX9-GISEL-NEXT: v_or3_b32 v1, v1, v2, v3
	; GFX9-GISEL-NEXT: v_ffbl_b32_e32 v2, v1			; GFX9-GISEL-NEXT: v_ffbl_b32_e32 v2, v1
				; GFX9-GISEL-NEXT: v_min_u32_e32 v2, 32, v2
	; GFX9-GISEL-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1			; GFX9-GISEL-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
	; GFX9-GISEL-NEXT: v_cndmask_b32_e64 v1, v2, 32, vcc			; GFX9-GISEL-NEXT: v_cndmask_b32_e64 v1, v2, -1, vcc
	; GFX9-GISEL-NEXT: v_cndmask_b32_e64 v1, v1, -1, vcc
	; GFX9-GISEL-NEXT: global_store_dword v0, v1, s[2:3]			; GFX9-GISEL-NEXT: global_store_dword v0, v1, s[2:3]
	; GFX9-GISEL-NEXT: s_endpgm			; GFX9-GISEL-NEXT: s_endpgm
	%val = load i32, i32 addrspace(1)* %arrayidx, align 1			%val = load i32, i32 addrspace(1)* %arrayidx, align 1
	%ctlz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	%cmp = icmp eq i32 %val, 0			%cmp = icmp eq i32 %val, 0
	%sel = select i1 %cmp, i32 -1, i32 %ctlz			%sel = select i1 %cmp, i32 -1, i32 %ctlz
	store i32 %sel, i32 addrspace(1)* %out			store i32 %sel, i32 addrspace(1)* %out
	ret void			ret void
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; GFX9-GISEL-NEXT: v_and_b32_e32 v3, s0, v3			; GFX9-GISEL-NEXT: v_and_b32_e32 v3, s0, v3
	; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-GISEL-NEXT: v_and_b32_e32 v4, s0, v4			; GFX9-GISEL-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX9-GISEL-NEXT: v_and_or_b32 v1, v1, s0, v2			; GFX9-GISEL-NEXT: v_and_or_b32 v1, v1, s0, v2
	; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v2, 16, v3			; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v2, 16, v3
	; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v3, 24, v4			; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v3, 24, v4
	; GFX9-GISEL-NEXT: v_or3_b32 v1, v1, v2, v3			; GFX9-GISEL-NEXT: v_or3_b32 v1, v1, v2, v3
	; GFX9-GISEL-NEXT: v_ffbl_b32_e32 v2, v1			; GFX9-GISEL-NEXT: v_ffbl_b32_e32 v2, v1
	; GFX9-GISEL-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1			; GFX9-GISEL-NEXT: v_min_u32_e32 v2, 32, v2
	; GFX9-GISEL-NEXT: v_cndmask_b32_e64 v2, v2, 32, vcc
	; GFX9-GISEL-NEXT: v_cmp_ne_u32_e32 vcc, 0, v1			; GFX9-GISEL-NEXT: v_cmp_ne_u32_e32 vcc, 0, v1
	; GFX9-GISEL-NEXT: v_cndmask_b32_e32 v1, -1, v2, vcc			; GFX9-GISEL-NEXT: v_cndmask_b32_e32 v1, -1, v2, vcc
	; GFX9-GISEL-NEXT: global_store_dword v0, v1, s[2:3]			; GFX9-GISEL-NEXT: global_store_dword v0, v1, s[2:3]
	; GFX9-GISEL-NEXT: s_endpgm			; GFX9-GISEL-NEXT: s_endpgm
	%val = load i32, i32 addrspace(1)* %arrayidx, align 1			%val = load i32, i32 addrspace(1)* %arrayidx, align 1
	%ctlz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	%cmp = icmp ne i32 %val, 0			%cmp = icmp ne i32 %val, 0
	%sel = select i1 %cmp, i32 %ctlz, i32 -1			%sel = select i1 %cmp, i32 %ctlz, i32 -1
	▲ Show 20 Lines • Show All 116 Lines • ▼ Show 20 Lines
	; GFX9-GISEL-NEXT: s_waitcnt vmcnt(1)			; GFX9-GISEL-NEXT: s_waitcnt vmcnt(1)
	; GFX9-GISEL-NEXT: v_and_b32_e32 v3, s0, v3			; GFX9-GISEL-NEXT: v_and_b32_e32 v3, s0, v3
	; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0)			; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-GISEL-NEXT: v_and_b32_e32 v4, s0, v4			; GFX9-GISEL-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX9-GISEL-NEXT: v_and_or_b32 v1, v1, s0, v2			; GFX9-GISEL-NEXT: v_and_or_b32 v1, v1, s0, v2
	; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v2, 16, v3			; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v2, 16, v3
	; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v3, 24, v4			; GFX9-GISEL-NEXT: v_lshlrev_b32_e32 v3, 24, v4
	; GFX9-GISEL-NEXT: v_or3_b32 v1, v1, v2, v3			; GFX9-GISEL-NEXT: v_or3_b32 v1, v1, v2, v3
	; GFX9-GISEL-NEXT: v_ffbl_b32_e32 v2, v1			; GFX9-GISEL-NEXT: v_ffbl_b32_e32 v1, v1
	; GFX9-GISEL-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1			; GFX9-GISEL-NEXT: v_min_u32_e32 v1, 32, v1
	; GFX9-GISEL-NEXT: v_cndmask_b32_e64 v1, v2, 32, vcc
	; GFX9-GISEL-NEXT: v_cmp_ne_u32_e32 vcc, 32, v1			; GFX9-GISEL-NEXT: v_cmp_ne_u32_e32 vcc, 32, v1
	; GFX9-GISEL-NEXT: v_cndmask_b32_e32 v1, -1, v1, vcc			; GFX9-GISEL-NEXT: v_cndmask_b32_e32 v1, -1, v1, vcc
	; GFX9-GISEL-NEXT: global_store_dword v0, v1, s[2:3]			; GFX9-GISEL-NEXT: global_store_dword v0, v1, s[2:3]
	; GFX9-GISEL-NEXT: s_endpgm			; GFX9-GISEL-NEXT: s_endpgm
	%val = load i32, i32 addrspace(1)* %arrayidx, align 1			%val = load i32, i32 addrspace(1)* %arrayidx, align 1
	%ctlz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone			%ctlz = call i32 @llvm.cttz.i32(i32 %val, i1 false) nounwind readnone
	%cmp = icmp ne i32 %ctlz, 32			%cmp = icmp ne i32 %ctlz, 32
	%sel = select i1 %cmp, i32 %ctlz, i32 -1			%sel = select i1 %cmp, i32 %ctlz, i32 -1
	▲ Show 20 Lines • Show All 194 Lines • Show Last 20 Lines