This is an archive of the discontinued LLVM Phabricator instance.

%3:_(<2 x s32>), %4:_(<2 x s32>) = G_UNMERGE_VALUES %0:_(<2 x s64>)
%5:_(<2 x s32>), %6:_(<2 x s32>) = G_UNMERGE_VALUES %1:_(<2 x s64>)
%7:_(<2 x s32>) = G_MUL %3:_, %5:_
%8:_(<2 x s32>) = G_MUL %4:_, %5:_
%9:_(<2 x s32>) = G_MUL %3:_, %6:_
%10:_(<2 x s32>) = G_UMULH %3:_, %5:_
%11:_(<2 x s32>), %12:_(<2 x s1>) = G_UADDO %8:_, %9:_
%13:_(<2 x s32>) = G_ZEXT %12:_(<2 x s1>)
%14:_(<2 x s32>), %15:_(<2 x s1>) = G_UADDO %11:_, %10:_
%16:_(<2 x s32>) = G_ZEXT %15:_(<2 x s1>)
%17:_(<2 x s32>) = G_ADD %13:_, %16:_
%18:_(<2 x s32>) = G_MUL %4:_, %6:_
%19:_(<2 x s32>) = G_UMULH %4:_, %5:_
%20:_(<2 x s32>) = G_UMULH %3:_, %6:_
%21:_(<2 x s32>), %22:_(<2 x s1>) = G_UADDO %18:_, %19:_
%23:_(<2 x s32>) = G_ZEXT %22:_(<2 x s1>)
%24:_(<2 x s32>), %25:_(<2 x s1>) = G_UADDO %21:_, %20:_
%26:_(<2 x s32>) = G_ZEXT %25:_(<2 x s1>)
%27:_(<2 x s32>) = G_ADD %23:_, %26:_
%28:_(<2 x s32>), %29:_(<2 x s1>) = G_UADDO %24:_, %17:_
%30:_(<2 x s32>) = G_ZEXT %29:_(<2 x s1>)
%31:_(<2 x s32>) = G_ADD %27:_, %30:_
%32:_(<2 x s32>) = G_UMULH %4:_, %6:_
%33:_(<2 x s32>) = G_ADD %32:_, %31:_

we need a way to merge %28:_(<2 x s32>) (a vector of the low parts of each element of the result) and %33:_(<2 x s32>) (same for the high parts) into a <2 x s64> result. I don't know how to do that. G_MERGE_VALUES only works on scalars, though I don't see why it couldn't be extended to work element-wise on vectors that all have the same length. And I can't see any existing helper functions in LegalizerHelper.cpp that do what I want either.

Afaik %3:_(<2 x s32>), %4:_(<2 x s32>) = G_UNMERGE_VALUES %0:_(<2 x s64>) is not yet defined to work like that and should probably be forbidden to make such instruction in builder. Only allow scalar split and vector split to elements or sub-vectors.
Desired unmerge works if done step by step:

%5:_(s64), %6:_(s64) = G_UNMERGE_VALUES %0:_(<2 x s64>)
%7:_(s32), %8:_(s32) = G_UNMERGE_VALUES %5:_(s64)
%9:_(s32), %10:_(s32) = G_UNMERGE_VALUES %6:_(s64)
%3:_(<2 x s32>) = G_BUILD_VECTOR %5:_(s64), %7:_(s32)
%4:_(<2 x s32>) = G_BUILD_VECTOR %6:_(s64), %8:_(s32)

Similar for merge: merge s64 elements first then build <2 x s64> vector.
But <2 x s32> instructions will be scalarized, bit shift packing into <2 x s16> is most probably slower.
Why not go with scalarize at the start?

Why not go with scalarize at the start?

Good idea. I will abandon this and change AMDGPU's legalization rules instead.

foad abandoned this revision.Oct 5 2021, 2:33 AM

In D110926#3041963, @Petar.Avramovic wrote:

Afaik %3:_(<2 x s32>), %4:_(<2 x s32>) = G_UNMERGE_VALUES %0:_(<2 x s64>) is not yet defined to work like that and should probably be forbidden to make such instruction in builder. Only allow scalar split and vector split to elements or sub-vectors.

Ugh, it is apprently legal but it means something different. See comments in D111132.

Don't we need this even if AMDGPU scalarizes first?

In D110926#3073752, @arsenm wrote:

Don't we need this even if AMDGPU scalarizes first?

Why? For other targets? Maybe, but I'm not motivated to work on it until there's a concrete need for it.

In D110926#3074676, @foad wrote:

In D110926#3073752, @arsenm wrote:

Don't we need this even if AMDGPU scalarizes first?

Why? For other targets? Maybe, but I'm not motivated to work on it until there's a concrete need for it.

Yes. Plus I'm not entirely comfortable with legalization only working if you have the magic ordering of legalizer rules. I've lost a lot of time fighting legalizer rule ordering issues

My preferred way of implementing this would be to extend G_MERGE_VALUES so that it works elementwise on vectors:

%2:_(<3 x s64>) = G_MERGE_VALUES %0:_(<3 x s32>), %1:_(<3 x s32>) // %0 is three low halves, %1 is three high halves

But that requires G_UNMERGE_VALUES to be able to do the converse:

%1:_(<3 x s32>), %2:_(<3 x s32>) = G_UNMERGE_VALUES %0:_(<3 x s64>)  // %1 is three low halves, %2 is three high halves

But this was already allowed and apparently meant something different (a G_BITCAST plus the converse of G_CONCAT_VECTORS?) which is how I got sidetracked into D111132.

Revision Contents

Path

Size

llvm/

lib/

CodeGen/

GlobalISel/

LegalizerHelper.cpp

26 lines

test/

CodeGen/

AMDGPU/

GlobalISel/

legalize-umulh.mir

166 lines

legalize-umulo.mir

180 lines

Diff 376963

llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,180 Lines • ▼ Show 20 Lines	void LegalizerHelper::multiplyRegisters(SmallVectorImpl<Register> &DstRegs,
unsigned DstIdx = 0; // Low bits of the result.		unsigned DstIdx = 0; // Low bits of the result.
Register FactorSum =		Register FactorSum =
B.buildMul(NarrowTy, Src1Regs[DstIdx], Src2Regs[DstIdx]).getReg(0);		B.buildMul(NarrowTy, Src1Regs[DstIdx], Src2Regs[DstIdx]).getReg(0);
DstRegs[DstIdx] = FactorSum;		DstRegs[DstIdx] = FactorSum;

unsigned CarrySumPrevDstIdx;		unsigned CarrySumPrevDstIdx;
SmallVector<Register, 4> Factors;		SmallVector<Register, 4> Factors;

		LLT BoolTy = NarrowTy.changeElementSize(1);

for (DstIdx = 1; DstIdx < DstParts; DstIdx++) {		for (DstIdx = 1; DstIdx < DstParts; DstIdx++) {
// Collect low parts of muls for DstIdx.		// Collect low parts of muls for DstIdx.
for (unsigned i = DstIdx + 1 < SrcParts ? 0 : DstIdx - SrcParts + 1;		for (unsigned i = DstIdx + 1 < SrcParts ? 0 : DstIdx - SrcParts + 1;
i <= std::min(DstIdx, SrcParts - 1); ++i) {		i <= std::min(DstIdx, SrcParts - 1); ++i) {
MachineInstrBuilder Mul =		MachineInstrBuilder Mul =
B.buildMul(NarrowTy, Src1Regs[DstIdx - i], Src2Regs[i]);		B.buildMul(NarrowTy, Src1Regs[DstIdx - i], Src2Regs[i]);
Factors.push_back(Mul.getReg(0));		Factors.push_back(Mul.getReg(0));
}		}
// Collect high parts of muls from previous DstIdx.		// Collect high parts of muls from previous DstIdx.
for (unsigned i = DstIdx < SrcParts ? 0 : DstIdx - SrcParts;		for (unsigned i = DstIdx < SrcParts ? 0 : DstIdx - SrcParts;
i <= std::min(DstIdx - 1, SrcParts - 1); ++i) {		i <= std::min(DstIdx - 1, SrcParts - 1); ++i) {
MachineInstrBuilder Umulh =		MachineInstrBuilder Umulh =
B.buildUMulH(NarrowTy, Src1Regs[DstIdx - 1 - i], Src2Regs[i]);		B.buildUMulH(NarrowTy, Src1Regs[DstIdx - 1 - i], Src2Regs[i]);
Factors.push_back(Umulh.getReg(0));		Factors.push_back(Umulh.getReg(0));
}		}
// Add CarrySum from additions calculated for previous DstIdx.		// Add CarrySum from additions calculated for previous DstIdx.
if (DstIdx != 1) {		if (DstIdx != 1) {
Factors.push_back(CarrySumPrevDstIdx);		Factors.push_back(CarrySumPrevDstIdx);
}		}

Register CarrySum;		Register CarrySum;
// Add all factors and accumulate all carries into CarrySum.		// Add all factors and accumulate all carries into CarrySum.
if (DstIdx != DstParts - 1) {		if (DstIdx != DstParts - 1) {
MachineInstrBuilder Uaddo =		MachineInstrBuilder Uaddo =
B.buildUAddo(NarrowTy, LLT::scalar(1), Factors[0], Factors[1]);		B.buildUAddo(NarrowTy, BoolTy, Factors[0], Factors[1]);
FactorSum = Uaddo.getReg(0);		FactorSum = Uaddo.getReg(0);
CarrySum = B.buildZExt(NarrowTy, Uaddo.getReg(1)).getReg(0);		CarrySum = B.buildZExt(NarrowTy, Uaddo.getReg(1)).getReg(0);
for (unsigned i = 2; i < Factors.size(); ++i) {		for (unsigned i = 2; i < Factors.size(); ++i) {
MachineInstrBuilder Uaddo =		MachineInstrBuilder Uaddo =
B.buildUAddo(NarrowTy, LLT::scalar(1), FactorSum, Factors[i]);		B.buildUAddo(NarrowTy, BoolTy, FactorSum, Factors[i]);
FactorSum = Uaddo.getReg(0);		FactorSum = Uaddo.getReg(0);
MachineInstrBuilder Carry = B.buildZExt(NarrowTy, Uaddo.getReg(1));		MachineInstrBuilder Carry = B.buildZExt(NarrowTy, Uaddo.getReg(1));
CarrySum = B.buildAdd(NarrowTy, CarrySum, Carry).getReg(0);		CarrySum = B.buildAdd(NarrowTy, CarrySum, Carry).getReg(0);
}		}
} else {		} else {
// Since value for the next index is not calculated, neither is CarrySum.		// Since value for the next index is not calculated, neither is CarrySum.
FactorSum = B.buildAdd(NarrowTy, Factors[0], Factors[1]).getReg(0);		FactorSum = B.buildAdd(NarrowTy, Factors[0], Factors[1]).getReg(0);
for (unsigned i = 2; i < Factors.size(); ++i)		for (unsigned i = 2; i < Factors.size(); ++i)
▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines

LegalizerHelper::LegalizeResult		LegalizerHelper::LegalizeResult
LegalizerHelper::narrowScalarMul(MachineInstr &MI, LLT NarrowTy) {		LegalizerHelper::narrowScalarMul(MachineInstr &MI, LLT NarrowTy) {
Register DstReg = MI.getOperand(0).getReg();		Register DstReg = MI.getOperand(0).getReg();
Register Src1 = MI.getOperand(1).getReg();		Register Src1 = MI.getOperand(1).getReg();
Register Src2 = MI.getOperand(2).getReg();		Register Src2 = MI.getOperand(2).getReg();

LLT Ty = MRI.getType(DstReg);		LLT Ty = MRI.getType(DstReg);
if (Ty.isVector())
return UnableToLegalize;

unsigned SrcSize = MRI.getType(Src1).getSizeInBits();		unsigned Size = Ty.getScalarSizeInBits();
unsigned DstSize = Ty.getSizeInBits();		unsigned NarrowSize = NarrowTy.getScalarSizeInBits();
unsigned NarrowSize = NarrowTy.getSizeInBits();		if (Size % NarrowSize != 0)
if (DstSize % NarrowSize != 0 \|\| SrcSize % NarrowSize != 0)
return UnableToLegalize;		return UnableToLegalize;

unsigned NumDstParts = DstSize / NarrowSize;		unsigned NumParts = Size / NarrowSize;
unsigned NumSrcParts = SrcSize / NarrowSize;
bool IsMulHigh = MI.getOpcode() == TargetOpcode::G_UMULH;		bool IsMulHigh = MI.getOpcode() == TargetOpcode::G_UMULH;
unsigned DstTmpParts = NumDstParts * (IsMulHigh ? 2 : 1);		unsigned DstTmpParts = NumParts * (IsMulHigh ? 2 : 1);

SmallVector<Register, 2> Src1Parts, Src2Parts;		SmallVector<Register, 2> Src1Parts, Src2Parts;
SmallVector<Register, 2> DstTmpRegs(DstTmpParts);		SmallVector<Register, 2> DstTmpRegs(DstTmpParts);
extractParts(Src1, NarrowTy, NumSrcParts, Src1Parts);		extractParts(Src1, NarrowTy, NumParts, Src1Parts);
extractParts(Src2, NarrowTy, NumSrcParts, Src2Parts);		extractParts(Src2, NarrowTy, NumParts, Src2Parts);
multiplyRegisters(DstTmpRegs, Src1Parts, Src2Parts, NarrowTy);		multiplyRegisters(DstTmpRegs, Src1Parts, Src2Parts, NarrowTy);

// Take only high half of registers if this is high mul.		// Take only high half of registers if this is high mul.
ArrayRef<Register> DstRegs(		ArrayRef<Register> DstRegs(
IsMulHigh ? &DstTmpRegs[DstTmpParts / 2] : &DstTmpRegs[0], NumDstParts);		IsMulHigh ? &DstTmpRegs[DstTmpParts / 2] : &DstTmpRegs[0], NumParts);
MIRBuilder.buildMerge(DstReg, DstRegs);		MIRBuilder.buildMerge(DstReg, DstRegs);
MI.eraseFromParent();		MI.eraseFromParent();
return Legalized;		return Legalized;
}		}

LegalizerHelper::LegalizeResult		LegalizerHelper::LegalizeResult
LegalizerHelper::narrowScalarFPTOI(MachineInstr &MI, unsigned TypeIdx,		LegalizerHelper::narrowScalarFPTOI(MachineInstr &MI, unsigned TypeIdx,
LLT NarrowTy) {		LLT NarrowTy) {
▲ Show 20 Lines • Show All 2,622 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-umulh.mir

# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py		# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
# RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=fiji -global-isel-abort=0 -O0 -run-pass=legalizer %s -o - \| FileCheck %s --check-prefix=GFX8		# RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=fiji -O0 -run-pass=legalizer %s -o - \| FileCheck %s --check-prefix=GFX8
# RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=gfx906 -global-isel-abort=0 -O0 -run-pass=legalizer %s -o - \| FileCheck %s --check-prefix=GFX9		# RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=gfx906 -O0 -run-pass=legalizer %s -o - \| FileCheck %s --check-prefix=GFX9

---		---
name: test_umulh_s32		name: test_umulh_s32
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0, $vgpr1		liveins: $vgpr0, $vgpr1

; GFX8-LABEL: name: test_umulh_s32		; GFX8-LABEL: name: test_umulh_s32
▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines	bb.0:
; GFX9: $vgpr0_vgpr1 = COPY [[MV]](s64)		; GFX9: $vgpr0_vgpr1 = COPY [[MV]](s64)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s64) = COPY $vgpr2_vgpr3		%1:_(s64) = COPY $vgpr2_vgpr3
%2:_(s64) = G_UMULH %0, %1		%2:_(s64) = G_UMULH %0, %1
$vgpr0_vgpr1 = COPY %2		$vgpr0_vgpr1 = COPY %2
...		...

---		---
		name: test_umulh_v2s64
		body: \|
		bb.0:
		liveins: $vgpr0_vgpr1_vgpr2_vgpr3, $vgpr4_vgpr5_vgpr6_vgpr7

		; GFX8-LABEL: name: test_umulh_v2s64
		; GFX8: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
		; GFX8: [[COPY1:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr4_vgpr5_vgpr6_vgpr7
		; GFX8: [[UV:%[0-9]+]]:_(<2 x s32>), [[UV1:%[0-9]+]]:_(<2 x s32>) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
		; GFX8: [[UV2:%[0-9]+]]:_(<2 x s32>), [[UV3:%[0-9]+]]:_(<2 x s32>) = G_UNMERGE_VALUES [[COPY1]](<2 x s64>)
		; GFX8: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](<2 x s32>)
		; GFX8: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](<2 x s32>)
		; GFX8: [[MUL:%[0-9]+]]:_(s32) = G_MUL [[UV4]], [[UV6]]
		; GFX8: [[MUL1:%[0-9]+]]:_(s32) = G_MUL [[UV5]], [[UV7]]
		; GFX8: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](<2 x s32>)
		; GFX8: [[UV10:%[0-9]+]]:_(s32), [[UV11:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](<2 x s32>)
		; GFX8: [[MUL2:%[0-9]+]]:_(s32) = G_MUL [[UV8]], [[UV10]]
		; GFX8: [[MUL3:%[0-9]+]]:_(s32) = G_MUL [[UV9]], [[UV11]]
		; GFX8: [[UV12:%[0-9]+]]:_(s32), [[UV13:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](<2 x s32>)
		; GFX8: [[UV14:%[0-9]+]]:_(s32), [[UV15:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](<2 x s32>)
		; GFX8: [[UMULH:%[0-9]+]]:_(s32) = G_UMULH [[UV12]], [[UV14]]
		; GFX8: [[UMULH1:%[0-9]+]]:_(s32) = G_UMULH [[UV13]], [[UV15]]
		; GFX8: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[MUL]], [[MUL2]]
		; GFX8: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[MUL1]], [[MUL3]]
		; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD]](s32), [[MUL2]]
		; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD1]](s32), [[MUL3]]
		; GFX8: [[ADD2:%[0-9]+]]:_(s32) = G_ADD [[ADD]], [[UMULH]]
		; GFX8: [[ADD3:%[0-9]+]]:_(s32) = G_ADD [[ADD1]], [[UMULH1]]
		; GFX8: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD2]](s32), [[UMULH]]
		; GFX8: [[ICMP3:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD3]](s32), [[UMULH1]]
		; GFX8: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP]](s1)
		; GFX8: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP1]](s1)
		; GFX8: [[ZEXT2:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP2]](s1)
		; GFX8: [[ZEXT3:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP3]](s1)
		; GFX8: [[ADD4:%[0-9]+]]:_(s32) = G_ADD [[ZEXT]], [[ZEXT2]]
		; GFX8: [[ADD5:%[0-9]+]]:_(s32) = G_ADD [[ZEXT1]], [[ZEXT3]]
		; GFX8: [[UV16:%[0-9]+]]:_(s32), [[UV17:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](<2 x s32>)
		; GFX8: [[UV18:%[0-9]+]]:_(s32), [[UV19:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](<2 x s32>)
		; GFX8: [[MUL4:%[0-9]+]]:_(s32) = G_MUL [[UV16]], [[UV18]]
		; GFX8: [[MUL5:%[0-9]+]]:_(s32) = G_MUL [[UV17]], [[UV19]]
		; GFX8: [[UV20:%[0-9]+]]:_(s32), [[UV21:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](<2 x s32>)
		; GFX8: [[UV22:%[0-9]+]]:_(s32), [[UV23:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](<2 x s32>)
		; GFX8: [[UMULH2:%[0-9]+]]:_(s32) = G_UMULH [[UV20]], [[UV22]]
		; GFX8: [[UMULH3:%[0-9]+]]:_(s32) = G_UMULH [[UV21]], [[UV23]]
		; GFX8: [[UV24:%[0-9]+]]:_(s32), [[UV25:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](<2 x s32>)
		; GFX8: [[UV26:%[0-9]+]]:_(s32), [[UV27:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](<2 x s32>)
		; GFX8: [[UMULH4:%[0-9]+]]:_(s32) = G_UMULH [[UV24]], [[UV26]]
		; GFX8: [[UMULH5:%[0-9]+]]:_(s32) = G_UMULH [[UV25]], [[UV27]]
		; GFX8: [[ADD6:%[0-9]+]]:_(s32) = G_ADD [[MUL4]], [[UMULH2]]
		; GFX8: [[ADD7:%[0-9]+]]:_(s32) = G_ADD [[MUL5]], [[UMULH3]]
		; GFX8: [[ICMP4:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD6]](s32), [[UMULH2]]
		; GFX8: [[ICMP5:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD7]](s32), [[UMULH3]]
		; GFX8: [[ADD8:%[0-9]+]]:_(s32) = G_ADD [[ADD6]], [[UMULH4]]
		; GFX8: [[ADD9:%[0-9]+]]:_(s32) = G_ADD [[ADD7]], [[UMULH5]]
		; GFX8: [[ICMP6:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD8]](s32), [[UMULH4]]
		; GFX8: [[ICMP7:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD9]](s32), [[UMULH5]]
		; GFX8: [[ZEXT4:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP4]](s1)
		; GFX8: [[ZEXT5:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP5]](s1)
		; GFX8: [[ZEXT6:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP6]](s1)
		; GFX8: [[ZEXT7:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP7]](s1)
		; GFX8: [[ADD10:%[0-9]+]]:_(s32) = G_ADD [[ZEXT4]], [[ZEXT6]]
		; GFX8: [[ADD11:%[0-9]+]]:_(s32) = G_ADD [[ZEXT5]], [[ZEXT7]]
		; GFX8: [[ADD12:%[0-9]+]]:_(s32) = G_ADD [[ADD8]], [[ADD4]]
		; GFX8: [[ADD13:%[0-9]+]]:_(s32) = G_ADD [[ADD9]], [[ADD5]]
		; GFX8: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[ADD12]](s32), [[ADD13]](s32)
		; GFX8: [[ICMP8:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD12]](s32), [[ADD4]]
		; GFX8: [[ICMP9:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD13]](s32), [[ADD5]]
		; GFX8: [[ZEXT8:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP8]](s1)
		; GFX8: [[ZEXT9:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP9]](s1)
		; GFX8: [[ADD14:%[0-9]+]]:_(s32) = G_ADD [[ADD10]], [[ZEXT8]]
		; GFX8: [[ADD15:%[0-9]+]]:_(s32) = G_ADD [[ADD11]], [[ZEXT9]]
		; GFX8: [[UV28:%[0-9]+]]:_(s32), [[UV29:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](<2 x s32>)
		; GFX8: [[UV30:%[0-9]+]]:_(s32), [[UV31:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](<2 x s32>)
		; GFX8: [[UMULH6:%[0-9]+]]:_(s32) = G_UMULH [[UV28]], [[UV30]]
		; GFX8: [[UMULH7:%[0-9]+]]:_(s32) = G_UMULH [[UV29]], [[UV31]]
		; GFX8: [[ADD16:%[0-9]+]]:_(s32) = G_ADD [[UMULH6]], [[ADD14]]
		; GFX8: [[ADD17:%[0-9]+]]:_(s32) = G_ADD [[UMULH7]], [[ADD15]]
		; GFX8: [[BUILD_VECTOR1:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[ADD16]](s32), [[ADD17]](s32)
		; GFX8: [[CONCAT_VECTORS:%[0-9]+]]:_(<2 x s64>) = G_CONCAT_VECTORS [[BUILD_VECTOR]](<2 x s32>), [[BUILD_VECTOR1]](<2 x s32>)
		; GFX8: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[CONCAT_VECTORS]](<2 x s64>)
		; GFX9-LABEL: name: test_umulh_v2s64
		; GFX9: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
		; GFX9: [[COPY1:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr4_vgpr5_vgpr6_vgpr7
		; GFX9: [[UV:%[0-9]+]]:_(<2 x s32>), [[UV1:%[0-9]+]]:_(<2 x s32>) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
		; GFX9: [[UV2:%[0-9]+]]:_(<2 x s32>), [[UV3:%[0-9]+]]:_(<2 x s32>) = G_UNMERGE_VALUES [[COPY1]](<2 x s64>)
		; GFX9: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](<2 x s32>)
		; GFX9: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](<2 x s32>)
		; GFX9: [[MUL:%[0-9]+]]:_(s32) = G_MUL [[UV4]], [[UV6]]
		; GFX9: [[MUL1:%[0-9]+]]:_(s32) = G_MUL [[UV5]], [[UV7]]
		; GFX9: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](<2 x s32>)
		; GFX9: [[UV10:%[0-9]+]]:_(s32), [[UV11:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](<2 x s32>)
		; GFX9: [[MUL2:%[0-9]+]]:_(s32) = G_MUL [[UV8]], [[UV10]]
		; GFX9: [[MUL3:%[0-9]+]]:_(s32) = G_MUL [[UV9]], [[UV11]]
		; GFX9: [[UV12:%[0-9]+]]:_(s32), [[UV13:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](<2 x s32>)
		; GFX9: [[UV14:%[0-9]+]]:_(s32), [[UV15:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](<2 x s32>)
		; GFX9: [[UMULH:%[0-9]+]]:_(s32) = G_UMULH [[UV12]], [[UV14]]
		; GFX9: [[UMULH1:%[0-9]+]]:_(s32) = G_UMULH [[UV13]], [[UV15]]
		; GFX9: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[MUL]], [[MUL2]]
		; GFX9: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[MUL1]], [[MUL3]]
		; GFX9: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD]](s32), [[MUL2]]
		; GFX9: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD1]](s32), [[MUL3]]
		; GFX9: [[ADD2:%[0-9]+]]:_(s32) = G_ADD [[ADD]], [[UMULH]]
		; GFX9: [[ADD3:%[0-9]+]]:_(s32) = G_ADD [[ADD1]], [[UMULH1]]
		; GFX9: [[ICMP2:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD2]](s32), [[UMULH]]
		; GFX9: [[ICMP3:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD3]](s32), [[UMULH1]]
		; GFX9: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP]](s1)
		; GFX9: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP1]](s1)
		; GFX9: [[ZEXT2:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP2]](s1)
		; GFX9: [[ZEXT3:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP3]](s1)
		; GFX9: [[ADD4:%[0-9]+]]:_(s32) = G_ADD [[ZEXT]], [[ZEXT2]]
		; GFX9: [[ADD5:%[0-9]+]]:_(s32) = G_ADD [[ZEXT1]], [[ZEXT3]]
		; GFX9: [[UV16:%[0-9]+]]:_(s32), [[UV17:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](<2 x s32>)
		; GFX9: [[UV18:%[0-9]+]]:_(s32), [[UV19:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](<2 x s32>)
		; GFX9: [[MUL4:%[0-9]+]]:_(s32) = G_MUL [[UV16]], [[UV18]]
		; GFX9: [[MUL5:%[0-9]+]]:_(s32) = G_MUL [[UV17]], [[UV19]]
		; GFX9: [[UV20:%[0-9]+]]:_(s32), [[UV21:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](<2 x s32>)
		; GFX9: [[UV22:%[0-9]+]]:_(s32), [[UV23:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](<2 x s32>)
		; GFX9: [[UMULH2:%[0-9]+]]:_(s32) = G_UMULH [[UV20]], [[UV22]]
		; GFX9: [[UMULH3:%[0-9]+]]:_(s32) = G_UMULH [[UV21]], [[UV23]]
		; GFX9: [[UV24:%[0-9]+]]:_(s32), [[UV25:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](<2 x s32>)
		; GFX9: [[UV26:%[0-9]+]]:_(s32), [[UV27:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](<2 x s32>)
		; GFX9: [[UMULH4:%[0-9]+]]:_(s32) = G_UMULH [[UV24]], [[UV26]]
		; GFX9: [[UMULH5:%[0-9]+]]:_(s32) = G_UMULH [[UV25]], [[UV27]]
		; GFX9: [[ADD6:%[0-9]+]]:_(s32) = G_ADD [[MUL4]], [[UMULH2]]
		; GFX9: [[ADD7:%[0-9]+]]:_(s32) = G_ADD [[MUL5]], [[UMULH3]]
		; GFX9: [[ICMP4:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD6]](s32), [[UMULH2]]
		; GFX9: [[ICMP5:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD7]](s32), [[UMULH3]]
		; GFX9: [[ADD8:%[0-9]+]]:_(s32) = G_ADD [[ADD6]], [[UMULH4]]
		; GFX9: [[ADD9:%[0-9]+]]:_(s32) = G_ADD [[ADD7]], [[UMULH5]]
		; GFX9: [[ICMP6:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD8]](s32), [[UMULH4]]
		; GFX9: [[ICMP7:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD9]](s32), [[UMULH5]]
		; GFX9: [[ZEXT4:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP4]](s1)
		; GFX9: [[ZEXT5:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP5]](s1)
		; GFX9: [[ZEXT6:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP6]](s1)
		; GFX9: [[ZEXT7:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP7]](s1)
		; GFX9: [[ADD10:%[0-9]+]]:_(s32) = G_ADD [[ZEXT4]], [[ZEXT6]]
		; GFX9: [[ADD11:%[0-9]+]]:_(s32) = G_ADD [[ZEXT5]], [[ZEXT7]]
		; GFX9: [[ADD12:%[0-9]+]]:_(s32) = G_ADD [[ADD8]], [[ADD4]]
		; GFX9: [[ADD13:%[0-9]+]]:_(s32) = G_ADD [[ADD9]], [[ADD5]]
		; GFX9: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[ADD12]](s32), [[ADD13]](s32)
		; GFX9: [[ICMP8:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD12]](s32), [[ADD4]]
		; GFX9: [[ICMP9:%[0-9]+]]:_(s1) = G_ICMP intpred(ult), [[ADD13]](s32), [[ADD5]]
		; GFX9: [[ZEXT8:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP8]](s1)
		; GFX9: [[ZEXT9:%[0-9]+]]:_(s32) = G_ZEXT [[ICMP9]](s1)
		; GFX9: [[ADD14:%[0-9]+]]:_(s32) = G_ADD [[ADD10]], [[ZEXT8]]
		; GFX9: [[ADD15:%[0-9]+]]:_(s32) = G_ADD [[ADD11]], [[ZEXT9]]
		; GFX9: [[UV28:%[0-9]+]]:_(s32), [[UV29:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](<2 x s32>)
		; GFX9: [[UV30:%[0-9]+]]:_(s32), [[UV31:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](<2 x s32>)
		; GFX9: [[UMULH6:%[0-9]+]]:_(s32) = G_UMULH [[UV28]], [[UV30]]
		; GFX9: [[UMULH7:%[0-9]+]]:_(s32) = G_UMULH [[UV29]], [[UV31]]
		; GFX9: [[ADD16:%[0-9]+]]:_(s32) = G_ADD [[UMULH6]], [[ADD14]]
		; GFX9: [[ADD17:%[0-9]+]]:_(s32) = G_ADD [[UMULH7]], [[ADD15]]
		; GFX9: [[BUILD_VECTOR1:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[ADD16]](s32), [[ADD17]](s32)
		; GFX9: [[CONCAT_VECTORS:%[0-9]+]]:_(<2 x s64>) = G_CONCAT_VECTORS [[BUILD_VECTOR]](<2 x s32>), [[BUILD_VECTOR1]](<2 x s32>)
		; GFX9: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[CONCAT_VECTORS]](<2 x s64>)
		%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
		%1:_(<2 x s64>) = COPY $vgpr4_vgpr5_vgpr6_vgpr7
		%2:_(<2 x s64>) = G_UMULH %0, %1
		$vgpr0_vgpr1_vgpr2_vgpr3 = COPY %2
		...

		---
name: test_umulh_s16		name: test_umulh_s16
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0, $vgpr1		liveins: $vgpr0, $vgpr1

; GFX8-LABEL: name: test_umulh_s16		; GFX8-LABEL: name: test_umulh_s16
; GFX8: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0		; GFX8: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
; GFX8: [[COPY1:%[0-9]+]]:_(s32) = COPY $vgpr1		; GFX8: [[COPY1:%[0-9]+]]:_(s32) = COPY $vgpr1
▲ Show 20 Lines • Show All 495 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-umulo.mir

Show First 20 Lines • Show All 183 Lines • ▼ Show 20 Lines	bb.0:
%1:_(s64) = COPY $vgpr2_vgpr3		%1:_(s64) = COPY $vgpr2_vgpr3
%2:_(s64), %3:_(s1) = G_UMULO %0, %1		%2:_(s64), %3:_(s1) = G_UMULO %0, %1
%4:_(s64) = G_ZEXT %3		%4:_(s64) = G_ZEXT %3
$vgpr0_vgpr1 = COPY %2		$vgpr0_vgpr1 = COPY %2
$vgpr2_vgpr3 = COPY %4		$vgpr2_vgpr3 = COPY %4
...		...

---		---
		name: test_umulo_v2s64
		body: \|
		bb.0:
		liveins: $vgpr0_vgpr1_vgpr2_vgpr3, $vgpr4_vgpr5_vgpr6_vgpr7

		; GFX8-LABEL: name: test_umulo_v2s64
		; GFX8: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
		; GFX8: [[COPY1:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr4_vgpr5_vgpr6_vgpr7
		; GFX8: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
		; GFX8: [[UV2:%[0-9]+]]:_(s64), [[UV3:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY1]](<2 x s64>)
		; GFX8: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
		; GFX8: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](s64)
		; GFX8: [[MUL:%[0-9]+]]:_(s32) = G_MUL [[UV5]], [[UV6]]
		; GFX8: [[MUL1:%[0-9]+]]:_(s32) = G_MUL [[UV4]], [[UV7]]
		; GFX8: [[UMULH:%[0-9]+]]:_(s32) = G_UMULH [[UV4]], [[UV6]]
		; GFX8: [[UADDO:%[0-9]+]]:_(s32), [[UADDO1:%[0-9]+]]:_(s1) = G_UADDO [[MUL]], [[MUL1]]
		; GFX8: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO1]](s1)
		; GFX8: [[UADDO2:%[0-9]+]]:_(s32), [[UADDO3:%[0-9]+]]:_(s1) = G_UADDO [[UADDO]], [[UMULH]]
		; GFX8: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO3]](s1)
		; GFX8: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[ZEXT]], [[ZEXT1]]
		; GFX8: [[MUL2:%[0-9]+]]:_(s32) = G_MUL [[UV5]], [[UV7]]
		; GFX8: [[UMULH1:%[0-9]+]]:_(s32) = G_UMULH [[UV5]], [[UV6]]
		; GFX8: [[UMULH2:%[0-9]+]]:_(s32) = G_UMULH [[UV4]], [[UV7]]
		; GFX8: [[UADDO4:%[0-9]+]]:_(s32), [[UADDO5:%[0-9]+]]:_(s1) = G_UADDO [[MUL2]], [[UMULH1]]
		; GFX8: [[ZEXT2:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO5]](s1)
		; GFX8: [[UADDO6:%[0-9]+]]:_(s32), [[UADDO7:%[0-9]+]]:_(s1) = G_UADDO [[UADDO4]], [[UMULH2]]
		; GFX8: [[ZEXT3:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO7]](s1)
		; GFX8: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[ZEXT2]], [[ZEXT3]]
		; GFX8: [[UADDO8:%[0-9]+]]:_(s32), [[UADDO9:%[0-9]+]]:_(s1) = G_UADDO [[UADDO6]], [[ADD]]
		; GFX8: [[ZEXT4:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO9]](s1)
		; GFX8: [[ADD2:%[0-9]+]]:_(s32) = G_ADD [[ADD1]], [[ZEXT4]]
		; GFX8: [[UMULH3:%[0-9]+]]:_(s32) = G_UMULH [[UV5]], [[UV7]]
		; GFX8: [[ADD3:%[0-9]+]]:_(s32) = G_ADD [[UMULH3]], [[ADD2]]
		; GFX8: [[MV:%[0-9]+]]:_(s64) = G_MERGE_VALUES [[UADDO8]](s32), [[ADD3]](s32)
		; GFX8: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 0
		; GFX8: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
		; GFX8: [[UV10:%[0-9]+]]:_(s32), [[UV11:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](s64)
		; GFX8: [[MUL3:%[0-9]+]]:_(s32) = G_MUL [[UV8]], [[UV10]]
		; GFX8: [[MUL4:%[0-9]+]]:_(s32) = G_MUL [[UV9]], [[UV10]]
		; GFX8: [[MUL5:%[0-9]+]]:_(s32) = G_MUL [[UV8]], [[UV11]]
		; GFX8: [[UMULH4:%[0-9]+]]:_(s32) = G_UMULH [[UV8]], [[UV10]]
		; GFX8: [[ADD4:%[0-9]+]]:_(s32) = G_ADD [[MUL4]], [[MUL5]]
		; GFX8: [[ADD5:%[0-9]+]]:_(s32) = G_ADD [[ADD4]], [[UMULH4]]
		; GFX8: [[MV1:%[0-9]+]]:_(s64) = G_MERGE_VALUES [[MUL3]](s32), [[ADD5]](s32)
		; GFX8: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[MV]](s64), [[C]]
		; GFX8: [[UV12:%[0-9]+]]:_(s32), [[UV13:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
		; GFX8: [[UV14:%[0-9]+]]:_(s32), [[UV15:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](s64)
		; GFX8: [[MUL6:%[0-9]+]]:_(s32) = G_MUL [[UV13]], [[UV14]]
		; GFX8: [[MUL7:%[0-9]+]]:_(s32) = G_MUL [[UV12]], [[UV15]]
		; GFX8: [[UMULH5:%[0-9]+]]:_(s32) = G_UMULH [[UV12]], [[UV14]]
		; GFX8: [[UADDO10:%[0-9]+]]:_(s32), [[UADDO11:%[0-9]+]]:_(s1) = G_UADDO [[MUL6]], [[MUL7]]
		; GFX8: [[ZEXT5:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO11]](s1)
		; GFX8: [[UADDO12:%[0-9]+]]:_(s32), [[UADDO13:%[0-9]+]]:_(s1) = G_UADDO [[UADDO10]], [[UMULH5]]
		; GFX8: [[ZEXT6:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO13]](s1)
		; GFX8: [[ADD6:%[0-9]+]]:_(s32) = G_ADD [[ZEXT5]], [[ZEXT6]]
		; GFX8: [[MUL8:%[0-9]+]]:_(s32) = G_MUL [[UV13]], [[UV15]]
		; GFX8: [[UMULH6:%[0-9]+]]:_(s32) = G_UMULH [[UV13]], [[UV14]]
		; GFX8: [[UMULH7:%[0-9]+]]:_(s32) = G_UMULH [[UV12]], [[UV15]]
		; GFX8: [[UADDO14:%[0-9]+]]:_(s32), [[UADDO15:%[0-9]+]]:_(s1) = G_UADDO [[MUL8]], [[UMULH6]]
		; GFX8: [[ZEXT7:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO15]](s1)
		; GFX8: [[UADDO16:%[0-9]+]]:_(s32), [[UADDO17:%[0-9]+]]:_(s1) = G_UADDO [[UADDO14]], [[UMULH7]]
		; GFX8: [[ZEXT8:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO17]](s1)
		; GFX8: [[ADD7:%[0-9]+]]:_(s32) = G_ADD [[ZEXT7]], [[ZEXT8]]
		; GFX8: [[UADDO18:%[0-9]+]]:_(s32), [[UADDO19:%[0-9]+]]:_(s1) = G_UADDO [[UADDO16]], [[ADD6]]
		; GFX8: [[ZEXT9:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO19]](s1)
		; GFX8: [[ADD8:%[0-9]+]]:_(s32) = G_ADD [[ADD7]], [[ZEXT9]]
		; GFX8: [[UMULH8:%[0-9]+]]:_(s32) = G_UMULH [[UV13]], [[UV15]]
		; GFX8: [[ADD9:%[0-9]+]]:_(s32) = G_ADD [[UMULH8]], [[ADD8]]
		; GFX8: [[MV2:%[0-9]+]]:_(s64) = G_MERGE_VALUES [[UADDO18]](s32), [[ADD9]](s32)
		; GFX8: [[UV16:%[0-9]+]]:_(s32), [[UV17:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
		; GFX8: [[UV18:%[0-9]+]]:_(s32), [[UV19:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](s64)
		; GFX8: [[MUL9:%[0-9]+]]:_(s32) = G_MUL [[UV16]], [[UV18]]
		; GFX8: [[MUL10:%[0-9]+]]:_(s32) = G_MUL [[UV17]], [[UV18]]
		; GFX8: [[MUL11:%[0-9]+]]:_(s32) = G_MUL [[UV16]], [[UV19]]
		; GFX8: [[UMULH9:%[0-9]+]]:_(s32) = G_UMULH [[UV16]], [[UV18]]
		; GFX8: [[ADD10:%[0-9]+]]:_(s32) = G_ADD [[MUL10]], [[MUL11]]
		; GFX8: [[ADD11:%[0-9]+]]:_(s32) = G_ADD [[ADD10]], [[UMULH9]]
		; GFX8: [[MV3:%[0-9]+]]:_(s64) = G_MERGE_VALUES [[MUL9]](s32), [[ADD11]](s32)
		; GFX8: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[MV2]](s64), [[C]]
		; GFX8: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s64>) = G_BUILD_VECTOR [[MV1]](s64), [[MV3]](s64)
		; GFX8: [[C1:%[0-9]+]]:_(s64) = G_CONSTANT i64 1
		; GFX8: [[ANYEXT:%[0-9]+]]:_(s64) = G_ANYEXT [[ICMP]](s1)
		; GFX8: [[AND:%[0-9]+]]:_(s64) = G_AND [[ANYEXT]], [[C1]]
		; GFX8: [[ANYEXT1:%[0-9]+]]:_(s64) = G_ANYEXT [[ICMP1]](s1)
		; GFX8: [[AND1:%[0-9]+]]:_(s64) = G_AND [[ANYEXT1]], [[C1]]
		; GFX8: [[BUILD_VECTOR1:%[0-9]+]]:_(<2 x s64>) = G_BUILD_VECTOR [[AND]](s64), [[AND1]](s64)
		; GFX8: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[BUILD_VECTOR]](<2 x s64>)
		; GFX8: $vgpr4_vgpr5_vgpr6_vgpr7 = COPY [[BUILD_VECTOR1]](<2 x s64>)
		; GFX9-LABEL: name: test_umulo_v2s64
		; GFX9: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
		; GFX9: [[COPY1:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr4_vgpr5_vgpr6_vgpr7
		; GFX9: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
		; GFX9: [[UV2:%[0-9]+]]:_(s64), [[UV3:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY1]](<2 x s64>)
		; GFX9: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
		; GFX9: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](s64)
		; GFX9: [[MUL:%[0-9]+]]:_(s32) = G_MUL [[UV5]], [[UV6]]
		; GFX9: [[MUL1:%[0-9]+]]:_(s32) = G_MUL [[UV4]], [[UV7]]
		; GFX9: [[UMULH:%[0-9]+]]:_(s32) = G_UMULH [[UV4]], [[UV6]]
		; GFX9: [[UADDO:%[0-9]+]]:_(s32), [[UADDO1:%[0-9]+]]:_(s1) = G_UADDO [[MUL]], [[MUL1]]
		; GFX9: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO1]](s1)
		; GFX9: [[UADDO2:%[0-9]+]]:_(s32), [[UADDO3:%[0-9]+]]:_(s1) = G_UADDO [[UADDO]], [[UMULH]]
		; GFX9: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO3]](s1)
		; GFX9: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[ZEXT]], [[ZEXT1]]
		; GFX9: [[MUL2:%[0-9]+]]:_(s32) = G_MUL [[UV5]], [[UV7]]
		; GFX9: [[UMULH1:%[0-9]+]]:_(s32) = G_UMULH [[UV5]], [[UV6]]
		; GFX9: [[UMULH2:%[0-9]+]]:_(s32) = G_UMULH [[UV4]], [[UV7]]
		; GFX9: [[UADDO4:%[0-9]+]]:_(s32), [[UADDO5:%[0-9]+]]:_(s1) = G_UADDO [[MUL2]], [[UMULH1]]
		; GFX9: [[ZEXT2:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO5]](s1)
		; GFX9: [[UADDO6:%[0-9]+]]:_(s32), [[UADDO7:%[0-9]+]]:_(s1) = G_UADDO [[UADDO4]], [[UMULH2]]
		; GFX9: [[ZEXT3:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO7]](s1)
		; GFX9: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[ZEXT2]], [[ZEXT3]]
		; GFX9: [[UADDO8:%[0-9]+]]:_(s32), [[UADDO9:%[0-9]+]]:_(s1) = G_UADDO [[UADDO6]], [[ADD]]
		; GFX9: [[ZEXT4:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO9]](s1)
		; GFX9: [[ADD2:%[0-9]+]]:_(s32) = G_ADD [[ADD1]], [[ZEXT4]]
		; GFX9: [[UMULH3:%[0-9]+]]:_(s32) = G_UMULH [[UV5]], [[UV7]]
		; GFX9: [[ADD3:%[0-9]+]]:_(s32) = G_ADD [[UMULH3]], [[ADD2]]
		; GFX9: [[MV:%[0-9]+]]:_(s64) = G_MERGE_VALUES [[UADDO8]](s32), [[ADD3]](s32)
		; GFX9: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 0
		; GFX9: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
		; GFX9: [[UV10:%[0-9]+]]:_(s32), [[UV11:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV2]](s64)
		; GFX9: [[MUL3:%[0-9]+]]:_(s32) = G_MUL [[UV8]], [[UV10]]
		; GFX9: [[MUL4:%[0-9]+]]:_(s32) = G_MUL [[UV9]], [[UV10]]
		; GFX9: [[MUL5:%[0-9]+]]:_(s32) = G_MUL [[UV8]], [[UV11]]
		; GFX9: [[UMULH4:%[0-9]+]]:_(s32) = G_UMULH [[UV8]], [[UV10]]
		; GFX9: [[ADD4:%[0-9]+]]:_(s32) = G_ADD [[MUL4]], [[MUL5]]
		; GFX9: [[ADD5:%[0-9]+]]:_(s32) = G_ADD [[ADD4]], [[UMULH4]]
		; GFX9: [[MV1:%[0-9]+]]:_(s64) = G_MERGE_VALUES [[MUL3]](s32), [[ADD5]](s32)
		; GFX9: [[ICMP:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[MV]](s64), [[C]]
		; GFX9: [[UV12:%[0-9]+]]:_(s32), [[UV13:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
		; GFX9: [[UV14:%[0-9]+]]:_(s32), [[UV15:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](s64)
		; GFX9: [[MUL6:%[0-9]+]]:_(s32) = G_MUL [[UV13]], [[UV14]]
		; GFX9: [[MUL7:%[0-9]+]]:_(s32) = G_MUL [[UV12]], [[UV15]]
		; GFX9: [[UMULH5:%[0-9]+]]:_(s32) = G_UMULH [[UV12]], [[UV14]]
		; GFX9: [[UADDO10:%[0-9]+]]:_(s32), [[UADDO11:%[0-9]+]]:_(s1) = G_UADDO [[MUL6]], [[MUL7]]
		; GFX9: [[ZEXT5:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO11]](s1)
		; GFX9: [[UADDO12:%[0-9]+]]:_(s32), [[UADDO13:%[0-9]+]]:_(s1) = G_UADDO [[UADDO10]], [[UMULH5]]
		; GFX9: [[ZEXT6:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO13]](s1)
		; GFX9: [[ADD6:%[0-9]+]]:_(s32) = G_ADD [[ZEXT5]], [[ZEXT6]]
		; GFX9: [[MUL8:%[0-9]+]]:_(s32) = G_MUL [[UV13]], [[UV15]]
		; GFX9: [[UMULH6:%[0-9]+]]:_(s32) = G_UMULH [[UV13]], [[UV14]]
		; GFX9: [[UMULH7:%[0-9]+]]:_(s32) = G_UMULH [[UV12]], [[UV15]]
		; GFX9: [[UADDO14:%[0-9]+]]:_(s32), [[UADDO15:%[0-9]+]]:_(s1) = G_UADDO [[MUL8]], [[UMULH6]]
		; GFX9: [[ZEXT7:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO15]](s1)
		; GFX9: [[UADDO16:%[0-9]+]]:_(s32), [[UADDO17:%[0-9]+]]:_(s1) = G_UADDO [[UADDO14]], [[UMULH7]]
		; GFX9: [[ZEXT8:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO17]](s1)
		; GFX9: [[ADD7:%[0-9]+]]:_(s32) = G_ADD [[ZEXT7]], [[ZEXT8]]
		; GFX9: [[UADDO18:%[0-9]+]]:_(s32), [[UADDO19:%[0-9]+]]:_(s1) = G_UADDO [[UADDO16]], [[ADD6]]
		; GFX9: [[ZEXT9:%[0-9]+]]:_(s32) = G_ZEXT [[UADDO19]](s1)
		; GFX9: [[ADD8:%[0-9]+]]:_(s32) = G_ADD [[ADD7]], [[ZEXT9]]
		; GFX9: [[UMULH8:%[0-9]+]]:_(s32) = G_UMULH [[UV13]], [[UV15]]
		; GFX9: [[ADD9:%[0-9]+]]:_(s32) = G_ADD [[UMULH8]], [[ADD8]]
		; GFX9: [[MV2:%[0-9]+]]:_(s64) = G_MERGE_VALUES [[UADDO18]](s32), [[ADD9]](s32)
		; GFX9: [[UV16:%[0-9]+]]:_(s32), [[UV17:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
		; GFX9: [[UV18:%[0-9]+]]:_(s32), [[UV19:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV3]](s64)
		; GFX9: [[MUL9:%[0-9]+]]:_(s32) = G_MUL [[UV16]], [[UV18]]
		; GFX9: [[MUL10:%[0-9]+]]:_(s32) = G_MUL [[UV17]], [[UV18]]
		; GFX9: [[MUL11:%[0-9]+]]:_(s32) = G_MUL [[UV16]], [[UV19]]
		; GFX9: [[UMULH9:%[0-9]+]]:_(s32) = G_UMULH [[UV16]], [[UV18]]
		; GFX9: [[ADD10:%[0-9]+]]:_(s32) = G_ADD [[MUL10]], [[MUL11]]
		; GFX9: [[ADD11:%[0-9]+]]:_(s32) = G_ADD [[ADD10]], [[UMULH9]]
		; GFX9: [[MV3:%[0-9]+]]:_(s64) = G_MERGE_VALUES [[MUL9]](s32), [[ADD11]](s32)
		; GFX9: [[ICMP1:%[0-9]+]]:_(s1) = G_ICMP intpred(ne), [[MV2]](s64), [[C]]
		; GFX9: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s64>) = G_BUILD_VECTOR [[MV1]](s64), [[MV3]](s64)
		; GFX9: [[C1:%[0-9]+]]:_(s64) = G_CONSTANT i64 1
		; GFX9: [[ANYEXT:%[0-9]+]]:_(s64) = G_ANYEXT [[ICMP]](s1)
		; GFX9: [[AND:%[0-9]+]]:_(s64) = G_AND [[ANYEXT]], [[C1]]
		; GFX9: [[ANYEXT1:%[0-9]+]]:_(s64) = G_ANYEXT [[ICMP1]](s1)
		; GFX9: [[AND1:%[0-9]+]]:_(s64) = G_AND [[ANYEXT1]], [[C1]]
		; GFX9: [[BUILD_VECTOR1:%[0-9]+]]:_(<2 x s64>) = G_BUILD_VECTOR [[AND]](s64), [[AND1]](s64)
		; GFX9: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[BUILD_VECTOR]](<2 x s64>)
		; GFX9: $vgpr4_vgpr5_vgpr6_vgpr7 = COPY [[BUILD_VECTOR1]](<2 x s64>)
		%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
		%1:_(<2 x s64>) = COPY $vgpr4_vgpr5_vgpr6_vgpr7
		%2:_(<2 x s64>), %3:_(<2 x s1>) = G_UMULO %0, %1
		%4:_(<2 x s64>) = G_ZEXT %3
		$vgpr0_vgpr1_vgpr2_vgpr3 = COPY %2
		$vgpr4_vgpr5_vgpr6_vgpr7 = COPY %4
		...

		---
name: test_umulo_s24		name: test_umulo_s24
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0, $vgpr1		liveins: $vgpr0, $vgpr1

; GFX8-LABEL: name: test_umulo_s24		; GFX8-LABEL: name: test_umulo_s24
; GFX8: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0		; GFX8: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
; GFX8: [[COPY1:%[0-9]+]]:_(s32) = COPY $vgpr1		; GFX8: [[COPY1:%[0-9]+]]:_(s32) = COPY $vgpr1
▲ Show 20 Lines • Show All 399 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[GlobalISel] Support vectors in LegalizerHelper::narrowScalarMulAbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 376963

llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-umulh.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-umulo.mir

[GlobalISel] Support vectors in LegalizerHelper::narrowScalarMul
AbandonedPublic