Diff 230913

llvm/include/llvm/CodeGen/MachineCombinerPattern.h

Show All 32 Lines	enum class MachineCombinerPattern {
MULADDWI_OP1,		MULADDWI_OP1,
MULSUBWI_OP1,		MULSUBWI_OP1,
MULADDX_OP1,		MULADDX_OP1,
MULADDX_OP2,		MULADDX_OP2,
MULSUBX_OP1,		MULSUBX_OP1,
MULSUBX_OP2,		MULSUBX_OP2,
MULADDXI_OP1,		MULADDXI_OP1,
MULSUBXI_OP1,		MULSUBXI_OP1,
		// NEON integers vectors
		VMULADDv8i8_OP1,
		dmgreenUnsubmitted Done Reply Inline Actions Do these need V's on the front? The type is already in the name. dmgreen: Do these need V's on the front? The type is already in the name.
		VMULADDv8i8_OP2,
		VMULADDv16i8_OP1,
		VMULADDv16i8_OP2,
		VMULADDv4i16_OP1,
		VMULADDv4i16_OP2,
		VMULADDv8i16_OP1,
		VMULADDv8i16_OP2,
		VMULADDv2i32_OP1,
		VMULADDv2i32_OP2,
		VMULADDv4i32_OP1,
		VMULADDv4i32_OP2,

		VMULSUBv8i8_OP1,
		VMULSUBv8i8_OP2,
		VMULSUBv16i8_OP1,
		VMULSUBv16i8_OP2,
		VMULSUBv4i16_OP1,
		VMULSUBv4i16_OP2,
		VMULSUBv8i16_OP1,
		VMULSUBv8i16_OP2,
		VMULSUBv2i32_OP1,
		VMULSUBv2i32_OP2,
		VMULSUBv4i32_OP1,
		VMULSUBv4i32_OP2,

// Floating Point		// Floating Point
FMULADDH_OP1,		FMULADDH_OP1,
FMULADDH_OP2,		FMULADDH_OP2,
FMULSUBH_OP1,		FMULSUBH_OP1,
FMULSUBH_OP2,		FMULSUBH_OP2,
FMULADDS_OP1,		FMULADDS_OP1,
FMULADDS_OP2,		FMULADDS_OP2,
FMULSUBS_OP1,		FMULSUBS_OP1,
▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrInfo.cpp

Show First 20 Lines • Show All 3,565 Lines • ▼ Show 20 Lines	static bool isCombineInstrCandidate64(unsigned Opc) {
case AArch64::ADDXri:		case AArch64::ADDXri:
case AArch64::SUBXrr:		case AArch64::SUBXrr:
case AArch64::ADDSXrr:		case AArch64::ADDSXrr:
case AArch64::ADDSXri:		case AArch64::ADDSXri:
case AArch64::SUBSXrr:		case AArch64::SUBSXrr:
// Note: MSUB Wd,Wn,Wm,Wi -> Wd = Wi - WnxWm, not Wd=WnxWm - Wi.		// Note: MSUB Wd,Wn,Wm,Wi -> Wd = Wi - WnxWm, not Wd=WnxWm - Wi.
case AArch64::SUBXri:		case AArch64::SUBXri:
case AArch64::SUBSXri:		case AArch64::SUBSXri:
		case AArch64::ADDv8i8:
		case AArch64::ADDv16i8:
		case AArch64::ADDv4i16:
		case AArch64::ADDv8i16:
		case AArch64::ADDv2i32:
		case AArch64::ADDv4i32:
		case AArch64::SUBv8i8:
		case AArch64::SUBv16i8:
		case AArch64::SUBv4i16:
		case AArch64::SUBv8i16:
		case AArch64::SUBv2i32:
		case AArch64::SUBv4i32:
return true;		return true;
default:		default:
break;		break;
}		}
return false;		return false;
}		}

// FP Opcodes that can be combined with a FMUL		// FP Opcodes that can be combined with a FMUL
▲ Show 20 Lines • Show All 126 Lines • ▼ Show 20 Lines	static bool getMaddPatterns(MachineInstr &Root,
auto setFound = [&](int Opcode, int Operand, unsigned ZeroReg,		auto setFound = [&](int Opcode, int Operand, unsigned ZeroReg,
MachineCombinerPattern Pattern) {		MachineCombinerPattern Pattern) {
if (canCombineWithMUL(MBB, Root.getOperand(Operand), Opcode, ZeroReg)) {		if (canCombineWithMUL(MBB, Root.getOperand(Operand), Opcode, ZeroReg)) {
Patterns.push_back(Pattern);		Patterns.push_back(Pattern);
Found = true;		Found = true;
}		}
};		};

		auto setVFound = [&](int Opcode, int Operand, MachineCombinerPattern Pattern) {
		if (canCombine(MBB, Root.getOperand(Operand), Opcode)) {
		Patterns.push_back(Pattern);
		Found = true;
		}
		};

typedef MachineCombinerPattern MCP;		typedef MachineCombinerPattern MCP;

switch (Opc) {		switch (Opc) {
default:		default:
break;		break;
case AArch64::ADDWrr:		case AArch64::ADDWrr:
assert(Root.getOperand(1).isReg() && Root.getOperand(2).isReg() &&		assert(Root.getOperand(1).isReg() && Root.getOperand(2).isReg() &&
"ADDWrr does not have register operands");		"ADDWrr does not have register operands");
Show All 19 Lines	case AArch64::ADDXri:
setFound(AArch64::MADDXrrr, 1, AArch64::XZR, MCP::MULADDXI_OP1);		setFound(AArch64::MADDXrrr, 1, AArch64::XZR, MCP::MULADDXI_OP1);
break;		break;
case AArch64::SUBWri:		case AArch64::SUBWri:
setFound(AArch64::MADDWrrr, 1, AArch64::WZR, MCP::MULSUBWI_OP1);		setFound(AArch64::MADDWrrr, 1, AArch64::WZR, MCP::MULSUBWI_OP1);
break;		break;
case AArch64::SUBXri:		case AArch64::SUBXri:
setFound(AArch64::MADDXrrr, 1, AArch64::XZR, MCP::MULSUBXI_OP1);		setFound(AArch64::MADDXrrr, 1, AArch64::XZR, MCP::MULSUBXI_OP1);
break;		break;
		case AArch64::ADDv8i8:
		setVFound(AArch64::MULv8i8, 1, MCP::VMULADDv8i8_OP1);
		setVFound(AArch64::MULv8i8, 2, MCP::VMULADDv8i8_OP2);
		break;
		case AArch64::ADDv16i8:
		setVFound(AArch64::MULv16i8, 1, MCP::VMULADDv16i8_OP1);
		setVFound(AArch64::MULv16i8, 2, MCP::VMULADDv16i8_OP2);
		break;
		case AArch64::ADDv4i16:
		setVFound(AArch64::MULv4i16, 1, MCP::VMULADDv4i16_OP1);
		setVFound(AArch64::MULv4i16, 2, MCP::VMULADDv4i16_OP2);
		break;
		case AArch64::ADDv8i16:
		setVFound(AArch64::MULv8i16, 1, MCP::VMULADDv8i16_OP1);
		setVFound(AArch64::MULv8i16, 2, MCP::VMULADDv8i16_OP2);
		break;
		case AArch64::ADDv2i32:
		setVFound(AArch64::MULv2i32, 1, MCP::VMULADDv2i32_OP1);
		setVFound(AArch64::MULv2i32, 2, MCP::VMULADDv2i32_OP2);
		break;
		case AArch64::ADDv4i32:
		setVFound(AArch64::MULv4i32, 1, MCP::VMULADDv4i32_OP1);
		setVFound(AArch64::MULv4i32, 2, MCP::VMULADDv4i32_OP2);
		break;
		case AArch64::SUBv8i8:
		setVFound(AArch64::MULv8i8, 1, MCP::VMULSUBv8i8_OP1);
		setVFound(AArch64::MULv8i8, 2, MCP::VMULSUBv8i8_OP2);
		break;
		case AArch64::SUBv16i8:
		setVFound(AArch64::MULv16i8, 1, MCP::VMULSUBv16i8_OP1);
		setVFound(AArch64::MULv16i8, 2, MCP::VMULSUBv16i8_OP2);
		break;
		case AArch64::SUBv4i16:
		setVFound(AArch64::MULv4i16, 1, MCP::VMULSUBv4i16_OP1);
		setVFound(AArch64::MULv4i16, 2, MCP::VMULSUBv4i16_OP2);
		break;
		case AArch64::SUBv8i16:
		setVFound(AArch64::MULv8i16, 1, MCP::VMULSUBv8i16_OP1);
		setVFound(AArch64::MULv8i16, 2, MCP::VMULSUBv8i16_OP2);
		break;
		case AArch64::SUBv2i32:
		setVFound(AArch64::MULv2i32, 1, MCP::VMULSUBv2i32_OP1);
		setVFound(AArch64::MULv2i32, 2, MCP::VMULSUBv2i32_OP2);
		break;
		case AArch64::SUBv4i32:
		setVFound(AArch64::MULv4i32, 1, MCP::VMULSUBv4i32_OP1);
		setVFound(AArch64::MULv4i32, 2, MCP::VMULSUBv4i32_OP2);
		break;
}		}
return Found;		return Found;
}		}
/// Floating-Point Support		/// Floating-Point Support

/// Find instructions that can be turned into madd.		/// Find instructions that can be turned into madd.
static bool getFMAPatterns(MachineInstr &Root,		static bool getFMAPatterns(MachineInstr &Root,
SmallVectorImpl<MachineCombinerPattern> &Patterns) {		SmallVectorImpl<MachineCombinerPattern> &Patterns) {
▲ Show 20 Lines • Show All 236 Lines • ▼ Show 20 Lines
/// \param Root is the F\|ADD instruction		/// \param Root is the F\|ADD instruction
/// \param [out] InsInstrs is a vector of machine instructions and will		/// \param [out] InsInstrs is a vector of machine instructions and will
/// contain the generated madd instruction		/// contain the generated madd instruction
/// \param IdxMulOpd is index of operand in Root that is the result of		/// \param IdxMulOpd is index of operand in Root that is the result of
/// the F\|MUL. In the example above IdxMulOpd is 1.		/// the F\|MUL. In the example above IdxMulOpd is 1.
/// \param MaddOpc the opcode fo the f\|madd instruction		/// \param MaddOpc the opcode fo the f\|madd instruction
/// \param RC Register class of operands		/// \param RC Register class of operands
/// \param kind of fma instruction (addressing mode) to be generated		/// \param kind of fma instruction (addressing mode) to be generated
/// \param ReplacedAddend is the result register from the instruction		/// \param ReplacedAddend is the result register from the instruction
		dmgreenUnsubmitted Done Reply Inline Actions Can you explain what this means? Are these not already SIMD MULADDs? dmgreen: Can you explain what this means? Are these not already SIMD MULADDs?
		sanwou01AuthorUnsubmitted Done Reply Inline Actions Ah, sorry, that TODO was there to remind me to add them :-) sanwou01: Ah, sorry, that TODO was there to remind me to add them :-)
/// replacing the non-combined operand, if any.		/// replacing the non-combined operand, if any.
static MachineInstr *		static MachineInstr *
genFusedMultiply(MachineFunction &MF, MachineRegisterInfo &MRI,		genFusedMultiply(MachineFunction &MF, MachineRegisterInfo &MRI,
const TargetInstrInfo *TII, MachineInstr &Root,		const TargetInstrInfo *TII, MachineInstr &Root,
SmallVectorImpl<MachineInstr *> &InsInstrs, unsigned IdxMulOpd,		SmallVectorImpl<MachineInstr *> &InsInstrs, unsigned IdxMulOpd,
unsigned MaddOpc, const TargetRegisterClass *RC,		unsigned MaddOpc, const TargetRegisterClass *RC,
FMAInstKind kind = FMAInstKind::Default,		FMAInstKind kind = FMAInstKind::Default,
const Register *ReplacedAddend = nullptr) {		const Register *ReplacedAddend = nullptr) {
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	MIB = BuildMI(MF, Root.getDebugLoc(), TII->get(MaddOpc), ResultReg)
.addReg(SrcReg1, getKillRegState(Src1IsKill));		.addReg(SrcReg1, getKillRegState(Src1IsKill));
else		else
assert(false && "Invalid FMA instruction kind \n");		assert(false && "Invalid FMA instruction kind \n");
// Insert the MADD (MADD, FMA, FMS, FMLA, FMSL)		// Insert the MADD (MADD, FMA, FMS, FMLA, FMSL)
InsInstrs.push_back(MIB);		InsInstrs.push_back(MIB);
return MUL;		return MUL;
}		}

		/// genFusedMultiplyAcc - Helper to generate fused multiply accumulate
		/// instructions.
		///
		/// \see genFusedMultiply
		static MachineInstr *genFusedMultiplyAcc(
		MachineFunction &MF, MachineRegisterInfo &MRI, const TargetInstrInfo *TII,
		MachineInstr &Root, SmallVectorImpl<MachineInstr *> &InsInstrs,
		unsigned IdxMulOpd, unsigned MaddOpc, const TargetRegisterClass *RC,
		const Register *ReplacedAddend = nullptr) {
		dmgreenUnsubmitted Done Reply Inline Actions Is ReplacedAddend ever not nullptr? dmgreen: Is ReplacedAddend ever not nullptr?
		return genFusedMultiply(MF, MRI, TII, Root, InsInstrs, IdxMulOpd, MaddOpc, RC,
		FMAInstKind::Accumulator, ReplacedAddend);
		}

/// genMaddR - Generate madd instruction and combine mul and add using		/// genMaddR - Generate madd instruction and combine mul and add using
/// an extra virtual register		/// an extra virtual register
/// Example - an ADD intermediate needs to be stored in a register:		/// Example - an ADD intermediate needs to be stored in a register:
/// MUL I=A,B,0		/// MUL I=A,B,0
/// ADD R,I,Imm		/// ADD R,I,Imm
/// ==> ORR V, ZR, Imm		/// ==> ORR V, ZR, Imm
/// ==> MADD R,A,B,V		/// ==> MADD R,A,B,V
/// \param MF Containing MachineFunction		/// \param MF Containing MachineFunction
▲ Show 20 Lines • Show All 223 Lines • ▼ Show 20 Lines	if (AArch64_AM::processLogicalImmediate(UImm, BitSize, Encoding)) {
.addReg(ZeroReg)		.addReg(ZeroReg)
.addImm(Encoding);		.addImm(Encoding);
InsInstrs.push_back(MIB1);		InsInstrs.push_back(MIB1);
InstrIdxForVirtReg.insert(std::make_pair(NewVR, 0));		InstrIdxForVirtReg.insert(std::make_pair(NewVR, 0));
MUL = genMaddR(MF, MRI, TII, Root, InsInstrs, 1, Opc, NewVR, RC);		MUL = genMaddR(MF, MRI, TII, Root, InsInstrs, 1, Opc, NewVR, RC);
}		}
break;		break;
}		}

		case MachineCombinerPattern::VMULADDv8i8_OP1:
		Opc = AArch64::MLAv8i8;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv8i8_OP2:
		Opc = AArch64::MLAv8i8;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv16i8_OP1:
		Opc = AArch64::MLAv16i8;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv16i8_OP2:
		Opc = AArch64::MLAv16i8;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv4i16_OP1:
		Opc = AArch64::MLAv4i16;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv4i16_OP2:
		Opc = AArch64::MLAv4i16;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv8i16_OP1:
		Opc = AArch64::MLAv8i16;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv8i16_OP2:
		Opc = AArch64::MLAv8i16;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv2i32_OP1:
		Opc = AArch64::MLAv2i32;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv2i32_OP2:
		Opc = AArch64::MLAv2i32;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv4i32_OP1:
		Opc = AArch64::MLAv4i32;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULADDv4i32_OP2:
		Opc = AArch64::MLAv4i32;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;

		case MachineCombinerPattern::VMULSUBv8i8_OP1:
		Opc = AArch64::MLSv8i8;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv8i8_OP2:
		Opc = AArch64::MLSv8i8;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv16i8_OP1:
		Opc = AArch64::MLSv16i8;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv16i8_OP2:
		Opc = AArch64::MLSv16i8;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv4i16_OP1:
		Opc = AArch64::MLSv4i16;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv4i16_OP2:
		Opc = AArch64::MLSv4i16;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv8i16_OP1:
		Opc = AArch64::MLSv8i16;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv8i16_OP2:
		Opc = AArch64::MLSv8i16;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv2i32_OP1:
		Opc = AArch64::MLSv2i32;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv2i32_OP2:
		Opc = AArch64::MLSv2i32;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv4i32_OP1:
		Opc = AArch64::MLSv4i32;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::VMULSUBv4i32_OP2:
		Opc = AArch64::MLSv4i32;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;

// Floating Point Support		// Floating Point Support
case MachineCombinerPattern::FMULADDH_OP1:		case MachineCombinerPattern::FMULADDH_OP1:
Opc = AArch64::FMADDHrrr;		Opc = AArch64::FMADDHrrr;
RC = &AArch64::FPR16RegClass;		RC = &AArch64::FPR16RegClass;
MUL = genFusedMultiply(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);		MUL = genFusedMultiply(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
break;		break;
case MachineCombinerPattern::FMULADDS_OP1:		case MachineCombinerPattern::FMULADDS_OP1:
Opc = AArch64::FMADDSrrr;		Opc = AArch64::FMADDSrrr;
▲ Show 20 Lines • Show All 1,482 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrInfo.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 3,787 Lines • ▼ Show 20 Lines
	def : Pat<(v2f64 (fma (fneg V128:$Rn), V128:$Rm, V128:$Rd)),			def : Pat<(v2f64 (fma (fneg V128:$Rn), V128:$Rm, V128:$Rd)),
	(FMLSv2f64 V128:$Rd, V128:$Rn, V128:$Rm)>;			(FMLSv2f64 V128:$Rd, V128:$Rn, V128:$Rm)>;

	defm FMULX : SIMDThreeSameVectorFP<0,0,0b011,"fmulx", int_aarch64_neon_fmulx>;			defm FMULX : SIMDThreeSameVectorFP<0,0,0b011,"fmulx", int_aarch64_neon_fmulx>;
	defm FMUL : SIMDThreeSameVectorFP<1,0,0b011,"fmul", fmul>;			defm FMUL : SIMDThreeSameVectorFP<1,0,0b011,"fmul", fmul>;
	defm FRECPS : SIMDThreeSameVectorFP<0,0,0b111,"frecps", int_aarch64_neon_frecps>;			defm FRECPS : SIMDThreeSameVectorFP<0,0,0b111,"frecps", int_aarch64_neon_frecps>;
	defm FRSQRTS : SIMDThreeSameVectorFP<0,1,0b111,"frsqrts", int_aarch64_neon_frsqrts>;			defm FRSQRTS : SIMDThreeSameVectorFP<0,1,0b111,"frsqrts", int_aarch64_neon_frsqrts>;
	defm FSUB : SIMDThreeSameVectorFP<0,1,0b010,"fsub", fsub>;			defm FSUB : SIMDThreeSameVectorFP<0,1,0b010,"fsub", fsub>;
	defm MLA : SIMDThreeSameVectorBHSTied<0, 0b10010, "mla",			defm MLA : SIMDThreeSameVectorBHSTied<0, 0b10010, "mla", null_frag>; // Generated in MachineCombine
	TriOpFrag<(add node:$LHS, (mul node:$MHS, node:$RHS))> >;			defm MLS : SIMDThreeSameVectorBHSTied<1, 0b10010, "mls", null_frag>; // Generated in MachineCombine
				dmgreenUnsubmitted Done Reply Inline Actions You might want to keep these on separate lines, with the comment making them quite long. dmgreen: You might want to keep these on separate lines, with the comment making them quite long.
	defm MLS : SIMDThreeSameVectorBHSTied<1, 0b10010, "mls",
	TriOpFrag<(sub node:$LHS, (mul node:$MHS, node:$RHS))> >;
	defm MUL : SIMDThreeSameVectorBHS<0, 0b10011, "mul", mul>;			defm MUL : SIMDThreeSameVectorBHS<0, 0b10011, "mul", mul>;
	defm PMUL : SIMDThreeSameVectorB<1, 0b10011, "pmul", int_aarch64_neon_pmul>;			defm PMUL : SIMDThreeSameVectorB<1, 0b10011, "pmul", int_aarch64_neon_pmul>;
	defm SABA : SIMDThreeSameVectorBHSTied<0, 0b01111, "saba",			defm SABA : SIMDThreeSameVectorBHSTied<0, 0b01111, "saba",
	TriOpFrag<(add node:$LHS, (int_aarch64_neon_sabd node:$MHS, node:$RHS))> >;			TriOpFrag<(add node:$LHS, (int_aarch64_neon_sabd node:$MHS, node:$RHS))> >;
	defm SABD : SIMDThreeSameVectorBHS<0,0b01110,"sabd", int_aarch64_neon_sabd>;			defm SABD : SIMDThreeSameVectorBHS<0,0b01110,"sabd", int_aarch64_neon_sabd>;
	defm SHADD : SIMDThreeSameVectorBHS<0,0b00000,"shadd", int_aarch64_neon_shadd>;			defm SHADD : SIMDThreeSameVectorBHS<0,0b00000,"shadd", int_aarch64_neon_shadd>;
	defm SHSUB : SIMDThreeSameVectorBHS<0,0b00100,"shsub", int_aarch64_neon_shsub>;			defm SHSUB : SIMDThreeSameVectorBHS<0,0b00100,"shsub", int_aarch64_neon_shsub>;
	defm SMAXP : SIMDThreeSameVectorBHS<0,0b10100,"smaxp", int_aarch64_neon_smaxp>;			defm SMAXP : SIMDThreeSameVectorBHS<0,0b10100,"smaxp", int_aarch64_neon_smaxp>;
	▲ Show 20 Lines • Show All 3,425 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/GlobalISel/select-with-no-legality-check.mir

Show First 20 Lines • Show All 1,427 Lines • ▼ Show 20 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule944_id3803_at_idx61417		; CHECK-LABEL: name: test_rule944_id3803_at_idx61417
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLAv8i8_:%[0-9]+]]:fpr64 = MLAv8i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i8_:%[0-9]+]]:fpr64 = MULv8i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv8i8_]]		; CHECK: [[ADDv8i8_:%[0-9]+]]:fpr64 = ADDv8i8 [[MULv8i8_]], [[COPY2]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv8i8_]]
%4:fpr(<8 x s8>) = COPY $d2		%4:fpr(<8 x s8>) = COPY $d2
%3:fpr(<8 x s8>) = COPY $d1		%3:fpr(<8 x s8>) = COPY $d1
%2:fpr(<8 x s8>) = COPY $d0		%2:fpr(<8 x s8>) = COPY $d0
%0:fpr(<8 x s8>) = G_MUL %3, %4		%0:fpr(<8 x s8>) = G_MUL %3, %4
%1:fpr(<8 x s8>) = G_ADD %0, %2		%1:fpr(<8 x s8>) = G_ADD %0, %2
$noreg = PATCHABLE_RET %1(<8 x s8>)		$noreg = PATCHABLE_RET %1(<8 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule945_id3804_at_idx61505		; CHECK-LABEL: name: test_rule945_id3804_at_idx61505
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLAv16i8_:%[0-9]+]]:fpr128 = MLAv16i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv16i8_:%[0-9]+]]:fpr128 = MULv16i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv16i8_]]		; CHECK: [[ADDv16i8_:%[0-9]+]]:fpr128 = ADDv16i8 [[MULv16i8_]], [[COPY2]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv16i8_]]
%4:fpr(<16 x s8>) = COPY $q2		%4:fpr(<16 x s8>) = COPY $q2
%3:fpr(<16 x s8>) = COPY $q1		%3:fpr(<16 x s8>) = COPY $q1
%2:fpr(<16 x s8>) = COPY $q0		%2:fpr(<16 x s8>) = COPY $q0
%0:fpr(<16 x s8>) = G_MUL %3, %4		%0:fpr(<16 x s8>) = G_MUL %3, %4
%1:fpr(<16 x s8>) = G_ADD %0, %2		%1:fpr(<16 x s8>) = G_ADD %0, %2
$noreg = PATCHABLE_RET %1(<16 x s8>)		$noreg = PATCHABLE_RET %1(<16 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule946_id3805_at_idx61593		; CHECK-LABEL: name: test_rule946_id3805_at_idx61593
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLAv4i16_:%[0-9]+]]:fpr64 = MLAv4i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv4i16_:%[0-9]+]]:fpr64 = MULv4i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv4i16_]]		; CHECK: [[ADDv4i16_:%[0-9]+]]:fpr64 = ADDv4i16 [[MULv4i16_]], [[COPY2]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv4i16_]]
%4:fpr(<4 x s16>) = COPY $d2		%4:fpr(<4 x s16>) = COPY $d2
%3:fpr(<4 x s16>) = COPY $d1		%3:fpr(<4 x s16>) = COPY $d1
%2:fpr(<4 x s16>) = COPY $d0		%2:fpr(<4 x s16>) = COPY $d0
%0:fpr(<4 x s16>) = G_MUL %3, %4		%0:fpr(<4 x s16>) = G_MUL %3, %4
%1:fpr(<4 x s16>) = G_ADD %0, %2		%1:fpr(<4 x s16>) = G_ADD %0, %2
$noreg = PATCHABLE_RET %1(<4 x s16>)		$noreg = PATCHABLE_RET %1(<4 x s16>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule947_id3806_at_idx61681		; CHECK-LABEL: name: test_rule947_id3806_at_idx61681
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLAv8i16_:%[0-9]+]]:fpr128 = MLAv8i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i16_:%[0-9]+]]:fpr128 = MULv8i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv8i16_]]		; CHECK: [[ADDv8i16_:%[0-9]+]]:fpr128 = ADDv8i16 [[MULv8i16_]], [[COPY2]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv8i16_]]
%4:fpr(<8 x s16>) = COPY $q2		%4:fpr(<8 x s16>) = COPY $q2
%3:fpr(<8 x s16>) = COPY $q1		%3:fpr(<8 x s16>) = COPY $q1
%2:fpr(<8 x s16>) = COPY $q0		%2:fpr(<8 x s16>) = COPY $q0
%0:fpr(<8 x s16>) = G_MUL %3, %4		%0:fpr(<8 x s16>) = G_MUL %3, %4
%1:fpr(<8 x s16>) = G_ADD %0, %2		%1:fpr(<8 x s16>) = G_ADD %0, %2
$noreg = PATCHABLE_RET %1(<8 x s16>)		$noreg = PATCHABLE_RET %1(<8 x s16>)

...		...
▲ Show 20 Lines • Show All 203 Lines • ▼ Show 20 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule956_id927_at_idx62401		; CHECK-LABEL: name: test_rule956_id927_at_idx62401
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLAv8i8_:%[0-9]+]]:fpr64 = MLAv8i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i8_:%[0-9]+]]:fpr64 = MULv8i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv8i8_]]		; CHECK: [[ADDv8i8_:%[0-9]+]]:fpr64 = ADDv8i8 [[COPY2]], [[MULv8i8_]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv8i8_]]
%4:fpr(<8 x s8>) = COPY $d2		%4:fpr(<8 x s8>) = COPY $d2
%3:fpr(<8 x s8>) = COPY $d1		%3:fpr(<8 x s8>) = COPY $d1
%2:fpr(<8 x s8>) = COPY $d0		%2:fpr(<8 x s8>) = COPY $d0
%0:fpr(<8 x s8>) = G_MUL %3, %4		%0:fpr(<8 x s8>) = G_MUL %3, %4
%1:fpr(<8 x s8>) = G_ADD %2, %0		%1:fpr(<8 x s8>) = G_ADD %2, %0
$noreg = PATCHABLE_RET %1(<8 x s8>)		$noreg = PATCHABLE_RET %1(<8 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule957_id928_at_idx62489		; CHECK-LABEL: name: test_rule957_id928_at_idx62489
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLAv16i8_:%[0-9]+]]:fpr128 = MLAv16i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv16i8_:%[0-9]+]]:fpr128 = MULv16i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv16i8_]]		; CHECK: [[ADDv16i8_:%[0-9]+]]:fpr128 = ADDv16i8 [[COPY2]], [[MULv16i8_]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv16i8_]]
%4:fpr(<16 x s8>) = COPY $q2		%4:fpr(<16 x s8>) = COPY $q2
%3:fpr(<16 x s8>) = COPY $q1		%3:fpr(<16 x s8>) = COPY $q1
%2:fpr(<16 x s8>) = COPY $q0		%2:fpr(<16 x s8>) = COPY $q0
%0:fpr(<16 x s8>) = G_MUL %3, %4		%0:fpr(<16 x s8>) = G_MUL %3, %4
%1:fpr(<16 x s8>) = G_ADD %2, %0		%1:fpr(<16 x s8>) = G_ADD %2, %0
$noreg = PATCHABLE_RET %1(<16 x s8>)		$noreg = PATCHABLE_RET %1(<16 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule958_id929_at_idx62577		; CHECK-LABEL: name: test_rule958_id929_at_idx62577
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLAv4i16_:%[0-9]+]]:fpr64 = MLAv4i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv4i16_:%[0-9]+]]:fpr64 = MULv4i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv4i16_]]		; CHECK: [[ADDv4i16_:%[0-9]+]]:fpr64 = ADDv4i16 [[COPY2]], [[MULv4i16_]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv4i16_]]
%4:fpr(<4 x s16>) = COPY $d2		%4:fpr(<4 x s16>) = COPY $d2
%3:fpr(<4 x s16>) = COPY $d1		%3:fpr(<4 x s16>) = COPY $d1
%2:fpr(<4 x s16>) = COPY $d0		%2:fpr(<4 x s16>) = COPY $d0
%0:fpr(<4 x s16>) = G_MUL %3, %4		%0:fpr(<4 x s16>) = G_MUL %3, %4
%1:fpr(<4 x s16>) = G_ADD %2, %0		%1:fpr(<4 x s16>) = G_ADD %2, %0
$noreg = PATCHABLE_RET %1(<4 x s16>)		$noreg = PATCHABLE_RET %1(<4 x s16>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule959_id930_at_idx62665		; CHECK-LABEL: name: test_rule959_id930_at_idx62665
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLAv8i16_:%[0-9]+]]:fpr128 = MLAv8i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i16_:%[0-9]+]]:fpr128 = MULv8i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv8i16_]]		; CHECK: [[ADDv8i16_:%[0-9]+]]:fpr128 = ADDv8i16 [[COPY2]], [[MULv8i16_]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv8i16_]]
%4:fpr(<8 x s16>) = COPY $q2		%4:fpr(<8 x s16>) = COPY $q2
%3:fpr(<8 x s16>) = COPY $q1		%3:fpr(<8 x s16>) = COPY $q1
%2:fpr(<8 x s16>) = COPY $q0		%2:fpr(<8 x s16>) = COPY $q0
%0:fpr(<8 x s16>) = G_MUL %3, %4		%0:fpr(<8 x s16>) = G_MUL %3, %4
%1:fpr(<8 x s16>) = G_ADD %2, %0		%1:fpr(<8 x s16>) = G_ADD %2, %0
$noreg = PATCHABLE_RET %1(<8 x s16>)		$noreg = PATCHABLE_RET %1(<8 x s16>)

...		...
▲ Show 20 Lines • Show All 203 Lines • ▼ Show 20 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule977_id933_at_idx64051		; CHECK-LABEL: name: test_rule977_id933_at_idx64051
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLSv8i8_:%[0-9]+]]:fpr64 = MLSv8i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i8_:%[0-9]+]]:fpr64 = MULv8i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLSv8i8_]]		; CHECK: [[SUBv8i8_:%[0-9]+]]:fpr64 = SUBv8i8 [[COPY2]], [[MULv8i8_]]
		; CHECK: $noreg = PATCHABLE_RET [[SUBv8i8_]]
%4:fpr(<8 x s8>) = COPY $d2		%4:fpr(<8 x s8>) = COPY $d2
%3:fpr(<8 x s8>) = COPY $d1		%3:fpr(<8 x s8>) = COPY $d1
%2:fpr(<8 x s8>) = COPY $d0		%2:fpr(<8 x s8>) = COPY $d0
%0:fpr(<8 x s8>) = G_MUL %3, %4		%0:fpr(<8 x s8>) = G_MUL %3, %4
%1:fpr(<8 x s8>) = G_SUB %2, %0		%1:fpr(<8 x s8>) = G_SUB %2, %0
$noreg = PATCHABLE_RET %1(<8 x s8>)		$noreg = PATCHABLE_RET %1(<8 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule978_id934_at_idx64139		; CHECK-LABEL: name: test_rule978_id934_at_idx64139
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLSv16i8_:%[0-9]+]]:fpr128 = MLSv16i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv16i8_:%[0-9]+]]:fpr128 = MULv16i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLSv16i8_]]		; CHECK: [[SUBv16i8_:%[0-9]+]]:fpr128 = SUBv16i8 [[COPY2]], [[MULv16i8_]]
		; CHECK: $noreg = PATCHABLE_RET [[SUBv16i8_]]
%4:fpr(<16 x s8>) = COPY $q2		%4:fpr(<16 x s8>) = COPY $q2
%3:fpr(<16 x s8>) = COPY $q1		%3:fpr(<16 x s8>) = COPY $q1
%2:fpr(<16 x s8>) = COPY $q0		%2:fpr(<16 x s8>) = COPY $q0
%0:fpr(<16 x s8>) = G_MUL %3, %4		%0:fpr(<16 x s8>) = G_MUL %3, %4
%1:fpr(<16 x s8>) = G_SUB %2, %0		%1:fpr(<16 x s8>) = G_SUB %2, %0
$noreg = PATCHABLE_RET %1(<16 x s8>)		$noreg = PATCHABLE_RET %1(<16 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule979_id935_at_idx64227		; CHECK-LABEL: name: test_rule979_id935_at_idx64227
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLSv4i16_:%[0-9]+]]:fpr64 = MLSv4i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv4i16_:%[0-9]+]]:fpr64 = MULv4i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLSv4i16_]]		; CHECK: [[SUBv4i16_:%[0-9]+]]:fpr64 = SUBv4i16 [[COPY2]], [[MULv4i16_]]
		; CHECK: $noreg = PATCHABLE_RET [[SUBv4i16_]]
%4:fpr(<4 x s16>) = COPY $d2		%4:fpr(<4 x s16>) = COPY $d2
%3:fpr(<4 x s16>) = COPY $d1		%3:fpr(<4 x s16>) = COPY $d1
%2:fpr(<4 x s16>) = COPY $d0		%2:fpr(<4 x s16>) = COPY $d0
%0:fpr(<4 x s16>) = G_MUL %3, %4		%0:fpr(<4 x s16>) = G_MUL %3, %4
%1:fpr(<4 x s16>) = G_SUB %2, %0		%1:fpr(<4 x s16>) = G_SUB %2, %0
$noreg = PATCHABLE_RET %1(<4 x s16>)		$noreg = PATCHABLE_RET %1(<4 x s16>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule980_id936_at_idx64315		; CHECK-LABEL: name: test_rule980_id936_at_idx64315
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLSv8i16_:%[0-9]+]]:fpr128 = MLSv8i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i16_:%[0-9]+]]:fpr128 = MULv8i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLSv8i16_]]		; CHECK: [[SUBv8i16_:%[0-9]+]]:fpr128 = SUBv8i16 [[COPY2]], [[MULv8i16_]]
		; CHECK: $noreg = PATCHABLE_RET [[SUBv8i16_]]
%4:fpr(<8 x s16>) = COPY $q2		%4:fpr(<8 x s16>) = COPY $q2
%3:fpr(<8 x s16>) = COPY $q1		%3:fpr(<8 x s16>) = COPY $q1
%2:fpr(<8 x s16>) = COPY $q0		%2:fpr(<8 x s16>) = COPY $q0
%0:fpr(<8 x s16>) = G_MUL %3, %4		%0:fpr(<8 x s16>) = G_MUL %3, %4
%1:fpr(<8 x s16>) = G_SUB %2, %0		%1:fpr(<8 x s16>) = G_SUB %2, %0
$noreg = PATCHABLE_RET %1(<8 x s16>)		$noreg = PATCHABLE_RET %1(<8 x s16>)

...		...
▲ Show 20 Lines • Show All 2,344 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/overeager_mla_fusing.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc %s --mtriple aarch64 -verify-machineinstrs -o - \| FileCheck %s			; RUN: llc %s --mtriple aarch64 -verify-machineinstrs -o - \| FileCheck %s

	define dso_local void @jsimd_idct_ifast_neon_intrinsic(i8* nocapture readonly %dct_table, i16* nocapture readonly %coef_block, i8** nocapture readonly %output_buf, i32 %output_col) local_unnamed_addr #0 {			define dso_local void @jsimd_idct_ifast_neon_intrinsic(i8* nocapture readonly %dct_table, i16* nocapture readonly %coef_block, i8** nocapture readonly %output_buf, i32 %output_col) local_unnamed_addr #0 {
	; CHECK-LABEL: jsimd_idct_ifast_neon_intrinsic:			; CHECK-LABEL: jsimd_idct_ifast_neon_intrinsic:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: ldr q0, [x1, #32]			; CHECK-NEXT: ldr q0, [x1, #32]
	; CHECK-NEXT: ldr q1, [x0, #32]			; CHECK-NEXT: ldr q1, [x1, #96]
	; CHECK-NEXT: ldr q2, [x1, #96]			; CHECK-NEXT: ldr q2, [x0, #32]
	; CHECK-NEXT: ldr q3, [x0, #96]			; CHECK-NEXT: ldr q3, [x0, #96]
	; CHECK-NEXT: ldr x8, [x2, #48]			; CHECK-NEXT: ldr x8, [x2, #48]
	; CHECK-NEXT: mul v0.8h, v1.8h, v0.8h
	; CHECK-NEXT: mov v1.16b, v0.16b
	; CHECK-NEXT: mla v1.8h, v3.8h, v2.8h
	; CHECK-NEXT: mov w9, w3			; CHECK-NEXT: mov w9, w3
	; CHECK-NEXT: str q1, [x8, x9]			; CHECK-NEXT: mul v0.8h, v2.8h, v0.8h
				; CHECK-NEXT: mul v1.8h, v3.8h, v1.8h
				; CHECK-NEXT: add v2.8h, v0.8h, v1.8h
				; CHECK-NEXT: str q2, [x8, x9]
	; CHECK-NEXT: ldr x8, [x2, #56]			; CHECK-NEXT: ldr x8, [x2, #56]
	; CHECK-NEXT: mls v0.8h, v3.8h, v2.8h			; CHECK-NEXT: sub v0.8h, v0.8h, v1.8h
	; CHECK-NEXT: str q0, [x8, x9]			; CHECK-NEXT: str q0, [x8, x9]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%add.ptr5 = getelementptr inbounds i16, i16* %coef_block, i64 16			%add.ptr5 = getelementptr inbounds i16, i16* %coef_block, i64 16
	%0 = bitcast i16* %add.ptr5 to <8 x i16>*			%0 = bitcast i16* %add.ptr5 to <8 x i16>*
	%1 = load <8 x i16>, <8 x i16>* %0, align 16			%1 = load <8 x i16>, <8 x i16>* %0, align 16

	%add.ptr17 = getelementptr inbounds i16, i16* %coef_block, i64 48			%add.ptr17 = getelementptr inbounds i16, i16* %coef_block, i64 48
	Show All 33 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Fix over-eager fusing of NEON SIMD MUL/ADD
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 230913

llvm/include/llvm/CodeGen/MachineCombinerPattern.h

llvm/lib/Target/AArch64/AArch64InstrInfo.cpp

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/test/CodeGen/AArch64/GlobalISel/select-with-no-legality-check.mir

llvm/test/CodeGen/AArch64/overeager_mla_fusing.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Fix over-eager fusing of NEON SIMD MUL/ADDClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 230913

llvm/include/llvm/CodeGen/MachineCombinerPattern.h

llvm/lib/Target/AArch64/AArch64InstrInfo.cpp

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/test/CodeGen/AArch64/GlobalISel/select-with-no-legality-check.mir

llvm/test/CodeGen/AArch64/overeager_mla_fusing.ll

[AArch64] Fix over-eager fusing of NEON SIMD MUL/ADD
ClosedPublic