Diff 231912

llvm/include/llvm/CodeGen/MachineCombinerPattern.h

Show All 32 Lines	enum class MachineCombinerPattern {
MULADDWI_OP1,		MULADDWI_OP1,
MULSUBWI_OP1,		MULSUBWI_OP1,
MULADDX_OP1,		MULADDX_OP1,
MULADDX_OP2,		MULADDX_OP2,
MULSUBX_OP1,		MULSUBX_OP1,
MULSUBX_OP2,		MULSUBX_OP2,
MULADDXI_OP1,		MULADDXI_OP1,
MULSUBXI_OP1,		MULSUBXI_OP1,
		// NEON integers vectors
		MULADDv8i8_OP1,
		dmgreenUnsubmitted Done Reply Inline Actions Do these need V's on the front? The type is already in the name. dmgreen: Do these need V's on the front? The type is already in the name.
		MULADDv8i8_OP2,
		MULADDv16i8_OP1,
		MULADDv16i8_OP2,
		MULADDv4i16_OP1,
		MULADDv4i16_OP2,
		MULADDv8i16_OP1,
		MULADDv8i16_OP2,
		MULADDv2i32_OP1,
		MULADDv2i32_OP2,
		MULADDv4i32_OP1,
		MULADDv4i32_OP2,

		MULSUBv8i8_OP1,
		MULSUBv8i8_OP2,
		MULSUBv16i8_OP1,
		MULSUBv16i8_OP2,
		MULSUBv4i16_OP1,
		MULSUBv4i16_OP2,
		MULSUBv8i16_OP1,
		MULSUBv8i16_OP2,
		MULSUBv2i32_OP1,
		MULSUBv2i32_OP2,
		MULSUBv4i32_OP1,
		MULSUBv4i32_OP2,

		MULADDv4i16_indexed_OP1,
		MULADDv4i16_indexed_OP2,
		MULADDv8i16_indexed_OP1,
		MULADDv8i16_indexed_OP2,
		MULADDv2i32_indexed_OP1,
		MULADDv2i32_indexed_OP2,
		MULADDv4i32_indexed_OP1,
		MULADDv4i32_indexed_OP2,

		MULSUBv4i16_indexed_OP1,
		MULSUBv4i16_indexed_OP2,
		MULSUBv8i16_indexed_OP1,
		MULSUBv8i16_indexed_OP2,
		MULSUBv2i32_indexed_OP1,
		MULSUBv2i32_indexed_OP2,
		MULSUBv4i32_indexed_OP1,
		MULSUBv4i32_indexed_OP2,

// Floating Point		// Floating Point
FMULADDH_OP1,		FMULADDH_OP1,
FMULADDH_OP2,		FMULADDH_OP2,
FMULSUBH_OP1,		FMULSUBH_OP1,
FMULSUBH_OP2,		FMULSUBH_OP2,
FMULADDS_OP1,		FMULADDS_OP1,
FMULADDS_OP2,		FMULADDS_OP2,
FMULSUBS_OP1,		FMULSUBS_OP1,
▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrInfo.cpp

Show First 20 Lines • Show All 3,565 Lines • ▼ Show 20 Lines	static bool isCombineInstrCandidate64(unsigned Opc) {
case AArch64::ADDXri:		case AArch64::ADDXri:
case AArch64::SUBXrr:		case AArch64::SUBXrr:
case AArch64::ADDSXrr:		case AArch64::ADDSXrr:
case AArch64::ADDSXri:		case AArch64::ADDSXri:
case AArch64::SUBSXrr:		case AArch64::SUBSXrr:
// Note: MSUB Wd,Wn,Wm,Wi -> Wd = Wi - WnxWm, not Wd=WnxWm - Wi.		// Note: MSUB Wd,Wn,Wm,Wi -> Wd = Wi - WnxWm, not Wd=WnxWm - Wi.
case AArch64::SUBXri:		case AArch64::SUBXri:
case AArch64::SUBSXri:		case AArch64::SUBSXri:
		case AArch64::ADDv8i8:
		case AArch64::ADDv16i8:
		case AArch64::ADDv4i16:
		case AArch64::ADDv8i16:
		case AArch64::ADDv2i32:
		case AArch64::ADDv4i32:
		case AArch64::SUBv8i8:
		case AArch64::SUBv16i8:
		case AArch64::SUBv4i16:
		case AArch64::SUBv8i16:
		case AArch64::SUBv2i32:
		case AArch64::SUBv4i32:
return true;		return true;
default:		default:
break;		break;
}		}
return false;		return false;
}		}

// FP Opcodes that can be combined with a FMUL		// FP Opcodes that can be combined with a FMUL
▲ Show 20 Lines • Show All 126 Lines • ▼ Show 20 Lines	static bool getMaddPatterns(MachineInstr &Root,
auto setFound = [&](int Opcode, int Operand, unsigned ZeroReg,		auto setFound = [&](int Opcode, int Operand, unsigned ZeroReg,
MachineCombinerPattern Pattern) {		MachineCombinerPattern Pattern) {
if (canCombineWithMUL(MBB, Root.getOperand(Operand), Opcode, ZeroReg)) {		if (canCombineWithMUL(MBB, Root.getOperand(Operand), Opcode, ZeroReg)) {
Patterns.push_back(Pattern);		Patterns.push_back(Pattern);
Found = true;		Found = true;
}		}
};		};

		auto setVFound = [&](int Opcode, int Operand, MachineCombinerPattern Pattern) {
		if (canCombine(MBB, Root.getOperand(Operand), Opcode)) {
		Patterns.push_back(Pattern);
		Found = true;
		}
		};

typedef MachineCombinerPattern MCP;		typedef MachineCombinerPattern MCP;

switch (Opc) {		switch (Opc) {
default:		default:
break;		break;
case AArch64::ADDWrr:		case AArch64::ADDWrr:
assert(Root.getOperand(1).isReg() && Root.getOperand(2).isReg() &&		assert(Root.getOperand(1).isReg() && Root.getOperand(2).isReg() &&
"ADDWrr does not have register operands");		"ADDWrr does not have register operands");
Show All 19 Lines	case AArch64::ADDXri:
setFound(AArch64::MADDXrrr, 1, AArch64::XZR, MCP::MULADDXI_OP1);		setFound(AArch64::MADDXrrr, 1, AArch64::XZR, MCP::MULADDXI_OP1);
break;		break;
case AArch64::SUBWri:		case AArch64::SUBWri:
setFound(AArch64::MADDWrrr, 1, AArch64::WZR, MCP::MULSUBWI_OP1);		setFound(AArch64::MADDWrrr, 1, AArch64::WZR, MCP::MULSUBWI_OP1);
break;		break;
case AArch64::SUBXri:		case AArch64::SUBXri:
setFound(AArch64::MADDXrrr, 1, AArch64::XZR, MCP::MULSUBXI_OP1);		setFound(AArch64::MADDXrrr, 1, AArch64::XZR, MCP::MULSUBXI_OP1);
break;		break;
		case AArch64::ADDv8i8:
		setVFound(AArch64::MULv8i8, 1, MCP::MULADDv8i8_OP1);
		setVFound(AArch64::MULv8i8, 2, MCP::MULADDv8i8_OP2);
		break;
		case AArch64::ADDv16i8:
		setVFound(AArch64::MULv16i8, 1, MCP::MULADDv16i8_OP1);
		setVFound(AArch64::MULv16i8, 2, MCP::MULADDv16i8_OP2);
		break;
		case AArch64::ADDv4i16:
		setVFound(AArch64::MULv4i16, 1, MCP::MULADDv4i16_OP1);
		setVFound(AArch64::MULv4i16, 2, MCP::MULADDv4i16_OP2);
		setVFound(AArch64::MULv4i16_indexed, 1, MCP::MULADDv4i16_indexed_OP1);
		setVFound(AArch64::MULv4i16_indexed, 2, MCP::MULADDv4i16_indexed_OP2);
		break;
		case AArch64::ADDv8i16:
		setVFound(AArch64::MULv8i16, 1, MCP::MULADDv8i16_OP1);
		setVFound(AArch64::MULv8i16, 2, MCP::MULADDv8i16_OP2);
		setVFound(AArch64::MULv8i16_indexed, 1, MCP::MULADDv8i16_indexed_OP1);
		setVFound(AArch64::MULv8i16_indexed, 2, MCP::MULADDv8i16_indexed_OP2);
		break;
		case AArch64::ADDv2i32:
		setVFound(AArch64::MULv2i32, 1, MCP::MULADDv2i32_OP1);
		setVFound(AArch64::MULv2i32, 2, MCP::MULADDv2i32_OP2);
		setVFound(AArch64::MULv2i32_indexed, 1, MCP::MULADDv2i32_indexed_OP1);
		setVFound(AArch64::MULv2i32_indexed, 2, MCP::MULADDv2i32_indexed_OP2);
		break;
		case AArch64::ADDv4i32:
		setVFound(AArch64::MULv4i32, 1, MCP::MULADDv4i32_OP1);
		setVFound(AArch64::MULv4i32, 2, MCP::MULADDv4i32_OP2);
		setVFound(AArch64::MULv4i32_indexed, 1, MCP::MULADDv4i32_indexed_OP1);
		setVFound(AArch64::MULv4i32_indexed, 2, MCP::MULADDv4i32_indexed_OP2);
		break;
		case AArch64::SUBv8i8:
		setVFound(AArch64::MULv8i8, 1, MCP::MULSUBv8i8_OP1);
		setVFound(AArch64::MULv8i8, 2, MCP::MULSUBv8i8_OP2);
		break;
		case AArch64::SUBv16i8:
		setVFound(AArch64::MULv16i8, 1, MCP::MULSUBv16i8_OP1);
		setVFound(AArch64::MULv16i8, 2, MCP::MULSUBv16i8_OP2);
		break;
		case AArch64::SUBv4i16:
		setVFound(AArch64::MULv4i16, 1, MCP::MULSUBv4i16_OP1);
		setVFound(AArch64::MULv4i16, 2, MCP::MULSUBv4i16_OP2);
		setVFound(AArch64::MULv4i16_indexed, 1, MCP::MULSUBv4i16_indexed_OP1);
		setVFound(AArch64::MULv4i16_indexed, 2, MCP::MULSUBv4i16_indexed_OP2);
		break;
		case AArch64::SUBv8i16:
		setVFound(AArch64::MULv8i16, 1, MCP::MULSUBv8i16_OP1);
		setVFound(AArch64::MULv8i16, 2, MCP::MULSUBv8i16_OP2);
		setVFound(AArch64::MULv8i16_indexed, 1, MCP::MULSUBv8i16_indexed_OP1);
		setVFound(AArch64::MULv8i16_indexed, 2, MCP::MULSUBv8i16_indexed_OP2);
		break;
		case AArch64::SUBv2i32:
		setVFound(AArch64::MULv2i32, 1, MCP::MULSUBv2i32_OP1);
		setVFound(AArch64::MULv2i32, 2, MCP::MULSUBv2i32_OP2);
		setVFound(AArch64::MULv2i32_indexed, 1, MCP::MULSUBv2i32_indexed_OP1);
		setVFound(AArch64::MULv2i32_indexed, 2, MCP::MULSUBv2i32_indexed_OP2);
		break;
		case AArch64::SUBv4i32:
		setVFound(AArch64::MULv4i32, 1, MCP::MULSUBv4i32_OP1);
		setVFound(AArch64::MULv4i32, 2, MCP::MULSUBv4i32_OP2);
		setVFound(AArch64::MULv4i32_indexed, 1, MCP::MULSUBv4i32_indexed_OP1);
		setVFound(AArch64::MULv4i32_indexed, 2, MCP::MULSUBv4i32_indexed_OP2);
		break;
}		}
return Found;		return Found;
}		}
/// Floating-Point Support		/// Floating-Point Support

/// Find instructions that can be turned into madd.		/// Find instructions that can be turned into madd.
static bool getFMAPatterns(MachineInstr &Root,		static bool getFMAPatterns(MachineInstr &Root,
SmallVectorImpl<MachineCombinerPattern> &Patterns) {		SmallVectorImpl<MachineCombinerPattern> &Patterns) {
▲ Show 20 Lines • Show All 196 Lines • ▼ Show 20 Lines	bool AArch64InstrInfo::isThroughputPattern(
case MachineCombinerPattern::FMLSv4f16_OP1:		case MachineCombinerPattern::FMLSv4f16_OP1:
case MachineCombinerPattern::FMLSv4f16_OP2:		case MachineCombinerPattern::FMLSv4f16_OP2:
case MachineCombinerPattern::FMLSv8f16_OP1:		case MachineCombinerPattern::FMLSv8f16_OP1:
case MachineCombinerPattern::FMLSv8f16_OP2:		case MachineCombinerPattern::FMLSv8f16_OP2:
case MachineCombinerPattern::FMLSv2f32_OP2:		case MachineCombinerPattern::FMLSv2f32_OP2:
case MachineCombinerPattern::FMLSv2f64_OP2:		case MachineCombinerPattern::FMLSv2f64_OP2:
case MachineCombinerPattern::FMLSv4i32_indexed_OP2:		case MachineCombinerPattern::FMLSv4i32_indexed_OP2:
case MachineCombinerPattern::FMLSv4f32_OP2:		case MachineCombinerPattern::FMLSv4f32_OP2:
		case MachineCombinerPattern::MULADDv8i8_OP1:
		case MachineCombinerPattern::MULADDv8i8_OP2:
		case MachineCombinerPattern::MULADDv16i8_OP1:
		case MachineCombinerPattern::MULADDv16i8_OP2:
		case MachineCombinerPattern::MULADDv4i16_OP1:
		case MachineCombinerPattern::MULADDv4i16_OP2:
		case MachineCombinerPattern::MULADDv8i16_OP1:
		case MachineCombinerPattern::MULADDv8i16_OP2:
		case MachineCombinerPattern::MULADDv2i32_OP1:
		case MachineCombinerPattern::MULADDv2i32_OP2:
		case MachineCombinerPattern::MULADDv4i32_OP1:
		case MachineCombinerPattern::MULADDv4i32_OP2:
		case MachineCombinerPattern::MULSUBv8i8_OP1:
		case MachineCombinerPattern::MULSUBv8i8_OP2:
		case MachineCombinerPattern::MULSUBv16i8_OP1:
		case MachineCombinerPattern::MULSUBv16i8_OP2:
		case MachineCombinerPattern::MULSUBv4i16_OP1:
		case MachineCombinerPattern::MULSUBv4i16_OP2:
		case MachineCombinerPattern::MULSUBv8i16_OP1:
		case MachineCombinerPattern::MULSUBv8i16_OP2:
		case MachineCombinerPattern::MULSUBv2i32_OP1:
		case MachineCombinerPattern::MULSUBv2i32_OP2:
		case MachineCombinerPattern::MULSUBv4i32_OP1:
		case MachineCombinerPattern::MULSUBv4i32_OP2:
		case MachineCombinerPattern::MULADDv4i16_indexed_OP1:
		case MachineCombinerPattern::MULADDv4i16_indexed_OP2:
		case MachineCombinerPattern::MULADDv8i16_indexed_OP1:
		case MachineCombinerPattern::MULADDv8i16_indexed_OP2:
		case MachineCombinerPattern::MULADDv2i32_indexed_OP1:
		case MachineCombinerPattern::MULADDv2i32_indexed_OP2:
		case MachineCombinerPattern::MULADDv4i32_indexed_OP1:
		case MachineCombinerPattern::MULADDv4i32_indexed_OP2:
		case MachineCombinerPattern::MULSUBv4i16_indexed_OP1:
		case MachineCombinerPattern::MULSUBv4i16_indexed_OP2:
		case MachineCombinerPattern::MULSUBv8i16_indexed_OP1:
		case MachineCombinerPattern::MULSUBv8i16_indexed_OP2:
		case MachineCombinerPattern::MULSUBv2i32_indexed_OP1:
		case MachineCombinerPattern::MULSUBv2i32_indexed_OP2:
		case MachineCombinerPattern::MULSUBv4i32_indexed_OP1:
		case MachineCombinerPattern::MULSUBv4i32_indexed_OP2:
return true;		return true;
		dmgreenUnsubmitted Done Reply Inline Actions Can you explain what this means? Are these not already SIMD MULADDs? dmgreen: Can you explain what this means? Are these not already SIMD MULADDs?
		sanwou01AuthorUnsubmitted Done Reply Inline Actions Ah, sorry, that TODO was there to remind me to add them :-) sanwou01: Ah, sorry, that TODO was there to remind me to add them :-)
} // end switch (Pattern)		} // end switch (Pattern)
return false;		return false;
}		}
/// Return true when there is potentially a faster code sequence for an		/// Return true when there is potentially a faster code sequence for an
/// instruction chain ending in \p Root. All potential patterns are listed in		/// instruction chain ending in \p Root. All potential patterns are listed in
/// the \p Pattern vector. Pattern should be sorted in priority order since the		/// the \p Pattern vector. Pattern should be sorted in priority order since the
/// pattern evaluator stops checking as soon as it finds a faster sequence.		/// pattern evaluator stops checking as soon as it finds a faster sequence.

▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines	MIB = BuildMI(MF, Root.getDebugLoc(), TII->get(MaddOpc), ResultReg)
.addReg(SrcReg1, getKillRegState(Src1IsKill));		.addReg(SrcReg1, getKillRegState(Src1IsKill));
else		else
assert(false && "Invalid FMA instruction kind \n");		assert(false && "Invalid FMA instruction kind \n");
// Insert the MADD (MADD, FMA, FMS, FMLA, FMSL)		// Insert the MADD (MADD, FMA, FMS, FMLA, FMSL)
InsInstrs.push_back(MIB);		InsInstrs.push_back(MIB);
return MUL;		return MUL;
}		}

		/// genFusedMultiplyAcc - Helper to generate fused multiply accumulate
		/// instructions.
		///
		/// \see genFusedMultiply
		static MachineInstr *genFusedMultiplyAcc(
		MachineFunction &MF, MachineRegisterInfo &MRI, const TargetInstrInfo *TII,
		MachineInstr &Root, SmallVectorImpl<MachineInstr *> &InsInstrs,
		unsigned IdxMulOpd, unsigned MaddOpc, const TargetRegisterClass *RC) {
		return genFusedMultiply(MF, MRI, TII, Root, InsInstrs, IdxMulOpd, MaddOpc, RC,
		dmgreenUnsubmitted Done Reply Inline Actions Is ReplacedAddend ever not nullptr? dmgreen: Is ReplacedAddend ever not nullptr?
		FMAInstKind::Accumulator);
		}

		/// genFusedMultiplyIdx - Helper to generate fused multiply accumulate
		/// instructions.
		///
		/// \see genFusedMultiply
		static MachineInstr *genFusedMultiplyIdx(
		MachineFunction &MF, MachineRegisterInfo &MRI, const TargetInstrInfo *TII,
		MachineInstr &Root, SmallVectorImpl<MachineInstr *> &InsInstrs,
		unsigned IdxMulOpd, unsigned MaddOpc, const TargetRegisterClass *RC) {
		return genFusedMultiply(MF, MRI, TII, Root, InsInstrs, IdxMulOpd, MaddOpc, RC,
		FMAInstKind::Indexed);
		}

/// genMaddR - Generate madd instruction and combine mul and add using		/// genMaddR - Generate madd instruction and combine mul and add using
/// an extra virtual register		/// an extra virtual register
/// Example - an ADD intermediate needs to be stored in a register:		/// Example - an ADD intermediate needs to be stored in a register:
/// MUL I=A,B,0		/// MUL I=A,B,0
/// ADD R,I,Imm		/// ADD R,I,Imm
/// ==> ORR V, ZR, Imm		/// ==> ORR V, ZR, Imm
/// ==> MADD R,A,B,V		/// ==> MADD R,A,B,V
/// \param MF Containing MachineFunction		/// \param MF Containing MachineFunction
▲ Show 20 Lines • Show All 223 Lines • ▼ Show 20 Lines	if (AArch64_AM::processLogicalImmediate(UImm, BitSize, Encoding)) {
.addReg(ZeroReg)		.addReg(ZeroReg)
.addImm(Encoding);		.addImm(Encoding);
InsInstrs.push_back(MIB1);		InsInstrs.push_back(MIB1);
InstrIdxForVirtReg.insert(std::make_pair(NewVR, 0));		InstrIdxForVirtReg.insert(std::make_pair(NewVR, 0));
MUL = genMaddR(MF, MRI, TII, Root, InsInstrs, 1, Opc, NewVR, RC);		MUL = genMaddR(MF, MRI, TII, Root, InsInstrs, 1, Opc, NewVR, RC);
}		}
break;		break;
}		}

		case MachineCombinerPattern::MULADDv8i8_OP1:
		Opc = AArch64::MLAv8i8;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv8i8_OP2:
		Opc = AArch64::MLAv8i8;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv16i8_OP1:
		Opc = AArch64::MLAv16i8;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv16i8_OP2:
		Opc = AArch64::MLAv16i8;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv4i16_OP1:
		Opc = AArch64::MLAv4i16;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv4i16_OP2:
		Opc = AArch64::MLAv4i16;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv8i16_OP1:
		Opc = AArch64::MLAv8i16;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv8i16_OP2:
		Opc = AArch64::MLAv8i16;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv2i32_OP1:
		Opc = AArch64::MLAv2i32;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv2i32_OP2:
		Opc = AArch64::MLAv2i32;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv4i32_OP1:
		Opc = AArch64::MLAv4i32;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv4i32_OP2:
		Opc = AArch64::MLAv4i32;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;

		case MachineCombinerPattern::MULSUBv8i8_OP1:
		Opc = AArch64::MLSv8i8;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv8i8_OP2:
		Opc = AArch64::MLSv8i8;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv16i8_OP1:
		Opc = AArch64::MLSv16i8;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv16i8_OP2:
		Opc = AArch64::MLSv16i8;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv4i16_OP1:
		Opc = AArch64::MLSv4i16;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv4i16_OP2:
		Opc = AArch64::MLSv4i16;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv8i16_OP1:
		Opc = AArch64::MLSv8i16;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv8i16_OP2:
		Opc = AArch64::MLSv8i16;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv2i32_OP1:
		Opc = AArch64::MLSv2i32;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv2i32_OP2:
		Opc = AArch64::MLSv2i32;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv4i32_OP1:
		Opc = AArch64::MLSv4i32;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv4i32_OP2:
		Opc = AArch64::MLSv4i32;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyAcc(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;

		case MachineCombinerPattern::MULADDv4i16_indexed_OP1:
		Opc = AArch64::MLAv4i16_indexed;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv4i16_indexed_OP2:
		Opc = AArch64::MLAv4i16_indexed;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv8i16_indexed_OP1:
		Opc = AArch64::MLAv8i16_indexed;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv8i16_indexed_OP2:
		Opc = AArch64::MLAv8i16_indexed;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv2i32_indexed_OP1:
		Opc = AArch64::MLAv2i32_indexed;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv2i32_indexed_OP2:
		Opc = AArch64::MLAv2i32_indexed;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv4i32_indexed_OP1:
		Opc = AArch64::MLAv4i32_indexed;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULADDv4i32_indexed_OP2:
		Opc = AArch64::MLAv4i32_indexed;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;

		case MachineCombinerPattern::MULSUBv4i16_indexed_OP1:
		Opc = AArch64::MLSv4i16_indexed;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv4i16_indexed_OP2:
		Opc = AArch64::MLSv4i16_indexed;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv8i16_indexed_OP1:
		Opc = AArch64::MLSv8i16_indexed;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv8i16_indexed_OP2:
		Opc = AArch64::MLSv8i16_indexed;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv2i32_indexed_OP1:
		Opc = AArch64::MLSv2i32_indexed;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv2i32_indexed_OP2:
		Opc = AArch64::MLSv2i32_indexed;
		RC = &AArch64::FPR64RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv4i32_indexed_OP1:
		Opc = AArch64::MLSv4i32_indexed;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
		break;
		case MachineCombinerPattern::MULSUBv4i32_indexed_OP2:
		Opc = AArch64::MLSv4i32_indexed;
		RC = &AArch64::FPR128RegClass;
		MUL = genFusedMultiplyIdx(MF, MRI, TII, Root, InsInstrs, 2, Opc, RC);
		break;

// Floating Point Support		// Floating Point Support
case MachineCombinerPattern::FMULADDH_OP1:		case MachineCombinerPattern::FMULADDH_OP1:
Opc = AArch64::FMADDHrrr;		Opc = AArch64::FMADDHrrr;
RC = &AArch64::FPR16RegClass;		RC = &AArch64::FPR16RegClass;
MUL = genFusedMultiply(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);		MUL = genFusedMultiply(MF, MRI, TII, Root, InsInstrs, 1, Opc, RC);
break;		break;
case MachineCombinerPattern::FMULADDS_OP1:		case MachineCombinerPattern::FMULADDS_OP1:
Opc = AArch64::FMADDSrrr;		Opc = AArch64::FMADDSrrr;
▲ Show 20 Lines • Show All 1,482 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrInfo.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 3,818 Lines • ▼ Show 20 Lines
def : Pat<(v2f64 (fma (fneg V128:$Rn), V128:$Rm, V128:$Rd)),		def : Pat<(v2f64 (fma (fneg V128:$Rn), V128:$Rm, V128:$Rd)),
(FMLSv2f64 V128:$Rd, V128:$Rn, V128:$Rm)>;		(FMLSv2f64 V128:$Rd, V128:$Rn, V128:$Rm)>;

defm FMULX : SIMDThreeSameVectorFP<0,0,0b011,"fmulx", int_aarch64_neon_fmulx>;		defm FMULX : SIMDThreeSameVectorFP<0,0,0b011,"fmulx", int_aarch64_neon_fmulx>;
defm FMUL : SIMDThreeSameVectorFP<1,0,0b011,"fmul", fmul>;		defm FMUL : SIMDThreeSameVectorFP<1,0,0b011,"fmul", fmul>;
defm FRECPS : SIMDThreeSameVectorFP<0,0,0b111,"frecps", int_aarch64_neon_frecps>;		defm FRECPS : SIMDThreeSameVectorFP<0,0,0b111,"frecps", int_aarch64_neon_frecps>;
defm FRSQRTS : SIMDThreeSameVectorFP<0,1,0b111,"frsqrts", int_aarch64_neon_frsqrts>;		defm FRSQRTS : SIMDThreeSameVectorFP<0,1,0b111,"frsqrts", int_aarch64_neon_frsqrts>;
defm FSUB : SIMDThreeSameVectorFP<0,1,0b010,"fsub", fsub>;		defm FSUB : SIMDThreeSameVectorFP<0,1,0b010,"fsub", fsub>;
defm MLA : SIMDThreeSameVectorBHSTied<0, 0b10010, "mla",
TriOpFrag<(add node:$LHS, (mul node:$MHS, node:$RHS))> >;		// MLA and MLS are generated in MachineCombine
defm MLS : SIMDThreeSameVectorBHSTied<1, 0b10010, "mls",		defm MLA : SIMDThreeSameVectorBHSTied<0, 0b10010, "mla", null_frag>;
TriOpFrag<(sub node:$LHS, (mul node:$MHS, node:$RHS))> >;		defm MLS : SIMDThreeSameVectorBHSTied<1, 0b10010, "mls", null_frag>;

		dmgreenUnsubmitted Done Reply Inline Actions You might want to keep these on separate lines, with the comment making them quite long. dmgreen: You might want to keep these on separate lines, with the comment making them quite long.
defm MUL : SIMDThreeSameVectorBHS<0, 0b10011, "mul", mul>;		defm MUL : SIMDThreeSameVectorBHS<0, 0b10011, "mul", mul>;
defm PMUL : SIMDThreeSameVectorB<1, 0b10011, "pmul", int_aarch64_neon_pmul>;		defm PMUL : SIMDThreeSameVectorB<1, 0b10011, "pmul", int_aarch64_neon_pmul>;
defm SABA : SIMDThreeSameVectorBHSTied<0, 0b01111, "saba",		defm SABA : SIMDThreeSameVectorBHSTied<0, 0b01111, "saba",
TriOpFrag<(add node:$LHS, (int_aarch64_neon_sabd node:$MHS, node:$RHS))> >;		TriOpFrag<(add node:$LHS, (int_aarch64_neon_sabd node:$MHS, node:$RHS))> >;
defm SABD : SIMDThreeSameVectorBHS<0,0b01110,"sabd", int_aarch64_neon_sabd>;		defm SABD : SIMDThreeSameVectorBHS<0,0b01110,"sabd", int_aarch64_neon_sabd>;
defm SHADD : SIMDThreeSameVectorBHS<0,0b00000,"shadd", int_aarch64_neon_shadd>;		defm SHADD : SIMDThreeSameVectorBHS<0,0b00000,"shadd", int_aarch64_neon_shadd>;
defm SHSUB : SIMDThreeSameVectorBHS<0,0b00100,"shsub", int_aarch64_neon_shsub>;		defm SHSUB : SIMDThreeSameVectorBHS<0,0b00100,"shsub", int_aarch64_neon_shsub>;
defm SMAXP : SIMDThreeSameVectorBHS<0,0b10100,"smaxp", int_aarch64_neon_smaxp>;		defm SMAXP : SIMDThreeSameVectorBHS<0,0b10100,"smaxp", int_aarch64_neon_smaxp>;
▲ Show 20 Lines • Show All 1,713 Lines • ▼ Show 20 Lines	def : Pat<(v4f32 (fmul V128:$Rn, (AArch64dup (f32 FPR32:$Rm)))),
(i64 0))>;		(i64 0))>;
def : Pat<(v2f64 (fmul V128:$Rn, (AArch64dup (f64 FPR64:$Rm)))),		def : Pat<(v2f64 (fmul V128:$Rn, (AArch64dup (f64 FPR64:$Rm)))),
(FMULv2i64_indexed V128:$Rn,		(FMULv2i64_indexed V128:$Rn,
(INSERT_SUBREG (v4i32 (IMPLICIT_DEF)), FPR64:$Rm, dsub),		(INSERT_SUBREG (v4i32 (IMPLICIT_DEF)), FPR64:$Rm, dsub),
(i64 0))>;		(i64 0))>;

defm SQDMULH : SIMDIndexedHS<0, 0b1100, "sqdmulh", int_aarch64_neon_sqdmulh>;		defm SQDMULH : SIMDIndexedHS<0, 0b1100, "sqdmulh", int_aarch64_neon_sqdmulh>;
defm SQRDMULH : SIMDIndexedHS<0, 0b1101, "sqrdmulh", int_aarch64_neon_sqrdmulh>;		defm SQRDMULH : SIMDIndexedHS<0, 0b1101, "sqrdmulh", int_aarch64_neon_sqrdmulh>;
defm MLA : SIMDVectorIndexedHSTied<1, 0b0000, "mla",
TriOpFrag<(add node:$LHS, (mul node:$MHS, node:$RHS))>>;		// Generated by MachineCombine
defm MLS : SIMDVectorIndexedHSTied<1, 0b0100, "mls",		defm MLA : SIMDVectorIndexedHSTied<1, 0b0000, "mla", null_frag>;
TriOpFrag<(sub node:$LHS, (mul node:$MHS, node:$RHS))>>;		defm MLS : SIMDVectorIndexedHSTied<1, 0b0100, "mls", null_frag>;

defm MUL : SIMDVectorIndexedHS<0, 0b1000, "mul", mul>;		defm MUL : SIMDVectorIndexedHS<0, 0b1000, "mul", mul>;
defm SMLAL : SIMDVectorIndexedLongSDTied<0, 0b0010, "smlal",		defm SMLAL : SIMDVectorIndexedLongSDTied<0, 0b0010, "smlal",
TriOpFrag<(add node:$LHS, (int_aarch64_neon_smull node:$MHS, node:$RHS))>>;		TriOpFrag<(add node:$LHS, (int_aarch64_neon_smull node:$MHS, node:$RHS))>>;
defm SMLSL : SIMDVectorIndexedLongSDTied<0, 0b0110, "smlsl",		defm SMLSL : SIMDVectorIndexedLongSDTied<0, 0b0110, "smlsl",
TriOpFrag<(sub node:$LHS, (int_aarch64_neon_smull node:$MHS, node:$RHS))>>;		TriOpFrag<(sub node:$LHS, (int_aarch64_neon_smull node:$MHS, node:$RHS))>>;
defm SMULL : SIMDVectorIndexedLongSD<0, 0b1010, "smull",		defm SMULL : SIMDVectorIndexedLongSD<0, 0b1010, "smull",
int_aarch64_neon_smull>;		int_aarch64_neon_smull>;
defm SQDMLAL : SIMDIndexedLongSQDMLXSDTied<0, 0b0011, "sqdmlal",		defm SQDMLAL : SIMDIndexedLongSQDMLXSDTied<0, 0b0011, "sqdmlal",
▲ Show 20 Lines • Show All 1,692 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/GlobalISel/select-with-no-legality-check.mir

Show First 20 Lines • Show All 1,427 Lines • ▼ Show 20 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule944_id3803_at_idx61417		; CHECK-LABEL: name: test_rule944_id3803_at_idx61417
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLAv8i8_:%[0-9]+]]:fpr64 = MLAv8i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i8_:%[0-9]+]]:fpr64 = MULv8i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv8i8_]]		; CHECK: [[ADDv8i8_:%[0-9]+]]:fpr64 = ADDv8i8 [[MULv8i8_]], [[COPY2]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv8i8_]]
%4:fpr(<8 x s8>) = COPY $d2		%4:fpr(<8 x s8>) = COPY $d2
%3:fpr(<8 x s8>) = COPY $d1		%3:fpr(<8 x s8>) = COPY $d1
%2:fpr(<8 x s8>) = COPY $d0		%2:fpr(<8 x s8>) = COPY $d0
%0:fpr(<8 x s8>) = G_MUL %3, %4		%0:fpr(<8 x s8>) = G_MUL %3, %4
%1:fpr(<8 x s8>) = G_ADD %0, %2		%1:fpr(<8 x s8>) = G_ADD %0, %2
$noreg = PATCHABLE_RET %1(<8 x s8>)		$noreg = PATCHABLE_RET %1(<8 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule945_id3804_at_idx61505		; CHECK-LABEL: name: test_rule945_id3804_at_idx61505
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLAv16i8_:%[0-9]+]]:fpr128 = MLAv16i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv16i8_:%[0-9]+]]:fpr128 = MULv16i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv16i8_]]		; CHECK: [[ADDv16i8_:%[0-9]+]]:fpr128 = ADDv16i8 [[MULv16i8_]], [[COPY2]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv16i8_]]
%4:fpr(<16 x s8>) = COPY $q2		%4:fpr(<16 x s8>) = COPY $q2
%3:fpr(<16 x s8>) = COPY $q1		%3:fpr(<16 x s8>) = COPY $q1
%2:fpr(<16 x s8>) = COPY $q0		%2:fpr(<16 x s8>) = COPY $q0
%0:fpr(<16 x s8>) = G_MUL %3, %4		%0:fpr(<16 x s8>) = G_MUL %3, %4
%1:fpr(<16 x s8>) = G_ADD %0, %2		%1:fpr(<16 x s8>) = G_ADD %0, %2
$noreg = PATCHABLE_RET %1(<16 x s8>)		$noreg = PATCHABLE_RET %1(<16 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule946_id3805_at_idx61593		; CHECK-LABEL: name: test_rule946_id3805_at_idx61593
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLAv4i16_:%[0-9]+]]:fpr64 = MLAv4i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv4i16_:%[0-9]+]]:fpr64 = MULv4i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv4i16_]]		; CHECK: [[ADDv4i16_:%[0-9]+]]:fpr64 = ADDv4i16 [[MULv4i16_]], [[COPY2]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv4i16_]]
%4:fpr(<4 x s16>) = COPY $d2		%4:fpr(<4 x s16>) = COPY $d2
%3:fpr(<4 x s16>) = COPY $d1		%3:fpr(<4 x s16>) = COPY $d1
%2:fpr(<4 x s16>) = COPY $d0		%2:fpr(<4 x s16>) = COPY $d0
%0:fpr(<4 x s16>) = G_MUL %3, %4		%0:fpr(<4 x s16>) = G_MUL %3, %4
%1:fpr(<4 x s16>) = G_ADD %0, %2		%1:fpr(<4 x s16>) = G_ADD %0, %2
$noreg = PATCHABLE_RET %1(<4 x s16>)		$noreg = PATCHABLE_RET %1(<4 x s16>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule947_id3806_at_idx61681		; CHECK-LABEL: name: test_rule947_id3806_at_idx61681
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLAv8i16_:%[0-9]+]]:fpr128 = MLAv8i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i16_:%[0-9]+]]:fpr128 = MULv8i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv8i16_]]		; CHECK: [[ADDv8i16_:%[0-9]+]]:fpr128 = ADDv8i16 [[MULv8i16_]], [[COPY2]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv8i16_]]
%4:fpr(<8 x s16>) = COPY $q2		%4:fpr(<8 x s16>) = COPY $q2
%3:fpr(<8 x s16>) = COPY $q1		%3:fpr(<8 x s16>) = COPY $q1
%2:fpr(<8 x s16>) = COPY $q0		%2:fpr(<8 x s16>) = COPY $q0
%0:fpr(<8 x s16>) = G_MUL %3, %4		%0:fpr(<8 x s16>) = G_MUL %3, %4
%1:fpr(<8 x s16>) = G_ADD %0, %2		%1:fpr(<8 x s16>) = G_ADD %0, %2
$noreg = PATCHABLE_RET %1(<8 x s16>)		$noreg = PATCHABLE_RET %1(<8 x s16>)

...		...
▲ Show 20 Lines • Show All 203 Lines • ▼ Show 20 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule956_id927_at_idx62401		; CHECK-LABEL: name: test_rule956_id927_at_idx62401
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLAv8i8_:%[0-9]+]]:fpr64 = MLAv8i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i8_:%[0-9]+]]:fpr64 = MULv8i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv8i8_]]		; CHECK: [[ADDv8i8_:%[0-9]+]]:fpr64 = ADDv8i8 [[COPY2]], [[MULv8i8_]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv8i8_]]
%4:fpr(<8 x s8>) = COPY $d2		%4:fpr(<8 x s8>) = COPY $d2
%3:fpr(<8 x s8>) = COPY $d1		%3:fpr(<8 x s8>) = COPY $d1
%2:fpr(<8 x s8>) = COPY $d0		%2:fpr(<8 x s8>) = COPY $d0
%0:fpr(<8 x s8>) = G_MUL %3, %4		%0:fpr(<8 x s8>) = G_MUL %3, %4
%1:fpr(<8 x s8>) = G_ADD %2, %0		%1:fpr(<8 x s8>) = G_ADD %2, %0
$noreg = PATCHABLE_RET %1(<8 x s8>)		$noreg = PATCHABLE_RET %1(<8 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule957_id928_at_idx62489		; CHECK-LABEL: name: test_rule957_id928_at_idx62489
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLAv16i8_:%[0-9]+]]:fpr128 = MLAv16i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv16i8_:%[0-9]+]]:fpr128 = MULv16i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv16i8_]]		; CHECK: [[ADDv16i8_:%[0-9]+]]:fpr128 = ADDv16i8 [[COPY2]], [[MULv16i8_]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv16i8_]]
%4:fpr(<16 x s8>) = COPY $q2		%4:fpr(<16 x s8>) = COPY $q2
%3:fpr(<16 x s8>) = COPY $q1		%3:fpr(<16 x s8>) = COPY $q1
%2:fpr(<16 x s8>) = COPY $q0		%2:fpr(<16 x s8>) = COPY $q0
%0:fpr(<16 x s8>) = G_MUL %3, %4		%0:fpr(<16 x s8>) = G_MUL %3, %4
%1:fpr(<16 x s8>) = G_ADD %2, %0		%1:fpr(<16 x s8>) = G_ADD %2, %0
$noreg = PATCHABLE_RET %1(<16 x s8>)		$noreg = PATCHABLE_RET %1(<16 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule958_id929_at_idx62577		; CHECK-LABEL: name: test_rule958_id929_at_idx62577
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLAv4i16_:%[0-9]+]]:fpr64 = MLAv4i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv4i16_:%[0-9]+]]:fpr64 = MULv4i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv4i16_]]		; CHECK: [[ADDv4i16_:%[0-9]+]]:fpr64 = ADDv4i16 [[COPY2]], [[MULv4i16_]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv4i16_]]
%4:fpr(<4 x s16>) = COPY $d2		%4:fpr(<4 x s16>) = COPY $d2
%3:fpr(<4 x s16>) = COPY $d1		%3:fpr(<4 x s16>) = COPY $d1
%2:fpr(<4 x s16>) = COPY $d0		%2:fpr(<4 x s16>) = COPY $d0
%0:fpr(<4 x s16>) = G_MUL %3, %4		%0:fpr(<4 x s16>) = G_MUL %3, %4
%1:fpr(<4 x s16>) = G_ADD %2, %0		%1:fpr(<4 x s16>) = G_ADD %2, %0
$noreg = PATCHABLE_RET %1(<4 x s16>)		$noreg = PATCHABLE_RET %1(<4 x s16>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule959_id930_at_idx62665		; CHECK-LABEL: name: test_rule959_id930_at_idx62665
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLAv8i16_:%[0-9]+]]:fpr128 = MLAv8i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i16_:%[0-9]+]]:fpr128 = MULv8i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLAv8i16_]]		; CHECK: [[ADDv8i16_:%[0-9]+]]:fpr128 = ADDv8i16 [[COPY2]], [[MULv8i16_]]
		; CHECK: $noreg = PATCHABLE_RET [[ADDv8i16_]]
%4:fpr(<8 x s16>) = COPY $q2		%4:fpr(<8 x s16>) = COPY $q2
%3:fpr(<8 x s16>) = COPY $q1		%3:fpr(<8 x s16>) = COPY $q1
%2:fpr(<8 x s16>) = COPY $q0		%2:fpr(<8 x s16>) = COPY $q0
%0:fpr(<8 x s16>) = G_MUL %3, %4		%0:fpr(<8 x s16>) = G_MUL %3, %4
%1:fpr(<8 x s16>) = G_ADD %2, %0		%1:fpr(<8 x s16>) = G_ADD %2, %0
$noreg = PATCHABLE_RET %1(<8 x s16>)		$noreg = PATCHABLE_RET %1(<8 x s16>)

...		...
▲ Show 20 Lines • Show All 203 Lines • ▼ Show 20 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule977_id933_at_idx64051		; CHECK-LABEL: name: test_rule977_id933_at_idx64051
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLSv8i8_:%[0-9]+]]:fpr64 = MLSv8i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i8_:%[0-9]+]]:fpr64 = MULv8i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLSv8i8_]]		; CHECK: [[SUBv8i8_:%[0-9]+]]:fpr64 = SUBv8i8 [[COPY2]], [[MULv8i8_]]
		; CHECK: $noreg = PATCHABLE_RET [[SUBv8i8_]]
%4:fpr(<8 x s8>) = COPY $d2		%4:fpr(<8 x s8>) = COPY $d2
%3:fpr(<8 x s8>) = COPY $d1		%3:fpr(<8 x s8>) = COPY $d1
%2:fpr(<8 x s8>) = COPY $d0		%2:fpr(<8 x s8>) = COPY $d0
%0:fpr(<8 x s8>) = G_MUL %3, %4		%0:fpr(<8 x s8>) = G_MUL %3, %4
%1:fpr(<8 x s8>) = G_SUB %2, %0		%1:fpr(<8 x s8>) = G_SUB %2, %0
$noreg = PATCHABLE_RET %1(<8 x s8>)		$noreg = PATCHABLE_RET %1(<8 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule978_id934_at_idx64139		; CHECK-LABEL: name: test_rule978_id934_at_idx64139
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLSv16i8_:%[0-9]+]]:fpr128 = MLSv16i8 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv16i8_:%[0-9]+]]:fpr128 = MULv16i8 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLSv16i8_]]		; CHECK: [[SUBv16i8_:%[0-9]+]]:fpr128 = SUBv16i8 [[COPY2]], [[MULv16i8_]]
		; CHECK: $noreg = PATCHABLE_RET [[SUBv16i8_]]
%4:fpr(<16 x s8>) = COPY $q2		%4:fpr(<16 x s8>) = COPY $q2
%3:fpr(<16 x s8>) = COPY $q1		%3:fpr(<16 x s8>) = COPY $q1
%2:fpr(<16 x s8>) = COPY $q0		%2:fpr(<16 x s8>) = COPY $q0
%0:fpr(<16 x s8>) = G_MUL %3, %4		%0:fpr(<16 x s8>) = G_MUL %3, %4
%1:fpr(<16 x s8>) = G_SUB %2, %0		%1:fpr(<16 x s8>) = G_SUB %2, %0
$noreg = PATCHABLE_RET %1(<16 x s8>)		$noreg = PATCHABLE_RET %1(<16 x s8>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $d0, $d1, $d2		liveins: $d0, $d1, $d2

; CHECK-LABEL: name: test_rule979_id935_at_idx64227		; CHECK-LABEL: name: test_rule979_id935_at_idx64227
; CHECK: liveins: $d0, $d1, $d2		; CHECK: liveins: $d0, $d1, $d2
; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2		; CHECK: [[COPY:%[0-9]+]]:fpr64 = COPY $d2
; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1		; CHECK: [[COPY1:%[0-9]+]]:fpr64 = COPY $d1
; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0		; CHECK: [[COPY2:%[0-9]+]]:fpr64 = COPY $d0
; CHECK: [[MLSv4i16_:%[0-9]+]]:fpr64 = MLSv4i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv4i16_:%[0-9]+]]:fpr64 = MULv4i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLSv4i16_]]		; CHECK: [[SUBv4i16_:%[0-9]+]]:fpr64 = SUBv4i16 [[COPY2]], [[MULv4i16_]]
		; CHECK: $noreg = PATCHABLE_RET [[SUBv4i16_]]
%4:fpr(<4 x s16>) = COPY $d2		%4:fpr(<4 x s16>) = COPY $d2
%3:fpr(<4 x s16>) = COPY $d1		%3:fpr(<4 x s16>) = COPY $d1
%2:fpr(<4 x s16>) = COPY $d0		%2:fpr(<4 x s16>) = COPY $d0
%0:fpr(<4 x s16>) = G_MUL %3, %4		%0:fpr(<4 x s16>) = G_MUL %3, %4
%1:fpr(<4 x s16>) = G_SUB %2, %0		%1:fpr(<4 x s16>) = G_SUB %2, %0
$noreg = PATCHABLE_RET %1(<4 x s16>)		$noreg = PATCHABLE_RET %1(<4 x s16>)

...		...
Show All 17 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: test_rule980_id936_at_idx64315		; CHECK-LABEL: name: test_rule980_id936_at_idx64315
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2		; CHECK: [[COPY:%[0-9]+]]:fpr128 = COPY $q2
; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1		; CHECK: [[COPY1:%[0-9]+]]:fpr128 = COPY $q1
; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0		; CHECK: [[COPY2:%[0-9]+]]:fpr128 = COPY $q0
; CHECK: [[MLSv8i16_:%[0-9]+]]:fpr128 = MLSv8i16 [[COPY2]], [[COPY1]], [[COPY]]		; CHECK: [[MULv8i16_:%[0-9]+]]:fpr128 = MULv8i16 [[COPY1]], [[COPY]]
; CHECK: $noreg = PATCHABLE_RET [[MLSv8i16_]]		; CHECK: [[SUBv8i16_:%[0-9]+]]:fpr128 = SUBv8i16 [[COPY2]], [[MULv8i16_]]
		; CHECK: $noreg = PATCHABLE_RET [[SUBv8i16_]]
%4:fpr(<8 x s16>) = COPY $q2		%4:fpr(<8 x s16>) = COPY $q2
%3:fpr(<8 x s16>) = COPY $q1		%3:fpr(<8 x s16>) = COPY $q1
%2:fpr(<8 x s16>) = COPY $q0		%2:fpr(<8 x s16>) = COPY $q0
%0:fpr(<8 x s16>) = G_MUL %3, %4		%0:fpr(<8 x s16>) = G_MUL %3, %4
%1:fpr(<8 x s16>) = G_SUB %2, %0		%1:fpr(<8 x s16>) = G_SUB %2, %0
$noreg = PATCHABLE_RET %1(<8 x s16>)		$noreg = PATCHABLE_RET %1(<8 x s16>)

...		...
▲ Show 20 Lines • Show All 2,344 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/overeager_mla_fusing.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc %s --mtriple aarch64 -verify-machineinstrs -o - \| FileCheck %s			; RUN: llc %s --mtriple aarch64 -verify-machineinstrs -o - \| FileCheck %s

	define dso_local void @jsimd_idct_ifast_neon_intrinsic(i8* nocapture readonly %dct_table, i16* nocapture readonly %coef_block, i8** nocapture readonly %output_buf, i32 %output_col) local_unnamed_addr #0 {			define dso_local void @jsimd_idct_ifast_neon_intrinsic(i8* nocapture readonly %dct_table, i16* nocapture readonly %coef_block, i8** nocapture readonly %output_buf, i32 %output_col) local_unnamed_addr #0 {
	; CHECK-LABEL: jsimd_idct_ifast_neon_intrinsic:			; CHECK-LABEL: jsimd_idct_ifast_neon_intrinsic:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: ldr q0, [x1, #32]			; CHECK-NEXT: ldr q0, [x1, #32]
	; CHECK-NEXT: ldr q1, [x0, #32]			; CHECK-NEXT: ldr q1, [x1, #96]
	; CHECK-NEXT: ldr q2, [x1, #96]			; CHECK-NEXT: ldr q2, [x0, #32]
	; CHECK-NEXT: ldr q3, [x0, #96]			; CHECK-NEXT: ldr q3, [x0, #96]
	; CHECK-NEXT: ldr x8, [x2, #48]			; CHECK-NEXT: ldr x8, [x2, #48]
	; CHECK-NEXT: mul v0.8h, v1.8h, v0.8h
	; CHECK-NEXT: mov v1.16b, v0.16b
	; CHECK-NEXT: mla v1.8h, v3.8h, v2.8h
	; CHECK-NEXT: mov w9, w3			; CHECK-NEXT: mov w9, w3
	; CHECK-NEXT: str q1, [x8, x9]			; CHECK-NEXT: mul v0.8h, v2.8h, v0.8h
				; CHECK-NEXT: mul v1.8h, v3.8h, v1.8h
				; CHECK-NEXT: add v2.8h, v0.8h, v1.8h
				; CHECK-NEXT: str q2, [x8, x9]
	; CHECK-NEXT: ldr x8, [x2, #56]			; CHECK-NEXT: ldr x8, [x2, #56]
	; CHECK-NEXT: mls v0.8h, v3.8h, v2.8h			; CHECK-NEXT: sub v0.8h, v0.8h, v1.8h
	; CHECK-NEXT: str q0, [x8, x9]			; CHECK-NEXT: str q0, [x8, x9]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%add.ptr5 = getelementptr inbounds i16, i16* %coef_block, i64 16			%add.ptr5 = getelementptr inbounds i16, i16* %coef_block, i64 16
	%0 = bitcast i16* %add.ptr5 to <8 x i16>*			%0 = bitcast i16* %add.ptr5 to <8 x i16>*
	%1 = load <8 x i16>, <8 x i16>* %0, align 16			%1 = load <8 x i16>, <8 x i16>* %0, align 16

	%add.ptr17 = getelementptr inbounds i16, i16* %coef_block, i64 48			%add.ptr17 = getelementptr inbounds i16, i16* %coef_block, i64 48
	Show All 33 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Fix over-eager fusing of NEON SIMD MUL/ADD
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 231912

llvm/include/llvm/CodeGen/MachineCombinerPattern.h

llvm/lib/Target/AArch64/AArch64InstrInfo.cpp

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/test/CodeGen/AArch64/GlobalISel/select-with-no-legality-check.mir

llvm/test/CodeGen/AArch64/overeager_mla_fusing.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Fix over-eager fusing of NEON SIMD MUL/ADDClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 231912

llvm/include/llvm/CodeGen/MachineCombinerPattern.h

llvm/lib/Target/AArch64/AArch64InstrInfo.cpp

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/test/CodeGen/AArch64/GlobalISel/select-with-no-legality-check.mir

llvm/test/CodeGen/AArch64/overeager_mla_fusing.ll

[AArch64] Fix over-eager fusing of NEON SIMD MUL/ADD
ClosedPublic