Diff 306424

llvm/include/llvm/CodeGen/GlobalISel/MIPatternMatch.h

Show All 18 Lines
namespace llvm {		namespace llvm {
namespace MIPatternMatch {		namespace MIPatternMatch {

template <typename Reg, typename Pattern>		template <typename Reg, typename Pattern>
bool mi_match(Reg R, const MachineRegisterInfo &MRI, Pattern &&P) {		bool mi_match(Reg R, const MachineRegisterInfo &MRI, Pattern &&P) {
return P.match(MRI, R);		return P.match(MRI, R);
}		}

		template <typename Pattern>
		bool mi_match(MachineInstr* MI, Pattern &&P) {
		return P.match(MI->getMF()->getRegInfo(), MI);
		arsenmUnsubmitted Not Done Reply Inline Actions I'd rather just have to pass MRI consistently arsenm: I'd rather just have to pass MRI consistently
		}

// TODO: Extend for N use.		// TODO: Extend for N use.
template <typename SubPatternT> struct OneUse_match {		template <typename SubPatternT> struct OneUse_match {
SubPatternT SubPat;		SubPatternT SubPat;
OneUse_match(const SubPatternT &SP) : SubPat(SP) {}		OneUse_match(const SubPatternT &SP) : SubPat(SP) {}

bool match(const MachineRegisterInfo &MRI, Register Reg) {		bool match(const MachineRegisterInfo &MRI, Register Reg) {
return MRI.hasOneUse(Reg) && SubPat.match(MRI, Reg);		return MRI.hasOneUse(Reg) && SubPat.match(MRI, Reg);
}		}
Show All 36 Lines
///{		///{
/// Convenience matchers for specific integer values.		/// Convenience matchers for specific integer values.
inline SpecificConstantMatch m_ZeroInt() { return SpecificConstantMatch(0); }		inline SpecificConstantMatch m_ZeroInt() { return SpecificConstantMatch(0); }
inline SpecificConstantMatch m_AllOnesInt() {		inline SpecificConstantMatch m_AllOnesInt() {
return SpecificConstantMatch(-1);		return SpecificConstantMatch(-1);
}		}
///}		///}

		struct ICstRegMatch {
		Register &CR;
		ICstRegMatch(Register &C) : CR(C) {}
		bool match(const MachineRegisterInfo &MRI, Register Reg) {
		if (auto MaybeCst = getConstantVRegValWithLookThrough(
		Reg, MRI, /LookThroughInstrs/ true,
		/HandleFConstants/ false)) {
		CR = MaybeCst->VReg;
		return true;
		}
		return false;
		}
		};

		inline ICstRegMatch m_ICst(Register &Reg) { return ICstRegMatch(Reg); }

// TODO: Rework this for different kinds of MachineOperand.		// TODO: Rework this for different kinds of MachineOperand.
// Currently assumes the Src for a match is a register.		// Currently assumes the Src for a match is a register.
// We might want to support taking in some MachineOperands and call getReg on		// We might want to support taking in some MachineOperands and call getReg on
// that.		// that.

struct operand_type_match {		struct operand_type_match {
bool match(const MachineRegisterInfo &MRI, Register Reg) { return true; }		bool match(const MachineRegisterInfo &MRI, Register Reg) { return true; }
bool match(const MachineRegisterInfo &MRI, MachineOperand *MO) {		bool match(const MachineRegisterInfo &MRI, MachineOperand *MO) {
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
template <> struct bind_helper<MachineInstr *> {		template <> struct bind_helper<MachineInstr *> {
static bool bind(const MachineRegisterInfo &MRI, MachineInstr *&MI,		static bool bind(const MachineRegisterInfo &MRI, MachineInstr *&MI,
Register Reg) {		Register Reg) {
MI = MRI.getVRegDef(Reg);		MI = MRI.getVRegDef(Reg);
if (MI)		if (MI)
return true;		return true;
return false;		return false;
}		}
		static bool bind(const MachineRegisterInfo &MRI, MachineInstr *&MI,
		MachineInstr *Inst) {
		MI = Inst;
		foadUnsubmitted Not Done Reply Inline Actions Why is the cast needed? foad: Why is the cast needed?
		if (MI)
		return true;
		return false;
		}
};		};

template <> struct bind_helper<LLT> {		template <> struct bind_helper<LLT> {
static bool bind(const MachineRegisterInfo &MRI, LLT Ty, Register Reg) {		static bool bind(const MachineRegisterInfo &MRI, LLT Ty, Register Reg) {
Ty = MRI.getType(Reg);		Ty = MRI.getType(Reg);
if (Ty.isValid())		if (Ty.isValid())
return true;		return true;
return false;		return false;
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	if (mi_match(Op, MRI, m_MInstr(TmpMI))) {
(Commutable && (R.match(MRI, TmpMI->getOperand(1).getReg()) &&		(Commutable && (R.match(MRI, TmpMI->getOperand(1).getReg()) &&
L.match(MRI, TmpMI->getOperand(2).getReg())));		L.match(MRI, TmpMI->getOperand(2).getReg())));
}		}
}		}
return false;		return false;
}		}
};		};

		// Helper for (commutable) binary generic MI. Doesn't check opcode.
		template <typename LHS_P, typename RHS_P, bool Commutable = false>
		struct AnyBinaryOp_match {
		LHS_P L;
		RHS_P R;

		AnyBinaryOp_match(const LHS_P &LHS, const RHS_P &RHS) : L(LHS), R(RHS) {}
		template <typename OpTy>
		bool match(const MachineRegisterInfo &MRI, OpTy &&Op) {
		MachineInstr *TmpMI;
		if (mi_match(Op, MRI, m_MInstr(TmpMI))) {
		if (TmpMI->getNumOperands() == 3) {
		return matchOperands(MRI, TmpMI->getOperand(1).getReg(),
		TmpMI->getOperand(2).getReg());
		}
		}
		return false;
		}
		arsenmUnsubmitted Not Done Reply Inline Actions Probably should split the new MIPatternMtach changes into a separate patch arsenm: Probably should split the new MIPatternMtach changes into a separate patch
		bool matchOperands(const MachineRegisterInfo &MRI, Register Op0,
		Register Op1) {
		return (L.match(MRI, Op0) && R.match(MRI, Op1)) \|\|
		(Commutable && (R.match(MRI, Op0) && L.match(MRI, Op1)));
		foadUnsubmitted Not Done Reply Inline Actions Nit: drop the parens around `(R.match(MRI, Op0) && L.match(MRI, Op1))`. foad: Nit: drop the parens around `(R.match(MRI, Op0) && L.match(MRI, Op1))`.
		}
		};

		template <typename LHS, typename RHS>
		inline AnyBinaryOp_match<LHS, RHS, false> m_BinOp(const LHS &L, const RHS &R) {
		return AnyBinaryOp_match<LHS, RHS, false>(L, R);
		}

		template <typename LHS, typename RHS>
		inline AnyBinaryOp_match<LHS, RHS, true> m_CommutableBinOp(const LHS &L,
		const RHS &R) {
		return AnyBinaryOp_match<LHS, RHS, true>(L, R);
		}

		foadUnsubmitted Not Done Reply Inline Actions Might be simpler to make this a subclass of AnyBinaryOp_match? foad: Might be simpler to make this a subclass of AnyBinaryOp_match?
		// Helper for (commutable) binary generic MI that checks Opcode.
		template <typename LHS_P, typename RHS_P, bool Commutable = false>
		struct BinaryOpWithOpcode_match : AnyBinaryOp_match<LHS_P, RHS_P, Commutable> {
		unsigned Opcode;

		BinaryOpWithOpcode_match(unsigned Opcode, const LHS_P &LHS, const RHS_P &RHS)
		: AnyBinaryOp_match<LHS_P, RHS_P, Commutable>(LHS, RHS), Opcode(Opcode) {}
		template <typename OpTy>
		bool match(const MachineRegisterInfo &MRI, OpTy &&Op) {
		MachineInstr *TmpMI;
		if (mi_match(Op, MRI, m_MInstr(TmpMI))) {
		if (TmpMI->getOpcode() == Opcode && TmpMI->getNumOperands() == 3) {
		return this->matchOperands(MRI, TmpMI->getOperand(1).getReg(),
		TmpMI->getOperand(2).getReg());
		}
		}
		return false;
		}
		};

		template <typename LHS, typename RHS>
		inline BinaryOpWithOpcode_match<LHS, RHS, false>
		m_BinOp(unsigned Opcode, const LHS &L, const RHS &R) {
		return BinaryOpWithOpcode_match<LHS, RHS, false>(Opcode, L, R);
		}

		template <typename LHS, typename RHS>
		inline BinaryOpWithOpcode_match<LHS, RHS, true>
		m_CommutableBinOp(unsigned Opcode, const LHS &L, const RHS &R) {
		return BinaryOpWithOpcode_match<LHS, RHS, true>(Opcode, L, R);
		}

template <typename LHS, typename RHS>		template <typename LHS, typename RHS>
inline BinaryOp_match<LHS, RHS, TargetOpcode::G_ADD, true>		inline BinaryOp_match<LHS, RHS, TargetOpcode::G_ADD, true>
m_GAdd(const LHS &L, const RHS &R) {		m_GAdd(const LHS &L, const RHS &R) {
return BinaryOp_match<LHS, RHS, TargetOpcode::G_ADD, true>(L, R);		return BinaryOp_match<LHS, RHS, TargetOpcode::G_ADD, true>(L, R);
}		}

template <typename LHS, typename RHS>		template <typename LHS, typename RHS>
inline BinaryOp_match<LHS, RHS, TargetOpcode::G_SUB> m_GSub(const LHS &L,		inline BinaryOp_match<LHS, RHS, TargetOpcode::G_SUB> m_GSub(const LHS &L,
▲ Show 20 Lines • Show All 246 Lines • Show Last 20 Lines

llvm/include/llvm/CodeGen/GlobalISel/Utils.h

	Show All 31 Lines
	class MachineRegisterInfo;			class MachineRegisterInfo;
	class MCInstrDesc;			class MCInstrDesc;
	class RegisterBankInfo;			class RegisterBankInfo;
	class TargetInstrInfo;			class TargetInstrInfo;
	class TargetLowering;			class TargetLowering;
	class TargetPassConfig;			class TargetPassConfig;
	class TargetRegisterInfo;			class TargetRegisterInfo;
	class TargetRegisterClass;			class TargetRegisterClass;
				class ConstantInt;
	class ConstantFP;			class ConstantFP;
	class APFloat;			class APFloat;

	/// Try to constrain Reg to the specified register class. If this fails,			/// Try to constrain Reg to the specified register class. If this fails,
	/// create a new virtual register in the correct class.			/// create a new virtual register in the correct class.
	///			///
	/// \return The virtual register constrained to the right register class.			/// \return The virtual register constrained to the right register class.
	Register constrainRegToClass(MachineRegisterInfo &MRI,			Register constrainRegToClass(MachineRegisterInfo &MRI,
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	/// virtual register defined by this G_F/CONSTANT.			/// virtual register defined by this G_F/CONSTANT.
	/// When \p LookThroughInstrs == false this function behaves like			/// When \p LookThroughInstrs == false this function behaves like
	/// getConstantVRegVal.			/// getConstantVRegVal.
	/// When \p HandleFConstants == false the function bails on G_FCONSTANTs.			/// When \p HandleFConstants == false the function bails on G_FCONSTANTs.
	Optional<ValueAndVReg>			Optional<ValueAndVReg>
	getConstantVRegValWithLookThrough(Register VReg, const MachineRegisterInfo &MRI,			getConstantVRegValWithLookThrough(Register VReg, const MachineRegisterInfo &MRI,
	bool LookThroughInstrs = true,			bool LookThroughInstrs = true,
	bool HandleFConstants = true);			bool HandleFConstants = true);
				const ConstantInt *getConstantIntVRegVal(Register VReg,
				const MachineRegisterInfo &MRI);
	const ConstantFP* getConstantFPVRegVal(Register VReg,			const ConstantFP* getConstantFPVRegVal(Register VReg,
	const MachineRegisterInfo &MRI);			const MachineRegisterInfo &MRI);

	/// See if Reg is defined by an single def instruction that is			/// See if Reg is defined by an single def instruction that is
	/// Opcode. Also try to do trivial folding if it's a COPY with			/// Opcode. Also try to do trivial folding if it's a COPY with
	/// same types. Returns null otherwise.			/// same types. Returns null otherwise.
	MachineInstr *getOpcodeDef(unsigned Opcode, Register Reg,			MachineInstr *getOpcodeDef(unsigned Opcode, Register Reg,
	const MachineRegisterInfo &MRI);			const MachineRegisterInfo &MRI);
	▲ Show 20 Lines • Show All 113 Lines • Show Last 20 Lines

llvm/lib/CodeGen/GlobalISel/Utils.cpp

Show First 20 Lines • Show All 337 Lines • ▼ Show 20 Lines	Optional<ValueAndVReg> llvm::getConstantVRegValWithLookThrough(
}		}

if (Val.getBitWidth() > 64)		if (Val.getBitWidth() > 64)
return None;		return None;

return ValueAndVReg{Val.getSExtValue(), VReg};		return ValueAndVReg{Val.getSExtValue(), VReg};
}		}

		const ConstantInt *
		llvm::getConstantIntVRegVal(Register VReg, const MachineRegisterInfo &MRI) {
		MachineInstr *MI = MRI.getVRegDef(VReg);
		if (MI->getOpcode() != TargetOpcode::G_CONSTANT)
		foadUnsubmitted Not Done Reply Inline Actions Swap the operands: `MI->getOpcode() != TargetOpcode::G_CONSTANT` foad: Swap the operands: `MI->getOpcode() != TargetOpcode::G_CONSTANT`
		return nullptr;
		return MI->getOperand(1).getCImm();
		}

const ConstantFP *		const ConstantFP *
llvm::getConstantFPVRegVal(Register VReg, const MachineRegisterInfo &MRI) {		llvm::getConstantFPVRegVal(Register VReg, const MachineRegisterInfo &MRI) {
MachineInstr *MI = MRI.getVRegDef(VReg);		MachineInstr *MI = MRI.getVRegDef(VReg);
if (TargetOpcode::G_FCONSTANT != MI->getOpcode())		if (TargetOpcode::G_FCONSTANT != MI->getOpcode())
return nullptr;		return nullptr;
return MI->getOperand(1).getFPImm();		return MI->getOperand(1).getFPImm();
}		}

▲ Show 20 Lines • Show All 394 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUCombine.td

Show All 31 Lines	def cvt_f32_ubyteN : GICombineRule<
(defs root:$cvt_f32_ubyteN, cvt_f32_ubyteN_matchdata:$matchinfo),		(defs root:$cvt_f32_ubyteN, cvt_f32_ubyteN_matchdata:$matchinfo),
(match (wip_match_opcode G_AMDGPU_CVT_F32_UBYTE0,		(match (wip_match_opcode G_AMDGPU_CVT_F32_UBYTE0,
G_AMDGPU_CVT_F32_UBYTE1,		G_AMDGPU_CVT_F32_UBYTE1,
G_AMDGPU_CVT_F32_UBYTE2,		G_AMDGPU_CVT_F32_UBYTE2,
G_AMDGPU_CVT_F32_UBYTE3):$cvt_f32_ubyteN,		G_AMDGPU_CVT_F32_UBYTE3):$cvt_f32_ubyteN,
[{ return PostLegalizerHelper.matchCvtF32UByteN(*${cvt_f32_ubyteN}, ${matchinfo}); }]),		[{ return PostLegalizerHelper.matchCvtF32UByteN(*${cvt_f32_ubyteN}, ${matchinfo}); }]),
(apply [{ PostLegalizerHelper.applyCvtF32UByteN(*${cvt_f32_ubyteN}, ${matchinfo}); }])>;		(apply [{ PostLegalizerHelper.applyCvtF32UByteN(*${cvt_f32_ubyteN}, ${matchinfo}); }])>;

		def med3_matchdata : GIDefMatchData<"AMDGPUPostLegalizerCombinerHelper::Med3MatchInfo">;

		def int_minmax_to_med3 : GICombineRule<
		(defs root:$min_or_max, med3_matchdata:$matchinfo),
		(match (wip_match_opcode G_SMAX,
		G_SMIN,
		G_UMAX,
		G_UMIN):$min_or_max,
		[{ return PostLegalizerHelper.matchIntMinMaxToMed3(*${min_or_max}, ${matchinfo}); }]),
		(apply [{ PostLegalizerHelper.applyMed3(*${min_or_max}, ${matchinfo}); }])>;


// Combines which should only apply on SI/VI		// Combines which should only apply on SI/VI
def gfx6gfx7_combines : GICombineGroup<[fcmp_select_to_fmin_fmax_legacy]>;		def gfx6gfx7_combines : GICombineGroup<[fcmp_select_to_fmin_fmax_legacy]>;


def AMDGPUPreLegalizerCombinerHelper: GICombinerHelper<		def AMDGPUPreLegalizerCombinerHelper: GICombinerHelper<
"AMDGPUGenPreLegalizerCombinerHelper", [all_combines]> {		"AMDGPUGenPreLegalizerCombinerHelper", [all_combines]> {
let DisableRuleOption = "amdgpuprelegalizercombiner-disable-rule";		let DisableRuleOption = "amdgpuprelegalizercombiner-disable-rule";
}		}

def AMDGPUPostLegalizerCombinerHelper: GICombinerHelper<		def AMDGPUPostLegalizerCombinerHelper: GICombinerHelper<
"AMDGPUGenPostLegalizerCombinerHelper",		"AMDGPUGenPostLegalizerCombinerHelper",
[all_combines, gfx6gfx7_combines,		[all_combines, gfx6gfx7_combines,
uchar_to_float, cvt_f32_ubyteN]> {		uchar_to_float, cvt_f32_ubyteN,
		int_minmax_to_med3]> {
let DisableRuleOption = "amdgpupostlegalizercombiner-disable-rule";		let DisableRuleOption = "amdgpupostlegalizercombiner-disable-rule";
let StateClass = "AMDGPUPostLegalizerCombinerHelperState";		let StateClass = "AMDGPUPostLegalizerCombinerHelperState";
let AdditionalArguments = [];		let AdditionalArguments = [];
}		}

def AMDGPURegBankCombinerHelper : GICombinerHelper<		def AMDGPURegBankCombinerHelper : GICombinerHelper<
"AMDGPUGenRegBankCombinerHelper", []> {		"AMDGPUGenRegBankCombinerHelper", []> {
let DisableRuleOption = "amdgpuregbankcombiner-disable-rule";		let DisableRuleOption = "amdgpuregbankcombiner-disable-rule";
}		}

llvm/lib/Target/AMDGPU/AMDGPUGISel.td

	Show First 20 Lines • Show All 204 Lines • ▼ Show 20 Lines
	def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_AND, SIbuffer_atomic_and>;			def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_AND, SIbuffer_atomic_and>;
	def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_OR, SIbuffer_atomic_or>;			def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_OR, SIbuffer_atomic_or>;
	def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_XOR, SIbuffer_atomic_xor>;			def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_XOR, SIbuffer_atomic_xor>;
	def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_INC, SIbuffer_atomic_inc>;			def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_INC, SIbuffer_atomic_inc>;
	def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_DEC, SIbuffer_atomic_dec>;			def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_DEC, SIbuffer_atomic_dec>;
	def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_FADD, SIbuffer_atomic_fadd>;			def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_FADD, SIbuffer_atomic_fadd>;
	def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_CMPSWAP, SIbuffer_atomic_cmpswap>;			def : GINodeEquiv<G_AMDGPU_BUFFER_ATOMIC_CMPSWAP, SIbuffer_atomic_cmpswap>;
	def : GINodeEquiv<G_AMDGPU_S_BUFFER_LOAD, SIsbuffer_load>;			def : GINodeEquiv<G_AMDGPU_S_BUFFER_LOAD, SIsbuffer_load>;
				def : GINodeEquiv<G_AMDGPU_SMED3, AMDGPUsmed3>;
				def : GINodeEquiv<G_AMDGPU_UMED3, AMDGPUumed3>;

	class GISelSop2Pat <			class GISelSop2Pat <
	SDPatternOperator node,			SDPatternOperator node,
	Instruction inst,			Instruction inst,
	ValueType dst_vt,			ValueType dst_vt,
	ValueType src0_vt = dst_vt, ValueType src1_vt = src0_vt> : GCNPat <			ValueType src0_vt = dst_vt, ValueType src1_vt = src0_vt> : GCNPat <

	(dst_vt (node (src0_vt SReg_32:$src0), (src1_vt SReg_32:$src1))),			(dst_vt (node (src0_vt SReg_32:$src0), (src1_vt SReg_32:$src1))),
	▲ Show 20 Lines • Show All 111 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUPostLegalizerCombiner.cpp

Show All 30 Lines

class AMDGPUPostLegalizerCombinerHelper {		class AMDGPUPostLegalizerCombinerHelper {
protected:		protected:
MachineIRBuilder &B;		MachineIRBuilder &B;
MachineFunction &MF;		MachineFunction &MF;
MachineRegisterInfo &MRI;		MachineRegisterInfo &MRI;
CombinerHelper &Helper;		CombinerHelper &Helper;

public:		public:
AMDGPUPostLegalizerCombinerHelper(MachineIRBuilder &B, CombinerHelper &Helper)		AMDGPUPostLegalizerCombinerHelper(MachineIRBuilder &B, CombinerHelper &Helper)
: B(B), MF(B.getMF()), MRI(*B.getMRI()), Helper(Helper){};		: B(B), MF(B.getMF()), MRI(*B.getMRI()), Helper(Helper){};

struct FMinFMaxLegacyInfo {		struct FMinFMaxLegacyInfo {
Register LHS;		Register LHS;
Register RHS;		Register RHS;
Register True;		Register True;
Register False;		Register False;
CmpInst::Predicate Pred;		CmpInst::Predicate Pred;
};		};

// TODO: Make sure fmin_legacy/fmax_legacy don't canonicalize		// TODO: Make sure fmin_legacy/fmax_legacy don't canonicalize
bool matchFMinFMaxLegacy(MachineInstr &MI, FMinFMaxLegacyInfo &Info);		bool matchFMinFMaxLegacy(MachineInstr &MI, FMinFMaxLegacyInfo &Info);
void applySelectFCmpToFMinToFMaxLegacy(MachineInstr &MI,		void applySelectFCmpToFMinToFMaxLegacy(MachineInstr &MI,
const FMinFMaxLegacyInfo &Info);		const FMinFMaxLegacyInfo &Info);

bool matchUCharToFloat(MachineInstr &MI);		bool matchUCharToFloat(MachineInstr &MI);
void applyUCharToFloat(MachineInstr &MI);		void applyUCharToFloat(MachineInstr &MI);

// FIXME: Should be able to have 2 separate matchdatas rather than custom		// FIXME: Should be able to have 2 separate matchdatas rather than custom
// struct boilerplate.		// struct boilerplate.
struct CvtF32UByteMatchInfo {		struct CvtF32UByteMatchInfo {
Register CvtVal;		Register CvtVal;
unsigned ShiftOffset;		unsigned ShiftOffset;
};		};

bool matchCvtF32UByteN(MachineInstr &MI, CvtF32UByteMatchInfo &MatchInfo);		bool matchCvtF32UByteN(MachineInstr &MI, CvtF32UByteMatchInfo &MatchInfo);
void applyCvtF32UByteN(MachineInstr &MI,		void applyCvtF32UByteN(MachineInstr &MI,
		arsenmUnsubmitted Not Done Reply Inline Actions This feels like reinventing MIPatternMatch arsenm: This feels like reinventing MIPatternMatch
const CvtF32UByteMatchInfo &MatchInfo);		const CvtF32UByteMatchInfo &MatchInfo);

		struct MinMaxMedOpc {
		unsigned Min, Max, Med;
		};

		struct Med3MatchInfo {
		unsigned Opc;
		Register Val0, Val1, Val2;
		};

		MinMaxMedOpc getMinMaxPair(unsigned Opc);

		template <class m_Cst>
		bool matchMed(MachineInstr &MI, MachineRegisterInfo &MRI, MinMaxMedOpc MMMOpc,
		Register &Val, Register &K0, Register &K1);
		arsenmUnsubmitted Not Done Reply Inline Actions Opcode checks first? arsenm: Opcode checks first?

		bool matchIntMinMaxToMed3(MachineInstr &MI, Med3MatchInfo &MatchInfo);
		void applyMed3(MachineInstr &MI, Med3MatchInfo &MatchInfo);

};		};

bool AMDGPUPostLegalizerCombinerHelper::matchFMinFMaxLegacy(		bool AMDGPUPostLegalizerCombinerHelper::matchFMinFMaxLegacy(
MachineInstr &MI, FMinFMaxLegacyInfo &Info) {		MachineInstr &MI, FMinFMaxLegacyInfo &Info) {
// FIXME: Combines should have subtarget predicates, and we shouldn't need		// FIXME: Combines should have subtarget predicates, and we shouldn't need
// this here.		// this here.
if (!MF.getSubtarget<GCNSubtarget>().hasFminFmaxLegacy())		if (!MF.getSubtarget<GCNSubtarget>().hasFminFmaxLegacy())
		arsenmUnsubmitted Not Done Reply Inline Actions Technically 0 is a valid instruction opcode (PHI) but we ignore that most places arsenm: Technically 0 is a valid instruction opcode (PHI) but we ignore that most places
return false;		return false;

// FIXME: Type predicate on pattern		// FIXME: Type predicate on pattern
if (MRI.getType(MI.getOperand(0).getReg()) != LLT::scalar(32))		if (MRI.getType(MI.getOperand(0).getReg()) != LLT::scalar(32))
return false;		return false;

Register Cond = MI.getOperand(1).getReg();		Register Cond = MI.getOperand(1).getReg();
if (!MRI.hasOneNonDBGUse(Cond) \|\|		if (!MRI.hasOneNonDBGUse(Cond) \|\|
!mi_match(Cond, MRI,		!mi_match(Cond, MRI,
m_GFCmp(m_Pred(Info.Pred), m_Reg(Info.LHS), m_Reg(Info.RHS))))		m_GFCmp(m_Pred(Info.Pred), m_Reg(Info.LHS), m_Reg(Info.RHS))))
return false;		return false;

Info.True = MI.getOperand(2).getReg();		Info.True = MI.getOperand(2).getReg();
		arsenmUnsubmitted Not Done Reply Inline Actions Braces arsenm: Braces
Info.False = MI.getOperand(3).getReg();		Info.False = MI.getOperand(3).getReg();

if (!(Info.LHS == Info.True && Info.RHS == Info.False) &&		if (!(Info.LHS == Info.True && Info.RHS == Info.False) &&
!(Info.LHS == Info.False && Info.RHS == Info.True))		!(Info.LHS == Info.False && Info.RHS == Info.True))
return false;		return false;

switch (Info.Pred) {		switch (Info.Pred) {
case CmpInst::FCMP_FALSE:		case CmpInst::FCMP_FALSE:
case CmpInst::FCMP_OEQ:		case CmpInst::FCMP_OEQ:
case CmpInst::FCMP_ONE:		case CmpInst::FCMP_ONE:
case CmpInst::FCMP_ORD:		case CmpInst::FCMP_ORD:
case CmpInst::FCMP_UNO:		case CmpInst::FCMP_UNO:
case CmpInst::FCMP_UEQ:		case CmpInst::FCMP_UEQ:
case CmpInst::FCMP_UNE:		case CmpInst::FCMP_UNE:
case CmpInst::FCMP_TRUE:		case CmpInst::FCMP_TRUE:
return false;		return false;
default:		default:
return true;		return true;
}		}
}		}

void AMDGPUPostLegalizerCombinerHelper::applySelectFCmpToFMinToFMaxLegacy(		void AMDGPUPostLegalizerCombinerHelper::applySelectFCmpToFMinToFMaxLegacy(
MachineInstr &MI, const FMinFMaxLegacyInfo &Info) {		MachineInstr &MI, const FMinFMaxLegacyInfo &Info) {
B.setInstrAndDebugLoc(MI);		B.setInstrAndDebugLoc(MI);
auto buildNewInst = [&MI, this](unsigned Opc, Register X, Register Y) {		auto buildNewInst = [&MI, this](unsigned Opc, Register X, Register Y) {
B.buildInstr(Opc, {MI.getOperand(0)}, {X, Y}, MI.getFlags());		B.buildInstr(Opc, {MI.getOperand(0)}, {X, Y}, MI.getFlags());
		foadUnsubmitted Not Done Reply Inline Actions This should never fail. foad: This should never fail.
};		};

switch (Info.Pred) {		switch (Info.Pred) {
case CmpInst::FCMP_ULT:		case CmpInst::FCMP_ULT:
case CmpInst::FCMP_ULE:		case CmpInst::FCMP_ULE:
if (Info.LHS == Info.True)		if (Info.LHS == Info.True)
buildNewInst(AMDGPU::G_AMDGPU_FMIN_LEGACY, Info.RHS, Info.LHS);		buildNewInst(AMDGPU::G_AMDGPU_FMIN_LEGACY, Info.RHS, Info.LHS);
else		else
		foadUnsubmitted Not Done Reply Inline Actions I think it only has to be K0 <= K1. foad: I think it only has to be K0 <= K1.
buildNewInst(AMDGPU::G_AMDGPU_FMAX_LEGACY, Info.LHS, Info.RHS);		buildNewInst(AMDGPU::G_AMDGPU_FMAX_LEGACY, Info.LHS, Info.RHS);
break;		break;
case CmpInst::FCMP_OLE:		case CmpInst::FCMP_OLE:
case CmpInst::FCMP_OLT: {		case CmpInst::FCMP_OLT: {
// We need to permute the operands to get the correct NaN behavior. The		// We need to permute the operands to get the correct NaN behavior. The
// selected operand is the second one based on the failing compare with NaN,		// selected operand is the second one based on the failing compare with NaN,
// so permute it based on the compare type the hardware uses.		// so permute it based on the compare type the hardware uses.
if (Info.LHS == Info.True)		if (Info.LHS == Info.True)
buildNewInst(AMDGPU::G_AMDGPU_FMIN_LEGACY, Info.LHS, Info.RHS);		buildNewInst(AMDGPU::G_AMDGPU_FMIN_LEGACY, Info.LHS, Info.RHS);
else		else
buildNewInst(AMDGPU::G_AMDGPU_FMAX_LEGACY, Info.RHS, Info.LHS);		buildNewInst(AMDGPU::G_AMDGPU_FMAX_LEGACY, Info.RHS, Info.LHS);
		arsenmUnsubmitted Not Done Reply Inline Actions This will fail if the constant is a bitcasted G_FCONSTANT when the other patch extends isConst arsenm: This will fail if the constant is a bitcasted G_FCONSTANT when the other patch extends isConst
break;		break;
}		}
case CmpInst::FCMP_UGE:		case CmpInst::FCMP_UGE:
case CmpInst::FCMP_UGT: {		case CmpInst::FCMP_UGT: {
if (Info.LHS == Info.True)		if (Info.LHS == Info.True)
buildNewInst(AMDGPU::G_AMDGPU_FMAX_LEGACY, Info.RHS, Info.LHS);		buildNewInst(AMDGPU::G_AMDGPU_FMAX_LEGACY, Info.RHS, Info.LHS);
else		else
buildNewInst(AMDGPU::G_AMDGPU_FMIN_LEGACY, Info.LHS, Info.RHS);		buildNewInst(AMDGPU::G_AMDGPU_FMIN_LEGACY, Info.LHS, Info.RHS);
break;		break;
}		}
case CmpInst::FCMP_OGT:		case CmpInst::FCMP_OGT:
case CmpInst::FCMP_OGE: {		case CmpInst::FCMP_OGE: {
if (Info.LHS == Info.True)		if (Info.LHS == Info.True)
buildNewInst(AMDGPU::G_AMDGPU_FMAX_LEGACY, Info.LHS, Info.RHS);		buildNewInst(AMDGPU::G_AMDGPU_FMAX_LEGACY, Info.LHS, Info.RHS);
		arsenmUnsubmitted Not Done Reply Inline Actions Should not construct new MachineIRBuilder arsenm: Should not construct new MachineIRBuilder
else		else
buildNewInst(AMDGPU::G_AMDGPU_FMIN_LEGACY, Info.RHS, Info.LHS);		buildNewInst(AMDGPU::G_AMDGPU_FMIN_LEGACY, Info.RHS, Info.LHS);
break;		break;
}		}
default:		default:
llvm_unreachable("predicate should not have matched");		llvm_unreachable("predicate should not have matched");
}		}

▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	if (SrcTy != S32) {
CvtSrc = B.buildAnyExt(S32, CvtSrc).getReg(0);		CvtSrc = B.buildAnyExt(S32, CvtSrc).getReg(0);
}		}

assert(MI.getOpcode() != NewOpc);		assert(MI.getOpcode() != NewOpc);
B.buildInstr(NewOpc, {MI.getOperand(0)}, {CvtSrc}, MI.getFlags());		B.buildInstr(NewOpc, {MI.getOperand(0)}, {CvtSrc}, MI.getFlags());
MI.eraseFromParent();		MI.eraseFromParent();
}		}

		AMDGPUPostLegalizerCombinerHelper::MinMaxMedOpc
		foadUnsubmitted Not Done Reply Inline Actions I don't understand why you need to use Optional here. The default case could just be marked as unreachable. foad: I don't understand why you need to use Optional here. The default case could just be marked as…
		AMDGPUPostLegalizerCombinerHelper::getMinMaxPair(unsigned Opc) {
		switch (Opc) {
		default:
		llvm_unreachable("Unsupported opcode");
		case AMDGPU::G_SMAX:
		case AMDGPU::G_SMIN:
		return {AMDGPU::G_SMIN, AMDGPU::G_SMAX, AMDGPU::G_AMDGPU_SMED3};
		case AMDGPU::G_UMAX:
		case AMDGPU::G_UMIN:
		return {AMDGPU::G_UMIN, AMDGPU::G_UMAX, AMDGPU::G_AMDGPU_UMED3};
		}
		}

		template <class m_Cst>
		foadUnsubmitted Not Done Reply Inline Actions Is this a template so that you can use it for floating point values in the future? Then shouldn't "CstRegMatch" be called "ICstRegMatch"? foad: Is this a template so that you can use it for floating point values in the future? Then…
		Petar.AvramovicAuthorUnsubmitted Done Reply Inline Actions Yes, fmed3 will match fconstant, and clamp fconstant or splat value Petar.Avramovic: Yes, fmed3 will match fconstant, and clamp fconstant or splat value
		bool AMDGPUPostLegalizerCombinerHelper::matchMed(MachineInstr &MI,
		MachineRegisterInfo &MRI,
		MinMaxMedOpc MMMOpc,
		Register &Val, Register &K0,
		Register &K1) {
		// 4 operand commutes of: min(max(Val, K0), K1). Find K1 from outer instr:
		// min(max(...), K1) or min(K1, max(...)). Find K0 and Val from inner instr:
		// max(K0, Val) or max(Val, K0).
		if (MI.getOpcode() == MMMOpc.Min)
		return mi_match(
		&MI,
		m_CommutableBinOp(m_CommutableBinOp(MMMOpc.Max, m_Reg(Val), m_Cst(K0)),
		m_Cst(K1)));
		// 4 operand commutes of: max(min(Val, K1), K0). Find K0 from outer instr:
		// max(min(...), K0) or max(K0, min(...)). Find K1 and Val from inner instr:
		// min(K1, Val) or min(Val, K1).
		return mi_match(&MI, m_CommutableBinOp(
		m_CommutableBinOp(MMMOpc.Min, m_Reg(Val), m_Cst(K1)),
		m_Cst(K0)));
		}

		bool AMDGPUPostLegalizerCombinerHelper::matchIntMinMaxToMed3(
		MachineInstr &MI, Med3MatchInfo &MatchInfo) {
		LLT Ty = MRI.getType(MI.getOperand(0).getReg());
		if (Ty != LLT::scalar(16) && Ty != LLT::scalar(32))
		return false;

		MinMaxMedOpc OpcodeTriple = getMinMaxPair(MI.getOpcode());
		Register Val, K0, K1;
		// Match min(max(Val, K0), K1) or max(min(Val, K1), K0). Then see if K0 <= K1.
		if (!matchMed<ICstRegMatch>(MI, MRI, OpcodeTriple, Val, K0, K1))
		return false;
		foadUnsubmitted Not Done Reply Inline Actions I would remove these asserts. foad: I would remove these asserts.

		const APInt &KO_Imm = getConstantIntVRegVal(K0, MRI)->getValue();
		const APInt &K1_Imm = getConstantIntVRegVal(K1, MRI)->getValue();
		if (OpcodeTriple.Med == AMDGPU::G_AMDGPU_SMED3 && KO_Imm.sgt(K1_Imm))
		return false;
		if (OpcodeTriple.Med == AMDGPU::G_AMDGPU_UMED3 && KO_Imm.ugt(K1_Imm))
		return false;

		MatchInfo = {OpcodeTriple.Med, Val, K0, K1};
		return true;
		}

		void AMDGPUPostLegalizerCombinerHelper::applyMed3(MachineInstr &MI,
		Med3MatchInfo &MatchInfo) {
		B.setInstrAndDebugLoc(MI);
		B.buildInstr(MatchInfo.Opc, {MI.getOperand(0)},
		{MatchInfo.Val0, MatchInfo.Val1, MatchInfo.Val2}, MI.getFlags());
		MI.eraseFromParent();
		}

class AMDGPUPostLegalizerCombinerHelperState {		class AMDGPUPostLegalizerCombinerHelperState {
protected:		protected:
CombinerHelper &Helper;		CombinerHelper &Helper;
AMDGPUPostLegalizerCombinerHelper &PostLegalizerHelper;		AMDGPUPostLegalizerCombinerHelper &PostLegalizerHelper;

public:		public:
AMDGPUPostLegalizerCombinerHelperState(		AMDGPUPostLegalizerCombinerHelperState(
CombinerHelper &Helper,		CombinerHelper &Helper,
▲ Show 20 Lines • Show All 138 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp

Show First 20 Lines • Show All 3,631 Lines • ▼ Show 20 Lines	AMDGPURegisterBankInfo::getInstrMapping(const MachineInstr &MI) const {
case AMDGPU::G_AMDGPU_FFBH_U32:		case AMDGPU::G_AMDGPU_FFBH_U32:
case AMDGPU::G_AMDGPU_FMIN_LEGACY:		case AMDGPU::G_AMDGPU_FMIN_LEGACY:
case AMDGPU::G_AMDGPU_FMAX_LEGACY:		case AMDGPU::G_AMDGPU_FMAX_LEGACY:
case AMDGPU::G_AMDGPU_RCP_IFLAG:		case AMDGPU::G_AMDGPU_RCP_IFLAG:
case AMDGPU::G_AMDGPU_CVT_F32_UBYTE0:		case AMDGPU::G_AMDGPU_CVT_F32_UBYTE0:
case AMDGPU::G_AMDGPU_CVT_F32_UBYTE1:		case AMDGPU::G_AMDGPU_CVT_F32_UBYTE1:
case AMDGPU::G_AMDGPU_CVT_F32_UBYTE2:		case AMDGPU::G_AMDGPU_CVT_F32_UBYTE2:
case AMDGPU::G_AMDGPU_CVT_F32_UBYTE3:		case AMDGPU::G_AMDGPU_CVT_F32_UBYTE3:
		case AMDGPU::G_AMDGPU_SMED3:
		case AMDGPU::G_AMDGPU_UMED3:
return getDefaultMappingVOP(MI);		return getDefaultMappingVOP(MI);
case AMDGPU::G_UMULH:		case AMDGPU::G_UMULH:
case AMDGPU::G_SMULH: {		case AMDGPU::G_SMULH: {
if (Subtarget.hasScalarMulHiInsts() && isSALUMapping(MI))		if (Subtarget.hasScalarMulHiInsts() && isSALUMapping(MI))
return getDefaultMappingSOP(MI);		return getDefaultMappingSOP(MI);
return getDefaultMappingVOP(MI);		return getDefaultMappingVOP(MI);
}		}
case AMDGPU::G_IMPLICIT_DEF: {		case AMDGPU::G_IMPLICIT_DEF: {
▲ Show 20 Lines • Show All 836 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIInstructions.td

	Show First 20 Lines • Show All 2,639 Lines • ▼ Show 20 Lines

	def G_AMDGPU_INTRIN_BVH_INTERSECT_RAY : AMDGPUGenericInstruction {			def G_AMDGPU_INTRIN_BVH_INTERSECT_RAY : AMDGPUGenericInstruction {
	let OutOperandList = (outs type0:$dst);			let OutOperandList = (outs type0:$dst);
	let InOperandList = (ins unknown:$intrin, variable_ops);			let InOperandList = (ins unknown:$intrin, variable_ops);
	let hasSideEffects = 0;			let hasSideEffects = 0;
	let mayLoad = 1;			let mayLoad = 1;
	let mayStore = 0;			let mayStore = 0;
	}			}

				def G_AMDGPU_SMED3 : AMDGPUGenericInstruction {
				let OutOperandList = (outs type0:$dst);
				let InOperandList = (ins type0:$src0, type0:$src1, type0:$src2);
				let hasSideEffects = 0;
				}

				def G_AMDGPU_UMED3 : AMDGPUGenericInstruction {
				let OutOperandList = (outs type0:$dst);
				let InOperandList = (ins type0:$src0, type0:$src1, type0:$src2);
				let hasSideEffects = 0;
				}

llvm/test/CodeGen/AMDGPU/GlobalISel/postlegalizercombiner-smed3.mir

This file was added.

				# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
				# RUN: llc -mtriple=amdgcn-amd-mesa3d -mcpu=gfx1010 -run-pass=amdgpu-postlegalizer-combiner -verify-machineinstrs %s -o - \| FileCheck %s

				---
				name: test_min_max_ValK0_K1_i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_min_max_ValK0_K1_i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 -12
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[AMDGPU_SMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_SMED3 [[COPY]], [[C]], [[C1]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_SMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 -12
				%3:_(s32) = G_SMAX %0, %2
				%4:_(s32) = G_CONSTANT i32 17
				%5:_(s32) = G_SMIN %3, %4
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: min_max_ValK0_K1_i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: min_max_ValK0_K1_i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 -12
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[AMDGPU_SMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_SMED3 [[COPY]], [[C]], [[C1]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_SMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 -12
				%3:_(s32) = G_SMAX %2, %0
				%4:_(s32) = G_CONSTANT i32 17
				%5:_(s32) = G_SMIN %3, %4
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_min_K1max_ValK0__i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_min_K1max_ValK0__i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 -12
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[AMDGPU_SMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_SMED3 [[COPY]], [[C]], [[C1]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_SMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 -12
				%3:_(s32) = G_SMAX %0, %2
				%4:_(s32) = G_CONSTANT i32 17
				%5:_(s32) = G_SMIN %4, %3
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_min_K1max_K0Val__i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_min_K1max_K0Val__i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 -12
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[AMDGPU_SMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_SMED3 [[COPY]], [[C]], [[C1]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_SMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 -12
				%3:_(s32) = G_SMAX %2, %0
				%4:_(s32) = G_CONSTANT i32 17
				%5:_(s32) = G_SMIN %4, %3
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_max_min_ValK1_K0_i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_max_min_ValK1_K0_i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 -12
				; CHECK: [[AMDGPU_SMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_SMED3 [[COPY]], [[C1]], [[C]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_SMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 17
				%3:_(s32) = G_SMIN %0, %2
				%4:_(s32) = G_CONSTANT i32 -12
				%5:_(s32) = G_SMAX %3, %4
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_max_min_K1Val_K0_i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_max_min_K1Val_K0_i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 -12
				; CHECK: [[AMDGPU_SMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_SMED3 [[COPY]], [[C1]], [[C]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_SMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 17
				%3:_(s32) = G_SMIN %2, %0
				%4:_(s32) = G_CONSTANT i32 -12
				%5:_(s32) = G_SMAX %3, %4
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_max_K0min_ValK1__i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_max_K0min_ValK1__i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 -12
				; CHECK: [[AMDGPU_SMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_SMED3 [[COPY]], [[C1]], [[C]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_SMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 17
				%3:_(s32) = G_SMIN %0, %2
				%4:_(s32) = G_CONSTANT i32 -12
				%5:_(s32) = G_SMAX %4, %3
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_max_K0min_K1Val__i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_max_K0min_K1Val__i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 -12
				; CHECK: [[AMDGPU_SMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_SMED3 [[COPY]], [[C1]], [[C]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_SMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 17
				%3:_(s32) = G_SMIN %2, %0
				%4:_(s32) = G_CONSTANT i32 -12
				%5:_(s32) = G_SMAX %4, %3
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

llvm/test/CodeGen/AMDGPU/GlobalISel/postlegalizercombiner-umed3.mir

This file was added.

				# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
				# RUN: llc -mtriple=amdgcn-amd-mesa3d -mcpu=gfx1010 -run-pass=amdgpu-postlegalizer-combiner -verify-machineinstrs %s -o - \| FileCheck %s

				---
				name: test_min_max_ValK0_K1_u32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_min_max_ValK0_K1_u32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 12
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[AMDGPU_UMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_UMED3 [[COPY]], [[C]], [[C1]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_UMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 12
				%3:_(s32) = G_UMAX %0, %2
				%4:_(s32) = G_CONSTANT i32 17
				%5:_(s32) = G_UMIN %3, %4
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: min_max_ValK0_K1_i32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: min_max_ValK0_K1_i32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 12
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[AMDGPU_UMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_UMED3 [[COPY]], [[C]], [[C1]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_UMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 12
				%3:_(s32) = G_UMAX %2, %0
				%4:_(s32) = G_CONSTANT i32 17
				%5:_(s32) = G_UMIN %3, %4
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_min_K1max_ValK0__u32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_min_K1max_ValK0__u32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 12
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[AMDGPU_UMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_UMED3 [[COPY]], [[C]], [[C1]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_UMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 12
				%3:_(s32) = G_UMAX %0, %2
				%4:_(s32) = G_CONSTANT i32 17
				%5:_(s32) = G_UMIN %4, %3
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_min_K1max_K0Val__u32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_min_K1max_K0Val__u32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 12
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[AMDGPU_UMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_UMED3 [[COPY]], [[C]], [[C1]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_UMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 12
				%3:_(s32) = G_UMAX %2, %0
				%4:_(s32) = G_CONSTANT i32 17
				%5:_(s32) = G_UMIN %4, %3
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_max_min_ValK1_K0_u32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_max_min_ValK1_K0_u32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 12
				; CHECK: [[AMDGPU_UMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_UMED3 [[COPY]], [[C1]], [[C]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_UMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 17
				%3:_(s32) = G_UMIN %0, %2
				%4:_(s32) = G_CONSTANT i32 12
				%5:_(s32) = G_UMAX %3, %4
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_max_min_K1Val_K0_u32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_max_min_K1Val_K0_u32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 12
				; CHECK: [[AMDGPU_UMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_UMED3 [[COPY]], [[C1]], [[C]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_UMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 17
				%3:_(s32) = G_UMIN %2, %0
				%4:_(s32) = G_CONSTANT i32 12
				%5:_(s32) = G_UMAX %3, %4
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_max_K0min_ValK1__u32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_max_K0min_ValK1__u32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 12
				; CHECK: [[AMDGPU_UMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_UMED3 [[COPY]], [[C1]], [[C]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_UMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 17
				%3:_(s32) = G_UMIN %0, %2
				%4:_(s32) = G_CONSTANT i32 12
				%5:_(s32) = G_UMAX %4, %3
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

				---
				name: test_max_K0min_K1Val__u32
				legalized: true
				tracksRegLiveness: true
				body: \|
				bb.1:
				liveins: $vgpr0, $sgpr30_sgpr31

				; CHECK-LABEL: name: test_max_K0min_K1Val__u32
				; CHECK: liveins: $vgpr0, $sgpr30_sgpr31
				; CHECK: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
				; CHECK: [[COPY1:%[0-9]+]]:sgpr_64 = COPY $sgpr30_sgpr31
				; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 17
				; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 12
				; CHECK: [[AMDGPU_UMED3_:%[0-9]+]]:_(s32) = G_AMDGPU_UMED3 [[COPY]], [[C1]], [[C]]
				; CHECK: $vgpr0 = COPY [[AMDGPU_UMED3_]](s32)
				; CHECK: [[COPY2:%[0-9]+]]:ccr_sgpr_64 = COPY [[COPY1]]
				; CHECK: S_SETPC_B64_return [[COPY2]], implicit $vgpr0
				%0:_(s32) = COPY $vgpr0
				%1:sgpr_64 = COPY $sgpr30_sgpr31
				%2:_(s32) = G_CONSTANT i32 17
				%3:_(s32) = G_UMIN %2, %0
				%4:_(s32) = G_CONSTANT i32 12
				%5:_(s32) = G_UMAX %4, %3
				$vgpr0 = COPY %5(s32)
				%6:ccr_sgpr_64 = COPY %1
				S_SETPC_B64_return %6, implicit $vgpr0
				...

llvm/test/CodeGen/AMDGPU/GlobalISel/smed3.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -global-isel -mtriple=amdgcn-amd-mesa3d -mcpu=gfx1010 -verify-machineinstrs < %s \| FileCheck -check-prefix=GFX10 %s

				define i32 @test_min_max_ValK0_K1_i32(i32 %a) {
				; GFX10-LABEL: test_min_max_ValK0_K1_i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_i32 v0, v0, -12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%smax = call i32 @llvm.smax.i32(i32 %a, i32 -12)
				%smed = call i32 @llvm.smin.i32(i32 %smax, i32 17)
				ret i32 %smed
				}

				define i32 @min_max_ValK0_K1_i32(i32 %a) {
				; GFX10-LABEL: min_max_ValK0_K1_i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_i32 v0, v0, -12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%smax = call i32 @llvm.smax.i32(i32 -12, i32 %a)
				%smed = call i32 @llvm.smin.i32(i32 %smax, i32 17)
				ret i32 %smed
				}

				define i32 @test_min_K1max_ValK0__i32(i32 %a) {
				; GFX10-LABEL: test_min_K1max_ValK0__i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_i32 v0, v0, -12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%smax = call i32 @llvm.smax.i32(i32 %a, i32 -12)
				%smed = call i32 @llvm.smin.i32(i32 17, i32 %smax)
				ret i32 %smed
				}

				define i32 @test_min_K1max_K0Val__i32(i32 %a) {
				; GFX10-LABEL: test_min_K1max_K0Val__i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_i32 v0, v0, -12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%smax = call i32 @llvm.smax.i32(i32 -12, i32 %a)
				%smed = call i32 @llvm.smin.i32(i32 17, i32 %smax)
				ret i32 %smed
				}

				define i32 @test_max_min_ValK1_K0_i32(i32 %a) {
				; GFX10-LABEL: test_max_min_ValK1_K0_i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_i32 v0, v0, -12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%smin = call i32 @llvm.smin.i32(i32 %a, i32 17)
				%smed = call i32 @llvm.smax.i32(i32 %smin, i32 -12)
				ret i32 %smed
				}

				define i32 @test_max_min_K1Val_K0_i32(i32 %a) {
				; GFX10-LABEL: test_max_min_K1Val_K0_i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_i32 v0, v0, -12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%smin = call i32 @llvm.smin.i32(i32 17, i32 %a)
				%smed = call i32 @llvm.smax.i32(i32 %smin, i32 -12)
				ret i32 %smed
				}

				define i32 @test_max_K0min_ValK1__i32(i32 %a) {
				; GFX10-LABEL: test_max_K0min_ValK1__i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_i32 v0, v0, -12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%smin = call i32 @llvm.smin.i32(i32 %a, i32 17)
				%smed = call i32 @llvm.smax.i32(i32 -12, i32 %smin)
				ret i32 %smed
				}

				define i32 @test_max_K0min_K1Val__i32(i32 %a) {
				; GFX10-LABEL: test_max_K0min_K1Val__i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_i32 v0, v0, -12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%smin = call i32 @llvm.smin.i32(i32 17, i32 %a)
				%smed = call i32 @llvm.smax.i32(i32 -12, i32 %smin)
				ret i32 %smed
				}

				declare i32 @llvm.smin.i32(i32, i32)
				declare i32 @llvm.smax.i32(i32, i32)

llvm/test/CodeGen/AMDGPU/GlobalISel/umed3.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -global-isel -mtriple=amdgcn-amd-mesa3d -mcpu=gfx1010 -verify-machineinstrs < %s \| FileCheck -check-prefix=GFX10 %s

				define i32 @test_min_max_ValK0_K1_u32(i32 %a) {
				; GFX10-LABEL: test_min_max_ValK0_K1_u32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_u32 v0, v0, 12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%umax = call i32 @llvm.umax.i32(i32 %a, i32 12)
				%umed = call i32 @llvm.umin.i32(i32 %umax, i32 17)
				ret i32 %umed
				}

				define i32 @min_max_ValK0_K1_i32(i32 %a) {
				; GFX10-LABEL: min_max_ValK0_K1_i32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_u32 v0, v0, 12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%umax = call i32 @llvm.umax.i32(i32 12, i32 %a)
				%umed = call i32 @llvm.umin.i32(i32 %umax, i32 17)
				ret i32 %umed
				}

				define i32 @test_min_K1max_ValK0__u32(i32 %a) {
				; GFX10-LABEL: test_min_K1max_ValK0__u32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_u32 v0, v0, 12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%umax = call i32 @llvm.umax.i32(i32 %a, i32 12)
				%umed = call i32 @llvm.umin.i32(i32 17, i32 %umax)
				ret i32 %umed
				}

				define i32 @test_min_K1max_K0Val__u32(i32 %a) {
				; GFX10-LABEL: test_min_K1max_K0Val__u32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_u32 v0, v0, 12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%umax = call i32 @llvm.umax.i32(i32 12, i32 %a)
				%umed = call i32 @llvm.umin.i32(i32 17, i32 %umax)
				ret i32 %umed
				}

				define i32 @test_max_min_ValK1_K0_u32(i32 %a) {
				; GFX10-LABEL: test_max_min_ValK1_K0_u32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_u32 v0, v0, 12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%umin = call i32 @llvm.umin.i32(i32 %a, i32 17)
				%umed = call i32 @llvm.umax.i32(i32 %umin, i32 12)
				ret i32 %umed
				}

				define i32 @test_max_min_K1Val_K0_u32(i32 %a) {
				; GFX10-LABEL: test_max_min_K1Val_K0_u32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_u32 v0, v0, 12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%umin = call i32 @llvm.umin.i32(i32 17, i32 %a)
				%umed = call i32 @llvm.umax.i32(i32 %umin, i32 12)
				ret i32 %umed
				}

				define i32 @test_max_K0min_ValK1__u32(i32 %a) {
				; GFX10-LABEL: test_max_K0min_ValK1__u32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_u32 v0, v0, 12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%umin = call i32 @llvm.umin.i32(i32 %a, i32 17)
				%umed = call i32 @llvm.umax.i32(i32 12, i32 %umin)
				ret i32 %umed
				}

				define i32 @test_max_K0min_K1Val__u32(i32 %a) {
				; GFX10-LABEL: test_max_K0min_K1Val__u32:
				; GFX10: ; %bb.0:
				; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX10-NEXT: v_med3_u32 v0, v0, 12, 17
				; GFX10-NEXT: ; implicit-def: $vcc_hi
				; GFX10-NEXT: s_setpc_b64 s[30:31]
				%umin = call i32 @llvm.umin.i32(i32 17, i32 %a)
				%umed = call i32 @llvm.umax.i32(i32 12, i32 %umin)
				ret i32 %umed
				}

				declare i32 @llvm.umin.i32(i32, i32)
				declare i32 @llvm.umax.i32(i32, i32)

This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU/GlobalISel: Add integer med3 combines
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 306424

llvm/include/llvm/CodeGen/GlobalISel/MIPatternMatch.h

llvm/include/llvm/CodeGen/GlobalISel/Utils.h

llvm/lib/CodeGen/GlobalISel/Utils.cpp

llvm/lib/Target/AMDGPU/AMDGPUCombine.td

llvm/lib/Target/AMDGPU/AMDGPUGISel.td

llvm/lib/Target/AMDGPU/AMDGPUPostLegalizerCombiner.cpp

llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp

llvm/lib/Target/AMDGPU/SIInstructions.td

llvm/test/CodeGen/AMDGPU/GlobalISel/postlegalizercombiner-smed3.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/postlegalizercombiner-umed3.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/smed3.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/umed3.ll

This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU/GlobalISel: Add integer med3 combinesClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 306424

llvm/include/llvm/CodeGen/GlobalISel/MIPatternMatch.h

llvm/include/llvm/CodeGen/GlobalISel/Utils.h

llvm/lib/CodeGen/GlobalISel/Utils.cpp

llvm/lib/Target/AMDGPU/AMDGPUCombine.td

llvm/lib/Target/AMDGPU/AMDGPUGISel.td

llvm/lib/Target/AMDGPU/AMDGPUPostLegalizerCombiner.cpp

llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp

llvm/lib/Target/AMDGPU/SIInstructions.td

llvm/test/CodeGen/AMDGPU/GlobalISel/postlegalizercombiner-smed3.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/postlegalizercombiner-umed3.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/smed3.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/umed3.ll

AMDGPU/GlobalISel: Add integer med3 combines
ClosedPublic