Diff 539498

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

Show First 20 Lines • Show All 3,303 Lines • ▼ Show 20 Lines	bool RISCVDAGToDAGISel::performCombineVMergeAndVOps(SDNode *N) {

// The vector policy operand may be present for masked intrinsics		// The vector policy operand may be present for masked intrinsics
bool HasVecPolicyOp = RISCVII::hasVecPolicyOp(TrueTSFlags);		bool HasVecPolicyOp = RISCVII::hasVecPolicyOp(TrueTSFlags);
unsigned TrueVOpsStart = True.getNumOperands() - HasVecPolicyOp - HasChainOp -		unsigned TrueVOpsStart = True.getNumOperands() - HasVecPolicyOp - HasChainOp -
HasGlueOp - 2 - IsMasked;		HasGlueOp - 2 - IsMasked;
SDValue TrueVL = True.getOperand(TrueVOpsStart + IsMasked);		SDValue TrueVL = True.getOperand(TrueVOpsStart + IsMasked);
SDValue TrueSEW = True.getOperand(TrueVOpsStart + IsMasked + 1);		SDValue TrueSEW = True.getOperand(TrueVOpsStart + IsMasked + 1);

// Allow the peephole for non-exception True with VLMAX vector length, since		auto GetSmallerOrEqualVL = [](SDValue LHS, SDValue RHS) {
// all the values after VL of N are dependent on Merge. VLMAX should be		if (LHS == RHS)
// lowered to (XLenVT -1).		return LHS;
if (TrueVL != VL && !isAllOnesConstant(TrueVL))		if (isAllOnesConstant(LHS))
		return RHS;
		if (isAllOnesConstant(RHS))
		return LHS;
		if (auto *CLHS = dyn_cast<ConstantSDNode>(LHS),
		fakepaper56Unsubmitted Done Reply Inline Actions Is the below code more concise? if (auto CLHS = dyn_cast<ConstantSDNode>(LHS)) if (auto CRHS = dyn_cast<ConstantSDNode>(RHS)) fakepaper56: Is the below code more concise? ``` if (auto *CLHS = dyn_cast<ConstantSDNode>(LHS)) if (auto…
		lukeAuthorUnsubmitted Done Reply Inline Actions Yeah that's much more readable, thanks! luke: Yeah that's much more readable, thanks!
		reamesUnsubmitted Not Done Reply Inline Actions Suggestion: auto CLHS = dyn_cast<ConstantSDNode>(LHS); auto CRHS = dyn_cast<ConstantSDNode>(RHS); if (!CRHS \|\| !CLHS) return SDValue(); return CLHS->getZExtValue() <= CRHS->getZExtValue() ? LHS : RHS; reames: Suggestion: ``` auto CLHS = dyn_cast<ConstantSDNode>(LHS); auto CRHS =…
		*CRHS = dyn_cast<ConstantSDNode>(RHS);
		CLHS && CRHS)
		return CLHS->getZExtValue() <= CRHS->getZExtValue() ? LHS : RHS;
		return SDValue();
		};

		reamesUnsubmitted Not Done Reply Inline Actions Nit pick - have the same merge operand or the merge on the True instruction doesn't exist and is thus undef. reames: Nit pick - have the same merge operand *or the merge on the True instruction doesn't exist and…
		lukeAuthorUnsubmitted Not Done Reply Inline Actions My mental model of this is that we need to have the same merge operand for both, but if the merge operand on True is undefined or missing, then we assume it's the same merge operand as N. Could we make this reasoning more explicit in the preceding code? luke: My mental model of this is that we need to have the same merge operand for both, but if the…
		lukeAuthorUnsubmitted Not Done Reply Inline Actions Something like: diff --git a/llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp b/llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp index d956b303e584..6a084efa0a8f 100644 --- a/llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp +++ b/llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp @@ -3245,18 +3245,20 @@ bool RISCVDAGToDAGISel::performCombineVMergeAndVOps(SDNode N) { if (!Info) return false; - if (HasTiedDest && !isImplicitDef(True->getOperand(0))) { - // The vmerge instruction must be TU. - // FIXME: This could be relaxed, but we need to handle the policy for the - // resulting op correctly. - if (isImplicitDef(Merge)) - return false; - SDValue MergeOpTrue = True->getOperand(0); - // Both the vmerge instruction and the True instruction must have the same - // merge operand. - if (False != MergeOpTrue) - return false; - } + SDValue TrueMerge = HasTiedDest ? True->getOperand(0) : False; + if (isImplicitDef(TrueMerge)) + TrueMerge = False; + + // Both the vmerge instruction and the True instruction must have the same + // merge operand. + if (TrueMerge != False) + return false; + + // The vmerge instruction must be TU. + // FIXME: This could be relaxed, but we need to handle the policy for the + // resulting op correctly. + if (isImplicitDef(Merge) && !isImplicitDef(TrueMerge)) + return false; if (IsMasked) { assert(HasTiedDest && "Expected tied dest"); luke:* Something like: ``` diff --git a/llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp…
		lukeAuthorUnsubmitted Done Reply Inline Actions @reames Do you have any thoughts on the above? luke: @reames Do you have any thoughts on the above?
		// Because N and True must have the same merge operand, the "effective" body
		reamesUnsubmitted Not Done Reply Inline Actions This comment is awfully verbose, and I don't think the example helps much. reames: This comment is awfully verbose, and I don't think the example helps much.
		lukeAuthorUnsubmitted Done Reply Inline Actions After reading this the next day, I agree. I think I was using the comments as a mental scratch pad luke: After reading this the next day, I agree. I think I was using the comments as a mental scratch…
		// is the minimum of their VLs. For example, if we have VL=3 and VL=5:
		//
		// \|o o o\|x x x x x\| <- %x = PseudoVADD %merge, %a, %b, VL=3
		// \|o o o x x\|x x x\| <- %y = PseudoVMERGE %merge, %merge, %x, %mask, VL=5
		// -----------------
		// \|o o o\|x x x x x\| <~ %y = PseudoVADD_MASK %merge, %a, %b, %mask, VL=3
		//
		// Then the result contains only the first 3 elements of True.
		//
		// So even if the VLs don't match, if we know that one of them is smaller than
		// the other then we can go ahead and use it.
		SDValue NewVL = GetSmallerOrEqualVL(TrueVL, VL);
		if (!NewVL)
		reamesUnsubmitted Not Done Reply Inline Actions Naming: GetMinVL reames: Naming: GetMinVL
return false;		return false;

// If we end up changing the VL or mask of True, then we need to make sure it		// If we end up changing the VL or mask of True, then we need to make sure it
// doesn't raise any fp exceptions, since changing the active elements will		// doesn't raise any fp exceptions, since changing the active elements will
// affect how fflags is set.		// affect how fflags is set.
if (TrueVL != VL \|\| !IsMasked)		if (TrueVL != NewVL \|\| !IsMasked)
		reamesUnsubmitted Not Done Reply Inline Actions The comment change needs reverted. reames: The comment change needs reverted.
if (mayRaiseFPException(True.getNode()) &&		if (mayRaiseFPException(True.getNode()) &&
!True->getFlags().hasNoFPExcept())		!True->getFlags().hasNoFPExcept())
return false;		return false;

SDLoc DL(N);		SDLoc DL(N);
unsigned MaskedOpc = Info->MaskedPseudo;		unsigned MaskedOpc = Info->MaskedPseudo;
#ifndef NDEBUG		#ifndef NDEBUG
const MCInstrDesc &MaskedMCID = TII->get(MaskedOpc);		const MCInstrDesc &MaskedMCID = TII->get(MaskedOpc);
assert(RISCVII::hasVecPolicyOp(MaskedMCID.TSFlags) &&		assert(RISCVII::hasVecPolicyOp(MaskedMCID.TSFlags) &&
"Expected instructions with mask have policy operand.");		"Expected instructions with mask have policy operand.");
assert(MaskedMCID.getOperandConstraint(MaskedMCID.getNumDefs(),		assert(MaskedMCID.getOperandConstraint(MaskedMCID.getNumDefs(),
MCOI::TIED_TO) == 0 &&		MCOI::TIED_TO) == 0 &&
"Expected instructions with mask have a tied dest.");		"Expected instructions with mask have a tied dest.");
#endif		#endif

uint64_t Policy = isImplicitDef(N->getOperand(0)) ?		uint64_t Policy = isImplicitDef(N->getOperand(0)) ?
RISCVII::TAIL_AGNOSTIC : /TUMU/ 0;		RISCVII::TAIL_AGNOSTIC : /TUMU/ 0;
SDValue PolicyOp =		SDValue PolicyOp =
CurDAG->getTargetConstant(Policy, DL, Subtarget->getXLenVT());		CurDAG->getTargetConstant(Policy, DL, Subtarget->getXLenVT());

SmallVector<SDValue, 8> Ops;		SmallVector<SDValue, 8> Ops;
Ops.push_back(False);		Ops.push_back(False);
Ops.append(True->op_begin() + HasTiedDest, True->op_begin() + TrueVOpsStart);		Ops.append(True->op_begin() + HasTiedDest, True->op_begin() + TrueVOpsStart);
Ops.append({Mask, VL, TrueSEW, PolicyOp});		Ops.append({Mask, NewVL, TrueSEW, PolicyOp});

// Result node should have chain operand of True.		// Result node should have chain operand of True.
if (HasChainOp)		if (HasChainOp)
Ops.push_back(True.getOperand(TrueChainOpIdx));		Ops.push_back(True.getOperand(TrueChainOpIdx));

// Add the glue for the CopyToReg of mask->v0.		// Add the glue for the CopyToReg of mask->v0.
Ops.push_back(Glue);		Ops.push_back(Glue);

▲ Show 20 Lines • Show All 88 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vselect.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s -check-prefixes=CHECK,RV32			; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s -check-prefixes=CHECK,RV32
	; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s -check-prefixes=CHECK,RV64			; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s -check-prefixes=CHECK,RV64

	define void @vselect_vv_v6i32(ptr %a, ptr %b, ptr %cc, ptr %z) {			define void @vselect_vv_v6i32(ptr %a, ptr %b, ptr %cc, ptr %z) {
	; RV32-LABEL: vselect_vv_v6i32:			; RV32-LABEL: vselect_vv_v6i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: lbu a2, 0(a2)			; RV32-NEXT: lbu a2, 0(a2)
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a1)
	; RV32-NEXT: vle32.v v10, (a1)			; RV32-NEXT: andi a1, a2, 1
	; RV32-NEXT: andi a0, a2, 1
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vslide1down.vx v12, v8, a0			; RV32-NEXT: vslide1down.vx v10, v8, a1
	; RV32-NEXT: slli a0, a2, 30			; RV32-NEXT: slli a1, a2, 30
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: vslide1down.vx v12, v12, a0			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: slli a0, a2, 29			; RV32-NEXT: slli a1, a2, 29
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: vslide1down.vx v12, v12, a0			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: slli a0, a2, 28			; RV32-NEXT: slli a1, a2, 28
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: vslide1down.vx v12, v12, a0			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: slli a0, a2, 27			; RV32-NEXT: slli a1, a2, 27
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: vslide1down.vx v12, v12, a0			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: srli a2, a2, 5			; RV32-NEXT: srli a2, a2, 5
	; RV32-NEXT: vslide1down.vx v12, v12, a2			; RV32-NEXT: vslide1down.vx v10, v10, a2
	; RV32-NEXT: vslidedown.vi v12, v12, 2			; RV32-NEXT: vslidedown.vi v10, v10, 2
	; RV32-NEXT: vand.vi v12, v12, 1			; RV32-NEXT: vand.vi v10, v10, 1
	; RV32-NEXT: vmsne.vi v0, v12, 0			; RV32-NEXT: vmsne.vi v0, v10, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, mu
	; RV32-NEXT: vmerge.vvm v8, v10, v8, v0			; RV32-NEXT: vle32.v v8, (a0), v0.t
	; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: vse32.v v8, (a3)			; RV32-NEXT: vse32.v v8, (a3)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vselect_vv_v6i32:			; RV64-LABEL: vselect_vv_v6i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: lbu a2, 0(a2)			; RV64-NEXT: lbu a2, 0(a2)
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a1)
	; RV64-NEXT: vle32.v v10, (a1)			; RV64-NEXT: andi a1, a2, 1
	; RV64-NEXT: andi a0, a2, 1
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vslide1down.vx v12, v8, a0			; RV64-NEXT: vslide1down.vx v10, v8, a1
	; RV64-NEXT: slli a0, a2, 62			; RV64-NEXT: slli a1, a2, 62
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: vslide1down.vx v12, v12, a0			; RV64-NEXT: vslide1down.vx v10, v10, a1
	; RV64-NEXT: slli a0, a2, 61			; RV64-NEXT: slli a1, a2, 61
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: vslide1down.vx v12, v12, a0			; RV64-NEXT: vslide1down.vx v10, v10, a1
	; RV64-NEXT: slli a0, a2, 60			; RV64-NEXT: slli a1, a2, 60
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: vslide1down.vx v12, v12, a0			; RV64-NEXT: vslide1down.vx v10, v10, a1
	; RV64-NEXT: slli a0, a2, 59			; RV64-NEXT: slli a1, a2, 59
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: vslide1down.vx v12, v12, a0			; RV64-NEXT: vslide1down.vx v10, v10, a1
	; RV64-NEXT: srli a2, a2, 5			; RV64-NEXT: srli a2, a2, 5
	; RV64-NEXT: vslide1down.vx v12, v12, a2			; RV64-NEXT: vslide1down.vx v10, v10, a2
	; RV64-NEXT: vslidedown.vi v12, v12, 2			; RV64-NEXT: vslidedown.vi v10, v10, 2
	; RV64-NEXT: vand.vi v12, v12, 1			; RV64-NEXT: vand.vi v10, v10, 1
	; RV64-NEXT: vmsne.vi v0, v12, 0			; RV64-NEXT: vmsne.vi v0, v10, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, mu
	; RV64-NEXT: vmerge.vvm v8, v10, v8, v0			; RV64-NEXT: vle32.v v8, (a0), v0.t
				craig.topperUnsubmitted Not Done Reply Inline Actions I think this shows the bug. This is a ta load, formed from a vl=6 load and vl=8 merge both ta. Elements 6 and 7 are now part of the tail after merging. Elements 6 and 7 were defined if the mask was 0 for those elements. We're now ignoring mask bits 6 and 7 with the reduce vl. So we need to use tu to make them defined. craig.topper: I think this shows the bug. This is a ta load, formed from a vl=6 load and vl=8 merge both ta.
	; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: vse32.v v8, (a3)			; RV64-NEXT: vse32.v v8, (a3)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%va = load <6 x i32>, ptr %a			%va = load <6 x i32>, ptr %a
	%vb = load <6 x i32>, ptr %b			%vb = load <6 x i32>, ptr %b
	%vcc = load <6 x i1>, ptr %cc			%vcc = load <6 x i1>, ptr %cc
	%vsel = select <6 x i1> %vcc, <6 x i32> %va, <6 x i32> %vb			%vsel = select <6 x i1> %vcc, <6 x i32> %va, <6 x i32> %vb
	store <6 x i32> %vsel, ptr %z			store <6 x i32> %vsel, ptr %z
	ret void			ret void
	▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
	}			}


	define void @vselect_vv_v6f32(ptr %a, ptr %b, ptr %cc, ptr %z) {			define void @vselect_vv_v6f32(ptr %a, ptr %b, ptr %cc, ptr %z) {
	; RV32-LABEL: vselect_vv_v6f32:			; RV32-LABEL: vselect_vv_v6f32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: lbu a2, 0(a2)			; RV32-NEXT: lbu a2, 0(a2)
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a1)
	; RV32-NEXT: vle32.v v10, (a1)			; RV32-NEXT: andi a1, a2, 1
	; RV32-NEXT: andi a0, a2, 1
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vslide1down.vx v12, v8, a0			; RV32-NEXT: vslide1down.vx v10, v8, a1
	; RV32-NEXT: slli a0, a2, 30			; RV32-NEXT: slli a1, a2, 30
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: vslide1down.vx v12, v12, a0			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: slli a0, a2, 29			; RV32-NEXT: slli a1, a2, 29
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: vslide1down.vx v12, v12, a0			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: slli a0, a2, 28			; RV32-NEXT: slli a1, a2, 28
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: vslide1down.vx v12, v12, a0			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: slli a0, a2, 27			; RV32-NEXT: slli a1, a2, 27
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: vslide1down.vx v12, v12, a0			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: srli a2, a2, 5			; RV32-NEXT: srli a2, a2, 5
	; RV32-NEXT: vslide1down.vx v12, v12, a2			; RV32-NEXT: vslide1down.vx v10, v10, a2
	; RV32-NEXT: vslidedown.vi v12, v12, 2			; RV32-NEXT: vslidedown.vi v10, v10, 2
	; RV32-NEXT: vand.vi v12, v12, 1			; RV32-NEXT: vand.vi v10, v10, 1
	; RV32-NEXT: vmsne.vi v0, v12, 0			; RV32-NEXT: vmsne.vi v0, v10, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, mu
	; RV32-NEXT: vmerge.vvm v8, v10, v8, v0			; RV32-NEXT: vle32.v v8, (a0), v0.t
	; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: vse32.v v8, (a3)			; RV32-NEXT: vse32.v v8, (a3)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vselect_vv_v6f32:			; RV64-LABEL: vselect_vv_v6f32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: lbu a2, 0(a2)			; RV64-NEXT: lbu a2, 0(a2)
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a1)
				reamesUnsubmitted Not Done Reply Inline Actions Totally off topic for this review, but we can do way better for odd sized mask loads. The scalarization code here already touches all bits in the byte, we can just do a single byte vector load and mask off the high bits directly. Not sure we care, just noticed it as I was looking at this test. reames: Totally off topic for this review, but we can do way better for odd sized mask loads. The…
	; RV64-NEXT: vle32.v v10, (a1)			; RV64-NEXT: andi a1, a2, 1
	; RV64-NEXT: andi a0, a2, 1
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vslide1down.vx v12, v8, a0			; RV64-NEXT: vslide1down.vx v10, v8, a1
	; RV64-NEXT: slli a0, a2, 62			; RV64-NEXT: slli a1, a2, 62
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: vslide1down.vx v12, v12, a0			; RV64-NEXT: vslide1down.vx v10, v10, a1
	; RV64-NEXT: slli a0, a2, 61			; RV64-NEXT: slli a1, a2, 61
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: vslide1down.vx v12, v12, a0			; RV64-NEXT: vslide1down.vx v10, v10, a1
	; RV64-NEXT: slli a0, a2, 60			; RV64-NEXT: slli a1, a2, 60
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: vslide1down.vx v12, v12, a0			; RV64-NEXT: vslide1down.vx v10, v10, a1
	; RV64-NEXT: slli a0, a2, 59			; RV64-NEXT: slli a1, a2, 59
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: vslide1down.vx v12, v12, a0			; RV64-NEXT: vslide1down.vx v10, v10, a1
	; RV64-NEXT: srli a2, a2, 5			; RV64-NEXT: srli a2, a2, 5
	; RV64-NEXT: vslide1down.vx v12, v12, a2			; RV64-NEXT: vslide1down.vx v10, v10, a2
	; RV64-NEXT: vslidedown.vi v12, v12, 2			; RV64-NEXT: vslidedown.vi v10, v10, 2
	; RV64-NEXT: vand.vi v12, v12, 1			; RV64-NEXT: vand.vi v10, v10, 1
	; RV64-NEXT: vmsne.vi v0, v12, 0			; RV64-NEXT: vmsne.vi v0, v10, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, mu
	; RV64-NEXT: vmerge.vvm v8, v10, v8, v0			; RV64-NEXT: vle32.v v8, (a0), v0.t
	; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: vse32.v v8, (a3)			; RV64-NEXT: vse32.v v8, (a3)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%va = load <6 x float>, ptr %a			%va = load <6 x float>, ptr %a
	%vb = load <6 x float>, ptr %b			%vb = load <6 x float>, ptr %b
	%vcc = load <6 x i1>, ptr %cc			%vcc = load <6 x i1>, ptr %cc
	%vsel = select <6 x i1> %vcc, <6 x float> %va, <6 x float> %vb			%vsel = select <6 x i1> %vcc, <6 x float> %va, <6 x float> %vb
	store <6 x float> %vsel, ptr %z			store <6 x float> %vsel, ptr %z
	ret void			ret void
	▲ Show 20 Lines • Show All 432 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/rvv-peephole-vmerge-masked-vops.ll

Show First 20 Lines • Show All 149 Lines • ▼ Show 20 Lines
}		}

; Tests for folding vmerge into its ops when their VLs differ		; Tests for folding vmerge into its ops when their VLs differ

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_smaller_vl_same_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_smaller_vl_same_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
; CHECK-LABEL: vmerge_smaller_vl_same_passthru:		; CHECK-LABEL: vmerge_smaller_vl_same_passthru:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 3, e32, m1, tu, mu		; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; CHECK-NEXT: vmv1r.v v11, v8		; CHECK-NEXT: vadd.vv v8, v9, v10, v0.t
; CHECK-NEXT: vadd.vv v11, v9, v10, v0.t
; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, ma
; CHECK-NEXT: vmv.v.v v8, v11
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = call <vscale x 2 x i32> @llvm.riscv.vadd.mask.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m, i64 3, i64 0)		%a = call <vscale x 2 x i32> @llvm.riscv.vadd.mask.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m, i64 3, i64 0)
%splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0		%splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
%mask = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer		%mask = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 2)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 2)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_larger_vl_same_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_larger_vl_same_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
; CHECK-LABEL: vmerge_larger_vl_same_passthru:		; CHECK-LABEL: vmerge_larger_vl_same_passthru:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu		; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; CHECK-NEXT: vmv1r.v v11, v8		; CHECK-NEXT: vadd.vv v8, v9, v10, v0.t
; CHECK-NEXT: vadd.vv v11, v9, v10, v0.t
; CHECK-NEXT: vsetivli zero, 3, e32, m1, tu, ma
; CHECK-NEXT: vmv.v.v v8, v11
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = call <vscale x 2 x i32> @llvm.riscv.vadd.mask.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m, i64 2, i64 0)		%a = call <vscale x 2 x i32> @llvm.riscv.vadd.mask.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m, i64 2, i64 0)
%splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0		%splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
%mask = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer		%mask = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 3)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 3)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

Show All 30 Lines	; CHECK-NEXT: ret
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %pt2, <vscale x 2 x i32> %pt2, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 3)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %pt2, <vscale x 2 x i32> %pt2, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 3)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_smaller_vl_poison_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_smaller_vl_poison_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
; CHECK-LABEL: vmerge_smaller_vl_poison_passthru:		; CHECK-LABEL: vmerge_smaller_vl_poison_passthru:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; CHECK-NEXT: vadd.vv v9, v9, v10, v0.t		; CHECK-NEXT: vadd.vv v8, v9, v10, v0.t
; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, ma
; CHECK-NEXT: vmv.v.v v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = call <vscale x 2 x i32> @llvm.riscv.vadd.mask.nxv2i32.nxv2i32(<vscale x 2 x i32> poison, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m, i64 3, i64 0)		%a = call <vscale x 2 x i32> @llvm.riscv.vadd.mask.nxv2i32.nxv2i32(<vscale x 2 x i32> poison, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m, i64 3, i64 0)
%splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0		%splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
%mask = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer		%mask = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 2)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 2)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_larger_vl_poison_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_larger_vl_poison_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
; CHECK-LABEL: vmerge_larger_vl_poison_passthru:		; CHECK-LABEL: vmerge_larger_vl_poison_passthru:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; CHECK-NEXT: vadd.vv v9, v9, v10, v0.t		; CHECK-NEXT: vadd.vv v8, v9, v10, v0.t
; CHECK-NEXT: vsetivli zero, 3, e32, m1, tu, ma
; CHECK-NEXT: vmv.v.v v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = call <vscale x 2 x i32> @llvm.riscv.vadd.mask.nxv2i32.nxv2i32(<vscale x 2 x i32> poison, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m, i64 2, i64 0)		%a = call <vscale x 2 x i32> @llvm.riscv.vadd.mask.nxv2i32.nxv2i32(<vscale x 2 x i32> poison, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m, i64 2, i64 0)
%splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0		%splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
%mask = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer		%mask = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 3)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %mask, i64 3)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

llvm/test/CodeGen/RISCV/rvv/rvv-peephole-vmerge-vops.ll

Show First 20 Lines • Show All 970 Lines • ▼ Show 20 Lines

declare <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32>, <vscale x 2 x i32>, <vscale x 2 x i32>, i64)		declare <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32>, <vscale x 2 x i32>, <vscale x 2 x i32>, i64)
declare <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32>, <vscale x 2 x i32>, <vscale x 2 x i32>, <vscale x 2 x i1>, i64)		declare <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32>, <vscale x 2 x i32>, <vscale x 2 x i32>, <vscale x 2 x i1>, i64)

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_smaller_vl_same_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_smaller_vl_same_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
; CHECK-LABEL: vmerge_smaller_vl_same_passthru:		; CHECK-LABEL: vmerge_smaller_vl_same_passthru:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, tu, ma		; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; CHECK-NEXT: vmv1r.v v11, v8		; CHECK-NEXT: vadd.vv v8, v9, v10, v0.t
; CHECK-NEXT: vadd.vv v11, v9, v10
; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, ma
; CHECK-NEXT: vmerge.vvm v8, v8, v11, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = call <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, i64 4)		%a = call <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, i64 4)
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 2)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 2)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_larger_vl_same_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_larger_vl_same_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
; CHECK-LABEL: vmerge_larger_vl_same_passthru:		; CHECK-LABEL: vmerge_larger_vl_same_passthru:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, ma		; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; CHECK-NEXT: vmv1r.v v11, v8		; CHECK-NEXT: vadd.vv v8, v9, v10, v0.t
; CHECK-NEXT: vadd.vv v11, v9, v10
; CHECK-NEXT: vsetivli zero, 3, e32, m1, tu, ma
; CHECK-NEXT: vmerge.vvm v8, v8, v11, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = call <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, i64 2)		%a = call <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, i64 2)
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 3)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 3)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_smaller_vl_different_passthru(<vscale x 2 x i32> %pt1, <vscale x 2 x i32> %pt2, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_smaller_vl_different_passthru(<vscale x 2 x i32> %pt1, <vscale x 2 x i32> %pt2, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
Show All 24 Lines	; CHECK-NEXT: ret
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %pt2, <vscale x 2 x i32> %pt2, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 3)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %pt2, <vscale x 2 x i32> %pt2, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 3)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_smaller_vl_poison_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_smaller_vl_poison_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
; CHECK-LABEL: vmerge_smaller_vl_poison_passthru:		; CHECK-LABEL: vmerge_smaller_vl_poison_passthru:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; CHECK-NEXT: vadd.vv v9, v9, v10		; CHECK-NEXT: vadd.vv v8, v9, v10, v0.t
; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, ma
; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = call <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32> poison, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, i64 3)		%a = call <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32> poison, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, i64 3)
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 2)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 2)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

; Can fold with VL=2		; Can fold with VL=2
define <vscale x 2 x i32> @vmerge_larger_vl_poison_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {		define <vscale x 2 x i32> @vmerge_larger_vl_poison_passthru(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, <vscale x 2 x i1> %m) {
; CHECK-LABEL: vmerge_larger_vl_poison_passthru:		; CHECK-LABEL: vmerge_larger_vl_poison_passthru:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; CHECK-NEXT: vadd.vv v9, v9, v10		; CHECK-NEXT: vadd.vv v8, v9, v10, v0.t
; CHECK-NEXT: vsetivli zero, 3, e32, m1, tu, ma
; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = call <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32> poison, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, i64 2)		%a = call <vscale x 2 x i32> @llvm.riscv.vadd.nxv2i32.nxv2i32(<vscale x 2 x i32> poison, <vscale x 2 x i32> %x, <vscale x 2 x i32> %y, i64 2)
%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 3)		%b = call <vscale x 2 x i32> @llvm.riscv.vmerge.nxv2i32.nxv2i32(<vscale x 2 x i32> %passthru, <vscale x 2 x i32> %passthru, <vscale x 2 x i32> %a, <vscale x 2 x i1> %m, i64 3)
ret <vscale x 2 x i32> %b		ret <vscale x 2 x i32> %b
}		}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Fold vmerge into its ops with smaller VL if known
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 539498

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vselect.ll

llvm/test/CodeGen/RISCV/rvv/rvv-peephole-vmerge-masked-vops.ll

llvm/test/CodeGen/RISCV/rvv/rvv-peephole-vmerge-vops.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Fold vmerge into its ops with smaller VL if knownClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 539498

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vselect.ll

llvm/test/CodeGen/RISCV/rvv/rvv-peephole-vmerge-masked-vops.ll

llvm/test/CodeGen/RISCV/rvv/rvv-peephole-vmerge-vops.ll

[RISCV] Fold vmerge into its ops with smaller VL if known
ClosedPublic