This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Avoid changing etype for splat of 0 or -1
ClosedPublic

Authored by reames on Jun 16 2022, 1:48 PM.

Download Raw Diff

Details

Reviewers

craig.topper
kito-cheng
frasercrmck

Commits

rG755c84c62cda: [RISCV] Avoid changing etype for splat of 0 or -1

Summary

A splat of the values 0 and -1 as sign extended 12 bit immediates are always the same bit pattern regardless of the etype used to perform the operation. As a result, we can sometimes avoid introducing a vsetvli just for the purposes of a splat.

Looking at the diffs, we don't get a huge amount of immediate value out of this. We mostly push the vsetvli one instruction down, usually in front of a vmerge. We also don't get the corresponding fixed length vector cases because VL typically is changed despite the actual bits written being the same. Both of these are areas I plan to explore in future patches.

Interestingly, this makes a great example of why we need the forward and backward implementation to be consistent. Before we merged the demanded field handling, if we implement only the forward direction, we lost the ability to mutate a prior vsetvli and eliminate a later one entirely. This resulted in practical regressions instead of improvements. It's always nice when practice matches theory. :)

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

reames created this revision.Jun 16 2022, 1:48 PM

Herald added a project: Restricted Project. · View Herald TranscriptJun 16 2022, 1:48 PM

Herald added subscribers: sunshaoce, VincentWu, luke957 and 30 others. · View Herald Transcript

reames requested review of this revision.Jun 16 2022, 1:48 PM

Herald added a project: Restricted Project. · View Herald TranscriptJun 16 2022, 1:48 PM

Herald added subscribers: • pcwang-thead, eopXD, MaskRay. · View Herald Transcript

Rebase over landed changes and simplify as a result

Harbormaster completed remote builds in B170387: Diff 437727.Jun 16 2022, 4:53 PM

LGTM with one stray formatting change and one possible future improvment.

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
608	Stray blank line change?
llvm/test/CodeGen/RISCV/rvv/fixed-vectors-extload-truncstore.ll
10	Seems like this could be e16, mf4 to avoid the later vsetvli

This revision is now accepted and ready to land.Jun 16 2022, 10:03 PM

LGTM

reames added inline comments.Jun 17 2022, 8:07 AM

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-extload-truncstore.ll
10	We don't have any demanded rules for vlm.v, and as such, can't rewrite the vsetvli before it. I went and glanced at the spec for that instruction, and honestly, the wording is vague enough I'm not quite sure what we're allowed to do with it.

This revision was landed with ongoing or failed builds.Jun 17 2022, 8:10 AM

Closed by commit rG755c84c62cda: [RISCV] Avoid changing etype for splat of 0 or -1 (authored by reames). · Explain Why

This revision was automatically updated to reflect the committed changes.

reames added a commit: rG755c84c62cda: [RISCV] Avoid changing etype for splat of 0 or -1.

craig.topper added inline comments.Jun 28 2022, 8:29 PM

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-calling-conv.ll
1571	I don't think this patch is correct. In the old code we zeroed the entire register because lmul was 1. Now we're only zeroing a quarter of the register because lmul is 1/4. The VL in bytes the comment in the code mentions is more or less LMUL.

craig.topper added inline comments.Jun 28 2022, 8:45 PM

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-calling-conv.ll
1571	Ignore that part of LMUL being VL in bytes. It's really more like LMUL is the upper bound on how much of the register can be updated. If AVL is X0 then you would need the LMUL to be the same independent of SEW. For other AVLs its more complicated.

reames added inline comments.Jun 29 2022, 10:17 AM

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-calling-conv.ll
1571	I agree, this is definitely wrong. Revert in progress now. Looking at this again, the whole logic is wrong. This depends on VLInBytes, not VLMAX. I don't know what I was thinking here.

reames added a reverting change: rGdd48d3ad0e5f: Revert "[RISCV] Avoid changing etype for splat of 0 or -1".Jun 29 2022, 10:27 AM

Fraser reported another problem with this patch to me privately. In addition to the wrong number of bits being written Craig found, we could also construct illegal instruction encodings. This could happen because we changed the VLMUL of the splat, but did not change the LMUL on the pseudo itself. As a result, the register allocator would assign e.g. an LMUL1 register, when the VSETVLI was now e.g. LMUL2. Given only have of registers are legal operands at LMUL2, this has a high chance of producing an illegal instruction encoding.

frasercrmck mentioned this in rGd5213c83ffe4: [RISCV] Add a test covering a (reverted) codegen issue.Jun 30 2022, 1:39 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVInsertVSETVLI.cpp

40 lines

test/

CodeGen/

RISCV/

rvv/

constant-folding-crash.ll

8 lines

fixed-vectors-calling-conv.ll

3 lines

fixed-vectors-extload-truncstore.ll

2 lines

fixed-vectors-fp-setcc.ll

48 lines

fixed-vectors-fp2i.ll

8 lines

fixed-vectors-unaligned.ll

6 lines

Diff 437909

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp

Show First 20 Lines • Show All 76 Lines • ▼ Show 20 Lines	static bool isScalarMoveInstr(const MachineInstr &MI) {
case RISCV::PseudoVFMV_S_F64_M1:		case RISCV::PseudoVFMV_S_F64_M1:
case RISCV::PseudoVFMV_S_F64_M2:		case RISCV::PseudoVFMV_S_F64_M2:
case RISCV::PseudoVFMV_S_F64_M4:		case RISCV::PseudoVFMV_S_F64_M4:
case RISCV::PseudoVFMV_S_F64_M8:		case RISCV::PseudoVFMV_S_F64_M8:
return true;		return true;
}		}
}		}

		static bool isSplatMoveInstr(const MachineInstr &MI) {
		switch (MI.getOpcode()) {
		default:
		return false;
		case RISCV::PseudoVMV_V_X_M1:
		case RISCV::PseudoVMV_V_X_M2:
		case RISCV::PseudoVMV_V_X_M4:
		case RISCV::PseudoVMV_V_X_M8:
		case RISCV::PseudoVMV_V_X_MF2:
		case RISCV::PseudoVMV_V_X_MF4:
		case RISCV::PseudoVMV_V_X_MF8:
		case RISCV::PseudoVMV_V_I_M1:
		case RISCV::PseudoVMV_V_I_M2:
		case RISCV::PseudoVMV_V_I_M4:
		case RISCV::PseudoVMV_V_I_M8:
		case RISCV::PseudoVMV_V_I_MF2:
		case RISCV::PseudoVMV_V_I_MF4:
		case RISCV::PseudoVMV_V_I_MF8:
		return true;
		}
		}

		static bool isSplatOfZeroOrMinusOne(const MachineInstr &MI) {
		if (!isSplatMoveInstr(MI))
		return false;

		const MachineOperand &SrcMO = MI.getOperand(1);
		if (SrcMO.isImm())
		return SrcMO.getImm() == 0 \|\| SrcMO.getImm() == -1;
		return SrcMO.isReg() && SrcMO.getReg() == RISCV::X0;
		}

/// Get the EEW for a load or store instruction. Return None if MI is not		/// Get the EEW for a load or store instruction. Return None if MI is not
/// a load or store which ignores SEW.		/// a load or store which ignores SEW.
static Optional<unsigned> getEEWForLoadStore(const MachineInstr &MI) {		static Optional<unsigned> getEEWForLoadStore(const MachineInstr &MI) {
switch (MI.getOpcode()) {		switch (MI.getOpcode()) {
default:		default:
return None;		return None;
case RISCV::PseudoVLE8_V_M1:		case RISCV::PseudoVLE8_V_M1:
case RISCV::PseudoVLE8_V_M1_MASK:		case RISCV::PseudoVLE8_V_M1_MASK:
▲ Show 20 Lines • Show All 272 Lines • ▼ Show 20 Lines	static DemandedFields getDemanded(const MachineInstr &MI) {
// They instead demand the ratio of the two which is used in computing		// They instead demand the ratio of the two which is used in computing
// EMUL, but which allows us the flexibility to change SEW and LMUL		// EMUL, but which allows us the flexibility to change SEW and LMUL
// provided we don't change the ratio.		// provided we don't change the ratio.
if (getEEWForLoadStore(MI)) {		if (getEEWForLoadStore(MI)) {
Res.SEW = false;		Res.SEW = false;
Res.LMUL = false;		Res.LMUL = false;
}		}

		// A splat of 0/-1 is always a splat of 0/-1, regardless of etype.
		// TODO: We're currently demanding VL + SEWLMULRatio which is sufficient
		// but not neccessary. What we really need is VLInBytes.
		if (isSplatOfZeroOrMinusOne(MI)) {
		Res.SEW = false;
		Res.LMUL = false;
		}

return Res;		return Res;
}		}

/// Defines the abstract state with which the forward dataflow models the		/// Defines the abstract state with which the forward dataflow models the
/// values of the VL and VTYPE registers after insertion.		/// values of the VL and VTYPE registers after insertion.
class VSETVLIInfo {		class VSETVLIInfo {
union {		union {
Register AVLReg;		Register AVLReg;
▲ Show 20 Lines • Show All 179 Lines • ▼ Show 20 Lines	bool hasCompatibleVTYPE(const MachineInstr &MI,
uint64_t TSFlags = MI.getDesc().TSFlags;		uint64_t TSFlags = MI.getDesc().TSFlags;
if (RISCVII::hasSEWOp(TSFlags) && MI.getNumExplicitDefs() == 0) {		if (RISCVII::hasSEWOp(TSFlags) && MI.getNumExplicitDefs() == 0) {
Used.TailPolicy = false;		Used.TailPolicy = false;
Used.MaskPolicy = false;		Used.MaskPolicy = false;
}		}
return areCompatibleVTYPEs(encodeVTYPE(), Require.encodeVTYPE(), Used);		return areCompatibleVTYPEs(encodeVTYPE(), Require.encodeVTYPE(), Used);
}		}

// Determine whether the vector instructions requirements represented by		// Determine whether the vector instructions requirements represented by
		craig.topperUnsubmitted Not Done Reply Inline Actions Stray blank line change? craig.topper: Stray blank line change?
// Require are compatible with the previous vsetvli instruction represented		// Require are compatible with the previous vsetvli instruction represented
// by this. MI is the instruction whose requirements we're considering.		// by this. MI is the instruction whose requirements we're considering.
bool isCompatible(const MachineInstr &MI, const VSETVLIInfo &Require) const {		bool isCompatible(const MachineInstr &MI, const VSETVLIInfo &Require) const {
assert(isValid() && Require.isValid() &&		assert(isValid() && Require.isValid() &&
"Can't compare invalid VSETVLIInfos");		"Can't compare invalid VSETVLIInfos");
assert(!Require.SEWLMULRatioOnly &&		assert(!Require.SEWLMULRatioOnly &&
"Expected a valid VTYPE for instruction!");		"Expected a valid VTYPE for instruction!");
// Nothing is compatible with Unknown.		// Nothing is compatible with Unknown.
▲ Show 20 Lines • Show All 1,036 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/constant-folding-crash.ll

	Show All 21 Lines
	; RV32-NEXT: vmv1r.v v10, v0			; RV32-NEXT: vmv1r.v v10, v0
	; RV32-NEXT: andi a0, a0, 1			; RV32-NEXT: andi a0, a0, 1
	; RV32-NEXT: seqz a0, a0			; RV32-NEXT: seqz a0, a0
	; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
	; RV32-NEXT: vmv.v.x v11, a0			; RV32-NEXT: vmv.v.x v11, a0
	; RV32-NEXT: vmsne.vi v0, v11, 0			; RV32-NEXT: vmsne.vi v0, v11, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m1, ta, mu			; RV32-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; RV32-NEXT: vmerge.vvm v8, v9, v8, v0			; RV32-NEXT: vmerge.vvm v8, v9, v8, v0
	; RV32-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; RV32-NEXT: vmv.v.i v9, 0			; RV32-NEXT: vmv.v.i v9, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; RV32-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; RV32-NEXT: vmv1r.v v0, v10			; RV32-NEXT: vmv1r.v v0, v10
	; RV32-NEXT: vmerge.vim v8, v9, 1, v0			; RV32-NEXT: vmerge.vim v8, v9, 1, v0
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: andi a1, a1, 1			; RV32-NEXT: andi a1, a1, 1
	; RV32-NEXT: vmv.v.x v8, a1			; RV32-NEXT: vmv.v.x v8, a1
	; RV32-NEXT: vmsne.vi v0, v8, 0			; RV32-NEXT: vmsne.vi v0, v8, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m1, ta, mu			; RV32-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; RV32-NEXT: vmv.v.i v8, 10			; RV32-NEXT: vmv.v.i v8, 10
	; RV32-NEXT: vse32.v v8, (a0), v0.t			; RV32-NEXT: vse32.v v8, (a0), v0.t
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: constant_folding_crash:			; RV64-LABEL: constant_folding_crash:
	; RV64: # %bb.0: # %entry			; RV64: # %bb.0: # %entry
	; RV64-NEXT: ld a0, 8(a0)			; RV64-NEXT: ld a0, 8(a0)
	; RV64-NEXT: vmv1r.v v12, v0			; RV64-NEXT: vmv1r.v v12, v0
	; RV64-NEXT: andi a0, a0, 1			; RV64-NEXT: andi a0, a0, 1
	; RV64-NEXT: seqz a0, a0			; RV64-NEXT: seqz a0, a0
	; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
	; RV64-NEXT: vmv.v.x v13, a0			; RV64-NEXT: vmv.v.x v13, a0
	; RV64-NEXT: vmsne.vi v0, v13, 0			; RV64-NEXT: vmsne.vi v0, v13, 0
	; RV64-NEXT: vsetvli zero, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli zero, zero, e64, m2, ta, mu
	; RV64-NEXT: vmerge.vvm v8, v10, v8, v0			; RV64-NEXT: vmerge.vvm v8, v10, v8, v0
	; RV64-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; RV64-NEXT: vmv.v.i v10, 0			; RV64-NEXT: vmv.v.i v10, 0
	; RV64-NEXT: vsetvli zero, zero, e64, m2, ta, mu
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; RV64-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; RV64-NEXT: vmv1r.v v0, v12			; RV64-NEXT: vmv1r.v v0, v12
	; RV64-NEXT: vmerge.vim v8, v10, 1, v0			; RV64-NEXT: vmerge.vim v8, v10, 1, v0
	; RV64-NEXT: vmv.x.s a1, v8			; RV64-NEXT: vmv.x.s a1, v8
	; RV64-NEXT: andi a1, a1, 1			; RV64-NEXT: andi a1, a1, 1
	; RV64-NEXT: vmv.v.x v8, a1			; RV64-NEXT: vmv.v.x v8, a1
	; RV64-NEXT: vmsne.vi v0, v8, 0			; RV64-NEXT: vmsne.vi v0, v8, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m1, ta, mu			; RV64-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; RV64-NEXT: vmv.v.i v8, 10			; RV64-NEXT: vmv.v.i v8, 10
	Show All 16 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-calling-conv.ll

	Show First 20 Lines • Show All 1,561 Lines • ▼ Show 20 Lines
	; LMULMAX1-LABEL: pass_vector_mask_arg_via_stack:			; LMULMAX1-LABEL: pass_vector_mask_arg_via_stack:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: addi sp, sp, -160			; LMULMAX1-NEXT: addi sp, sp, -160
	; LMULMAX1-NEXT: .cfi_def_cfa_offset 160			; LMULMAX1-NEXT: .cfi_def_cfa_offset 160
	; LMULMAX1-NEXT: sd ra, 152(sp) # 8-byte Folded Spill			; LMULMAX1-NEXT: sd ra, 152(sp) # 8-byte Folded Spill
	; LMULMAX1-NEXT: .cfi_offset ra, -8			; LMULMAX1-NEXT: .cfi_offset ra, -8
	; LMULMAX1-NEXT: li a0, 8			; LMULMAX1-NEXT: li a0, 8
	; LMULMAX1-NEXT: sd a0, 128(sp)			; LMULMAX1-NEXT: sd a0, 128(sp)
	; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v8, 0			; LMULMAX1-NEXT: vmv.v.i v8, 0
				craig.topperUnsubmitted Not Done Reply Inline Actions I don't think this patch is correct. In the old code we zeroed the entire register because lmul was 1. Now we're only zeroing a quarter of the register because lmul is 1/4. The VL in bytes the comment in the code mentions is more or less LMUL. craig.topper: I don't think this patch is correct. In the old code we zeroed the entire register because lmul…
				craig.topperUnsubmitted Not Done Reply Inline Actions Ignore that part of LMUL being VL in bytes. It's really more like LMUL is the upper bound on how much of the register can be updated. If AVL is X0 then you would need the LMUL to be the same independent of SEW. For other AVLs its more complicated. craig.topper: Ignore that part of LMUL being VL in bytes. It's really more like LMUL is the upper bound on…
				reamesAuthorUnsubmitted Done Reply Inline Actions I agree, this is definitely wrong. Revert in progress now. Looking at this again, the whole logic is wrong. This depends on VLInBytes, not VLMAX. I don't know what I was thinking here. reames: I agree, this is definitely wrong. Revert in progress now. Looking at this again, the whole…
	; LMULMAX1-NEXT: vse32.v v8, (sp)			; LMULMAX1-NEXT: vse32.v v8, (sp)
	; LMULMAX1-NEXT: addi a0, sp, 112			; LMULMAX1-NEXT: addi a0, sp, 112
	; LMULMAX1-NEXT: vse32.v v8, (a0)			; LMULMAX1-NEXT: vse32.v v8, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 96			; LMULMAX1-NEXT: addi a0, sp, 96
	; LMULMAX1-NEXT: vse32.v v8, (a0)			; LMULMAX1-NEXT: vse32.v v8, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 80			; LMULMAX1-NEXT: addi a0, sp, 80
	; LMULMAX1-NEXT: vse32.v v8, (a0)			; LMULMAX1-NEXT: vse32.v v8, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 64			; LMULMAX1-NEXT: addi a0, sp, 64
	; LMULMAX1-NEXT: vse32.v v8, (a0)			; LMULMAX1-NEXT: vse32.v v8, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 48			; LMULMAX1-NEXT: addi a0, sp, 48
	; LMULMAX1-NEXT: vse32.v v8, (a0)			; LMULMAX1-NEXT: vse32.v v8, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 32			; LMULMAX1-NEXT: addi a0, sp, 32
	; LMULMAX1-NEXT: vse32.v v8, (a0)			; LMULMAX1-NEXT: vse32.v v8, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 16			; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vse32.v v8, (a0)			; LMULMAX1-NEXT: vse32.v v8, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v9, 0			; LMULMAX1-NEXT: vmv.v.i v9, 0
	; LMULMAX1-NEXT: vmerge.vim v9, v9, 1, v0			; LMULMAX1-NEXT: vmerge.vim v9, v9, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v10, 0			; LMULMAX1-NEXT: vmv.v.i v10, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v10, v9, 0			; LMULMAX1-NEXT: vslideup.vi v10, v9, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v9, v10, 0			; LMULMAX1-NEXT: vmsne.vi v9, v10, 0
	Show All 32 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-extload-truncstore.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1			; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1
	; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=4 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX4			; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=4 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX4
	; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1			; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1
	; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=4 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX4			; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=4 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX4

	define <2 x i16> @sextload_v2i1_v2i16(<2 x i1>* %x) {			define <2 x i16> @sextload_v2i1_v2i16(<2 x i1>* %x) {
	; CHECK-LABEL: sextload_v2i1_v2i16:			; CHECK-LABEL: sextload_v2i1_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu
				craig.topperUnsubmitted Not Done Reply Inline Actions Seems like this could be e16, mf4 to avoid the later vsetvli craig.topper: Seems like this could be e16, mf4 to avoid the later vsetvli
				reamesAuthorUnsubmitted Done Reply Inline Actions We don't have any demanded rules for vlm.v, and as such, can't rewrite the vsetvli before it. I went and glanced at the spec for that instruction, and honestly, the wording is vague enough I'm not quite sure what we're allowed to do with it. reames: We don't have any demanded rules for vlm.v, and as such, can't rewrite the vsetvli before it.
	; CHECK-NEXT: vlm.v v0, (a0)			; CHECK-NEXT: vlm.v v0, (a0)
	; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, -1, v0			; CHECK-NEXT: vmerge.vim v8, v8, -1, v0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%y = load <2 x i1>, <2 x i1>* %x			%y = load <2 x i1>, <2 x i1>* %x
	%z = sext <2 x i1> %y to <2 x i16>			%z = sext <2 x i1> %y to <2 x i16>
	ret <2 x i16> %z			ret <2 x i16> %z
	}			}

	define <2 x i16> @sextload_v2i8_v2i16(<2 x i8>* %x) {			define <2 x i16> @sextload_v2i8_v2i16(<2 x i8>* %x) {
	▲ Show 20 Lines • Show All 2,141 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-setcc.ll

	Show All 35 Lines

	define void @fcmp_une_vv_v4f32(<4 x float>* %x, <4 x float>* %y, <4 x i1>* %z) {			define void @fcmp_une_vv_v4f32(<4 x float>* %x, <4 x float>* %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_une_vv_v4f32:			; CHECK-LABEL: fcmp_une_vv_v4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vle32.v v9, (a1)			; CHECK-NEXT: vle32.v v9, (a1)
	; CHECK-NEXT: vmfne.vv v0, v8, v9			; CHECK-NEXT: vmfne.vv v0, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a2)			; CHECK-NEXT: vsm.v v8, (a2)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x float>, <4 x float>* %x			%a = load <4 x float>, <4 x float>* %x
	%b = load <4 x float>, <4 x float>* %y			%b = load <4 x float>, <4 x float>* %y
	%c = fcmp une <4 x float> %a, %b			%c = fcmp une <4 x float> %a, %b
	store <4 x i1> %c, <4 x i1>* %z			store <4 x i1> %c, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_une_vv_v4f32_nonans(<4 x float>* %x, <4 x float>* %y, <4 x i1>* %z) {			define void @fcmp_une_vv_v4f32_nonans(<4 x float>* %x, <4 x float>* %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_une_vv_v4f32_nonans:			; CHECK-LABEL: fcmp_une_vv_v4f32_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vle32.v v9, (a1)			; CHECK-NEXT: vle32.v v9, (a1)
	; CHECK-NEXT: vmfne.vv v0, v8, v9			; CHECK-NEXT: vmfne.vv v0, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a2)			; CHECK-NEXT: vsm.v v8, (a2)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x float>, <4 x float>* %x			%a = load <4 x float>, <4 x float>* %x
	%b = load <4 x float>, <4 x float>* %y			%b = load <4 x float>, <4 x float>* %y
	%c = fcmp nnan une <4 x float> %a, %b			%c = fcmp nnan une <4 x float> %a, %b
	store <4 x i1> %c, <4 x i1>* %z			store <4 x i1> %c, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ogt_vv_v2f64(<2 x double>* %x, <2 x double>* %y, <2 x i1>* %z) {			define void @fcmp_ogt_vv_v2f64(<2 x double>* %x, <2 x double>* %y, <2 x i1>* %z) {
	; CHECK-LABEL: fcmp_ogt_vv_v2f64:			; CHECK-LABEL: fcmp_ogt_vv_v2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vle64.v v9, (a1)			; CHECK-NEXT: vle64.v v9, (a1)
	; CHECK-NEXT: vmflt.vv v0, v9, v8			; CHECK-NEXT: vmflt.vv v0, v9, v8
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a2)			; CHECK-NEXT: vsm.v v8, (a2)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x double>, <2 x double>* %x			%a = load <2 x double>, <2 x double>* %x
	%b = load <2 x double>, <2 x double>* %y			%b = load <2 x double>, <2 x double>* %y
	%c = fcmp ogt <2 x double> %a, %b			%c = fcmp ogt <2 x double> %a, %b
	store <2 x i1> %c, <2 x i1>* %z			store <2 x i1> %c, <2 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ogt_vv_v2f64_nonans(<2 x double>* %x, <2 x double>* %y, <2 x i1>* %z) {			define void @fcmp_ogt_vv_v2f64_nonans(<2 x double>* %x, <2 x double>* %y, <2 x i1>* %z) {
	; CHECK-LABEL: fcmp_ogt_vv_v2f64_nonans:			; CHECK-LABEL: fcmp_ogt_vv_v2f64_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vle64.v v9, (a1)			; CHECK-NEXT: vle64.v v9, (a1)
	; CHECK-NEXT: vmflt.vv v0, v9, v8			; CHECK-NEXT: vmflt.vv v0, v9, v8
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a2)			; CHECK-NEXT: vsm.v v8, (a2)
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines

	define void @fcmp_ole_vv_v4f64(<4 x double>* %x, <4 x double>* %y, <4 x i1>* %z) {			define void @fcmp_ole_vv_v4f64(<4 x double>* %x, <4 x double>* %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_ole_vv_v4f64:			; CHECK-LABEL: fcmp_ole_vv_v4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vle64.v v10, (a1)			; CHECK-NEXT: vle64.v v10, (a1)
	; CHECK-NEXT: vmfle.vv v0, v8, v10			; CHECK-NEXT: vmfle.vv v0, v8, v10
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a2)			; CHECK-NEXT: vsm.v v8, (a2)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x double>, <4 x double>* %x			%a = load <4 x double>, <4 x double>* %x
	%b = load <4 x double>, <4 x double>* %y			%b = load <4 x double>, <4 x double>* %y
	%c = fcmp ole <4 x double> %a, %b			%c = fcmp ole <4 x double> %a, %b
	store <4 x i1> %c, <4 x i1>* %z			store <4 x i1> %c, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ole_vv_v4f64_nonans(<4 x double>* %x, <4 x double>* %y, <4 x i1>* %z) {			define void @fcmp_ole_vv_v4f64_nonans(<4 x double>* %x, <4 x double>* %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_ole_vv_v4f64_nonans:			; CHECK-LABEL: fcmp_ole_vv_v4f64_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vle64.v v10, (a1)			; CHECK-NEXT: vle64.v v10, (a1)
	; CHECK-NEXT: vmfle.vv v0, v8, v10			; CHECK-NEXT: vmfle.vv v0, v8, v10
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a2)			; CHECK-NEXT: vsm.v v8, (a2)
	▲ Show 20 Lines • Show All 215 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: fcmp_ord_vv_v4f16:			; CHECK-LABEL: fcmp_ord_vv_v4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; CHECK-NEXT: vle16.v v8, (a1)			; CHECK-NEXT: vle16.v v8, (a1)
	; CHECK-NEXT: vle16.v v9, (a0)			; CHECK-NEXT: vle16.v v9, (a0)
	; CHECK-NEXT: vmfeq.vv v8, v8, v8			; CHECK-NEXT: vmfeq.vv v8, v8, v8
	; CHECK-NEXT: vmfeq.vv v9, v9, v9			; CHECK-NEXT: vmfeq.vv v9, v9, v9
	; CHECK-NEXT: vmand.mm v0, v9, v8			; CHECK-NEXT: vmand.mm v0, v9, v8
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a2)			; CHECK-NEXT: vsm.v v8, (a2)
	Show All 9 Lines
	; CHECK-LABEL: fcmp_uno_vv_v4f16:			; CHECK-LABEL: fcmp_uno_vv_v4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
	; CHECK-NEXT: vle16.v v8, (a1)			; CHECK-NEXT: vle16.v v8, (a1)
	; CHECK-NEXT: vle16.v v9, (a0)			; CHECK-NEXT: vle16.v v9, (a0)
	; CHECK-NEXT: vmfne.vv v8, v8, v8			; CHECK-NEXT: vmfne.vv v8, v8, v8
	; CHECK-NEXT: vmfne.vv v9, v9, v9			; CHECK-NEXT: vmfne.vv v9, v9, v9
	; CHECK-NEXT: vmor.mm v0, v9, v8			; CHECK-NEXT: vmor.mm v0, v9, v8
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a2)			; CHECK-NEXT: vsm.v v8, (a2)
	Show All 38 Lines
	}			}

	define void @fcmp_une_vf_v4f32(<4 x float>* %x, float %y, <4 x i1>* %z) {			define void @fcmp_une_vf_v4f32(<4 x float>* %x, float %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_une_vf_v4f32:			; CHECK-LABEL: fcmp_une_vf_v4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmfne.vf v0, v8, fa0			; CHECK-NEXT: vmfne.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x float>, <4 x float>* %x			%a = load <4 x float>, <4 x float>* %x
	%b = insertelement <4 x float> poison, float %y, i32 0			%b = insertelement <4 x float> poison, float %y, i32 0
	%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer			%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
	%d = fcmp une <4 x float> %a, %c			%d = fcmp une <4 x float> %a, %c
	store <4 x i1> %d, <4 x i1>* %z			store <4 x i1> %d, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_une_vf_v4f32_nonans(<4 x float>* %x, float %y, <4 x i1>* %z) {			define void @fcmp_une_vf_v4f32_nonans(<4 x float>* %x, float %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_une_vf_v4f32_nonans:			; CHECK-LABEL: fcmp_une_vf_v4f32_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmfne.vf v0, v8, fa0			; CHECK-NEXT: vmfne.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x float>, <4 x float>* %x			%a = load <4 x float>, <4 x float>* %x
	%b = insertelement <4 x float> poison, float %y, i32 0			%b = insertelement <4 x float> poison, float %y, i32 0
	%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer			%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
	%d = fcmp nnan une <4 x float> %a, %c			%d = fcmp nnan une <4 x float> %a, %c
	store <4 x i1> %d, <4 x i1>* %z			store <4 x i1> %d, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ogt_vf_v2f64(<2 x double>* %x, double %y, <2 x i1>* %z) {			define void @fcmp_ogt_vf_v2f64(<2 x double>* %x, double %y, <2 x i1>* %z) {
	; CHECK-LABEL: fcmp_ogt_vf_v2f64:			; CHECK-LABEL: fcmp_ogt_vf_v2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vmfgt.vf v0, v8, fa0			; CHECK-NEXT: vmfgt.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x double>, <2 x double>* %x			%a = load <2 x double>, <2 x double>* %x
	%b = insertelement <2 x double> poison, double %y, i32 0			%b = insertelement <2 x double> poison, double %y, i32 0
	%c = shufflevector <2 x double> %b, <2 x double> poison, <2 x i32> zeroinitializer			%c = shufflevector <2 x double> %b, <2 x double> poison, <2 x i32> zeroinitializer
	%d = fcmp ogt <2 x double> %a, %c			%d = fcmp ogt <2 x double> %a, %c
	store <2 x i1> %d, <2 x i1>* %z			store <2 x i1> %d, <2 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ogt_vf_v2f64_nonans(<2 x double>* %x, double %y, <2 x i1>* %z) {			define void @fcmp_ogt_vf_v2f64_nonans(<2 x double>* %x, double %y, <2 x i1>* %z) {
	; CHECK-LABEL: fcmp_ogt_vf_v2f64_nonans:			; CHECK-LABEL: fcmp_ogt_vf_v2f64_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vmfgt.vf v0, v8, fa0			; CHECK-NEXT: vmfgt.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	}			}

	define void @fcmp_ole_vf_v4f64(<4 x double>* %x, double %y, <4 x i1>* %z) {			define void @fcmp_ole_vf_v4f64(<4 x double>* %x, double %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_ole_vf_v4f64:			; CHECK-LABEL: fcmp_ole_vf_v4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vmfle.vf v0, v8, fa0			; CHECK-NEXT: vmfle.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x double>, <4 x double>* %x			%a = load <4 x double>, <4 x double>* %x
	%b = insertelement <4 x double> poison, double %y, i32 0			%b = insertelement <4 x double> poison, double %y, i32 0
	%c = shufflevector <4 x double> %b, <4 x double> poison, <4 x i32> zeroinitializer			%c = shufflevector <4 x double> %b, <4 x double> poison, <4 x i32> zeroinitializer
	%d = fcmp ole <4 x double> %a, %c			%d = fcmp ole <4 x double> %a, %c
	store <4 x i1> %d, <4 x i1>* %z			store <4 x i1> %d, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ole_vf_v4f64_nonans(<4 x double>* %x, double %y, <4 x i1>* %z) {			define void @fcmp_ole_vf_v4f64_nonans(<4 x double>* %x, double %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_ole_vf_v4f64_nonans:			; CHECK-LABEL: fcmp_ole_vf_v4f64_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vmfle.vf v0, v8, fa0			; CHECK-NEXT: vmfle.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	▲ Show 20 Lines • Show All 216 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: fcmp_ord_vf_v4f16:			; CHECK-LABEL: fcmp_ord_vf_v4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vfmv.v.f v9, fa0			; CHECK-NEXT: vfmv.v.f v9, fa0
	; CHECK-NEXT: vmfeq.vf v9, v9, fa0			; CHECK-NEXT: vmfeq.vf v9, v9, fa0
	; CHECK-NEXT: vmfeq.vv v8, v8, v8			; CHECK-NEXT: vmfeq.vv v8, v8, v8
	; CHECK-NEXT: vmand.mm v0, v8, v9			; CHECK-NEXT: vmand.mm v0, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	Show All 10 Lines
	; CHECK-LABEL: fcmp_uno_vf_v4f16:			; CHECK-LABEL: fcmp_uno_vf_v4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vfmv.v.f v9, fa0			; CHECK-NEXT: vfmv.v.f v9, fa0
	; CHECK-NEXT: vmfne.vf v9, v9, fa0			; CHECK-NEXT: vmfne.vf v9, v9, fa0
	; CHECK-NEXT: vmfne.vv v8, v8, v8			; CHECK-NEXT: vmfne.vv v8, v8, v8
	; CHECK-NEXT: vmor.mm v0, v8, v9			; CHECK-NEXT: vmor.mm v0, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	Show All 39 Lines
	}			}

	define void @fcmp_une_fv_v4f32(<4 x float>* %x, float %y, <4 x i1>* %z) {			define void @fcmp_une_fv_v4f32(<4 x float>* %x, float %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_une_fv_v4f32:			; CHECK-LABEL: fcmp_une_fv_v4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmfne.vf v0, v8, fa0			; CHECK-NEXT: vmfne.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x float>, <4 x float>* %x			%a = load <4 x float>, <4 x float>* %x
	%b = insertelement <4 x float> poison, float %y, i32 0			%b = insertelement <4 x float> poison, float %y, i32 0
	%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer			%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
	%d = fcmp une <4 x float> %c, %a			%d = fcmp une <4 x float> %c, %a
	store <4 x i1> %d, <4 x i1>* %z			store <4 x i1> %d, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_une_fv_v4f32_nonans(<4 x float>* %x, float %y, <4 x i1>* %z) {			define void @fcmp_une_fv_v4f32_nonans(<4 x float>* %x, float %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_une_fv_v4f32_nonans:			; CHECK-LABEL: fcmp_une_fv_v4f32_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmfne.vf v0, v8, fa0			; CHECK-NEXT: vmfne.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x float>, <4 x float>* %x			%a = load <4 x float>, <4 x float>* %x
	%b = insertelement <4 x float> poison, float %y, i32 0			%b = insertelement <4 x float> poison, float %y, i32 0
	%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer			%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
	%d = fcmp nnan une <4 x float> %c, %a			%d = fcmp nnan une <4 x float> %c, %a
	store <4 x i1> %d, <4 x i1>* %z			store <4 x i1> %d, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ogt_fv_v2f64(<2 x double>* %x, double %y, <2 x i1>* %z) {			define void @fcmp_ogt_fv_v2f64(<2 x double>* %x, double %y, <2 x i1>* %z) {
	; CHECK-LABEL: fcmp_ogt_fv_v2f64:			; CHECK-LABEL: fcmp_ogt_fv_v2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vmflt.vf v0, v8, fa0			; CHECK-NEXT: vmflt.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x double>, <2 x double>* %x			%a = load <2 x double>, <2 x double>* %x
	%b = insertelement <2 x double> poison, double %y, i32 0			%b = insertelement <2 x double> poison, double %y, i32 0
	%c = shufflevector <2 x double> %b, <2 x double> poison, <2 x i32> zeroinitializer			%c = shufflevector <2 x double> %b, <2 x double> poison, <2 x i32> zeroinitializer
	%d = fcmp ogt <2 x double> %c, %a			%d = fcmp ogt <2 x double> %c, %a
	store <2 x i1> %d, <2 x i1>* %z			store <2 x i1> %d, <2 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ogt_fv_v2f64_nonans(<2 x double>* %x, double %y, <2 x i1>* %z) {			define void @fcmp_ogt_fv_v2f64_nonans(<2 x double>* %x, double %y, <2 x i1>* %z) {
	; CHECK-LABEL: fcmp_ogt_fv_v2f64_nonans:			; CHECK-LABEL: fcmp_ogt_fv_v2f64_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vmflt.vf v0, v8, fa0			; CHECK-NEXT: vmflt.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	}			}

	define void @fcmp_ole_fv_v4f64(<4 x double>* %x, double %y, <4 x i1>* %z) {			define void @fcmp_ole_fv_v4f64(<4 x double>* %x, double %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_ole_fv_v4f64:			; CHECK-LABEL: fcmp_ole_fv_v4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vmfge.vf v0, v8, fa0			; CHECK-NEXT: vmfge.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <4 x double>, <4 x double>* %x			%a = load <4 x double>, <4 x double>* %x
	%b = insertelement <4 x double> poison, double %y, i32 0			%b = insertelement <4 x double> poison, double %y, i32 0
	%c = shufflevector <4 x double> %b, <4 x double> poison, <4 x i32> zeroinitializer			%c = shufflevector <4 x double> %b, <4 x double> poison, <4 x i32> zeroinitializer
	%d = fcmp ole <4 x double> %c, %a			%d = fcmp ole <4 x double> %c, %a
	store <4 x i1> %d, <4 x i1>* %z			store <4 x i1> %d, <4 x i1>* %z
	ret void			ret void
	}			}

	define void @fcmp_ole_fv_v4f64_nonans(<4 x double>* %x, double %y, <4 x i1>* %z) {			define void @fcmp_ole_fv_v4f64_nonans(<4 x double>* %x, double %y, <4 x i1>* %z) {
	; CHECK-LABEL: fcmp_ole_fv_v4f64_nonans:			; CHECK-LABEL: fcmp_ole_fv_v4f64_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vmfge.vf v0, v8, fa0			; CHECK-NEXT: vmfge.vf v0, v8, fa0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	▲ Show 20 Lines • Show All 216 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: fcmp_ord_fv_v4f16:			; CHECK-LABEL: fcmp_ord_fv_v4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vfmv.v.f v9, fa0			; CHECK-NEXT: vfmv.v.f v9, fa0
	; CHECK-NEXT: vmfeq.vf v9, v9, fa0			; CHECK-NEXT: vmfeq.vf v9, v9, fa0
	; CHECK-NEXT: vmfeq.vv v8, v8, v8			; CHECK-NEXT: vmfeq.vv v8, v8, v8
	; CHECK-NEXT: vmand.mm v0, v9, v8			; CHECK-NEXT: vmand.mm v0, v9, v8
	; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	Show All 10 Lines
	; CHECK-LABEL: fcmp_uno_fv_v4f16:			; CHECK-LABEL: fcmp_uno_fv_v4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vfmv.v.f v9, fa0			; CHECK-NEXT: vfmv.v.f v9, fa0
	; CHECK-NEXT: vmfne.vf v9, v9, fa0			; CHECK-NEXT: vmfne.vf v9, v9, fa0
	; CHECK-NEXT: vmfne.vv v8, v8, v8			; CHECK-NEXT: vmfne.vv v8, v8, v8
	; CHECK-NEXT: vmor.mm v0, v9, v8			; CHECK-NEXT: vmor.mm v0, v9, v8
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v9, v8, 0			; CHECK-NEXT: vslideup.vi v9, v8, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v8, v9, 0			; CHECK-NEXT: vmsne.vi v8, v9, 0
	; CHECK-NEXT: vsm.v v8, (a1)			; CHECK-NEXT: vsm.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x half>, <2 x half>* %x			%a = load <2 x half>, <2 x half>* %x
	%b = insertelement <2 x half> poison, half %y, i32 0			%b = insertelement <2 x half> poison, half %y, i32 0
	%c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer			%c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer
	%d = fcmp uno <2 x half> %c, %a			%d = fcmp uno <2 x half> %c, %a
	store <2 x i1> %d, <2 x i1>* %z			store <2 x i1> %d, <2 x i1>* %z
	ret void			ret void
	}			}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp2i.ll

	Show First 20 Lines • Show All 148 Lines • ▼ Show 20 Lines
	; LMULMAX1-NEXT: vmsne.vi v0, v8, 0			; LMULMAX1-NEXT: vmsne.vi v0, v8, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v8, 0			; LMULMAX1-NEXT: vmv.v.i v8, 0
	; LMULMAX1-NEXT: vmerge.vim v8, v8, 1, v0			; LMULMAX1-NEXT: vmerge.vim v8, v8, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v10, v9			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v10, v9
	; LMULMAX1-NEXT: vand.vi v9, v10, 1			; LMULMAX1-NEXT: vand.vi v9, v10, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v9, 0			; LMULMAX1-NEXT: vmsne.vi v0, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v9, 0			; LMULMAX1-NEXT: vmv.v.i v9, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v9, v9, 1, v0			; LMULMAX1-NEXT: vmerge.vim v9, v9, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v8, v9, 4			; LMULMAX1-NEXT: vslideup.vi v8, v9, 4
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v8, 0			; LMULMAX1-NEXT: vmsne.vi v0, v8, 0
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%z = fptosi <8 x float> %x to <8 x i1>			%z = fptosi <8 x float> %x to <8 x i1>
	ret <8 x i1> %z			ret <8 x i1> %z
	Show All 16 Lines
	; LMULMAX1-NEXT: vmsne.vi v0, v8, 0			; LMULMAX1-NEXT: vmsne.vi v0, v8, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v8, 0			; LMULMAX1-NEXT: vmv.v.i v8, 0
	; LMULMAX1-NEXT: vmerge.vim v8, v8, 1, v0			; LMULMAX1-NEXT: vmerge.vim v8, v8, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v10, v9			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v10, v9
	; LMULMAX1-NEXT: vand.vi v9, v10, 1			; LMULMAX1-NEXT: vand.vi v9, v10, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v9, 0			; LMULMAX1-NEXT: vmsne.vi v0, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v9, 0			; LMULMAX1-NEXT: vmv.v.i v9, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v9, v9, 1, v0			; LMULMAX1-NEXT: vmerge.vim v9, v9, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v8, v9, 4			; LMULMAX1-NEXT: vslideup.vi v8, v9, 4
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v8, 0			; LMULMAX1-NEXT: vmsne.vi v0, v8, 0
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%z = fptoui <8 x float> %x to <8 x i1>			%z = fptoui <8 x float> %x to <8 x i1>
	ret <8 x i1> %z			ret <8 x i1> %z
	▲ Show 20 Lines • Show All 358 Lines • ▼ Show 20 Lines
	; LMULMAX1-NEXT: vmsne.vi v0, v8, 0			; LMULMAX1-NEXT: vmsne.vi v0, v8, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v8, 0			; LMULMAX1-NEXT: vmv.v.i v8, 0
	; LMULMAX1-NEXT: vmerge.vim v12, v8, 1, v0			; LMULMAX1-NEXT: vmerge.vim v12, v8, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v13, v9			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v13, v9
	; LMULMAX1-NEXT: vand.vi v9, v13, 1			; LMULMAX1-NEXT: vand.vi v9, v13, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v9, 0			; LMULMAX1-NEXT: vmsne.vi v0, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v9, 0			; LMULMAX1-NEXT: vmv.v.i v9, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v13, v9, 1, v0			; LMULMAX1-NEXT: vmerge.vim v13, v9, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v12, v13, 2			; LMULMAX1-NEXT: vslideup.vi v12, v13, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v12, 0			; LMULMAX1-NEXT: vmsne.vi v0, v12, 0
	; LMULMAX1-NEXT: vmerge.vim v12, v8, 1, v0			; LMULMAX1-NEXT: vmerge.vim v12, v8, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v13, v10			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v13, v10
	Show All 38 Lines
	; LMULMAX1-NEXT: vmsne.vi v0, v8, 0			; LMULMAX1-NEXT: vmsne.vi v0, v8, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v8, 0			; LMULMAX1-NEXT: vmv.v.i v8, 0
	; LMULMAX1-NEXT: vmerge.vim v12, v8, 1, v0			; LMULMAX1-NEXT: vmerge.vim v12, v8, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v13, v9			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v13, v9
	; LMULMAX1-NEXT: vand.vi v9, v13, 1			; LMULMAX1-NEXT: vand.vi v9, v13, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v9, 0			; LMULMAX1-NEXT: vmsne.vi v0, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v9, 0			; LMULMAX1-NEXT: vmv.v.i v9, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v13, v9, 1, v0			; LMULMAX1-NEXT: vmerge.vim v13, v9, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v12, v13, 2			; LMULMAX1-NEXT: vslideup.vi v12, v13, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v12, 0			; LMULMAX1-NEXT: vmsne.vi v0, v12, 0
	; LMULMAX1-NEXT: vmerge.vim v12, v8, 1, v0			; LMULMAX1-NEXT: vmerge.vim v12, v8, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v13, v10			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v13, v10
	Show All 23 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-unaligned.ll

	Show First 20 Lines • Show All 501 Lines • ▼ Show 20 Lines
	declare <2 x i32> @llvm.masked.load.v2i32(<2 x i32>*, i32, <2 x i1>, <2 x i32>)			declare <2 x i32> @llvm.masked.load.v2i32(<2 x i32>*, i32, <2 x i1>, <2 x i32>)

	define void @masked_load_v2i32_align1(<2 x i32>* %a, <2 x i32> %m, <2 x i32>* %res_ptr) nounwind {			define void @masked_load_v2i32_align1(<2 x i32>* %a, <2 x i32> %m, <2 x i32>* %res_ptr) nounwind {
	; RV32-LABEL: masked_load_v2i32_align1:			; RV32-LABEL: masked_load_v2i32_align1:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; RV32-NEXT: vmseq.vi v0, v8, 0			; RV32-NEXT: vmseq.vi v0, v8, 0
	; RV32-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; RV32-NEXT: vmv.v.i v8, 0			; RV32-NEXT: vmv.v.i v8, 0
				; RV32-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; RV32-NEXT: vmerge.vim v8, v8, 1, v0			; RV32-NEXT: vmerge.vim v8, v8, 1, v0
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; RV32-NEXT: vmv.v.i v9, 0			; RV32-NEXT: vmv.v.i v9, 0
	; RV32-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; RV32-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; RV32-NEXT: vslideup.vi v9, v8, 0			; RV32-NEXT: vslideup.vi v9, v8, 0
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; RV32-NEXT: vmsne.vi v8, v9, 0			; RV32-NEXT: vmsne.vi v8, v9, 0
	; RV32-NEXT: addi a2, sp, 15			; RV32-NEXT: addi a2, sp, 15
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: masked_load_v2i32_align1:			; RV64-LABEL: masked_load_v2i32_align1:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16			; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; RV64-NEXT: vmseq.vi v0, v8, 0			; RV64-NEXT: vmseq.vi v0, v8, 0
	; RV64-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; RV64-NEXT: vmv.v.i v8, 0			; RV64-NEXT: vmv.v.i v8, 0
				; RV64-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; RV64-NEXT: vmerge.vim v8, v8, 1, v0			; RV64-NEXT: vmerge.vim v8, v8, 1, v0
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; RV64-NEXT: vmv.v.i v9, 0			; RV64-NEXT: vmv.v.i v9, 0
	; RV64-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; RV64-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; RV64-NEXT: vslideup.vi v9, v8, 0			; RV64-NEXT: vslideup.vi v9, v8, 0
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; RV64-NEXT: vmsne.vi v8, v9, 0			; RV64-NEXT: vmsne.vi v8, v9, 0
	; RV64-NEXT: addi a2, sp, 15			; RV64-NEXT: addi a2, sp, 15
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	declare void @llvm.masked.store.v2i32.p0v2i32(<2 x i32>, <2 x i32>*, i32, <2 x i1>)			declare void @llvm.masked.store.v2i32.p0v2i32(<2 x i32>, <2 x i32>*, i32, <2 x i1>)

	define void @masked_store_v2i32_align2(<2 x i32> %val, <2 x i32>* %a, <2 x i32> %m) nounwind {			define void @masked_store_v2i32_align2(<2 x i32> %val, <2 x i32>* %a, <2 x i32> %m) nounwind {
	; CHECK-LABEL: masked_store_v2i32_align2:			; CHECK-LABEL: masked_store_v2i32_align2:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: addi sp, sp, -16			; CHECK-NEXT: addi sp, sp, -16
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; CHECK-NEXT: vmseq.vi v0, v9, 0			; CHECK-NEXT: vmseq.vi v0, v9, 0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.v.i v9, 0			; CHECK-NEXT: vmv.v.i v9, 0
				; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vmerge.vim v9, v9, 1, v0			; CHECK-NEXT: vmerge.vim v9, v9, 1, v0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.v.i v10, 0			; CHECK-NEXT: vmv.v.i v10, 0
	; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; CHECK-NEXT: vslideup.vi v10, v9, 0			; CHECK-NEXT: vslideup.vi v10, v9, 0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmsne.vi v9, v10, 0			; CHECK-NEXT: vmsne.vi v9, v10, 0
	; CHECK-NEXT: addi a1, sp, 15			; CHECK-NEXT: addi a1, sp, 15
	Show All 31 Lines