This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/
-
CodeGen/SelectionDAG/
-
SelectionDAG/
1/8
DAGCombiner.cpp
-
Target/
-
AArch64/
2
AArch64ISelLowering.cpp
-
ARM/
-
ARMISelLowering.cpp
-
test/CodeGen/
-
CodeGen/
-
RISCV/rvv/
-
rvv/
-
fixed-vectors-extload-truncstore.ll
-
fixed-vectors-fp-conv.ll
-
fixed-vectors-fp2i.ll
-
fixed-vectors-i2fp.ll
-
mgather-sdnode.ll
-
X86/
-
merge-consecutive-loads-512.ll
-
vector-shuffle-512-v16.ll
-
x86-interleaved-access.ll

Differential D107597

[DAG] Fold concat_vectors(concat_vectors(x,y),concat_vectors(a,b)) -> concat_vectors(x,y,a,b)
ClosedPublic

Authored by RKSimon on Aug 5 2021, 1:12 PM.

Download Raw Diff

Details

Reviewers

lebedev.ri
craig.topper
dmgreen
fhahn
efriedma
spatel
pengfei

Commits

rGd6fe8d37c68d: [DAG] Fold concat_vectors(concat_vectors(x,y),concat_vectors(a,b)) ->…

Summary

Followup to D107068, attempt to fold nested concat_vectors/undefs, as long as both the vector and inner subvector types are legal.

This exposed the same issue in ARM's MVE LowerCONCAT_VECTORS_i1 (raised as PR51365) and AArch64's performConcatVectorsCombine which both assumed concat_vectors only took 2 subvector operands.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

RKSimon created this revision.Aug 5 2021, 1:12 PM

Herald added subscribers: frasercrmck, ecnelises, luismarques and 21 others. · View Herald TranscriptAug 5 2021, 1:12 PM

RKSimon requested review of this revision.Aug 5 2021, 1:12 PM

Herald added a project: Restricted Project. · View Herald TranscriptAug 5 2021, 1:12 PM

Herald added a subscriber: MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B118248: Diff 364591.Aug 5 2021, 1:45 PM

Matt added a subscriber: Matt.Aug 5 2021, 4:51 PM

Thanks. Both Arm parts look OK to me (the MVE code for concating predicate registers just needs to work, it does not need to be very efficient :) )

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
19899	Can this use ConcatOps.append?
llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
13587	Can you add a N->getNumOperands() == 2 check here, to be safe.

Seems good to me.

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
19899	You might actually want append_range from STLExtras here

RKSimon added inline comments.Aug 6 2021, 1:06 AM

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
13587	OK - by the looks of it none of the folds in this function are safe for N->getNumOperands() != 2 - but I'll leave the tests on the individual fold so this can be more easily improved in the future.

The RISC-V changes look good to me.

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
19869	What would it take to add scalable vector support? I don't think I see anything here that relies on fixed-vector knowledge. If it's lack of testing we may be able to rustle up some test cases with extra wide scalable-vectors which are split during legalization?

RKSimon added inline comments.Aug 6 2021, 4:42 AM

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
19869	I was getting crashes in the legalizer which looked tricky to deal with - but turns out it was just aarch64 sve concat_vectors lowering not handling numops != 2 - trying a fix now.

Enable scalable vectors support with a fix for AArch64 sve concat_vectors with numops != 2

Harbormaster completed remote builds in B118352: Diff 364754.Aug 6 2021, 5:40 AM

frasercrmck added inline comments.Aug 9 2021, 2:46 AM

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
19869	Thanks, seems to have improved one of our tests at least!

ping - any more comments?

lebedev.ri added inline comments.Aug 16 2021, 4:25 AM

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
19863–19864	Does `concat_vectors` pad with undef? Or should this be // --> concat_vectors(x,y,z,w,u,u,a,b,c,d)

RKSimon added inline comments.Aug 16 2021, 5:48 AM

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
19863–19864	All subvector operands of concat_vectors are the same type, so undefs are 'split' to the new type - look at "SubVT" in the code below.

All the Arm code (and the DAG combine, as far as I can tell) look good to me.

This revision is now accepted and ready to land.Aug 16 2021, 6:01 AM

LGTM

I think we may also want some variation of concat(bitcast(vty0 to vty1), bitcast(vty0 to vty1))?
combineConcatVectorOfScalars() does that, but only for non-vector source type.

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
19863–19864	Err, right, i read that wrong, sorry.

This revision was landed with ongoing or failed builds.Aug 16 2021, 8:07 AM

Closed by commit rGd6fe8d37c68d: [DAG] Fold concat_vectors(concat_vectors(x,y),concat_vectors(a,b)) ->… (authored by RKSimon). · Explain Why

This revision was automatically updated to reflect the committed changes.

RKSimon added a commit: rGd6fe8d37c68d: [DAG] Fold concat_vectors(concat_vectors(x,y),concat_vectors(a,b)) ->….

rupprecht mentioned this in rG435756206700: [NFC][AArch64] Fix unused var in release build.Aug 16 2021, 10:40 AM

Revision Contents

Path

Size

llvm/

lib/

CodeGen/

SelectionDAG/

DAGCombiner.cpp

48 lines

Target/

AArch64/

AArch64ISelLowering.cpp

29 lines

ARM/

ARMISelLowering.cpp

96 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-extload-truncstore.ll

258 lines

fixed-vectors-fp-conv.ll

28 lines

fixed-vectors-fp2i.ll

188 lines

fixed-vectors-i2fp.ll

56 lines

mgather-sdnode.ll

38 lines

X86/

merge-consecutive-loads-512.ll

20 lines

vector-shuffle-512-v16.ll

4 lines

x86-interleaved-access.ll

14 lines

Diff 366635

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 19,854 Lines • ▼ Show 20 Lines	if (AnyInteger) {
if (Op.isUndef())		if (Op.isUndef())
Op = ScalarUndef;		Op = ScalarUndef;
else		else
Op = DAG.getBitcast(SVT, Op);		Op = DAG.getBitcast(SVT, Op);
}		}
}		}
}		}

EVT VecVT = EVT::getVectorVT(*DAG.getContext(), SVT,		EVT VecVT = EVT::getVectorVT(*DAG.getContext(), SVT,
VT.getSizeInBits() / SVT.getSizeInBits());		VT.getSizeInBits() / SVT.getSizeInBits());
		lebedev.riUnsubmitted Not Done Reply Inline Actions Does `concat_vectors` pad with undef? Or should this be // --> concat_vectors(x,y,z,w,u,u,a,b,c,d) lebedev.ri: Does `concat_vectors` pad with undef? Or should this be ``` // --> concat_vectors(x,y,z,w,u,u…
		RKSimonAuthorUnsubmitted Not Done Reply Inline Actions All subvector operands of concat_vectors are the same type, so undefs are 'split' to the new type - look at "SubVT" in the code below. RKSimon: All subvector operands of concat_vectors are the same type, so undefs are 'split' to the new…
		lebedev.riUnsubmitted Done Reply Inline Actions Err, right, i read that wrong, sorry. lebedev.ri: Err, right, i read that wrong, sorry.
return DAG.getBitcast(VT, DAG.getBuildVector(VecVT, DL, Ops));		return DAG.getBitcast(VT, DAG.getBuildVector(VecVT, DL, Ops));
}		}

		// Attempt to merge nested concat_vectors/undefs.
		// Fold concat_vectors(concat_vectors(x,y,z,w),u,u,concat_vectors(a,b,c,d))
		frasercrmckUnsubmitted Not Done Reply Inline Actions What would it take to add scalable vector support? I don't think I see anything here that relies on fixed-vector knowledge. If it's lack of testing we may be able to rustle up some test cases with extra wide scalable-vectors which are split during legalization? frasercrmck: What would it take to add scalable vector support? I don't think I see anything here that…
		RKSimonAuthorUnsubmitted Not Done Reply Inline Actions I was getting crashes in the legalizer which looked tricky to deal with - but turns out it was just aarch64 sve concat_vectors lowering not handling numops != 2 - trying a fix now. RKSimon: I was getting crashes in the legalizer which looked tricky to deal with - but turns out it was…
		frasercrmckUnsubmitted Not Done Reply Inline Actions Thanks, seems to have improved one of our tests at least! frasercrmck: Thanks, seems to have improved one of our tests at least!
		// --> concat_vectors(x,y,z,w,u,u,u,u,u,u,u,u,a,b,c,d)
		static SDValue combineConcatVectorOfConcatVectors(SDNode *N,
		SelectionDAG &DAG) {
		EVT VT = N->getValueType(0);

		// Ensure we're concatenating UNDEF and CONCAT_VECTORS nodes of similar types.
		EVT SubVT;
		SDValue FirstConcat;
		for (const SDValue &Op : N->ops()) {
		if (Op.isUndef())
		continue;
		if (Op.getOpcode() != ISD::CONCAT_VECTORS)
		return SDValue();
		if (!FirstConcat) {
		SubVT = Op.getOperand(0).getValueType();
		if (!DAG.getTargetLoweringInfo().isTypeLegal(SubVT))
		return SDValue();
		FirstConcat = Op;
		continue;
		}
		if (SubVT != Op.getOperand(0).getValueType())
		return SDValue();
		}
		assert(FirstConcat && "Concat of all-undefs found");

		SmallVector<SDValue> ConcatOps;
		for (const SDValue &Op : N->ops()) {
		if (Op.isUndef()) {
		ConcatOps.append(FirstConcat->getNumOperands(), DAG.getUNDEF(SubVT));
		continue;
		dmgreenUnsubmitted Not Done Reply Inline Actions Can this use ConcatOps.append? dmgreen: Can this use ConcatOps.append?
		lebedev.riUnsubmitted Not Done Reply Inline Actions You might actually want append_range from STLExtras here lebedev.ri: You might actually want append_range from STLExtras here
		}
		ConcatOps.append(Op->op_begin(), Op->op_end());
		}
		return DAG.getNode(ISD::CONCAT_VECTORS, SDLoc(N), VT, ConcatOps);
		}

// Check to see if this is a CONCAT_VECTORS of a bunch of EXTRACT_SUBVECTOR		// Check to see if this is a CONCAT_VECTORS of a bunch of EXTRACT_SUBVECTOR
// operations. If so, and if the EXTRACT_SUBVECTOR vector inputs come from at		// operations. If so, and if the EXTRACT_SUBVECTOR vector inputs come from at
// most two distinct vectors the same size as the result, attempt to turn this		// most two distinct vectors the same size as the result, attempt to turn this
// into a legal shuffle.		// into a legal shuffle.
static SDValue combineConcatVectorOfExtracts(SDNode *N, SelectionDAG &DAG) {		static SDValue combineConcatVectorOfExtracts(SDNode *N, SelectionDAG &DAG) {
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
EVT OpVT = N->getOperand(0).getValueType();		EVT OpVT = N->getOperand(0).getValueType();

▲ Show 20 Lines • Show All 243 Lines • ▼ Show 20 Lines	if (llvm::all_of(N->ops(), IsBuildVectorOrUndef)) {
}		}

assert(VT.getVectorNumElements() == Opnds.size() &&		assert(VT.getVectorNumElements() == Opnds.size() &&
"Concat vector type mismatch");		"Concat vector type mismatch");
return DAG.getBuildVector(VT, SDLoc(N), Opnds);		return DAG.getBuildVector(VT, SDLoc(N), Opnds);
}		}

// Fold CONCAT_VECTORS of only bitcast scalars (or undef) to BUILD_VECTOR.		// Fold CONCAT_VECTORS of only bitcast scalars (or undef) to BUILD_VECTOR.
		// FIXME: Add support for concat_vectors(bitcast(vec0),bitcast(vec1),...).
if (SDValue V = combineConcatVectorOfScalars(N, DAG))		if (SDValue V = combineConcatVectorOfScalars(N, DAG))
return V;		return V;

		if (Level < AfterLegalizeVectorOps && TLI.isTypeLegal(VT)) {
		// Fold CONCAT_VECTORS of CONCAT_VECTORS (or undef) to VECTOR_SHUFFLE.
		if (SDValue V = combineConcatVectorOfConcatVectors(N, DAG))
		return V;

// Fold CONCAT_VECTORS of EXTRACT_SUBVECTOR (or undef) to VECTOR_SHUFFLE.		// Fold CONCAT_VECTORS of EXTRACT_SUBVECTOR (or undef) to VECTOR_SHUFFLE.
if (Level < AfterLegalizeVectorOps && TLI.isTypeLegal(VT))
if (SDValue V = combineConcatVectorOfExtracts(N, DAG))		if (SDValue V = combineConcatVectorOfExtracts(N, DAG))
return V;		return V;
		}

if (SDValue V = combineConcatVectorOfCasts(N, DAG))		if (SDValue V = combineConcatVectorOfCasts(N, DAG))
return V;		return V;

// Type legalization of vectors and DAG canonicalization of SHUFFLE_VECTOR		// Type legalization of vectors and DAG canonicalization of SHUFFLE_VECTOR
// nodes often generate nop CONCAT_VECTOR nodes. Scan the CONCAT_VECTOR		// nodes often generate nop CONCAT_VECTOR nodes. Scan the CONCAT_VECTOR
// operands and look for a CONCAT operations that place the incoming vectors		// operands and look for a CONCAT operations that place the incoming vectors
// at the exact same location.		// at the exact same location.
▲ Show 20 Lines • Show All 3,381 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 10,453 Lines • ▼ Show 20 Lines	SDValue AArch64TargetLowering::LowerCONCAT_VECTORS(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
if (useSVEForFixedLengthVectorVT(Op.getValueType()))		if (useSVEForFixedLengthVectorVT(Op.getValueType()))
return LowerFixedLengthConcatVectorsToSVE(Op, DAG);		return LowerFixedLengthConcatVectorsToSVE(Op, DAG);

assert(Op.getValueType().isScalableVector() &&		assert(Op.getValueType().isScalableVector() &&
isTypeLegal(Op.getValueType()) &&		isTypeLegal(Op.getValueType()) &&
"Expected legal scalable vector type!");		"Expected legal scalable vector type!");

if (isTypeLegal(Op.getOperand(0).getValueType()) && Op.getNumOperands() == 2)		if (isTypeLegal(Op.getOperand(0).getValueType())) {
		unsigned NumOperands = Op->getNumOperands();
		assert(NumOperands > 1 && isPowerOf2_32(NumOperands) &&
		"Unexpected number of operands in CONCAT_VECTORS");

		if (Op.getNumOperands() == 2)
return Op;		return Op;

		// Concat each pair of subvectors and pack into the lower half of the array.
		SmallVector<SDValue> ConcatOps(Op->op_begin(), Op->op_end());
		while (ConcatOps.size() > 1) {
		for (unsigned I = 0, E = ConcatOps.size(); I != E; I += 2) {
		SDValue V1 = ConcatOps[I];
		SDValue V2 = ConcatOps[I + 1];
		EVT SubVT = V1.getValueType();
		EVT PairVT = SubVT.getDoubleNumVectorElementsVT(*DAG.getContext());
		ConcatOps[I / 2] =
		DAG.getNode(ISD::CONCAT_VECTORS, SDLoc(Op), PairVT, V1, V2);
		}
		ConcatOps.resize(ConcatOps.size() / 2);
		}
		return ConcatOps[0];
		}

return SDValue();		return SDValue();
}		}

SDValue AArch64TargetLowering::LowerINSERT_VECTOR_ELT(SDValue Op,		SDValue AArch64TargetLowering::LowerINSERT_VECTOR_ELT(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
assert(Op.getOpcode() == ISD::INSERT_VECTOR_ELT && "Unknown opcode!");		assert(Op.getOpcode() == ISD::INSERT_VECTOR_ELT && "Unknown opcode!");

if (useSVEForFixedLengthVectorVT(Op.getValueType()))		if (useSVEForFixedLengthVectorVT(Op.getValueType()))
▲ Show 20 Lines • Show All 3,085 Lines • ▼ Show 20 Lines	if (N00VT == N10.getValueType() &&
SmallVector<int, 8> Mask(MidVT.getVectorNumElements());		SmallVector<int, 8> Mask(MidVT.getVectorNumElements());
for (size_t i = 0; i < Mask.size(); ++i)		for (size_t i = 0; i < Mask.size(); ++i)
Mask[i] = i * 2;		Mask[i] = i * 2;
return DAG.getNode(ISD::TRUNCATE, dl, VT,		return DAG.getNode(ISD::TRUNCATE, dl, VT,
DAG.getVectorShuffle(		DAG.getVectorShuffle(
MidVT, dl,		MidVT, dl,
DAG.getNode(ISD::BITCAST, dl, MidVT, N00),		DAG.getNode(ISD::BITCAST, dl, MidVT, N00),
DAG.getNode(ISD::BITCAST, dl, MidVT, N10), Mask));		DAG.getNode(ISD::BITCAST, dl, MidVT, N10), Mask));
}		}
		dmgreenUnsubmitted Not Done Reply Inline Actions Can you add a N->getNumOperands() == 2 check here, to be safe. dmgreen: Can you add a N->getNumOperands() == 2 check here, to be safe.
		RKSimonAuthorUnsubmitted Not Done Reply Inline Actions OK - by the looks of it none of the folds in this function are safe for N->getNumOperands() != 2 - but I'll leave the tests on the individual fold so this can be more easily improved in the future. RKSimon: OK - by the looks of it none of the folds in this function are safe for N->getNumOperands() !=…
}		}

// Wait 'til after everything is legalized to try this. That way we have		// Wait 'til after everything is legalized to try this. That way we have
// legal vector types and such.		// legal vector types and such.
if (DCI.isBeforeLegalizeOps())		if (DCI.isBeforeLegalizeOps())
return SDValue();		return SDValue();

// Optimise concat_vectors of two [us]rhadds or [us]hadds that use extracted		// Optimise concat_vectors of two [us]rhadds or [us]hadds that use extracted
▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	if (N00->getOpcode() == ISD::EXTRACT_SUBVECTOR &&
return DAG.getNode(N0Opc, dl, VT, N00Source, N01Source);		return DAG.getNode(N0Opc, dl, VT, N00Source, N01Source);
}		}
}		}
}		}

// If we see a (concat_vectors (v1x64 A), (v1x64 A)) it's really a vector		// If we see a (concat_vectors (v1x64 A), (v1x64 A)) it's really a vector
// splat. The indexed instructions are going to be expecting a DUPLANE64, so		// splat. The indexed instructions are going to be expecting a DUPLANE64, so
// canonicalise to that.		// canonicalise to that.
if (N0 == N1 && VT.getVectorNumElements() == 2) {		if (N->getNumOperands() == 2 && N0 == N1 && VT.getVectorNumElements() == 2) {
assert(VT.getScalarSizeInBits() == 64);		assert(VT.getScalarSizeInBits() == 64);
return DAG.getNode(AArch64ISD::DUPLANE64, dl, VT, WidenVector(N0, DAG),		return DAG.getNode(AArch64ISD::DUPLANE64, dl, VT, WidenVector(N0, DAG),
DAG.getConstant(0, dl, MVT::i64));		DAG.getConstant(0, dl, MVT::i64));
}		}

// Canonicalise concat_vectors so that the right-hand vector has as few		// Canonicalise concat_vectors so that the right-hand vector has as few
// bit-casts as possible before its real operation. The primary matching		// bit-casts as possible before its real operation. The primary matching
// destination for these operations will be the narrowing "2" instructions,		// destination for these operations will be the narrowing "2" instructions,
// which depend on the operation being performed on this right-hand vector.		// which depend on the operation being performed on this right-hand vector.
// For example,		// For example,
// (concat_vectors LHS, (v1i64 (bitconvert (v4i16 RHS))))		// (concat_vectors LHS, (v1i64 (bitconvert (v4i16 RHS))))
// becomes		// becomes
// (bitconvert (concat_vectors (v4i16 (bitconvert LHS)), RHS))		// (bitconvert (concat_vectors (v4i16 (bitconvert LHS)), RHS))

if (N1Opc != ISD::BITCAST)		if (N->getNumOperands() != 2 \|\| N1Opc != ISD::BITCAST)
return SDValue();		return SDValue();
SDValue RHS = N1->getOperand(0);		SDValue RHS = N1->getOperand(0);
MVT RHSTy = RHS.getValueType().getSimpleVT();		MVT RHSTy = RHS.getValueType().getSimpleVT();
// If the RHS is not a vector, this is not the pattern we're looking for.		// If the RHS is not a vector, this is not the pattern we're looking for.
if (!RHSTy.isVector())		if (!RHSTy.isVector())
return SDValue();		return SDValue();

LLVM_DEBUG(		LLVM_DEBUG(
▲ Show 20 Lines • Show All 5,227 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 8,818 Lines • ▼ Show 20 Lines	if (Op.getValueType() == MVT::i32 && Vec.getScalarValueSizeInBits() < 32) {
return DAG.getNode(ARMISD::VGETLANEu, dl, MVT::i32, Vec, Lane);		return DAG.getNode(ARMISD::VGETLANEu, dl, MVT::i32, Vec, Lane);
}		}

return Op;		return Op;
}		}

static SDValue LowerCONCAT_VECTORS_i1(SDValue Op, SelectionDAG &DAG,		static SDValue LowerCONCAT_VECTORS_i1(SDValue Op, SelectionDAG &DAG,
const ARMSubtarget *ST) {		const ARMSubtarget *ST) {
SDValue V1 = Op.getOperand(0);
SDValue V2 = Op.getOperand(1);
SDLoc dl(Op);		SDLoc dl(Op);
EVT VT = Op.getValueType();		assert(Op.getValueType().getScalarSizeInBits() == 1 &&
EVT Op1VT = V1.getValueType();		"Unexpected custom CONCAT_VECTORS lowering");
EVT Op2VT = V2.getValueType();		assert(isPowerOf2_32(Op.getNumOperands()) &&
unsigned NumElts = VT.getVectorNumElements();

assert(Op1VT == Op2VT && "Operand types don't match!");
assert(VT.getScalarSizeInBits() == 1 &&
"Unexpected custom CONCAT_VECTORS lowering");		"Unexpected custom CONCAT_VECTORS lowering");
assert(ST->hasMVEIntegerOps() &&		assert(ST->hasMVEIntegerOps() &&
"CONCAT_VECTORS lowering only supported for MVE");		"CONCAT_VECTORS lowering only supported for MVE");

		auto ConcatPair = [&](SDValue V1, SDValue V2) {
		EVT Op1VT = V1.getValueType();
		EVT Op2VT = V2.getValueType();
		assert(Op1VT == Op2VT && "Operand types don't match!");
		EVT VT = Op1VT.getDoubleNumVectorElementsVT(*DAG.getContext());

SDValue NewV1 = PromoteMVEPredVector(dl, V1, Op1VT, DAG);		SDValue NewV1 = PromoteMVEPredVector(dl, V1, Op1VT, DAG);
SDValue NewV2 = PromoteMVEPredVector(dl, V2, Op2VT, DAG);		SDValue NewV2 = PromoteMVEPredVector(dl, V2, Op2VT, DAG);

// We now have Op1 + Op2 promoted to vectors of integers, where v8i1 gets		// We now have Op1 + Op2 promoted to vectors of integers, where v8i1 gets
// promoted to v8i16, etc.		// promoted to v8i16, etc.
		MVT ElType =
MVT ElType = getVectorTyFromPredicateVector(VT).getScalarType().getSimpleVT();		getVectorTyFromPredicateVector(VT).getScalarType().getSimpleVT();
		unsigned NumElts = 2 * Op1VT.getVectorNumElements();

// Extract the vector elements from Op1 and Op2 one by one and truncate them		// Extract the vector elements from Op1 and Op2 one by one and truncate them
// to be the right size for the destination. For example, if Op1 is v4i1 then		// to be the right size for the destination. For example, if Op1 is v4i1
// the promoted vector is v4i32. The result of concatentation gives a v8i1,		// then the promoted vector is v4i32. The result of concatentation gives a
// which when promoted is v8i16. That means each i32 element from Op1 needs		// v8i1, which when promoted is v8i16. That means each i32 element from Op1
// truncating to i16 and inserting in the result.		// needs truncating to i16 and inserting in the result.
EVT ConcatVT = MVT::getVectorVT(ElType, NumElts);		EVT ConcatVT = MVT::getVectorVT(ElType, NumElts);
SDValue ConVec = DAG.getNode(ISD::UNDEF, dl, ConcatVT);		SDValue ConVec = DAG.getNode(ISD::UNDEF, dl, ConcatVT);
auto ExractInto = [&DAG, &dl](SDValue NewV, SDValue ConVec, unsigned &j) {		auto ExtractInto = [&DAG, &dl](SDValue NewV, SDValue ConVec, unsigned &j) {
EVT NewVT = NewV.getValueType();		EVT NewVT = NewV.getValueType();
EVT ConcatVT = ConVec.getValueType();		EVT ConcatVT = ConVec.getValueType();
for (unsigned i = 0, e = NewVT.getVectorNumElements(); i < e; i++, j++) {		for (unsigned i = 0, e = NewVT.getVectorNumElements(); i < e; i++, j++) {
SDValue Elt = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, MVT::i32, NewV,		SDValue Elt = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, MVT::i32, NewV,
DAG.getIntPtrConstant(i, dl));		DAG.getIntPtrConstant(i, dl));
ConVec = DAG.getNode(ISD::INSERT_VECTOR_ELT, dl, ConcatVT, ConVec, Elt,		ConVec = DAG.getNode(ISD::INSERT_VECTOR_ELT, dl, ConcatVT, ConVec, Elt,
DAG.getConstant(j, dl, MVT::i32));		DAG.getConstant(j, dl, MVT::i32));
}		}
return ConVec;		return ConVec;
};		};
unsigned j = 0;		unsigned j = 0;
ConVec = ExractInto(NewV1, ConVec, j);		ConVec = ExtractInto(NewV1, ConVec, j);
ConVec = ExractInto(NewV2, ConVec, j);		ConVec = ExtractInto(NewV2, ConVec, j);

// Now return the result of comparing the subvector with zero,		// Now return the result of comparing the subvector with zero,
// which will generate a real predicate, i.e. v4i1, v8i1 or v16i1.		// which will generate a real predicate, i.e. v4i1, v8i1 or v16i1.
return DAG.getNode(ARMISD::VCMPZ, dl, VT, ConVec,		return DAG.getNode(ARMISD::VCMPZ, dl, VT, ConVec,
DAG.getConstant(ARMCC::NE, dl, MVT::i32));		DAG.getConstant(ARMCC::NE, dl, MVT::i32));
		};

		// Concat each pair of subvectors and pack into the lower half of the array.
		SmallVector<SDValue> ConcatOps(Op->op_begin(), Op->op_end());
		while (ConcatOps.size() > 1) {
		for (unsigned I = 0, E = ConcatOps.size(); I != E; I += 2) {
		SDValue V1 = ConcatOps[I];
		SDValue V2 = ConcatOps[I + 1];
		ConcatOps[I / 2] = ConcatPair(V1, V2);
		}
		ConcatOps.resize(ConcatOps.size() / 2);
		}
		return ConcatOps[0];
}		}

static SDValue LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG,		static SDValue LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG,
const ARMSubtarget *ST) {		const ARMSubtarget *ST) {
EVT VT = Op->getValueType(0);		EVT VT = Op->getValueType(0);
if (ST->hasMVEIntegerOps() && VT.getScalarSizeInBits() == 1)		if (ST->hasMVEIntegerOps() && VT.getScalarSizeInBits() == 1)
return LowerCONCAT_VECTORS_i1(Op, DAG, ST);		return LowerCONCAT_VECTORS_i1(Op, DAG, ST);

▲ Show 20 Lines • Show All 12,122 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-extload-truncstore.ll

	Show First 20 Lines • Show All 1,284 Lines • ▼ Show 20 Lines

	define void @truncstore_v16i32_v16i8(<16 x i32> %x, <16 x i8>* %z) {			define void @truncstore_v16i32_v16i8(<16 x i32> %x, <16 x i8>* %z) {
	; LMULMAX1-LABEL: truncstore_v16i32_v16i8:			; LMULMAX1-LABEL: truncstore_v16i32_v16i8:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v26, 0			; LMULMAX1-NEXT: vmv.v.i v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, m1, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v27, v26			; LMULMAX1-NEXT: vslideup.vi v26, v25, 0
	; LMULMAX1-NEXT: vslideup.vi v27, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v9, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v25, 4
	; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v27, 0			; LMULMAX1-NEXT: vslideup.vi v26, v25, 4
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v10, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v10, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 12, e8, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v27, 0			; LMULMAX1-NEXT: vslideup.vi v26, v25, 8
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v11, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v11, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v27, 4
	; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v26, 8			; LMULMAX1-NEXT: vslideup.vi v26, v25, 12
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, m1, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, m1, ta, mu
	; LMULMAX1-NEXT: vse8.v v25, (a0)			; LMULMAX1-NEXT: vse8.v v26, (a0)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	;			;
	; LMULMAX4-LABEL: truncstore_v16i32_v16i8:			; LMULMAX4-LABEL: truncstore_v16i32_v16i8:
	; LMULMAX4: # %bb.0:			; LMULMAX4: # %bb.0:
	; LMULMAX4-NEXT: vsetivli zero, 16, e16, m2, ta, mu			; LMULMAX4-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v26, v8, 0			; LMULMAX4-NEXT: vnsrl.wi v26, v8, 0
	; LMULMAX4-NEXT: vsetvli zero, zero, e8, m1, ta, mu			; LMULMAX4-NEXT: vsetvli zero, zero, e8, m1, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v25, v26, 0			; LMULMAX4-NEXT: vnsrl.wi v25, v26, 0
	▲ Show 20 Lines • Show All 287 Lines • ▼ Show 20 Lines
	; LMULMAX1-LABEL: truncstore_v8i64_v8i8:			; LMULMAX1-LABEL: truncstore_v8i64_v8i8:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v26, 0			; LMULMAX1-NEXT: vmv.v.i v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v27, v26			; LMULMAX1-NEXT: vslideup.vi v26, v25, 0
	; LMULMAX1-NEXT: vslideup.vi v27, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v9, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v27, 0			; LMULMAX1-NEXT: vslideup.vi v26, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v10, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v10, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v27, 0			; LMULMAX1-NEXT: vslideup.vi v26, v25, 4
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v11, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v11, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v27, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v26, 4			; LMULMAX1-NEXT: vslideup.vi v26, v25, 6
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vse8.v v25, (a0)			; LMULMAX1-NEXT: vse8.v v26, (a0)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	;			;
	; LMULMAX4-LABEL: truncstore_v8i64_v8i8:			; LMULMAX4-LABEL: truncstore_v8i64_v8i8:
	; LMULMAX4: # %bb.0:			; LMULMAX4: # %bb.0:
	; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v26, v8, 0			; LMULMAX4-NEXT: vnsrl.wi v26, v8, 0
	; LMULMAX4-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX4-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v25, v26, 0			; LMULMAX4-NEXT: vnsrl.wi v25, v26, 0
	; LMULMAX4-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX4-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX4-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX4-NEXT: vse8.v v25, (a0)			; LMULMAX4-NEXT: vse8.v v25, (a0)
	; LMULMAX4-NEXT: ret			; LMULMAX4-NEXT: ret
	%y = trunc <8 x i64> %x to <8 x i8>			%y = trunc <8 x i64> %x to <8 x i8>
	store <8 x i8> %y, <8 x i8>* %z			store <8 x i8> %y, <8 x i8>* %z
	ret void			ret void
	}			}

	define void @truncstore_v8i64_v8i16(<8 x i64> %x, <8 x i16>* %z) {			define void @truncstore_v8i64_v8i16(<8 x i64> %x, <8 x i16>* %z) {
	; LMULMAX1-LABEL: truncstore_v8i64_v8i16:			; LMULMAX1-LABEL: truncstore_v8i64_v8i16:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v26, 0			; LMULMAX1-NEXT: vmv.v.i v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e16, m1, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v27, v26			; LMULMAX1-NEXT: vslideup.vi v26, v25, 0
	; LMULMAX1-NEXT: vslideup.vi v27, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v9, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v27, 0			; LMULMAX1-NEXT: vslideup.vi v26, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v10, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v10, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v27, 0			; LMULMAX1-NEXT: vslideup.vi v26, v25, 4
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v11, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v11, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v27, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v26, 4			; LMULMAX1-NEXT: vslideup.vi v26, v25, 6
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-NEXT: vse16.v v25, (a0)			; LMULMAX1-NEXT: vse16.v v26, (a0)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	;			;
	; LMULMAX4-LABEL: truncstore_v8i64_v8i16:			; LMULMAX4-LABEL: truncstore_v8i64_v8i16:
	; LMULMAX4: # %bb.0:			; LMULMAX4: # %bb.0:
	; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v26, v8, 0			; LMULMAX4-NEXT: vnsrl.wi v26, v8, 0
	; LMULMAX4-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX4-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v25, v26, 0			; LMULMAX4-NEXT: vnsrl.wi v25, v26, 0
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; LMULMAX1-LABEL: truncstore_v16i64_v16i8:			; LMULMAX1-LABEL: truncstore_v16i64_v16i8:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v25, 0			; LMULMAX1-NEXT: vmv.v.i v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e8, m1, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v27, v25			; LMULMAX1-NEXT: vslideup.vi v25, v26, 0
	; LMULMAX1-NEXT: vslideup.vi v27, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v9, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v26, 2			; LMULMAX1-NEXT: vslideup.vi v25, v26, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v28, v26
	; LMULMAX1-NEXT: vslideup.vi v28, v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v10, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v10, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e8, m1, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v29, v25			; LMULMAX1-NEXT: vslideup.vi v25, v26, 4
	; LMULMAX1-NEXT: vslideup.vi v29, v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v11, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v11, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v29, v27, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v28, v29, 4
	; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v28, 0			; LMULMAX1-NEXT: vslideup.vi v25, v26, 6
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v12, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v12, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 10, e8, m1, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v29, v25			; LMULMAX1-NEXT: vslideup.vi v25, v26, 8
	; LMULMAX1-NEXT: vslideup.vi v29, v28, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v13, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v13, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 12, e8, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v29, v28, 2			; LMULMAX1-NEXT: vslideup.vi v25, v26, 10
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v29, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v14, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v14, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 14, e8, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v28, 0			; LMULMAX1-NEXT: vslideup.vi v25, v26, 12
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v15, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v15, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v28, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v25, 4
	; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v26, 8			; LMULMAX1-NEXT: vslideup.vi v25, v26, 14
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, m1, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, m1, ta, mu
	; LMULMAX1-NEXT: vse8.v v27, (a0)			; LMULMAX1-NEXT: vse8.v v25, (a0)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	;			;
	; LMULMAX4-LABEL: truncstore_v16i64_v16i8:			; LMULMAX4-LABEL: truncstore_v16i64_v16i8:
	; LMULMAX4: # %bb.0:			; LMULMAX4: # %bb.0:
	; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v26, v8, 0			; LMULMAX4-NEXT: vnsrl.wi v26, v8, 0
	; LMULMAX4-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX4-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX4-NEXT: vnsrl.wi v25, v26, 0			; LMULMAX4-NEXT: vnsrl.wi v25, v26, 0
	Show All 20 Lines
	}			}

	define void @truncstore_v16i64_v16i16(<16 x i64> %x, <16 x i16>* %z) {			define void @truncstore_v16i64_v16i16(<16 x i64> %x, <16 x i16>* %z) {
	; LMULMAX1-LABEL: truncstore_v16i64_v16i16:			; LMULMAX1-LABEL: truncstore_v16i64_v16i16:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v8, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v28, v25
	; LMULMAX1-NEXT: vslideup.vi v28, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v28, v26, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v26, 0			; LMULMAX1-NEXT: vmv.v.i v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e16, m1, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v27, v26			; LMULMAX1-NEXT: vmv1r.v v27, v26
	; LMULMAX1-NEXT: vslideup.vi v27, v28, 0			; LMULMAX1-NEXT: vslideup.vi v27, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v10, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v9, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v29, v25			; LMULMAX1-NEXT: vslideup.vi v27, v25, 2
	; LMULMAX1-NEXT: vslideup.vi v29, v28, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v11, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v10, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v29, v28, 2			; LMULMAX1-NEXT: vslideup.vi v27, v25, 4
				; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-NEXT: vnsrl.wi v25, v11, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
				; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v29, 4			; LMULMAX1-NEXT: vslideup.vi v27, v25, 6
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v12, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v12, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e16, m1, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v29, v25			; LMULMAX1-NEXT: vslideup.vi v26, v25, 0
	; LMULMAX1-NEXT: vslideup.vi v29, v28, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v13, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v13, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v29, v28, 2
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v29, 0			; LMULMAX1-NEXT: vslideup.vi v26, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v14, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v14, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v28, 0			; LMULMAX1-NEXT: vslideup.vi v26, v25, 4
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v15, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v15, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v28, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v25, v28, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v25, 4			; LMULMAX1-NEXT: vslideup.vi v26, v25, 6
	; LMULMAX1-NEXT: addi a1, a0, 16			; LMULMAX1-NEXT: addi a1, a0, 16
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-NEXT: vse16.v v26, (a1)			; LMULMAX1-NEXT: vse16.v v26, (a1)
	; LMULMAX1-NEXT: vse16.v v27, (a0)			; LMULMAX1-NEXT: vse16.v v27, (a0)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	;			;
	; LMULMAX4-LABEL: truncstore_v16i64_v16i16:			; LMULMAX4-LABEL: truncstore_v16i64_v16i16:
	; LMULMAX4: # %bb.0:			; LMULMAX4: # %bb.0:
	▲ Show 20 Lines • Show All 404 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-conv.ll

	Show First 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	; LMULMAX8-NEXT: vfncvt.rod.f.f.w v26, v28			; LMULMAX8-NEXT: vfncvt.rod.f.f.w v26, v28
	; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX8-NEXT: vfncvt.f.f.w v25, v26			; LMULMAX8-NEXT: vfncvt.f.f.w v25, v26
	; LMULMAX8-NEXT: vse16.v v25, (a1)			; LMULMAX8-NEXT: vse16.v v25, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fpround_v8f64_v8f16:			; LMULMAX1-LABEL: fpround_v8f64_v8f16:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: addi sp, sp, -48			; LMULMAX1-NEXT: addi sp, sp, -32
	; LMULMAX1-NEXT: .cfi_def_cfa_offset 48			; LMULMAX1-NEXT: .cfi_def_cfa_offset 32
	; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-NEXT: vle64.v v25, (a0)			; LMULMAX1-NEXT: vle64.v v25, (a0)
	; LMULMAX1-NEXT: addi a2, a0, 32			; LMULMAX1-NEXT: addi a2, a0, 16
	; LMULMAX1-NEXT: vle64.v v26, (a2)			; LMULMAX1-NEXT: vle64.v v26, (a2)
	; LMULMAX1-NEXT: addi a2, a0, 48			; LMULMAX1-NEXT: addi a2, a0, 48
	; LMULMAX1-NEXT: vle64.v v27, (a2)			; LMULMAX1-NEXT: vle64.v v27, (a2)
	; LMULMAX1-NEXT: addi a0, a0, 16			; LMULMAX1-NEXT: addi a0, a0, 32
	; LMULMAX1-NEXT: vle64.v v28, (a0)			; LMULMAX1-NEXT: vle64.v v28, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rod.f.f.w v29, v27			; LMULMAX1-NEXT: vfncvt.rod.f.f.w v29, v27
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v27, v29			; LMULMAX1-NEXT: vfncvt.f.f.w v27, v29
	; LMULMAX1-NEXT: addi a0, sp, 28			; LMULMAX1-NEXT: addi a0, sp, 28
	; LMULMAX1-NEXT: vse16.v v27, (a0)			; LMULMAX1-NEXT: vse16.v v27, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rod.f.f.w v27, v28			; LMULMAX1-NEXT: vfncvt.rod.f.f.w v27, v28
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v28, v27			; LMULMAX1-NEXT: vfncvt.f.f.w v28, v27
	; LMULMAX1-NEXT: addi a0, sp, 20			; LMULMAX1-NEXT: addi a0, sp, 24
	; LMULMAX1-NEXT: vse16.v v28, (a0)			; LMULMAX1-NEXT: vse16.v v28, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rod.f.f.w v27, v26			; LMULMAX1-NEXT: vfncvt.rod.f.f.w v27, v26
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v26, v27			; LMULMAX1-NEXT: vfncvt.f.f.w v26, v27
	; LMULMAX1-NEXT: addi a0, sp, 24			; LMULMAX1-NEXT: addi a0, sp, 20
	; LMULMAX1-NEXT: vse16.v v26, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 24
	; LMULMAX1-NEXT: vle16.v v26, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 40
	; LMULMAX1-NEXT: vse16.v v26, (a0)			; LMULMAX1-NEXT: vse16.v v26, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rod.f.f.w v26, v25			; LMULMAX1-NEXT: vfncvt.rod.f.f.w v26, v25
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v25, v26			; LMULMAX1-NEXT: vfncvt.f.f.w v25, v26
	; LMULMAX1-NEXT: addi a0, sp, 16			; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vse16.v v25, (a0)			; LMULMAX1-NEXT: vse16.v v25, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vle16.v v25, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 32
	; LMULMAX1-NEXT: vse16.v v25, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 32			; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vle16.v v25, (a0)			; LMULMAX1-NEXT: vle16.v v25, (a0)
	; LMULMAX1-NEXT: vse16.v v25, (a1)			; LMULMAX1-NEXT: vse16.v v25, (a1)
	; LMULMAX1-NEXT: addi sp, sp, 48			; LMULMAX1-NEXT: addi sp, sp, 32
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x double>, <8 x double>* %x			%a = load <8 x double>, <8 x double>* %x
	%d = fptrunc <8 x double> %a to <8 x half>			%d = fptrunc <8 x double> %a to <8 x half>
	store <8 x half> %d, <8 x half>* %y			store <8 x half> %d, <8 x half>* %y
	ret void			ret void
	}			}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp2i.ll

	Show First 20 Lines • Show All 442 Lines • ▼ Show 20 Lines
	; LMULMAX1-NEXT: addi a0, a0, 16			; LMULMAX1-NEXT: addi a0, a0, 16
	; LMULMAX1-NEXT: vle64.v v28, (a0)			; LMULMAX1-NEXT: vle64.v v28, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v29, v27			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v29, v27
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v29, 0			; LMULMAX1-NEXT: vnsrl.wi v27, v29, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v29, 0			; LMULMAX1-NEXT: vmv.v.i v29, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v30, v29			; LMULMAX1-NEXT: vslideup.vi v29, v27, 0
	; LMULMAX1-NEXT: vslideup.vi v30, v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v27, v28			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v27, v28
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v30, v27, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v30, 0			; LMULMAX1-NEXT: vslideup.vi v29, v27, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v28, v26			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v27, v26
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v27, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v29, v26, 0			; LMULMAX1-NEXT: vslideup.vi v29, v26, 4
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v26, v25			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v26, v25
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v26, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v29, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v29, 4			; LMULMAX1-NEXT: vslideup.vi v29, v25, 6
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vse8.v v27, (a1)			; LMULMAX1-NEXT: vse8.v v29, (a1)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x double>, <8 x double>* %x			%a = load <8 x double>, <8 x double>* %x
	%d = fptosi <8 x double> %a to <8 x i8>			%d = fptosi <8 x double> %a to <8 x i8>
	store <8 x i8> %d, <8 x i8>* %y			store <8 x i8> %d, <8 x i8>* %y
	ret void			ret void
	}			}

	define void @fp2ui_v8f64_v8i8(<8 x double>* %x, <8 x i8>* %y) {			define void @fp2ui_v8f64_v8i8(<8 x double>* %x, <8 x i8>* %y) {
	Show All 21 Lines
	; LMULMAX1-NEXT: addi a0, a0, 16			; LMULMAX1-NEXT: addi a0, a0, 16
	; LMULMAX1-NEXT: vle64.v v28, (a0)			; LMULMAX1-NEXT: vle64.v v28, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v29, v27			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v29, v27
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v29, 0			; LMULMAX1-NEXT: vnsrl.wi v27, v29, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v29, 0			; LMULMAX1-NEXT: vmv.v.i v29, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v30, v29			; LMULMAX1-NEXT: vslideup.vi v29, v27, 0
	; LMULMAX1-NEXT: vslideup.vi v30, v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v27, v28			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v27, v28
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0			; LMULMAX1-NEXT: vnsrl.wi v27, v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v30, v27, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v27, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v30, 0			; LMULMAX1-NEXT: vslideup.vi v29, v27, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v28, v26			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v27, v26
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v28, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v27, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0			; LMULMAX1-NEXT: vnsrl.wi v26, v26, 0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v29, v26, 0			; LMULMAX1-NEXT: vslideup.vi v29, v26, 4
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v26, v25			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v26, v25
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v26, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v26, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0			; LMULMAX1-NEXT: vnsrl.wi v25, v25, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v29, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v27, v29, 4			; LMULMAX1-NEXT: vslideup.vi v29, v25, 6
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vse8.v v27, (a1)			; LMULMAX1-NEXT: vse8.v v29, (a1)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x double>, <8 x double>* %x			%a = load <8 x double>, <8 x double>* %x
	%d = fptoui <8 x double> %a to <8 x i8>			%d = fptoui <8 x double> %a to <8 x i8>
	store <8 x i8> %d, <8 x i8>* %y			store <8 x i8> %d, <8 x i8>* %y
	ret void			ret void
	}			}

	define <8 x i1> @fp2si_v8f64_v8i1(<8 x double> %x) {			define <8 x i1> @fp2si_v8f64_v8i1(<8 x double> %x) {
	; LMULMAX8-LABEL: fp2si_v8f64_v8i1:			; LMULMAX8-LABEL: fp2si_v8f64_v8i1:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX8-NEXT: vfncvt.rtz.x.f.w v26, v8			; LMULMAX8-NEXT: vfncvt.rtz.x.f.w v26, v8
	; LMULMAX8-NEXT: vand.vi v26, v26, 1			; LMULMAX8-NEXT: vand.vi v26, v26, 1
	; LMULMAX8-NEXT: vmsne.vi v0, v26, 0			; LMULMAX8-NEXT: vmsne.vi v0, v26, 0
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fp2si_v8f64_v8i1:			; LMULMAX1-LABEL: fp2si_v8f64_v8i1:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v25, 0			; LMULMAX1-NEXT: vmv.v.i v25, 0
	; LMULMAX1-NEXT: vmclr.m v0			; LMULMAX1-NEXT: vmclr.m v0
	; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0			; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v27, v8			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v27, v8
	; LMULMAX1-NEXT: vand.vi v27, v27, 1			; LMULMAX1-NEXT: vand.vi v27, v27, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v27, 0			; LMULMAX1-NEXT: vmsne.vi v0, v27, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v27, 0			; LMULMAX1-NEXT: vmv.v.i v27, 0
	; LMULMAX1-NEXT: vmerge.vim v28, v27, 1, v0			; LMULMAX1-NEXT: vmerge.vim v28, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v29, v26			; LMULMAX1-NEXT: vslideup.vi v26, v28, 0
	; LMULMAX1-NEXT: vslideup.vi v29, v28, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v29, 0
	; LMULMAX1-NEXT: vmerge.vim v28, v25, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v29, v9
	; LMULMAX1-NEXT: vand.vi v29, v29, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v29, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v29, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v28, v29, 2
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v28, 0
	; LMULMAX1-NEXT: vmerge.vim v28, v25, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v29, 0			; LMULMAX1-NEXT: vmsne.vi v0, v26, 0
	; LMULMAX1-NEXT: vmclr.m v0			; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0
	; LMULMAX1-NEXT: vmerge.vim v30, v29, 1, v0			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v28, v9
				; LMULMAX1-NEXT: vand.vi v28, v28, 1
				; LMULMAX1-NEXT: vmsne.vi v0, v28, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
				; LMULMAX1-NEXT: vmerge.vim v28, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v30, v28, 0			; LMULMAX1-NEXT: vslideup.vi v26, v28, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v30, 0
	; LMULMAX1-NEXT: vmerge.vim v28, v29, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v29, v10
	; LMULMAX1-NEXT: vand.vi v29, v29, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v29, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v29, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v29, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v26, 0			; LMULMAX1-NEXT: vmsne.vi v0, v26, 0
	; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0			; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v29, v11			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v28, v10
	; LMULMAX1-NEXT: vand.vi v29, v29, 1			; LMULMAX1-NEXT: vand.vi v28, v28, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v29, 0			; LMULMAX1-NEXT: vmsne.vi v0, v28, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v27, v27, 1, v0			; LMULMAX1-NEXT: vmerge.vim v28, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v27, 2			; LMULMAX1-NEXT: vslideup.vi v26, v28, 4
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v26, 0			; LMULMAX1-NEXT: vmsne.vi v0, v26, 0
	; LMULMAX1-NEXT: vmerge.vim v25, v25, 1, v0			; LMULMAX1-NEXT: vmerge.vim v25, v25, 1, v0
				; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v26, v11
				; LMULMAX1-NEXT: vand.vi v26, v26, 1
				; LMULMAX1-NEXT: vmsne.vi v0, v26, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
				; LMULMAX1-NEXT: vmerge.vim v26, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v28, v25, 4			; LMULMAX1-NEXT: vslideup.vi v25, v26, 6
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v28, 0			; LMULMAX1-NEXT: vmsne.vi v0, v25, 0
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%z = fptosi <8 x double> %x to <8 x i1>			%z = fptosi <8 x double> %x to <8 x i1>
	ret <8 x i1> %z			ret <8 x i1> %z
	}			}

	define <8 x i1> @fp2ui_v8f64_v8i1(<8 x double> %x) {			define <8 x i1> @fp2ui_v8f64_v8i1(<8 x double> %x) {
	; LMULMAX8-LABEL: fp2ui_v8f64_v8i1:			; LMULMAX8-LABEL: fp2ui_v8f64_v8i1:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX8-NEXT: vfncvt.rtz.xu.f.w v26, v8			; LMULMAX8-NEXT: vfncvt.rtz.xu.f.w v26, v8
	; LMULMAX8-NEXT: vand.vi v26, v26, 1			; LMULMAX8-NEXT: vand.vi v26, v26, 1
	; LMULMAX8-NEXT: vmsne.vi v0, v26, 0			; LMULMAX8-NEXT: vmsne.vi v0, v26, 0
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fp2ui_v8f64_v8i1:			; LMULMAX1-LABEL: fp2ui_v8f64_v8i1:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v25, 0			; LMULMAX1-NEXT: vmv.v.i v25, 0
	; LMULMAX1-NEXT: vmclr.m v0			; LMULMAX1-NEXT: vmclr.m v0
	; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0			; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v27, v8			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v27, v8
	; LMULMAX1-NEXT: vand.vi v27, v27, 1			; LMULMAX1-NEXT: vand.vi v27, v27, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v27, 0			; LMULMAX1-NEXT: vmsne.vi v0, v27, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v27, 0			; LMULMAX1-NEXT: vmv.v.i v27, 0
	; LMULMAX1-NEXT: vmerge.vim v28, v27, 1, v0			; LMULMAX1-NEXT: vmerge.vim v28, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vmv1r.v v29, v26			; LMULMAX1-NEXT: vslideup.vi v26, v28, 0
	; LMULMAX1-NEXT: vslideup.vi v29, v28, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v29, 0
	; LMULMAX1-NEXT: vmerge.vim v28, v25, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v29, v9
	; LMULMAX1-NEXT: vand.vi v29, v29, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v29, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v29, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v28, v29, 2
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v28, 0
	; LMULMAX1-NEXT: vmerge.vim v28, v25, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmv.v.i v29, 0			; LMULMAX1-NEXT: vmsne.vi v0, v26, 0
	; LMULMAX1-NEXT: vmclr.m v0			; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0
	; LMULMAX1-NEXT: vmerge.vim v30, v29, 1, v0			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v28, v9
				; LMULMAX1-NEXT: vand.vi v28, v28, 1
				; LMULMAX1-NEXT: vmsne.vi v0, v28, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
				; LMULMAX1-NEXT: vmerge.vim v28, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v30, v28, 0			; LMULMAX1-NEXT: vslideup.vi v26, v28, 2
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v30, 0
	; LMULMAX1-NEXT: vmerge.vim v28, v29, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v29, v10
	; LMULMAX1-NEXT: vand.vi v29, v29, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v29, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v29, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v29, 0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v26, 0			; LMULMAX1-NEXT: vmsne.vi v0, v26, 0
	; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0			; LMULMAX1-NEXT: vmerge.vim v26, v25, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v29, v11			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v28, v10
	; LMULMAX1-NEXT: vand.vi v29, v29, 1			; LMULMAX1-NEXT: vand.vi v28, v28, 1
	; LMULMAX1-NEXT: vmsne.vi v0, v29, 0			; LMULMAX1-NEXT: vmsne.vi v0, v28, 0
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vmerge.vim v27, v27, 1, v0			; LMULMAX1-NEXT: vmerge.vim v28, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v26, v27, 2			; LMULMAX1-NEXT: vslideup.vi v26, v28, 4
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v26, 0			; LMULMAX1-NEXT: vmsne.vi v0, v26, 0
	; LMULMAX1-NEXT: vmerge.vim v25, v25, 1, v0			; LMULMAX1-NEXT: vmerge.vim v25, v25, 1, v0
				; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v26, v11
				; LMULMAX1-NEXT: vand.vi v26, v26, 1
				; LMULMAX1-NEXT: vmsne.vi v0, v26, 0
				; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
				; LMULMAX1-NEXT: vmerge.vim v26, v27, 1, v0
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v28, v25, 4			; LMULMAX1-NEXT: vslideup.vi v25, v26, 6
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-NEXT: vmsne.vi v0, v28, 0			; LMULMAX1-NEXT: vmsne.vi v0, v25, 0
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%z = fptoui <8 x double> %x to <8 x i1>			%z = fptoui <8 x double> %x to <8 x i1>
	ret <8 x i1> %z			ret <8 x i1> %z
	}			}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-i2fp.ll

	Show First 20 Lines • Show All 460 Lines • ▼ Show 20 Lines
	; LMULMAX8-NEXT: vfncvt.f.x.w v26, v28			; LMULMAX8-NEXT: vfncvt.f.x.w v26, v28
	; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX8-NEXT: vfncvt.f.f.w v25, v26			; LMULMAX8-NEXT: vfncvt.f.f.w v25, v26
	; LMULMAX8-NEXT: vse16.v v25, (a1)			; LMULMAX8-NEXT: vse16.v v25, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: si2fp_v8i64_v8f16:			; LMULMAX1-LABEL: si2fp_v8i64_v8f16:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: addi sp, sp, -48			; LMULMAX1-NEXT: addi sp, sp, -32
	; LMULMAX1-NEXT: .cfi_def_cfa_offset 48			; LMULMAX1-NEXT: .cfi_def_cfa_offset 32
	; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-NEXT: vle64.v v25, (a0)			; LMULMAX1-NEXT: vle64.v v25, (a0)
	; LMULMAX1-NEXT: addi a2, a0, 32			; LMULMAX1-NEXT: addi a2, a0, 16
	; LMULMAX1-NEXT: vle64.v v26, (a2)			; LMULMAX1-NEXT: vle64.v v26, (a2)
	; LMULMAX1-NEXT: addi a2, a0, 48			; LMULMAX1-NEXT: addi a2, a0, 48
	; LMULMAX1-NEXT: vle64.v v27, (a2)			; LMULMAX1-NEXT: vle64.v v27, (a2)
	; LMULMAX1-NEXT: addi a0, a0, 16			; LMULMAX1-NEXT: addi a0, a0, 32
	; LMULMAX1-NEXT: vle64.v v28, (a0)			; LMULMAX1-NEXT: vle64.v v28, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.x.w v29, v27			; LMULMAX1-NEXT: vfncvt.f.x.w v29, v27
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v27, v29			; LMULMAX1-NEXT: vfncvt.f.f.w v27, v29
	; LMULMAX1-NEXT: addi a0, sp, 28			; LMULMAX1-NEXT: addi a0, sp, 28
	; LMULMAX1-NEXT: vse16.v v27, (a0)			; LMULMAX1-NEXT: vse16.v v27, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.x.w v27, v28			; LMULMAX1-NEXT: vfncvt.f.x.w v27, v28
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v28, v27			; LMULMAX1-NEXT: vfncvt.f.f.w v28, v27
	; LMULMAX1-NEXT: addi a0, sp, 20			; LMULMAX1-NEXT: addi a0, sp, 24
	; LMULMAX1-NEXT: vse16.v v28, (a0)			; LMULMAX1-NEXT: vse16.v v28, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.x.w v27, v26			; LMULMAX1-NEXT: vfncvt.f.x.w v27, v26
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v26, v27			; LMULMAX1-NEXT: vfncvt.f.f.w v26, v27
	; LMULMAX1-NEXT: addi a0, sp, 24			; LMULMAX1-NEXT: addi a0, sp, 20
	; LMULMAX1-NEXT: vse16.v v26, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 24
	; LMULMAX1-NEXT: vle16.v v26, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 40
	; LMULMAX1-NEXT: vse16.v v26, (a0)			; LMULMAX1-NEXT: vse16.v v26, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.x.w v26, v25			; LMULMAX1-NEXT: vfncvt.f.x.w v26, v25
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v25, v26			; LMULMAX1-NEXT: vfncvt.f.f.w v25, v26
	; LMULMAX1-NEXT: addi a0, sp, 16			; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vse16.v v25, (a0)			; LMULMAX1-NEXT: vse16.v v25, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vle16.v v25, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 32
	; LMULMAX1-NEXT: vse16.v v25, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 32			; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vle16.v v25, (a0)			; LMULMAX1-NEXT: vle16.v v25, (a0)
	; LMULMAX1-NEXT: vse16.v v25, (a1)			; LMULMAX1-NEXT: vse16.v v25, (a1)
	; LMULMAX1-NEXT: addi sp, sp, 48			; LMULMAX1-NEXT: addi sp, sp, 32
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x i64>, <8 x i64>* %x			%a = load <8 x i64>, <8 x i64>* %x
	%d = sitofp <8 x i64> %a to <8 x half>			%d = sitofp <8 x i64> %a to <8 x half>
	store <8 x half> %d, <8 x half>* %y			store <8 x half> %d, <8 x half>* %y
	ret void			ret void
	}			}

	define void @ui2fp_v8i64_v8f16(<8 x i64>* %x, <8 x half>* %y) {			define void @ui2fp_v8i64_v8f16(<8 x i64>* %x, <8 x half>* %y) {
	; LMULMAX8-LABEL: ui2fp_v8i64_v8f16:			; LMULMAX8-LABEL: ui2fp_v8i64_v8f16:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu
	; LMULMAX8-NEXT: vle64.v v28, (a0)			; LMULMAX8-NEXT: vle64.v v28, (a0)
	; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX8-NEXT: vfncvt.f.xu.w v26, v28			; LMULMAX8-NEXT: vfncvt.f.xu.w v26, v28
	; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX8-NEXT: vfncvt.f.f.w v25, v26			; LMULMAX8-NEXT: vfncvt.f.f.w v25, v26
	; LMULMAX8-NEXT: vse16.v v25, (a1)			; LMULMAX8-NEXT: vse16.v v25, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: ui2fp_v8i64_v8f16:			; LMULMAX1-LABEL: ui2fp_v8i64_v8f16:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: addi sp, sp, -48			; LMULMAX1-NEXT: addi sp, sp, -32
	; LMULMAX1-NEXT: .cfi_def_cfa_offset 48			; LMULMAX1-NEXT: .cfi_def_cfa_offset 32
	; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-NEXT: vle64.v v25, (a0)			; LMULMAX1-NEXT: vle64.v v25, (a0)
	; LMULMAX1-NEXT: addi a2, a0, 32			; LMULMAX1-NEXT: addi a2, a0, 16
	; LMULMAX1-NEXT: vle64.v v26, (a2)			; LMULMAX1-NEXT: vle64.v v26, (a2)
	; LMULMAX1-NEXT: addi a2, a0, 48			; LMULMAX1-NEXT: addi a2, a0, 48
	; LMULMAX1-NEXT: vle64.v v27, (a2)			; LMULMAX1-NEXT: vle64.v v27, (a2)
	; LMULMAX1-NEXT: addi a0, a0, 16			; LMULMAX1-NEXT: addi a0, a0, 32
	; LMULMAX1-NEXT: vle64.v v28, (a0)			; LMULMAX1-NEXT: vle64.v v28, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.xu.w v29, v27			; LMULMAX1-NEXT: vfncvt.f.xu.w v29, v27
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v27, v29			; LMULMAX1-NEXT: vfncvt.f.f.w v27, v29
	; LMULMAX1-NEXT: addi a0, sp, 28			; LMULMAX1-NEXT: addi a0, sp, 28
	; LMULMAX1-NEXT: vse16.v v27, (a0)			; LMULMAX1-NEXT: vse16.v v27, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.xu.w v27, v28			; LMULMAX1-NEXT: vfncvt.f.xu.w v27, v28
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v28, v27			; LMULMAX1-NEXT: vfncvt.f.f.w v28, v27
	; LMULMAX1-NEXT: addi a0, sp, 20			; LMULMAX1-NEXT: addi a0, sp, 24
	; LMULMAX1-NEXT: vse16.v v28, (a0)			; LMULMAX1-NEXT: vse16.v v28, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.xu.w v27, v26			; LMULMAX1-NEXT: vfncvt.f.xu.w v27, v26
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v26, v27			; LMULMAX1-NEXT: vfncvt.f.f.w v26, v27
	; LMULMAX1-NEXT: addi a0, sp, 24			; LMULMAX1-NEXT: addi a0, sp, 20
	; LMULMAX1-NEXT: vse16.v v26, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 24
	; LMULMAX1-NEXT: vle16.v v26, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 40
	; LMULMAX1-NEXT: vse16.v v26, (a0)			; LMULMAX1-NEXT: vse16.v v26, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.xu.w v26, v25			; LMULMAX1-NEXT: vfncvt.f.xu.w v26, v25
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfncvt.f.f.w v25, v26			; LMULMAX1-NEXT: vfncvt.f.f.w v25, v26
	; LMULMAX1-NEXT: addi a0, sp, 16			; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vse16.v v25, (a0)			; LMULMAX1-NEXT: vse16.v v25, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vle16.v v25, (a0)
	; LMULMAX1-NEXT: addi a0, sp, 32
	; LMULMAX1-NEXT: vse16.v v25, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-NEXT: addi a0, sp, 32			; LMULMAX1-NEXT: addi a0, sp, 16
	; LMULMAX1-NEXT: vle16.v v25, (a0)			; LMULMAX1-NEXT: vle16.v v25, (a0)
	; LMULMAX1-NEXT: vse16.v v25, (a1)			; LMULMAX1-NEXT: vse16.v v25, (a1)
	; LMULMAX1-NEXT: addi sp, sp, 48			; LMULMAX1-NEXT: addi sp, sp, 32
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x i64>, <8 x i64>* %x			%a = load <8 x i64>, <8 x i64>* %x
	%d = uitofp <8 x i64> %a to <8 x half>			%d = uitofp <8 x i64> %a to <8 x half>
	store <8 x half> %d, <8 x half>* %y			store <8 x half> %d, <8 x half>* %y
	ret void			ret void
	}			}

	define <8 x half> @si2fp_v8i1_v8f16(<8 x i1> %x) {			define <8 x half> @si2fp_v8i1_v8f16(<8 x i1> %x) {
	Show All 22 Lines

llvm/test/CodeGen/RISCV/rvv/mgather-sdnode.ll

	Show First 20 Lines • Show All 2,261 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsetvli zero, zero, e8, m2, tu, mu			; RV32-NEXT: vsetvli zero, zero, e8, m2, tu, mu
	; RV32-NEXT: vluxei32.v v14, (a0), v16, v0.t			; RV32-NEXT: vluxei32.v v14, (a0), v16, v0.t
	; RV32-NEXT: vmv4r.v v8, v12			; RV32-NEXT: vmv4r.v v8, v12
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mgather_baseidx_nxv32i8:			; RV64-LABEL: mgather_baseidx_nxv32i8:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vmv1r.v v25, v0			; RV64-NEXT: vmv1r.v v25, v0
				; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsetvli zero, zero, e8, m1, tu, mu
				; RV64-NEXT: vluxei64.v v12, (a0), v16, v0.t
	; RV64-NEXT: csrr a1, vlenb			; RV64-NEXT: csrr a1, vlenb
	; RV64-NEXT: srli a2, a1, 2			; RV64-NEXT: srli a2, a1, 3
	; RV64-NEXT: vsetvli a3, zero, e8, mf2, ta, mu			; RV64-NEXT: vsetvli a3, zero, e8, mf4, ta, mu
	; RV64-NEXT: vslidedown.vx v26, v0, a2			; RV64-NEXT: vslidedown.vx v0, v0, a2
	; RV64-NEXT: srli a1, a1, 3			; RV64-NEXT: vsetvli a3, zero, e64, m8, ta, mu
	; RV64-NEXT: vsetvli a2, zero, e8, mf4, ta, mu			; RV64-NEXT: vsext.vf8 v16, v9
	; RV64-NEXT: vslidedown.vx v0, v26, a1
	; RV64-NEXT: vsetvli a2, zero, e64, m8, ta, mu
	; RV64-NEXT: vsext.vf8 v16, v11
	; RV64-NEXT: vsetvli zero, zero, e8, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e8, m1, tu, mu
	; RV64-NEXT: vluxei64.v v15, (a0), v16, v0.t			; RV64-NEXT: vluxei64.v v13, (a0), v16, v0.t
	; RV64-NEXT: vsetvli zero, zero, e64, m8, ta, mu			; RV64-NEXT: srli a1, a1, 2
				; RV64-NEXT: vsetvli a3, zero, e8, mf2, ta, mu
				; RV64-NEXT: vslidedown.vx v0, v25, a1
				; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vsext.vf8 v16, v10			; RV64-NEXT: vsext.vf8 v16, v10
	; RV64-NEXT: vsetvli zero, zero, e8, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e8, m1, tu, mu
	; RV64-NEXT: vmv1r.v v0, v26
	; RV64-NEXT: vluxei64.v v14, (a0), v16, v0.t			; RV64-NEXT: vluxei64.v v14, (a0), v16, v0.t
	; RV64-NEXT: vsetvli zero, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e8, mf4, ta, mu
	; RV64-NEXT: vsext.vf8 v16, v8			; RV64-NEXT: vslidedown.vx v0, v0, a2
	; RV64-NEXT: vsetvli zero, zero, e8, m1, tu, mu
	; RV64-NEXT: vmv1r.v v0, v25
	; RV64-NEXT: vluxei64.v v12, (a0), v16, v0.t
	; RV64-NEXT: vsetvli a2, zero, e8, mf4, ta, mu
	; RV64-NEXT: vslidedown.vx v0, v25, a1
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vsext.vf8 v16, v9			; RV64-NEXT: vsext.vf8 v16, v11
	; RV64-NEXT: vsetvli zero, zero, e8, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e8, m1, tu, mu
	; RV64-NEXT: vluxei64.v v13, (a0), v16, v0.t			; RV64-NEXT: vluxei64.v v15, (a0), v16, v0.t
	; RV64-NEXT: vmv4r.v v8, v12			; RV64-NEXT: vmv4r.v v8, v12
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%ptrs = getelementptr inbounds i8, i8* %base, <vscale x 32 x i8> %idxs			%ptrs = getelementptr inbounds i8, i8* %base, <vscale x 32 x i8> %idxs
	%v = call <vscale x 32 x i8> @llvm.masked.gather.nxv32i8.nxv32p0i8(<vscale x 32 x i8*> %ptrs, i32 2, <vscale x 32 x i1> %m, <vscale x 32 x i8> %passthru)			%v = call <vscale x 32 x i8> @llvm.masked.gather.nxv32i8.nxv32p0i8(<vscale x 32 x i8*> %ptrs, i32 2, <vscale x 32 x i1> %m, <vscale x 32 x i8> %passthru)
	ret <vscale x 32 x i8> %v			ret <vscale x 32 x i8> %v
	}			}

llvm/test/CodeGen/X86/merge-consecutive-loads-512.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=ALL			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=ALL
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx512f,+avx512bw \| FileCheck %s --check-prefix=ALL			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx512f,+avx512bw \| FileCheck %s --check-prefix=ALL
	;			;
	; Just one 32-bit run to make sure we do reasonable things.			; Just one 32-bit run to make sure we do reasonable things.
	; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=X86-AVX512F			; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=X86-AVX512F

	define <8 x double> @merge_8f64_2f64_12u4(<2 x double>* %ptr) nounwind uwtable noinline ssp {			define <8 x double> @merge_8f64_2f64_12u4(<2 x double>* %ptr) nounwind uwtable noinline ssp {
	; ALL-LABEL: merge_8f64_2f64_12u4:			; ALL-LABEL: merge_8f64_2f64_12u4:
	; ALL: # %bb.0:			; ALL: # %bb.0:
	; ALL-NEXT: vmovups 16(%rdi), %ymm0			; ALL-NEXT: vmovups 16(%rdi), %zmm0
	; ALL-NEXT: vinsertf128 $1, 64(%rdi), %ymm0, %ymm1
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	;			;
	; X86-AVX512F-LABEL: merge_8f64_2f64_12u4:			; X86-AVX512F-LABEL: merge_8f64_2f64_12u4:
	; X86-AVX512F: # %bb.0:			; X86-AVX512F: # %bb.0:
	; X86-AVX512F-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-AVX512F-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-AVX512F-NEXT: vmovups 16(%eax), %ymm0			; X86-AVX512F-NEXT: vmovups 16(%eax), %zmm0
	; X86-AVX512F-NEXT: vinsertf128 $1, 64(%eax), %ymm0, %ymm1
	; X86-AVX512F-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; X86-AVX512F-NEXT: retl			; X86-AVX512F-NEXT: retl
	%ptr0 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 1			%ptr0 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 1
	%ptr1 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 2			%ptr1 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 2
	%ptr3 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 4			%ptr3 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 4
	%val0 = load <2 x double>, <2 x double>* %ptr0			%val0 = load <2 x double>, <2 x double>* %ptr0
	%val1 = load <2 x double>, <2 x double>* %ptr1			%val1 = load <2 x double>, <2 x double>* %ptr1
	%val3 = load <2 x double>, <2 x double>* %ptr3			%val3 = load <2 x double>, <2 x double>* %ptr3
	%res01 = shufflevector <2 x double> %val0, <2 x double> %val1, <4 x i32> <i32 0, i32 1, i32 2, i32 3>			%res01 = shufflevector <2 x double> %val0, <2 x double> %val1, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
	%res23 = shufflevector <2 x double> undef, <2 x double> %val3, <4 x i32> <i32 0, i32 1, i32 2, i32 3>			%res23 = shufflevector <2 x double> undef, <2 x double> %val3, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
	%res = shufflevector <4 x double> %res01, <4 x double> %res23, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>			%res = shufflevector <4 x double> %res01, <4 x double> %res23, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <8 x double> %res			ret <8 x double> %res
	}			}

	define <8 x double> @merge_8f64_2f64_23z5(<2 x double>* %ptr) nounwind uwtable noinline ssp {			define <8 x double> @merge_8f64_2f64_23z5(<2 x double>* %ptr) nounwind uwtable noinline ssp {
	; ALL-LABEL: merge_8f64_2f64_23z5:			; ALL-LABEL: merge_8f64_2f64_23z5:
	; ALL: # %bb.0:			; ALL: # %bb.0:
	; ALL-NEXT: vmovups 32(%rdi), %ymm0			; ALL-NEXT: vmovdqu64 32(%rdi), %zmm0
	; ALL-NEXT: vxorps %xmm1, %xmm1, %xmm1			; ALL-NEXT: vpandq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %zmm0, %zmm0
	; ALL-NEXT: vinsertf128 $1, 80(%rdi), %ymm1, %ymm1
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	;			;
	; X86-AVX512F-LABEL: merge_8f64_2f64_23z5:			; X86-AVX512F-LABEL: merge_8f64_2f64_23z5:
	; X86-AVX512F: # %bb.0:			; X86-AVX512F: # %bb.0:
	; X86-AVX512F-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-AVX512F-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-AVX512F-NEXT: vmovups 32(%eax), %ymm0			; X86-AVX512F-NEXT: vmovdqu64 32(%eax), %zmm0
	; X86-AVX512F-NEXT: vxorps %xmm1, %xmm1, %xmm1			; X86-AVX512F-NEXT: vpandq {{\.?LCPI[0-9]+_[0-9]+}}, %zmm0, %zmm0
	; X86-AVX512F-NEXT: vinsertf128 $1, 80(%eax), %ymm1, %ymm1
	; X86-AVX512F-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; X86-AVX512F-NEXT: retl			; X86-AVX512F-NEXT: retl
	%ptr0 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 2			%ptr0 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 2
	%ptr1 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 3			%ptr1 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 3
	%ptr3 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 5			%ptr3 = getelementptr inbounds <2 x double>, <2 x double>* %ptr, i64 5
	%val0 = load <2 x double>, <2 x double>* %ptr0			%val0 = load <2 x double>, <2 x double>* %ptr0
	%val1 = load <2 x double>, <2 x double>* %ptr1			%val1 = load <2 x double>, <2 x double>* %ptr1
	%val3 = load <2 x double>, <2 x double>* %ptr3			%val3 = load <2 x double>, <2 x double>* %ptr3
	%res01 = shufflevector <2 x double> %val0, <2 x double> %val1, <4 x i32> <i32 0, i32 1, i32 2, i32 3>			%res01 = shufflevector <2 x double> %val0, <2 x double> %val1, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
	▲ Show 20 Lines • Show All 608 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shuffle-512-v16.ll

Show First 20 Lines • Show All 569 Lines • ▼ Show 20 Lines	; ALL-NEXT: retq
%sub1234 = shufflevector <8 x float> %sub12, <8 x float> %sub34, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>		%sub1234 = shufflevector <8 x float> %sub12, <8 x float> %sub34, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
%res = shufflevector <16 x float> %base, <16 x float> %sub1234, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 20, i32 21, i32 22, i32 23>		%res = shufflevector <16 x float> %base, <16 x float> %sub1234, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 20, i32 21, i32 22, i32 23>
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @insert_sub2_4(<16 x float> %base, <4 x float> %sub1, <4 x float> %sub2, <4 x float> %sub3, <4 x float> %sub4) {		define <16 x float> @insert_sub2_4(<16 x float> %base, <4 x float> %sub1, <4 x float> %sub2, <4 x float> %sub3, <4 x float> %sub4) {
; ALL-LABEL: insert_sub2_4:		; ALL-LABEL: insert_sub2_4:
; ALL: # %bb.0:		; ALL: # %bb.0:
; ALL-NEXT: vinsertf32x4 $2, %xmm3, %zmm0, %zmm1		; ALL-NEXT: vinsertf32x4 $1, %xmm3, %zmm0, %zmm0
; ALL-NEXT: vmovapd {{.*#+}} zmm2 = [0,1,12,13,4,5,6,7]
; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
; ALL-NEXT: retq		; ALL-NEXT: retq
%sub12 = shufflevector <4 x float> %sub1, <4 x float> %sub2, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%sub12 = shufflevector <4 x float> %sub1, <4 x float> %sub2, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%sub34 = shufflevector <4 x float> %sub3, <4 x float> %sub4, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%sub34 = shufflevector <4 x float> %sub3, <4 x float> %sub4, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%sub1234 = shufflevector <8 x float> %sub12, <8 x float> %sub34, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>		%sub1234 = shufflevector <8 x float> %sub12, <8 x float> %sub34, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
%res = shufflevector <16 x float> %base, <16 x float> %sub1234, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 24, i32 25, i32 26, i32 27, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>		%res = shufflevector <16 x float> %base, <16 x float> %sub1234, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 24, i32 25, i32 26, i32 27, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
ret <16 x float> %res		ret <16 x float> %res
}		}

▲ Show 20 Lines • Show All 311 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/x86-interleaved-access.ll

	Show First 20 Lines • Show All 363 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: vpunpcklbw {{.*#+}} xmm4 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]			; AVX512-NEXT: vpunpcklbw {{.*#+}} xmm4 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
	; AVX512-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15]			; AVX512-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15]
	; AVX512-NEXT: vpunpcklbw {{.*#+}} xmm1 = xmm2[0],xmm3[0],xmm2[1],xmm3[1],xmm2[2],xmm3[2],xmm2[3],xmm3[3],xmm2[4],xmm3[4],xmm2[5],xmm3[5],xmm2[6],xmm3[6],xmm2[7],xmm3[7]			; AVX512-NEXT: vpunpcklbw {{.*#+}} xmm1 = xmm2[0],xmm3[0],xmm2[1],xmm3[1],xmm2[2],xmm3[2],xmm2[3],xmm3[3],xmm2[4],xmm3[4],xmm2[5],xmm3[5],xmm2[6],xmm3[6],xmm2[7],xmm3[7]
	; AVX512-NEXT: vpunpckhbw {{.*#+}} xmm2 = xmm2[8],xmm3[8],xmm2[9],xmm3[9],xmm2[10],xmm3[10],xmm2[11],xmm3[11],xmm2[12],xmm3[12],xmm2[13],xmm3[13],xmm2[14],xmm3[14],xmm2[15],xmm3[15]			; AVX512-NEXT: vpunpckhbw {{.*#+}} xmm2 = xmm2[8],xmm3[8],xmm2[9],xmm3[9],xmm2[10],xmm3[10],xmm2[11],xmm3[11],xmm2[12],xmm3[12],xmm2[13],xmm3[13],xmm2[14],xmm3[14],xmm2[15],xmm3[15]
	; AVX512-NEXT: vpunpcklwd {{.*#+}} xmm3 = xmm4[0],xmm1[0],xmm4[1],xmm1[1],xmm4[2],xmm1[2],xmm4[3],xmm1[3]			; AVX512-NEXT: vpunpcklwd {{.*#+}} xmm3 = xmm4[0],xmm1[0],xmm4[1],xmm1[1],xmm4[2],xmm1[2],xmm4[3],xmm1[3]
	; AVX512-NEXT: vpunpckhwd {{.*#+}} xmm1 = xmm4[4],xmm1[4],xmm4[5],xmm1[5],xmm4[6],xmm1[6],xmm4[7],xmm1[7]			; AVX512-NEXT: vpunpckhwd {{.*#+}} xmm1 = xmm4[4],xmm1[4],xmm4[5],xmm1[5],xmm4[6],xmm1[6],xmm4[7],xmm1[7]
	; AVX512-NEXT: vpunpcklwd {{.*#+}} xmm4 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3]			; AVX512-NEXT: vpunpcklwd {{.*#+}} xmm4 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3]
	; AVX512-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]			; AVX512-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
	; AVX512-NEXT: vinserti128 $1, %xmm1, %ymm3, %ymm1
	; AVX512-NEXT: vinserti128 $1, %xmm0, %ymm4, %ymm0			; AVX512-NEXT: vinserti128 $1, %xmm0, %ymm4, %ymm0
				; AVX512-NEXT: vinserti128 $1, %xmm1, %ymm3, %ymm1
	; AVX512-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; AVX512-NEXT: vmovdqa64 %zmm0, (%rdi)			; AVX512-NEXT: vmovdqa64 %zmm0, (%rdi)
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%v1 = shufflevector <16 x i8> %x1, <16 x i8> %x2, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%v1 = shufflevector <16 x i8> %x1, <16 x i8> %x2, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%v2 = shufflevector <16 x i8> %x3, <16 x i8> %x4, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%v2 = shufflevector <16 x i8> %x3, <16 x i8> %x4, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%interleaved.vec = shufflevector <32 x i8> %v1, <32 x i8> %v2, <64 x i32> <i32 0,i32 16,i32 32,i32 48,i32 1,i32 17,i32 33,i32 49,i32 2,i32 18,i32 34,i32 50,i32 3,i32 19,i32 35,i32 51,i32 4,i32 20,i32 36,i32 52,i32 5,i32 21,i32 37,i32 53,i32 6,i32 22,i32 38,i32 54,i32 7,i32 23,i32 39,i32 55,i32 8,i32 24,i32 40,i32 56,i32 9,i32 25,i32 41,i32 57,i32 10,i32 26,i32 42,i32 58,i32 11,i32 27,i32 43,i32 59,i32 12,i32 28,i32 44,i32 60,i32 13,i32 29,i32 45,i32 61,i32 14,i32 30,i32 46,i32 62,i32 15,i32 31,i32 47,i32 63>			%interleaved.vec = shufflevector <32 x i8> %v1, <32 x i8> %v2, <64 x i32> <i32 0,i32 16,i32 32,i32 48,i32 1,i32 17,i32 33,i32 49,i32 2,i32 18,i32 34,i32 50,i32 3,i32 19,i32 35,i32 51,i32 4,i32 20,i32 36,i32 52,i32 5,i32 21,i32 37,i32 53,i32 6,i32 22,i32 38,i32 54,i32 7,i32 23,i32 39,i32 55,i32 8,i32 24,i32 40,i32 56,i32 9,i32 25,i32 41,i32 57,i32 10,i32 26,i32 42,i32 58,i32 11,i32 27,i32 43,i32 59,i32 12,i32 28,i32 44,i32 60,i32 13,i32 29,i32 45,i32 61,i32 14,i32 30,i32 46,i32 62,i32 15,i32 31,i32 47,i32 63>
	store <64 x i8> %interleaved.vec, <64 x i8>* %p			store <64 x i8> %interleaved.vec, <64 x i8>* %p
	▲ Show 20 Lines • Show All 1,080 Lines • ▼ Show 20 Lines
	; AVX512-LABEL: interleaved_load_vf64_i8_stride3:			; AVX512-LABEL: interleaved_load_vf64_i8_stride3:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vmovdqu (%rdi), %xmm0			; AVX512-NEXT: vmovdqu (%rdi), %xmm0
	; AVX512-NEXT: vmovdqu 16(%rdi), %xmm1			; AVX512-NEXT: vmovdqu 16(%rdi), %xmm1
	; AVX512-NEXT: vmovdqu 32(%rdi), %xmm2			; AVX512-NEXT: vmovdqu 32(%rdi), %xmm2
	; AVX512-NEXT: vmovdqu 96(%rdi), %xmm3			; AVX512-NEXT: vmovdqu 96(%rdi), %xmm3
	; AVX512-NEXT: vmovdqu 112(%rdi), %xmm4			; AVX512-NEXT: vmovdqu 112(%rdi), %xmm4
	; AVX512-NEXT: vmovdqu 128(%rdi), %xmm5			; AVX512-NEXT: vmovdqu 128(%rdi), %xmm5
				; AVX512-NEXT: vinserti128 $1, 144(%rdi), %ymm3, %ymm3
	; AVX512-NEXT: vinserti128 $1, 48(%rdi), %ymm0, %ymm0			; AVX512-NEXT: vinserti128 $1, 48(%rdi), %ymm0, %ymm0
				; AVX512-NEXT: vinserti64x4 $1, %ymm3, %zmm0, %zmm0
				; AVX512-NEXT: vinserti128 $1, 160(%rdi), %ymm4, %ymm3
	; AVX512-NEXT: vinserti128 $1, 64(%rdi), %ymm1, %ymm1			; AVX512-NEXT: vinserti128 $1, 64(%rdi), %ymm1, %ymm1
				; AVX512-NEXT: vinserti64x4 $1, %ymm3, %zmm1, %zmm1
				; AVX512-NEXT: vinserti128 $1, 176(%rdi), %ymm5, %ymm3
	; AVX512-NEXT: vinserti128 $1, 80(%rdi), %ymm2, %ymm2			; AVX512-NEXT: vinserti128 $1, 80(%rdi), %ymm2, %ymm2
	; AVX512-NEXT: vinserti128 $1, 144(%rdi), %ymm3, %ymm3			; AVX512-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512-NEXT: vinserti128 $1, 160(%rdi), %ymm4, %ymm4
	; AVX512-NEXT: vinserti128 $1, 176(%rdi), %ymm5, %ymm5
	; AVX512-NEXT: vinserti64x4 $1, %ymm3, %zmm0, %zmm0
	; AVX512-NEXT: vinserti64x4 $1, %ymm4, %zmm1, %zmm1
	; AVX512-NEXT: vinserti64x4 $1, %ymm5, %zmm2, %zmm2
	; AVX512-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,3,6,9,12,15,2,5,8,11,14,1,4,7,10,13,0,3,6,9,12,15,2,5,8,11,14,1,4,7,10,13,0,3,6,9,12,15,2,5,8,11,14,1,4,7,10,13,0,3,6,9,12,15,2,5,8,11,14,1,4,7,10,13]			; AVX512-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,3,6,9,12,15,2,5,8,11,14,1,4,7,10,13,0,3,6,9,12,15,2,5,8,11,14,1,4,7,10,13,0,3,6,9,12,15,2,5,8,11,14,1,4,7,10,13,0,3,6,9,12,15,2,5,8,11,14,1,4,7,10,13]
	; AVX512-NEXT: vpshufb %zmm3, %zmm0, %zmm0			; AVX512-NEXT: vpshufb %zmm3, %zmm0, %zmm0
	; AVX512-NEXT: vpshufb %zmm3, %zmm1, %zmm1			; AVX512-NEXT: vpshufb %zmm3, %zmm1, %zmm1
	; AVX512-NEXT: vpshufb %zmm3, %zmm2, %zmm2			; AVX512-NEXT: vpshufb %zmm3, %zmm2, %zmm2
	; AVX512-NEXT: vpalignr {{.*#+}} zmm3 = zmm2[11,12,13,14,15],zmm0[0,1,2,3,4,5,6,7,8,9,10],zmm2[27,28,29,30,31],zmm0[16,17,18,19,20,21,22,23,24,25,26],zmm2[43,44,45,46,47],zmm0[32,33,34,35,36,37,38,39,40,41,42],zmm2[59,60,61,62,63],zmm0[48,49,50,51,52,53,54,55,56,57,58]			; AVX512-NEXT: vpalignr {{.*#+}} zmm3 = zmm2[11,12,13,14,15],zmm0[0,1,2,3,4,5,6,7,8,9,10],zmm2[27,28,29,30,31],zmm0[16,17,18,19,20,21,22,23,24,25,26],zmm2[43,44,45,46,47],zmm0[32,33,34,35,36,37,38,39,40,41,42],zmm2[59,60,61,62,63],zmm0[48,49,50,51,52,53,54,55,56,57,58]
	; AVX512-NEXT: vpalignr {{.*#+}} zmm0 = zmm0[11,12,13,14,15],zmm1[0,1,2,3,4,5,6,7,8,9,10],zmm0[27,28,29,30,31],zmm1[16,17,18,19,20,21,22,23,24,25,26],zmm0[43,44,45,46,47],zmm1[32,33,34,35,36,37,38,39,40,41,42],zmm0[59,60,61,62,63],zmm1[48,49,50,51,52,53,54,55,56,57,58]			; AVX512-NEXT: vpalignr {{.*#+}} zmm0 = zmm0[11,12,13,14,15],zmm1[0,1,2,3,4,5,6,7,8,9,10],zmm0[27,28,29,30,31],zmm1[16,17,18,19,20,21,22,23,24,25,26],zmm0[43,44,45,46,47],zmm1[32,33,34,35,36,37,38,39,40,41,42],zmm0[59,60,61,62,63],zmm1[48,49,50,51,52,53,54,55,56,57,58]
	; AVX512-NEXT: vpalignr {{.*#+}} zmm1 = zmm1[11,12,13,14,15],zmm2[0,1,2,3,4,5,6,7,8,9,10],zmm1[27,28,29,30,31],zmm2[16,17,18,19,20,21,22,23,24,25,26],zmm1[43,44,45,46,47],zmm2[32,33,34,35,36,37,38,39,40,41,42],zmm1[59,60,61,62,63],zmm2[48,49,50,51,52,53,54,55,56,57,58]			; AVX512-NEXT: vpalignr {{.*#+}} zmm1 = zmm1[11,12,13,14,15],zmm2[0,1,2,3,4,5,6,7,8,9,10],zmm1[27,28,29,30,31],zmm2[16,17,18,19,20,21,22,23,24,25,26],zmm1[43,44,45,46,47],zmm2[32,33,34,35,36,37,38,39,40,41,42],zmm1[59,60,61,62,63],zmm2[48,49,50,51,52,53,54,55,56,57,58]
	; AVX512-NEXT: movabsq $-576188069258921984, %rax # imm = 0xF800F800F800F800			; AVX512-NEXT: movabsq $-576188069258921984, %rax # imm = 0xF800F800F800F800
	▲ Show 20 Lines • Show All 464 Lines • Show Last 20 Lines