Diff 542528

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 22,101 Lines • ▼ Show 20 Lines

static SDValue performDUPCombine(SDNode *N,		static SDValue performDUPCombine(SDNode *N,
TargetLowering::DAGCombinerInfo &DCI) {		TargetLowering::DAGCombinerInfo &DCI) {
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
// If "v2i32 DUP(x)" and "v4i32 DUP(x)" both exist, use an extract from the		// If "v2i32 DUP(x)" and "v4i32 DUP(x)" both exist, use an extract from the
// 128bit vector version.		// 128bit vector version.
if (VT.is64BitVector() && DCI.isAfterLegalizeDAG()) {		if (VT.is64BitVector() && DCI.isAfterLegalizeDAG()) {
EVT LVT = VT.getDoubleNumVectorElementsVT(*DCI.DAG.getContext());		EVT LVT = VT.getDoubleNumVectorElementsVT(*DCI.DAG.getContext());
if (SDNode *LN = DCI.DAG.getNodeIfExists(		SmallVector<SDValue> Ops(N->ops());
N->getOpcode(), DCI.DAG.getVTList(LVT), {N->getOperand(0)})) {		if (SDNode *LN = DCI.DAG.getNodeIfExists(N->getOpcode(),
		DCI.DAG.getVTList(LVT), Ops)) {
SDLoc DL(N);		SDLoc DL(N);
return DCI.DAG.getNode(ISD::EXTRACT_SUBVECTOR, DL, VT, SDValue(LN, 0),		return DCI.DAG.getNode(ISD::EXTRACT_SUBVECTOR, DL, VT, SDValue(LN, 0),
DCI.DAG.getConstant(0, DL, MVT::i64));		DCI.DAG.getConstant(0, DL, MVT::i64));
}		}
}		}

		if (N->getOpcode() == AArch64ISD::DUP)
return performPostLD1Combine(N, DCI, false);		return performPostLD1Combine(N, DCI, false);

		return SDValue();
		dmgreenUnsubmitted Not Done Reply Inline Actions Should this be excluded for everything that isn't DUP? dmgreen: Should this be excluded for everything that isn't DUP?
		jaykang10AuthorUnsubmitted Done Reply Inline Actions I do not know how the `performPostLD1Combine` function works in detail but the function checks whether the input node is `ISD::LOAD`. If it is not `ISD::LOAD`, the function returns `SDValue()`. To be safe, let me update code which do not execute the `performPostLD1Combine` function with DUPLANE. jaykang10: I do not know how the `performPostLD1Combine` function works in detail but the function checks…
}		}

/// Get rid of unnecessary NVCASTs (that don't change the type).		/// Get rid of unnecessary NVCASTs (that don't change the type).
static SDValue performNVCASTCombine(SDNode *N) {		static SDValue performNVCASTCombine(SDNode *N) {
if (N->getValueType(0) == N->getOperand(0).getValueType())		if (N->getValueType(0) == N->getOperand(0).getValueType())
return N->getOperand(0);		return N->getOperand(0);

return SDValue();		return SDValue();
▲ Show 20 Lines • Show All 911 Lines • ▼ Show 20 Lines	SDValue AArch64TargetLowering::PerformDAGCombine(SDNode *N,
case AArch64ISD::BRCOND:		case AArch64ISD::BRCOND:
return performBRCONDCombine(N, DCI, DAG);		return performBRCONDCombine(N, DCI, DAG);
case AArch64ISD::TBNZ:		case AArch64ISD::TBNZ:
case AArch64ISD::TBZ:		case AArch64ISD::TBZ:
return performTBZCombine(N, DCI, DAG);		return performTBZCombine(N, DCI, DAG);
case AArch64ISD::CSEL:		case AArch64ISD::CSEL:
return performCSELCombine(N, DCI, DAG);		return performCSELCombine(N, DCI, DAG);
case AArch64ISD::DUP:		case AArch64ISD::DUP:
		case AArch64ISD::DUPLANE8:
		case AArch64ISD::DUPLANE16:
		case AArch64ISD::DUPLANE32:
		case AArch64ISD::DUPLANE64:
return performDUPCombine(N, DCI);		return performDUPCombine(N, DCI);
case AArch64ISD::DUPLANE128:		case AArch64ISD::DUPLANE128:
return performDupLane128Combine(N, DAG);		return performDupLane128Combine(N, DAG);
case AArch64ISD::NVCAST:		case AArch64ISD::NVCAST:
return performNVCASTCombine(N);		return performNVCASTCombine(N);
case AArch64ISD::SPLICE:		case AArch64ISD::SPLICE:
return performSpliceCombine(N, DAG);		return performSpliceCombine(N, DAG);
case AArch64ISD::UUNPKLO:		case AArch64ISD::UUNPKLO:
▲ Show 20 Lines • Show All 2,950 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrFormats.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 132 Lines • ▼ Show 20 Lines
def extract_high_v2i64 :		def extract_high_v2i64 :
ComplexPattern<v1i64, 1, "SelectExtractHigh", [extract_subvector, bitconvert]>;		ComplexPattern<v1i64, 1, "SelectExtractHigh", [extract_subvector, bitconvert]>;

def extract_high_dup_v8i16 :		def extract_high_dup_v8i16 :
BinOpFrag<(extract_subvector (v8i16 (AArch64duplane16 (v8i16 node:$LHS), node:$RHS)), (i64 4))>;		BinOpFrag<(extract_subvector (v8i16 (AArch64duplane16 (v8i16 node:$LHS), node:$RHS)), (i64 4))>;
def extract_high_dup_v4i32 :		def extract_high_dup_v4i32 :
BinOpFrag<(extract_subvector (v4i32 (AArch64duplane32 (v4i32 node:$LHS), node:$RHS)), (i64 2))>;		BinOpFrag<(extract_subvector (v4i32 (AArch64duplane32 (v4i32 node:$LHS), node:$RHS)), (i64 2))>;

		def dup_v8i16 :
		PatFrags<(ops node:$LHS, node:$RHS),
		[(v4i16 (extract_subvector (v8i16 (AArch64duplane16 (v8i16 node:$LHS), node:$RHS)), (i64 0))),
		(v4i16 (AArch64duplane16 (v8i16 node:$LHS), node:$RHS))]>;
		def dup_v4i32 :
		PatFrags<(ops node:$LHS, node:$RHS),
		[(v2i32 (extract_subvector (v4i32 (AArch64duplane32 (v4i32 node:$LHS), node:$RHS)), (i64 0))),
		(v2i32 (AArch64duplane32 (v4i32 node:$LHS), node:$RHS))]>;
		def dup_v8f16 :
		PatFrags<(ops node:$LHS, node:$RHS),
		[(v4f16 (extract_subvector (v8f16 (AArch64duplane16 (v8f16 node:$LHS), node:$RHS)), (i64 0))),
		(v4f16 (AArch64duplane16 (v8f16 node:$LHS), node:$RHS))]>;
		def dup_v4f32 :
		PatFrags<(ops node:$LHS, node:$RHS),
		[(v2f32 (extract_subvector (v4f32 (AArch64duplane32 (v4f32 node:$LHS), node:$RHS)), (i64 0))),
		(v2f32 (AArch64duplane32 (v4f32 node:$LHS), node:$RHS))]>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Asm Operand Classes.		// Asm Operand Classes.
//		//

// Shifter operand for arithmetic shifted encodings.		// Shifter operand for arithmetic shifted encodings.
def ShifterOperand : AsmOperandClass {		def ShifterOperand : AsmOperandClass {
let Name = "Shifter";		let Name = "Shifter";
}		}
▲ Show 20 Lines • Show All 8,289 Lines • ▼ Show 20 Lines	multiclass SIMDFPIndexed<bit U, bits<4> opc, string asm,
let mayRaiseFPException = 1, Uses = [FPCR] in {		let mayRaiseFPException = 1, Uses = [FPCR] in {
let Predicates = [HasNEON, HasFullFP16] in {		let Predicates = [HasNEON, HasFullFP16] in {
def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b00, opc,		def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b00, opc,
V64, V64,		V64, V64,
V128_lo, VectorIndexH,		V128_lo, VectorIndexH,
asm, ".4h", ".4h", ".4h", ".h",		asm, ".4h", ".4h", ".4h", ".h",
[(set (v4f16 V64:$Rd),		[(set (v4f16 V64:$Rd),
(OpNode (v4f16 V64:$Rn),		(OpNode (v4f16 V64:$Rn),
(v4f16 (AArch64duplane16 (v8f16 V128_lo:$Rm), VectorIndexH:$idx))))]> {		(dup_v8f16 (v8f16 V128_lo:$Rm), VectorIndexH:$idx)))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b00, opc,		def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b00, opc,
V128, V128,		V128, V128,
Show All 10 Lines	multiclass SIMDFPIndexed<bit U, bits<4> opc, string asm,
} // Predicates = [HasNEON, HasFullFP16]		} // Predicates = [HasNEON, HasFullFP16]

def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
V64, V64,		V64, V64,
V128, VectorIndexS,		V128, VectorIndexS,
asm, ".2s", ".2s", ".2s", ".s",		asm, ".2s", ".2s", ".2s", ".s",
[(set (v2f32 V64:$Rd),		[(set (v2f32 V64:$Rd),
(OpNode (v2f32 V64:$Rn),		(OpNode (v2f32 V64:$Rn),
(v2f32 (AArch64duplane32 (v4f32 V128:$Rm), VectorIndexS:$idx))))]> {		(dup_v4f32 (v4f32 V128:$Rm), VectorIndexS:$idx)))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
V128, V128,		V128, V128,
V128, VectorIndexS,		V128, VectorIndexS,
▲ Show 20 Lines • Show All 294 Lines • ▼ Show 20 Lines

multiclass SIMDIndexedHS<bit U, bits<4> opc, string asm,		multiclass SIMDIndexedHS<bit U, bits<4> opc, string asm,
SDPatternOperator OpNode> {		SDPatternOperator OpNode> {
def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc, V64, V64,		def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc, V64, V64,
V128_lo, VectorIndexH,		V128_lo, VectorIndexH,
asm, ".4h", ".4h", ".4h", ".h",		asm, ".4h", ".4h", ".4h", ".h",
[(set (v4i16 V64:$Rd),		[(set (v4i16 V64:$Rd),
(OpNode (v4i16 V64:$Rn),		(OpNode (v4i16 V64:$Rn),
(v4i16 (AArch64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {		(dup_v8i16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx)))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,		def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,
V128, V128,		V128, V128,
Show All 9 Lines	multiclass SIMDIndexedHS<bit U, bits<4> opc, string asm,
}		}

def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
V64, V64,		V64, V64,
V128, VectorIndexS,		V128, VectorIndexS,
asm, ".2s", ".2s", ".2s", ".s",		asm, ".2s", ".2s", ".2s", ".s",
[(set (v2i32 V64:$Rd),		[(set (v2i32 V64:$Rd),
(OpNode (v2i32 V64:$Rn),		(OpNode (v2i32 V64:$Rn),
(v2i32 (AArch64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {		(dup_v4i32 (v4i32 V128:$Rm), VectorIndexS:$idx)))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
V128, V128,		V128, V128,
V128, VectorIndexS,		V128, VectorIndexS,
Show All 31 Lines
multiclass SIMDVectorIndexedHS<bit U, bits<4> opc, string asm,		multiclass SIMDVectorIndexedHS<bit U, bits<4> opc, string asm,
SDPatternOperator OpNode> {		SDPatternOperator OpNode> {
def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,		def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,
V64, V64,		V64, V64,
V128_lo, VectorIndexH,		V128_lo, VectorIndexH,
asm, ".4h", ".4h", ".4h", ".h",		asm, ".4h", ".4h", ".4h", ".h",
[(set (v4i16 V64:$Rd),		[(set (v4i16 V64:$Rd),
(OpNode (v4i16 V64:$Rn),		(OpNode (v4i16 V64:$Rn),
(v4i16 (AArch64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {		(dup_v8i16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx)))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,		def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,
V128, V128,		V128, V128,
Show All 9 Lines	multiclass SIMDVectorIndexedHS<bit U, bits<4> opc, string asm,
}		}

def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
V64, V64,		V64, V64,
V128, VectorIndexS,		V128, VectorIndexS,
asm, ".2s", ".2s", ".2s", ".s",		asm, ".2s", ".2s", ".2s", ".s",
[(set (v2i32 V64:$Rd),		[(set (v2i32 V64:$Rd),
(OpNode (v2i32 V64:$Rn),		(OpNode (v2i32 V64:$Rn),
(v2i32 (AArch64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {		(dup_v4i32 (v4i32 V128:$Rm), VectorIndexS:$idx)))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
V128, V128,		V128, V128,
V128, VectorIndexS,		V128, VectorIndexS,
Show All 9 Lines

multiclass SIMDVectorIndexedHSTied<bit U, bits<4> opc, string asm,		multiclass SIMDVectorIndexedHSTied<bit U, bits<4> opc, string asm,
SDPatternOperator OpNode> {		SDPatternOperator OpNode> {
def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc, V64, V64,		def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc, V64, V64,
V128_lo, VectorIndexH,		V128_lo, VectorIndexH,
asm, ".4h", ".4h", ".4h", ".h",		asm, ".4h", ".4h", ".4h", ".h",
[(set (v4i16 V64:$dst),		[(set (v4i16 V64:$dst),
(OpNode (v4i16 V64:$Rd),(v4i16 V64:$Rn),		(OpNode (v4i16 V64:$Rd),(v4i16 V64:$Rn),
(v4i16 (AArch64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {		(dup_v8i16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx)))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,		def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,
V128, V128,		V128, V128,
Show All 9 Lines	multiclass SIMDVectorIndexedHSTied<bit U, bits<4> opc, string asm,
}		}

def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,
V64, V64,		V64, V64,
V128, VectorIndexS,		V128, VectorIndexS,
asm, ".2s", ".2s", ".2s", ".s",		asm, ".2s", ".2s", ".2s", ".s",
[(set (v2i32 V64:$dst),		[(set (v2i32 V64:$dst),
(OpNode (v2i32 V64:$Rd), (v2i32 V64:$Rn),		(OpNode (v2i32 V64:$Rd), (v2i32 V64:$Rn),
(v2i32 (AArch64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {		(dup_v4i32 (v4i32 V128:$Rm), VectorIndexS:$idx)))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,
V128, V128,		V128, V128,
V128, VectorIndexS,		V128, VectorIndexS,
Show All 10 Lines
multiclass SIMDIndexedLongSD<bit U, bits<4> opc, string asm,		multiclass SIMDIndexedLongSD<bit U, bits<4> opc, string asm,
SDPatternOperator OpNode> {		SDPatternOperator OpNode> {
def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,		def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,
V128, V64,		V128, V64,
V128_lo, VectorIndexH,		V128_lo, VectorIndexH,
asm, ".4s", ".4s", ".4h", ".h",		asm, ".4s", ".4s", ".4h", ".h",
[(set (v4i32 V128:$Rd),		[(set (v4i32 V128:$Rd),
(OpNode (v4i16 V64:$Rn),		(OpNode (v4i16 V64:$Rn),
(v4i16 (AArch64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {		(dup_v8i16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx)))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,		def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,
V128, V128,		V128, V128,
Show All 10 Lines	multiclass SIMDIndexedLongSD<bit U, bits<4> opc, string asm,
}		}

def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
V128, V64,		V128, V64,
V128, VectorIndexS,		V128, VectorIndexS,
asm, ".2d", ".2d", ".2s", ".s",		asm, ".2d", ".2d", ".2s", ".s",
[(set (v2i64 V128:$Rd),		[(set (v2i64 V128:$Rd),
(OpNode (v2i32 V64:$Rn),		(OpNode (v2i32 V64:$Rn),
(v2i32 (AArch64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {		(dup_v4i32 (v4i32 V128:$Rm), VectorIndexS:$idx)))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
V128, V128,		V128, V128,
V128, VectorIndexS,		V128, VectorIndexS,
Show All 29 Lines	multiclass SIMDIndexedLongSQDMLXSDTied<bit U, bits<4> opc, string asm,
def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc,		def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc,
V128, V64,		V128, V64,
V128_lo, VectorIndexH,		V128_lo, VectorIndexH,
asm, ".4s", ".4s", ".4h", ".h",		asm, ".4s", ".4s", ".4h", ".h",
[(set (v4i32 V128:$dst),		[(set (v4i32 V128:$dst),
(Accum (v4i32 V128:$Rd),		(Accum (v4i32 V128:$Rd),
(v4i32 (int_aarch64_neon_sqdmull		(v4i32 (int_aarch64_neon_sqdmull
(v4i16 V64:$Rn),		(v4i16 V64:$Rn),
(v4i16 (AArch64duplane16 (v8i16 V128_lo:$Rm),		(dup_v8i16 (v8i16 V128_lo:$Rm),
VectorIndexH:$idx))))))]> {		VectorIndexH:$idx)))))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,		def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,
V128, V128,		V128, V128,
Show All 13 Lines	multiclass SIMDIndexedLongSQDMLXSDTied<bit U, bits<4> opc, string asm,
def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,
V128, V64,		V128, V64,
V128, VectorIndexS,		V128, VectorIndexS,
asm, ".2d", ".2d", ".2s", ".s",		asm, ".2d", ".2d", ".2s", ".s",
[(set (v2i64 V128:$dst),		[(set (v2i64 V128:$dst),
(Accum (v2i64 V128:$Rd),		(Accum (v2i64 V128:$Rd),
(v2i64 (int_aarch64_neon_sqdmull		(v2i64 (int_aarch64_neon_sqdmull
(v2i32 V64:$Rn),		(v2i32 V64:$Rn),
(v2i32 (AArch64duplane32 (v4i32 V128:$Rm),		(dup_v4i32 (v4i32 V128:$Rm), VectorIndexS:$idx)))))]> {
VectorIndexS:$idx))))))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,
V128, V128,		V128, V128,
V128, VectorIndexS,		V128, VectorIndexS,
Show All 28 Lines	def : Pat<(i32 (Accum (i32 FPR32Op:$Rd),
(EXTRACT_SUBREG V64:$Rn, hsub),		(EXTRACT_SUBREG V64:$Rn, hsub),
(INSERT_SUBREG (IMPLICIT_DEF), V64:$Rm, dsub),		(INSERT_SUBREG (IMPLICIT_DEF), V64:$Rm, dsub),
(i64 0))>;		(i64 0))>;

def : Pat<(i32 (Accum (i32 FPR32Op:$Rd),		def : Pat<(i32 (Accum (i32 FPR32Op:$Rd),
(i32 (vector_extract		(i32 (vector_extract
(v4i32 (int_aarch64_neon_sqdmull		(v4i32 (int_aarch64_neon_sqdmull
(v4i16 V64:$Rn),		(v4i16 V64:$Rn),
(v4i16 (AArch64duplane16		(dup_v8i16 (v8i16 V128_lo:$Rm),
(v8i16 V128_lo:$Rm),		VectorIndexH:$idx))),
VectorIndexH:$idx)))),
(i64 0))))),		(i64 0))))),
(!cast<Instruction>(NAME # v1i32_indexed)		(!cast<Instruction>(NAME # v1i32_indexed)
FPR32Op:$Rd,		FPR32Op:$Rd,
(EXTRACT_SUBREG V64:$Rn, hsub),		(EXTRACT_SUBREG V64:$Rn, hsub),
V128_lo:$Rm,		V128_lo:$Rm,
VectorIndexH:$idx)>;		VectorIndexH:$idx)>;

def v1i64_indexed : BaseSIMDIndexedTied<1, U, 1, 0b10, opc,		def v1i64_indexed : BaseSIMDIndexedTied<1, U, 1, 0b10, opc,
Show All 16 Lines	multiclass SIMDVectorIndexedLongSD<bit U, bits<4> opc, string asm,
SDPatternOperator OpNode> {		SDPatternOperator OpNode> {
let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {		let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,		def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,
V128, V64,		V128, V64,
V128_lo, VectorIndexH,		V128_lo, VectorIndexH,
asm, ".4s", ".4s", ".4h", ".h",		asm, ".4s", ".4s", ".4h", ".h",
[(set (v4i32 V128:$Rd),		[(set (v4i32 V128:$Rd),
(OpNode (v4i16 V64:$Rn),		(OpNode (v4i16 V64:$Rn),
(v4i16 (AArch64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {		(dup_v8i16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx)))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,		def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,
V128, V128,		V128, V128,
Show All 10 Lines	multiclass SIMDVectorIndexedLongSD<bit U, bits<4> opc, string asm,
}		}

def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
V128, V64,		V128, V64,
V128, VectorIndexS,		V128, VectorIndexS,
asm, ".2d", ".2d", ".2s", ".s",		asm, ".2d", ".2d", ".2s", ".s",
[(set (v2i64 V128:$Rd),		[(set (v2i64 V128:$Rd),
(OpNode (v2i32 V64:$Rn),		(OpNode (v2i32 V64:$Rn),
(v2i32 (AArch64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {		(dup_v4i32 (v4i32 V128:$Rm), VectorIndexS:$idx)))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
V128, V128,		V128, V128,
V128, VectorIndexS,		V128, VectorIndexS,
Show All 12 Lines	multiclass SIMDVectorIndexedLongSDTied<bit U, bits<4> opc, string asm,
SDPatternOperator OpNode> {		SDPatternOperator OpNode> {
let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {		let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc,		def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc,
V128, V64,		V128, V64,
V128_lo, VectorIndexH,		V128_lo, VectorIndexH,
asm, ".4s", ".4s", ".4h", ".h",		asm, ".4s", ".4s", ".4h", ".h",
[(set (v4i32 V128:$dst),		[(set (v4i32 V128:$dst),
(OpNode (v4i32 V128:$Rd), (v4i16 V64:$Rn),		(OpNode (v4i32 V128:$Rd), (v4i16 V64:$Rn),
(v4i16 (AArch64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {		(dup_v8i16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx)))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,		def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,
V128, V128,		V128, V128,
Show All 10 Lines	multiclass SIMDVectorIndexedLongSDTied<bit U, bits<4> opc, string asm,
}		}

def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,
V128, V64,		V128, V64,
V128, VectorIndexS,		V128, VectorIndexS,
asm, ".2d", ".2d", ".2s", ".s",		asm, ".2d", ".2d", ".2s", ".s",
[(set (v2i64 V128:$dst),		[(set (v2i64 V128:$dst),
(OpNode (v2i64 V128:$Rd), (v2i32 V64:$Rn),		(OpNode (v2i64 V128:$Rd), (v2i32 V64:$Rn),
(v2i32 (AArch64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {		(dup_v4i32 (v4i32 V128:$Rm), VectorIndexS:$idx)))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,
V128, V128,		V128, V128,
V128, VectorIndexS,		V128, VectorIndexS,
▲ Show 20 Lines • Show All 1,605 Lines • ▼ Show 20 Lines

multiclass SIMDIndexedSQRDMLxHSDTied<bit U, bits<4> opc, string asm,		multiclass SIMDIndexedSQRDMLxHSDTied<bit U, bits<4> opc, string asm,
SDPatternOperator op> {		SDPatternOperator op> {
def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc,		def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc,
V64, V64, V128_lo, VectorIndexH,		V64, V64, V128_lo, VectorIndexH,
asm, ".4h", ".4h", ".4h", ".h",		asm, ".4h", ".4h", ".4h", ".h",
[(set (v4i16 V64:$dst),		[(set (v4i16 V64:$dst),
(v4i16 (op (v4i16 V64:$Rd), (v4i16 V64:$Rn),		(v4i16 (op (v4i16 V64:$Rd), (v4i16 V64:$Rn),
(v4i16 (AArch64duplane16 (v8i16 V128_lo:$Rm),		(dup_v8i16 (v8i16 V128_lo:$Rm),
VectorIndexH:$idx)))))]> {		VectorIndexH:$idx))))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,		def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,
V128, V128, V128_lo, VectorIndexH,		V128, V128, V128_lo, VectorIndexH,
asm, ".8h", ".8h", ".8h", ".h",		asm, ".8h", ".8h", ".8h", ".h",
[(set (v8i16 V128:$dst),		[(set (v8i16 V128:$dst),
(v8i16 (op (v8i16 V128:$Rd), (v8i16 V128:$Rn),		(v8i16 (op (v8i16 V128:$Rd), (v8i16 V128:$Rn),
(v8i16 (AArch64duplane16 (v8i16 V128_lo:$Rm),		(v8i16 (AArch64duplane16 (v8i16 V128_lo:$Rm),
VectorIndexH:$idx)))))]> {		VectorIndexH:$idx)))))]> {
bits<3> idx;		bits<3> idx;
let Inst{11} = idx{2};		let Inst{11} = idx{2};
let Inst{21} = idx{1};		let Inst{21} = idx{1};
let Inst{20} = idx{0};		let Inst{20} = idx{0};
}		}

def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,		def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,
V64, V64, V128, VectorIndexS,		V64, V64, V128, VectorIndexS,
asm, ".2s", ".2s", ".2s", ".s",		asm, ".2s", ".2s", ".2s", ".s",
[(set (v2i32 V64:$dst),		[(set (v2i32 V64:$dst),
(v2i32 (op (v2i32 V64:$Rd), (v2i32 V64:$Rn),		(v2i32 (op (v2i32 V64:$Rd), (v2i32 V64:$Rn),
(v2i32 (AArch64duplane32 (v4i32 V128:$Rm),		(dup_v4i32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
VectorIndexS:$idx)))))]> {
bits<2> idx;		bits<2> idx;
let Inst{11} = idx{1};		let Inst{11} = idx{1};
let Inst{21} = idx{0};		let Inst{21} = idx{0};
}		}

def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,		def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,
V128, V128, V128, VectorIndexS,		V128, V128, V128, VectorIndexS,
asm, ".4s", ".4s", ".4s", ".s",		asm, ".4s", ".4s", ".4s", ".s",
▲ Show 20 Lines • Show All 1,277 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/aarch64-matrix-umull-smull.ll

	Show First 20 Lines • Show All 651 Lines • ▼ Show 20 Lines

	exit:			exit:
	ret void			ret void
	}			}

	define void @sink_v16s16_8(i32 %p, i32 %d, i64 %n, <16 x i8> %a) {			define void @sink_v16s16_8(i32 %p, i32 %d, i64 %n, <16 x i8> %a) {
	; CHECK-LABEL: sink_v16s16_8:			; CHECK-LABEL: sink_v16s16_8:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: dup v1.8b, v0.b[10]
	; CHECK-NEXT: mov x8, xzr			; CHECK-NEXT: mov x8, xzr
	; CHECK-NEXT: dup v0.16b, v0.b[10]			; CHECK-NEXT: dup v0.16b, v0.b[10]
	; CHECK-NEXT: .LBB9_1: // %loop			; CHECK-NEXT: .LBB9_1: // %loop
	; CHECK-NEXT: // =>This Inner Loop Header: Depth=1			; CHECK-NEXT: // =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: ldr q2, [x0]			; CHECK-NEXT: ldr q1, [x0]
	; CHECK-NEXT: add x8, x8, #8			; CHECK-NEXT: add x8, x8, #8
	; CHECK-NEXT: subs x2, x2, #8			; CHECK-NEXT: subs x2, x2, #8
	; CHECK-NEXT: smull2 v3.8h, v2.16b, v0.16b			; CHECK-NEXT: smull2 v2.8h, v1.16b, v0.16b
	; CHECK-NEXT: smull v2.8h, v2.8b, v1.8b			; CHECK-NEXT: smull v1.8h, v1.8b, v0.8b
	; CHECK-NEXT: cmlt v3.8h, v3.8h, #0
	; CHECK-NEXT: cmlt v2.8h, v2.8h, #0			; CHECK-NEXT: cmlt v2.8h, v2.8h, #0
	; CHECK-NEXT: uzp1 v2.16b, v2.16b, v3.16b			; CHECK-NEXT: cmlt v1.8h, v1.8h, #0
	; CHECK-NEXT: str q2, [x0], #32			; CHECK-NEXT: uzp1 v1.16b, v1.16b, v2.16b
				; CHECK-NEXT: str q1, [x0], #32
	; CHECK-NEXT: b.ne .LBB9_1			; CHECK-NEXT: b.ne .LBB9_1
	; CHECK-NEXT: // %bb.2: // %exit			; CHECK-NEXT: // %bb.2: // %exit
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%ext = sext <16 x i8> %a to <16 x i16>			%ext = sext <16 x i8> %a to <16 x i16>
	%broadcast.splat = shufflevector <16 x i16> %ext, <16 x i16> poison, <16 x i32> <i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10>			%broadcast.splat = shufflevector <16 x i16> %ext, <16 x i16> poison, <16 x i32> <i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10, i32 10>
	br label %loop			br label %loop

	▲ Show 20 Lines • Show All 292 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/duplane-index-patfrags.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple aarch64-none-linux-gnu -mattr=+fullfp16 < %s \| FileCheck %s

				define <8 x half> @sel.v8f16.fmul(ptr %p, ptr %q, <8 x half> %a, <8 x half> %b, <4 x half> %c) {
				; CHECK-LABEL: sel.v8f16.fmul:
				; CHECK: // %bb.0:
				; CHECK-NEXT: fmul v1.8h, v1.8h, v0.h[0]
				; CHECK-NEXT: fmul v2.4h, v2.4h, v0.h[0]
				; CHECK-NEXT: mov v0.16b, v1.16b
				; CHECK-NEXT: str d2, [x0]
				; CHECK-NEXT: ret
				%splat = shufflevector <8 x half> %a, <8 x half> poison, <8 x i32> zeroinitializer
				%splat2 = shufflevector <8 x half> %a, <8 x half> poison, <4 x i32> zeroinitializer

				%r = fmul <8 x half> %b, %splat
				%r2 = fmul <4 x half> %c, %splat2
				store <4 x half> %r2, ptr %p
				ret <8 x half> %r
				}

				define <4 x float> @sel.v4f32.fmul(ptr %p, ptr %q, <4 x float> %a, <4 x float> %b, <2 x float> %c) {
				; CHECK-LABEL: sel.v4f32.fmul:
				; CHECK: // %bb.0:
				; CHECK-NEXT: fmul v1.4s, v1.4s, v0.s[0]
				; CHECK-NEXT: fmul v2.2s, v2.2s, v0.s[0]
				; CHECK-NEXT: mov v0.16b, v1.16b
				; CHECK-NEXT: str d2, [x0]
				; CHECK-NEXT: ret
				%splat = shufflevector <4 x float> %a, <4 x float> poison, <4 x i32> zeroinitializer
				%splat2 = shufflevector <4 x float> %a, <4 x float> poison, <2 x i32> zeroinitializer

				%r = fmul <4 x float> %b, %splat
				%r2 = fmul <2 x float> %c, %splat2
				store <2 x float> %r2, ptr %p
				ret <4 x float> %r
				}

				define <8 x i16> @sel.v8i16.mul(ptr %p, ptr %q, <8 x i16> %a, <8 x i16> %b, <4 x i16> %c) {
				; CHECK-LABEL: sel.v8i16.mul:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mul v1.8h, v1.8h, v0.h[0]
				; CHECK-NEXT: mul v2.4h, v2.4h, v0.h[0]
				; CHECK-NEXT: mov v0.16b, v1.16b
				; CHECK-NEXT: str d2, [x0]
				; CHECK-NEXT: ret
				%splat = shufflevector <8 x i16> %a, <8 x i16> poison, <8 x i32> zeroinitializer
				%splat2 = shufflevector <8 x i16> %a, <8 x i16> poison, <4 x i32> zeroinitializer

				%r = mul <8 x i16> %b, %splat
				%r2 = mul <4 x i16> %c, %splat2
				store <4 x i16> %r2, ptr %p
				ret <8 x i16> %r
				}

				define <4 x i32> @sel.v4i32.mul(ptr %p, ptr %q, <4 x i32> %a, <4 x i32> %b, <2 x i32> %c) {
				; CHECK-LABEL: sel.v4i32.mul:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mul v1.4s, v1.4s, v0.s[0]
				; CHECK-NEXT: mul v2.2s, v2.2s, v0.s[0]
				; CHECK-NEXT: mov v0.16b, v1.16b
				; CHECK-NEXT: str d2, [x0]
				; CHECK-NEXT: ret
				%splat = shufflevector <4 x i32> %a, <4 x i32> poison, <4 x i32> zeroinitializer
				%splat2 = shufflevector <4 x i32> %a, <4 x i32> poison, <2 x i32> zeroinitializer

				%r = mul <4 x i32> %b, %splat
				%r2 = mul <2 x i32> %c, %splat2
				store <2 x i32> %r2, ptr %p
				ret <4 x i32> %r
				}

				define <4 x i64> @sel.v4i32.smull(<4 x i32> %a, <4 x i32> %b, <2 x i32> %c) {
				; CHECK-LABEL: sel.v4i32.smull:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smull2 v2.2d, v1.4s, v0.s[0]
				; CHECK-NEXT: smull v0.2d, v1.2s, v0.s[0]
				; CHECK-NEXT: mov v1.16b, v2.16b
				; CHECK-NEXT: ret
				%ext = sext <4 x i32> %a to <4 x i64>
				%splat = shufflevector <4 x i64> %ext, <4 x i64> poison, <4 x i32> zeroinitializer
				%d = sext <4 x i32> %b to <4 x i64>
				%r = mul <4 x i64> %d, %splat
				ret <4 x i64> %r
				}

				define <4 x i64> @sel.v4i32.umull(<4 x i32> %a, <4 x i32> %b, <2 x i32> %c) {
				; CHECK-LABEL: sel.v4i32.umull:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umull2 v2.2d, v1.4s, v0.s[0]
				; CHECK-NEXT: umull v0.2d, v1.2s, v0.s[0]
				; CHECK-NEXT: mov v1.16b, v2.16b
				; CHECK-NEXT: ret
				%ext = zext <4 x i32> %a to <4 x i64>
				%splat = shufflevector <4 x i64> %ext, <4 x i64> poison, <4 x i32> zeroinitializer
				%d = zext <4 x i32> %b to <4 x i64>
				%r = mul <4 x i64> %d, %splat
				ret <4 x i64> %r
				}

				define <4 x i32> @sel.v4i32.sqdmull(<8 x i16> %a, <4 x i16> %b) {
				; CHECK-LABEL: sel.v4i32.sqdmull:
				; CHECK: // %bb.0: // %entry
				; CHECK-NEXT: // kill: def $d1 killed $d1 def $q1
				; CHECK-NEXT: sqdmull v2.4s, v0.4h, v1.h[0]
				; CHECK-NEXT: sqdmlal2 v2.4s, v0.8h, v1.h[0]
				; CHECK-NEXT: mov v0.16b, v2.16b
				; CHECK-NEXT: ret
				entry:
				%c = shufflevector <8 x i16> %a, <8 x i16> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
				%d = shufflevector <4 x i16> %b, <4 x i16> poison, <4 x i32> zeroinitializer
				%e = tail call <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16> %c, <4 x i16> %d)
				%f = shufflevector <8 x i16> %a, <8 x i16> poison, <4 x i32> <i32 4, i32 5, i32 6, i32 7>
				%g = tail call <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16> %f, <4 x i16> %d)
				%h = tail call <4 x i32> @llvm.aarch64.neon.sqadd.v4i32(<4 x i32> %e, <4 x i32> %g)
				ret <4 x i32> %h
				}

				declare <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16>, <4 x i16>)
				declare <4 x i32> @llvm.aarch64.neon.sqadd.v4i32(<4 x i32>, <4 x i32>)

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Reuse larger DUPLANE if available
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 542528

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64InstrFormats.td

llvm/test/CodeGen/AArch64/aarch64-matrix-umull-smull.ll

llvm/test/CodeGen/AArch64/duplane-index-patfrags.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Reuse larger DUPLANE if availableClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 542528

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64InstrFormats.td

llvm/test/CodeGen/AArch64/aarch64-matrix-umull-smull.ll

llvm/test/CodeGen/AArch64/duplane-index-patfrags.ll

[AArch64] Reuse larger DUPLANE if available
ClosedPublic