Diff 146619

llvm/trunk/lib/Target/AArch64/AArch64InstrInfo.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 2,243 Lines • ▼ Show 20 Lines	multiclass VecROStoreLane0Pat<ROAddrMode ro, SDPatternOperator storeop,
def : Pat<(storeop (STy (vector_extract (VecTy VecListOne128:$Vt), 0)),		def : Pat<(storeop (STy (vector_extract (VecTy VecListOne128:$Vt), 0)),
(ro.Xpat GPR64sp:$Rn, GPR64:$Rm, ro.Xext:$extend)),		(ro.Xpat GPR64sp:$Rn, GPR64:$Rm, ro.Xext:$extend)),
(STRX (EXTRACT_SUBREG VecListOne128:$Vt, SubRegIdx),		(STRX (EXTRACT_SUBREG VecListOne128:$Vt, SubRegIdx),
GPR64sp:$Rn, GPR64:$Rm, ro.Xext:$extend)>;		GPR64sp:$Rn, GPR64:$Rm, ro.Xext:$extend)>;
}		}

let AddedComplexity = 19 in {		let AddedComplexity = 19 in {
defm : VecROStoreLane0Pat<ro16, truncstorei16, v8i16, i32, hsub, STRHroW, STRHroX>;		defm : VecROStoreLane0Pat<ro16, truncstorei16, v8i16, i32, hsub, STRHroW, STRHroX>;
defm : VecROStoreLane0Pat<ro16, store , v8i16, i16, hsub, STRHroW, STRHroX>;		defm : VecROStoreLane0Pat<ro16, store, v8f16, f16, hsub, STRHroW, STRHroX>;
defm : VecROStoreLane0Pat<ro32, truncstorei32, v4i32, i32, ssub, STRSroW, STRSroX>;
defm : VecROStoreLane0Pat<ro32, store , v4i32, i32, ssub, STRSroW, STRSroX>;		defm : VecROStoreLane0Pat<ro32, store, v4i32, i32, ssub, STRSroW, STRSroX>;
defm : VecROStoreLane0Pat<ro32, store , v4f32, f32, ssub, STRSroW, STRSroX>;		defm : VecROStoreLane0Pat<ro32, store, v4f32, f32, ssub, STRSroW, STRSroX>;
defm : VecROStoreLane0Pat<ro64, store , v2i64, i64, dsub, STRDroW, STRDroX>;		defm : VecROStoreLane0Pat<ro64, store, v2i64, i64, dsub, STRDroW, STRDroX>;
defm : VecROStoreLane0Pat<ro64, store , v2f64, f64, dsub, STRDroW, STRDroX>;		defm : VecROStoreLane0Pat<ro64, store, v2f64, f64, dsub, STRDroW, STRDroX>;
}		}

//---		//---
// (unsigned immediate)		// (unsigned immediate)
defm STRX : StoreUIz<0b11, 0, 0b00, GPR64z, uimm12s8, "str",		defm STRX : StoreUIz<0b11, 0, 0b00, GPR64z, uimm12s8, "str",
[(store GPR64z:$Rt,		[(store GPR64z:$Rt,
(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset))]>;		(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset))]>;
defm STRW : StoreUIz<0b10, 0, 0b00, GPR32z, uimm12s4, "str",		defm STRW : StoreUIz<0b10, 0, 0b00, GPR32z, uimm12s4, "str",
Show All 17 Lines	defm STRHH : StoreUIz<0b01, 0, 0b00, GPR32z, uimm12s2, "strh",
[(truncstorei16 GPR32z:$Rt,		[(truncstorei16 GPR32z:$Rt,
(am_indexed16 GPR64sp:$Rn,		(am_indexed16 GPR64sp:$Rn,
uimm12s2:$offset))]>;		uimm12s2:$offset))]>;
defm STRBB : StoreUIz<0b00, 0, 0b00, GPR32z, uimm12s1, "strb",		defm STRBB : StoreUIz<0b00, 0, 0b00, GPR32z, uimm12s1, "strb",
[(truncstorei8 GPR32z:$Rt,		[(truncstorei8 GPR32z:$Rt,
(am_indexed8 GPR64sp:$Rn,		(am_indexed8 GPR64sp:$Rn,
uimm12s1:$offset))]>;		uimm12s1:$offset))]>;

// Match all store 64 bits width whose type is compatible with FPR64
let AddedComplexity = 10 in {		let AddedComplexity = 10 in {

		// Match all store 64 bits width whose type is compatible with FPR64
		def : Pat<(store (v1i64 FPR64:$Rt),
		(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
		(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;
		def : Pat<(store (v1f64 FPR64:$Rt),
		(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
		(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;

let Predicates = [IsLE] in {		let Predicates = [IsLE] in {
// We must use ST1 to store vectors in big-endian.		// We must use ST1 to store vectors in big-endian.
def : Pat<(store (v2f32 FPR64:$Rt),		def : Pat<(store (v2f32 FPR64:$Rt),
(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),		(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;		(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;
def : Pat<(store (v8i8 FPR64:$Rt),		def : Pat<(store (v8i8 FPR64:$Rt),
(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),		(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;		(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;
def : Pat<(store (v4i16 FPR64:$Rt),		def : Pat<(store (v4i16 FPR64:$Rt),
(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),		(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;		(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;
def : Pat<(store (v2i32 FPR64:$Rt),		def : Pat<(store (v2i32 FPR64:$Rt),
(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),		(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;		(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;
def : Pat<(store (v4f16 FPR64:$Rt),		def : Pat<(store (v4f16 FPR64:$Rt),
(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),		(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;		(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;
}		}
def : Pat<(store (v1f64 FPR64:$Rt),
(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;
def : Pat<(store (v1i64 FPR64:$Rt),
(am_indexed64 GPR64sp:$Rn, uimm12s8:$offset)),
(STRDui FPR64:$Rt, GPR64sp:$Rn, uimm12s8:$offset)>;

// Match all store 128 bits width whose type is compatible with FPR128		// Match all store 128 bits width whose type is compatible with FPR128
		def : Pat<(store (f128 FPR128:$Rt),
		(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
		(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;

let Predicates = [IsLE] in {		let Predicates = [IsLE] in {
// We must use ST1 to store vectors in big-endian.		// We must use ST1 to store vectors in big-endian.
def : Pat<(store (v4f32 FPR128:$Rt),		def : Pat<(store (v4f32 FPR128:$Rt),
(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),		(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;		(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;
def : Pat<(store (v2f64 FPR128:$Rt),		def : Pat<(store (v2f64 FPR128:$Rt),
(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),		(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;		(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;
def : Pat<(store (v16i8 FPR128:$Rt),		def : Pat<(store (v16i8 FPR128:$Rt),
(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),		(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;		(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;
def : Pat<(store (v8i16 FPR128:$Rt),		def : Pat<(store (v8i16 FPR128:$Rt),
(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),		(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;		(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;
def : Pat<(store (v4i32 FPR128:$Rt),		def : Pat<(store (v4i32 FPR128:$Rt),
(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),		(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;		(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;
def : Pat<(store (v2i64 FPR128:$Rt),		def : Pat<(store (v2i64 FPR128:$Rt),
(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),		(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;		(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;
def : Pat<(store (v8f16 FPR128:$Rt),		def : Pat<(store (v8f16 FPR128:$Rt),
(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),		(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;		(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;
}		}
def : Pat<(store (f128 FPR128:$Rt),
(am_indexed128 GPR64sp:$Rn, uimm12s16:$offset)),
(STRQui FPR128:$Rt, GPR64sp:$Rn, uimm12s16:$offset)>;

// truncstore i64		// truncstore i64
def : Pat<(truncstorei32 GPR64:$Rt,		def : Pat<(truncstorei32 GPR64:$Rt,
(am_indexed32 GPR64sp:$Rn, uimm12s4:$offset)),		(am_indexed32 GPR64sp:$Rn, uimm12s4:$offset)),
(STRWui (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, uimm12s4:$offset)>;		(STRWui (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, uimm12s4:$offset)>;
def : Pat<(truncstorei16 GPR64:$Rt,		def : Pat<(truncstorei16 GPR64:$Rt,
(am_indexed16 GPR64sp:$Rn, uimm12s2:$offset)),		(am_indexed16 GPR64sp:$Rn, uimm12s2:$offset)),
(STRHHui (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, uimm12s2:$offset)>;		(STRHHui (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, uimm12s2:$offset)>;
def : Pat<(truncstorei8 GPR64:$Rt, (am_indexed8 GPR64sp:$Rn, uimm12s1:$offset)),		def : Pat<(truncstorei8 GPR64:$Rt, (am_indexed8 GPR64sp:$Rn, uimm12s1:$offset)),
(STRBBui (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, uimm12s1:$offset)>;		(STRBBui (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, uimm12s1:$offset)>;

} // AddedComplexity = 10		} // AddedComplexity = 10

		// Match stores from lane 0 to the appropriate subreg's store.
		multiclass VecStoreLane0Pat<Operand UIAddrMode, SDPatternOperator storeop,
		ValueType VTy, ValueType STy,
		SubRegIndex SubRegIdx, Operand IndexType,
		Instruction STR> {
		def : Pat<(storeop (STy (vector_extract (VTy VecListOne128:$Vt), 0)),
		(UIAddrMode GPR64sp:$Rn, IndexType:$offset)),
		(STR (EXTRACT_SUBREG VecListOne128:$Vt, SubRegIdx),
		GPR64sp:$Rn, IndexType:$offset)>;
		}

		let AddedComplexity = 19 in {
		defm : VecStoreLane0Pat<am_indexed16, truncstorei16, v8i16, i32, hsub, uimm12s2, STRHui>;
		defm : VecStoreLane0Pat<am_indexed16, store, v8f16, f16, hsub, uimm12s2, STRHui>;
		defm : VecStoreLane0Pat<am_indexed32, store, v4i32, i32, ssub, uimm12s4, STRSui>;
		defm : VecStoreLane0Pat<am_indexed32, store, v4f32, f32, ssub, uimm12s4, STRSui>;
		defm : VecStoreLane0Pat<am_indexed64, store, v2i64, i64, dsub, uimm12s8, STRDui>;
		defm : VecStoreLane0Pat<am_indexed64, store, v2f64, f64, dsub, uimm12s8, STRDui>;
		}

//---		//---
// (unscaled immediate)		// (unscaled immediate)
defm STURX : StoreUnscaled<0b11, 0, 0b00, GPR64z, "stur",		defm STURX : StoreUnscaled<0b11, 0, 0b00, GPR64z, "stur",
[(store GPR64z:$Rt,		[(store GPR64z:$Rt,
(am_unscaled64 GPR64sp:$Rn, simm9:$offset))]>;		(am_unscaled64 GPR64sp:$Rn, simm9:$offset))]>;
defm STURW : StoreUnscaled<0b10, 0, 0b00, GPR32z, "stur",		defm STURW : StoreUnscaled<0b10, 0, 0b00, GPR32z, "stur",
[(store GPR32z:$Rt,		[(store GPR32z:$Rt,
(am_unscaled32 GPR64sp:$Rn, simm9:$offset))]>;		(am_unscaled32 GPR64sp:$Rn, simm9:$offset))]>;
Show All 15 Lines
defm STURHH : StoreUnscaled<0b01, 0, 0b00, GPR32z, "sturh",		defm STURHH : StoreUnscaled<0b01, 0, 0b00, GPR32z, "sturh",
[(truncstorei16 GPR32z:$Rt,		[(truncstorei16 GPR32z:$Rt,
(am_unscaled16 GPR64sp:$Rn, simm9:$offset))]>;		(am_unscaled16 GPR64sp:$Rn, simm9:$offset))]>;
defm STURBB : StoreUnscaled<0b00, 0, 0b00, GPR32z, "sturb",		defm STURBB : StoreUnscaled<0b00, 0, 0b00, GPR32z, "sturb",
[(truncstorei8 GPR32z:$Rt,		[(truncstorei8 GPR32z:$Rt,
(am_unscaled8 GPR64sp:$Rn, simm9:$offset))]>;		(am_unscaled8 GPR64sp:$Rn, simm9:$offset))]>;

// Match all store 64 bits width whose type is compatible with FPR64		// Match all store 64 bits width whose type is compatible with FPR64
		def : Pat<(store (v1f64 FPR64:$Rt), (am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
		(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;
		def : Pat<(store (v1i64 FPR64:$Rt), (am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
		(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;

		let AddedComplexity = 10 in {

let Predicates = [IsLE] in {		let Predicates = [IsLE] in {
// We must use ST1 to store vectors in big-endian.		// We must use ST1 to store vectors in big-endian.
def : Pat<(store (v2f32 FPR64:$Rt),		def : Pat<(store (v2f32 FPR64:$Rt),
(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(store (v8i8 FPR64:$Rt),		def : Pat<(store (v8i8 FPR64:$Rt),
(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(store (v4i16 FPR64:$Rt),		def : Pat<(store (v4i16 FPR64:$Rt),
(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(store (v2i32 FPR64:$Rt),		def : Pat<(store (v2i32 FPR64:$Rt),
(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(store (v4f16 FPR64:$Rt),		def : Pat<(store (v4f16 FPR64:$Rt),
(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;
}		}
def : Pat<(store (v1f64 FPR64:$Rt), (am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(store (v1i64 FPR64:$Rt), (am_unscaled64 GPR64sp:$Rn, simm9:$offset)),
(STURDi FPR64:$Rt, GPR64sp:$Rn, simm9:$offset)>;

// Match all store 128 bits width whose type is compatible with FPR128		// Match all store 128 bits width whose type is compatible with FPR128
		def : Pat<(store (f128 FPR128:$Rt), (am_unscaled128 GPR64sp:$Rn, simm9:$offset)),
		(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;

let Predicates = [IsLE] in {		let Predicates = [IsLE] in {
// We must use ST1 to store vectors in big-endian.		// We must use ST1 to store vectors in big-endian.
def : Pat<(store (v4f32 FPR128:$Rt),		def : Pat<(store (v4f32 FPR128:$Rt),
(am_unscaled128 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled128 GPR64sp:$Rn, simm9:$offset)),
(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(store (v2f64 FPR128:$Rt),		def : Pat<(store (v2f64 FPR128:$Rt),
(am_unscaled128 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled128 GPR64sp:$Rn, simm9:$offset)),
(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;
Show All 12 Lines	let Predicates = [IsLE] in {
def : Pat<(store (v2f64 FPR128:$Rt),		def : Pat<(store (v2f64 FPR128:$Rt),
(am_unscaled128 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled128 GPR64sp:$Rn, simm9:$offset)),
(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(store (v8f16 FPR128:$Rt),		def : Pat<(store (v8f16 FPR128:$Rt),
(am_unscaled128 GPR64sp:$Rn, simm9:$offset)),		(am_unscaled128 GPR64sp:$Rn, simm9:$offset)),
(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;		(STURQi FPR128:$Rt, GPR64sp:$Rn, simm9:$offset)>;
}		}

		} // AddedComplexity = 10

// unscaled i64 truncating stores		// unscaled i64 truncating stores
def : Pat<(truncstorei32 GPR64:$Rt, (am_unscaled32 GPR64sp:$Rn, simm9:$offset)),		def : Pat<(truncstorei32 GPR64:$Rt, (am_unscaled32 GPR64sp:$Rn, simm9:$offset)),
(STURWi (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, simm9:$offset)>;		(STURWi (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(truncstorei16 GPR64:$Rt, (am_unscaled16 GPR64sp:$Rn, simm9:$offset)),		def : Pat<(truncstorei16 GPR64:$Rt, (am_unscaled16 GPR64sp:$Rn, simm9:$offset)),
(STURHHi (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, simm9:$offset)>;		(STURHHi (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, simm9:$offset)>;
def : Pat<(truncstorei8 GPR64:$Rt, (am_unscaled8 GPR64sp:$Rn, simm9:$offset)),		def : Pat<(truncstorei8 GPR64:$Rt, (am_unscaled8 GPR64sp:$Rn, simm9:$offset)),
(STURBBi (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, simm9:$offset)>;		(STURBBi (EXTRACT_SUBREG GPR64:$Rt, sub_32), GPR64sp:$Rn, simm9:$offset)>;

▲ Show 20 Lines • Show All 1,696 Lines • ▼ Show 20 Lines

def : Pat<(v8i16 (scalar_to_vector GPR32:$Rn)),		def : Pat<(v8i16 (scalar_to_vector GPR32:$Rn)),
(SUBREG_TO_REG (i32 0),		(SUBREG_TO_REG (i32 0),
(f32 (COPY_TO_REGCLASS GPR32:$Rn, FPR32)), ssub)>;		(f32 (COPY_TO_REGCLASS GPR32:$Rn, FPR32)), ssub)>;
def : Pat<(v4i16 (scalar_to_vector GPR32:$Rn)),		def : Pat<(v4i16 (scalar_to_vector GPR32:$Rn)),
(SUBREG_TO_REG (i32 0),		(SUBREG_TO_REG (i32 0),
(f32 (COPY_TO_REGCLASS GPR32:$Rn, FPR32)), ssub)>;		(f32 (COPY_TO_REGCLASS GPR32:$Rn, FPR32)), ssub)>;

		def : Pat<(v4f16 (scalar_to_vector (f16 FPR16:$Rn))),
		(INSERT_SUBREG (v4f16 (IMPLICIT_DEF)), FPR16:$Rn, hsub)>;
		def : Pat<(v8f16 (scalar_to_vector (f16 FPR16:$Rn))),
		(INSERT_SUBREG (v8f16 (IMPLICIT_DEF)), FPR16:$Rn, hsub)>;

def : Pat<(v2i32 (scalar_to_vector (i32 FPR32:$Rn))),		def : Pat<(v2i32 (scalar_to_vector (i32 FPR32:$Rn))),
(v2i32 (INSERT_SUBREG (v2i32 (IMPLICIT_DEF)),		(v2i32 (INSERT_SUBREG (v2i32 (IMPLICIT_DEF)),
(i32 FPR32:$Rn), ssub))>;		(i32 FPR32:$Rn), ssub))>;
def : Pat<(v4i32 (scalar_to_vector (i32 FPR32:$Rn))),		def : Pat<(v4i32 (scalar_to_vector (i32 FPR32:$Rn))),
(v4i32 (INSERT_SUBREG (v4i32 (IMPLICIT_DEF)),		(v4i32 (INSERT_SUBREG (v4i32 (IMPLICIT_DEF)),
(i32 FPR32:$Rn), ssub))>;		(i32 FPR32:$Rn), ssub))>;

def : Pat<(v2i64 (scalar_to_vector (i64 FPR64:$Rn))),		def : Pat<(v2i64 (scalar_to_vector (i64 FPR64:$Rn))),
(v2i64 (INSERT_SUBREG (v2i64 (IMPLICIT_DEF)),		(v2i64 (INSERT_SUBREG (v2i64 (IMPLICIT_DEF)),
(i64 FPR64:$Rn), dsub))>;		(i64 FPR64:$Rn), dsub))>;

def : Pat<(v4f16 (scalar_to_vector (f16 FPR16:$Rn))),		def : Pat<(v4f16 (scalar_to_vector (f16 FPR16:$Rn))),
(INSERT_SUBREG (v4f16 (IMPLICIT_DEF)), FPR16:$Rn, hsub)>;		(INSERT_SUBREG (v4f16 (IMPLICIT_DEF)), FPR16:$Rn, hsub)>;
def : Pat<(v8f16 (scalar_to_vector (f16 FPR16:$Rn))),		def : Pat<(v8f16 (scalar_to_vector (f16 FPR16:$Rn))),
(INSERT_SUBREG (v8f16 (IMPLICIT_DEF)), FPR16:$Rn, hsub)>;		(INSERT_SUBREG (v8f16 (IMPLICIT_DEF)), FPR16:$Rn, hsub)>;

def : Pat<(v4f32 (scalar_to_vector (f32 FPR32:$Rn))),		def : Pat<(v4f32 (scalar_to_vector (f32 FPR32:$Rn))),
(INSERT_SUBREG (v4f32 (IMPLICIT_DEF)), FPR32:$Rn, ssub)>;		(INSERT_SUBREG (v4f32 (IMPLICIT_DEF)), FPR32:$Rn, ssub)>;
def : Pat<(v2f32 (scalar_to_vector (f32 FPR32:$Rn))),		def : Pat<(v2f32 (scalar_to_vector (f32 FPR32:$Rn))),
(INSERT_SUBREG (v2f32 (IMPLICIT_DEF)), FPR32:$Rn, ssub)>;		(INSERT_SUBREG (v2f32 (IMPLICIT_DEF)), FPR32:$Rn, ssub)>;

def : Pat<(v2f64 (scalar_to_vector (f64 FPR64:$Rn))),		def : Pat<(v2f64 (scalar_to_vector (f64 FPR64:$Rn))),
(INSERT_SUBREG (v2f64 (IMPLICIT_DEF)), FPR64:$Rn, dsub)>;		(INSERT_SUBREG (v2f64 (IMPLICIT_DEF)), FPR64:$Rn, dsub)>;

def : Pat<(v4f16 (vector_insert (v4f16 V64:$Rn),		def : Pat<(v4f16 (vector_insert (v4f16 V64:$Rn),
(f16 FPR16:$Rm), (i64 VectorIndexS:$imm))),		(f16 FPR16:$Rm), (i64 VectorIndexS:$imm))),
(EXTRACT_SUBREG		(EXTRACT_SUBREG
(INSvi16lane		(INSvi16lane
(v8f16 (INSERT_SUBREG (v8f16 (IMPLICIT_DEF)), V64:$Rn, dsub)),		(v8f16 (INSERT_SUBREG (v8f16 (IMPLICIT_DEF)), V64:$Rn, dsub)),
▲ Show 20 Lines • Show All 2,146 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/AArch64/arm64-neon-copy.ll

Show First 20 Lines • Show All 919 Lines • ▼ Show 20 Lines	define <4 x i16> @test_extracts_inserts_varidx_extract(<8 x i16> %x, i32 %idx) {
%tmp7 = extractelement <8 x i16> %x, i32 3		%tmp7 = extractelement <8 x i16> %x, i32 3
%tmp8 = insertelement <4 x i16> %tmp6, i16 %tmp7, i32 3		%tmp8 = insertelement <4 x i16> %tmp6, i16 %tmp7, i32 3
ret <4 x i16> %tmp8		ret <4 x i16> %tmp8
}		}

; CHECK-LABEL: test_extracts_inserts_varidx_insert:		; CHECK-LABEL: test_extracts_inserts_varidx_insert:
; CHECK: and [[MASKED_IDX:x[0-9]+]], x0, #0x3		; CHECK: and [[MASKED_IDX:x[0-9]+]], x0, #0x3
; CHECK: bfi x9, [[MASKED_IDX]], #1, #2		; CHECK: bfi x9, [[MASKED_IDX]], #1, #2
; CHECK: st1 { v0.h }[0], [x9]		; CHECK: str h0, [x9]
; CHECK-DAG: ldr d[[R:[0-9]+]]		; CHECK-DAG: ldr d[[R:[0-9]+]]
; CHECK-DAG: mov v[[R]].h[1], v0.h[1]		; CHECK-DAG: mov v[[R]].h[1], v0.h[1]
; CHECK-DAG: mov v[[R]].h[2], v0.h[2]		; CHECK-DAG: mov v[[R]].h[2], v0.h[2]
; CHECK-DAG: mov v[[R]].h[3], v0.h[3]		; CHECK-DAG: mov v[[R]].h[3], v0.h[3]
define <4 x i16> @test_extracts_inserts_varidx_insert(<8 x i16> %x, i32 %idx) {		define <4 x i16> @test_extracts_inserts_varidx_insert(<8 x i16> %x, i32 %idx) {
%tmp = extractelement <8 x i16> %x, i32 0		%tmp = extractelement <8 x i16> %x, i32 0
%tmp2 = insertelement <4 x i16> undef, i16 %tmp, i32 %idx		%tmp2 = insertelement <4 x i16> undef, i16 %tmp, i32 %idx
%tmp3 = extractelement <8 x i16> %x, i32 1		%tmp3 = extractelement <8 x i16> %x, i32 1
▲ Show 20 Lines • Show All 548 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/AArch64/arm64-neon-simd-ldst-one.ll

	Show First 20 Lines • Show All 385 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: test_vst1q_lane_s16:			; CHECK-LABEL: test_vst1q_lane_s16:
	; CHECK: st1 { {{v[0-9]+}}.h }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.h }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <8 x i16> %b, i32 7			%0 = extractelement <8 x i16> %b, i32 7
	store i16 %0, i16* %a, align 2			store i16 %0, i16* %a, align 2
	ret void			ret void
	}			}

				define void @test_vst1q_lane0_s16(i16* %a, <8 x i16> %b) {
				; CHECK-LABEL: test_vst1q_lane0_s16:
				; CHECK: str {{h[0-9]+}}, [x0]
				entry:
				%0 = extractelement <8 x i16> %b, i32 0
				store i16 %0, i16* %a, align 2
				ret void
				}

	define void @test_vst1q_lane_s32(i32* %a, <4 x i32> %b) {			define void @test_vst1q_lane_s32(i32* %a, <4 x i32> %b) {
	; CHECK-LABEL: test_vst1q_lane_s32:			; CHECK-LABEL: test_vst1q_lane_s32:
	; CHECK: st1 { {{v[0-9]+}}.s }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.s }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <4 x i32> %b, i32 3			%0 = extractelement <4 x i32> %b, i32 3
	store i32 %0, i32* %a, align 4			store i32 %0, i32* %a, align 4
	ret void			ret void
	}			}

				define void @test_vst1q_lane0_s32(i32* %a, <4 x i32> %b) {
				; CHECK-LABEL: test_vst1q_lane0_s32:
				; CHECK: str {{s[0-9]+}}, [x0]
				entry:
				%0 = extractelement <4 x i32> %b, i32 0
				store i32 %0, i32* %a, align 4
				ret void
				}

	define void @test_vst1q_lane_s64(i64* %a, <2 x i64> %b) {			define void @test_vst1q_lane_s64(i64* %a, <2 x i64> %b) {
	; CHECK-LABEL: test_vst1q_lane_s64:			; CHECK-LABEL: test_vst1q_lane_s64:
	; CHECK: st1 { {{v[0-9]+}}.d }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.d }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <2 x i64> %b, i32 1			%0 = extractelement <2 x i64> %b, i32 1
	store i64 %0, i64* %a, align 8			store i64 %0, i64* %a, align 8
	ret void			ret void
	}			}

				define void @test_vst1q_lane0_s64(i64* %a, <2 x i64> %b) {
				; CHECK-LABEL: test_vst1q_lane0_s64:
				; CHECK: str {{d[0-9]+}}, [x0]
				entry:
				%0 = extractelement <2 x i64> %b, i32 0
				store i64 %0, i64* %a, align 8
				ret void
				}

	define void @test_vst1q_lane_f32(float* %a, <4 x float> %b) {			define void @test_vst1q_lane_f32(float* %a, <4 x float> %b) {
	; CHECK-LABEL: test_vst1q_lane_f32:			; CHECK-LABEL: test_vst1q_lane_f32:
	; CHECK: st1 { {{v[0-9]+}}.s }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.s }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <4 x float> %b, i32 3			%0 = extractelement <4 x float> %b, i32 3
	store float %0, float* %a, align 4			store float %0, float* %a, align 4
	ret void			ret void
	}			}

				define void @test_vst1q_lane0_f32(float* %a, <4 x float> %b) {
				; CHECK-LABEL: test_vst1q_lane0_f32:
				; CHECK: str {{s[0-9]+}}, [x0]
				entry:
				%0 = extractelement <4 x float> %b, i32 0
				store float %0, float* %a, align 4
				ret void
				}

	define void @test_vst1q_lane_f64(double* %a, <2 x double> %b) {			define void @test_vst1q_lane_f64(double* %a, <2 x double> %b) {
	; CHECK-LABEL: test_vst1q_lane_f64:			; CHECK-LABEL: test_vst1q_lane_f64:
	; CHECK: st1 { {{v[0-9]+}}.d }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.d }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <2 x double> %b, i32 1			%0 = extractelement <2 x double> %b, i32 1
	store double %0, double* %a, align 8			store double %0, double* %a, align 8
	ret void			ret void
	}			}

				define void @test_vst1q_lane0_f64(double* %a, <2 x double> %b) {
				; CHECK-LABEL: test_vst1q_lane0_f64:
				; CHECK: str {{d[0-9]+}}, [x0]
				entry:
				%0 = extractelement <2 x double> %b, i32 0
				store double %0, double* %a, align 8
				ret void
				}

	define void @test_vst1_lane_s8(i8* %a, <8 x i8> %b) {			define void @test_vst1_lane_s8(i8* %a, <8 x i8> %b) {
	; CHECK-LABEL: test_vst1_lane_s8:			; CHECK-LABEL: test_vst1_lane_s8:
	; CHECK: st1 { {{v[0-9]+}}.b }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.b }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <8 x i8> %b, i32 7			%0 = extractelement <8 x i8> %b, i32 7
	store i8 %0, i8* %a, align 1			store i8 %0, i8* %a, align 1
	ret void			ret void
	}			}

	define void @test_vst1_lane_s16(i16* %a, <4 x i16> %b) {			define void @test_vst1_lane_s16(i16* %a, <4 x i16> %b) {
	; CHECK-LABEL: test_vst1_lane_s16:			; CHECK-LABEL: test_vst1_lane_s16:
	; CHECK: st1 { {{v[0-9]+}}.h }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.h }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <4 x i16> %b, i32 3			%0 = extractelement <4 x i16> %b, i32 3
	store i16 %0, i16* %a, align 2			store i16 %0, i16* %a, align 2
	ret void			ret void
	}			}

				define void @test_vst1_lane0_s16(i16* %a, <4 x i16> %b) {
				; CHECK-LABEL: test_vst1_lane0_s16:
				; CHECK: str {{h[0-9]+}}, [x0]
				entry:
				%0 = extractelement <4 x i16> %b, i32 0
				store i16 %0, i16* %a, align 2
				ret void
				}

	define void @test_vst1_lane_s32(i32* %a, <2 x i32> %b) {			define void @test_vst1_lane_s32(i32* %a, <2 x i32> %b) {
	; CHECK-LABEL: test_vst1_lane_s32:			; CHECK-LABEL: test_vst1_lane_s32:
	; CHECK: st1 { {{v[0-9]+}}.s }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.s }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <2 x i32> %b, i32 1			%0 = extractelement <2 x i32> %b, i32 1
	store i32 %0, i32* %a, align 4			store i32 %0, i32* %a, align 4
	ret void			ret void
	}			}

				define void @test_vst1_lane0_s32(i32* %a, <2 x i32> %b) {
				; CHECK-LABEL: test_vst1_lane0_s32:
				; CHECK: str {{s[0-9]+}}, [x0]
				entry:
				%0 = extractelement <2 x i32> %b, i32 0
				store i32 %0, i32* %a, align 4
				ret void
				}

	define void @test_vst1_lane_s64(i64* %a, <1 x i64> %b) {			define void @test_vst1_lane_s64(i64* %a, <1 x i64> %b) {
	; CHECK-LABEL: test_vst1_lane_s64:			; CHECK-LABEL: test_vst1_lane_s64:
	; CHECK: st1 { {{v[0-9]+}}.d }[{{[0-9]+}}], [x0]			; CHECK: str {{d[0-9]+}}, [x0]
	entry:			entry:
	%0 = extractelement <1 x i64> %b, i32 0			%0 = extractelement <1 x i64> %b, i32 0
	store i64 %0, i64* %a, align 8			store i64 %0, i64* %a, align 8
	ret void			ret void
	}			}

	define void @test_vst1_lane_f32(float* %a, <2 x float> %b) {			define void @test_vst1_lane_f32(float* %a, <2 x float> %b) {
	; CHECK-LABEL: test_vst1_lane_f32:			; CHECK-LABEL: test_vst1_lane_f32:
	; CHECK: st1 { {{v[0-9]+}}.s }[{{[0-9]+}}], [x0]			; CHECK: st1 { {{v[0-9]+}}.s }[{{[0-9]+}}], [x0]
	entry:			entry:
	%0 = extractelement <2 x float> %b, i32 1			%0 = extractelement <2 x float> %b, i32 1
	store float %0, float* %a, align 4			store float %0, float* %a, align 4
	ret void			ret void
	}			}

				define void @test_vst1_lane0_f32(float* %a, <2 x float> %b) {
				; CHECK-LABEL: test_vst1_lane0_f32:
				; CHECK: str {{s[0-9]+}}, [x0]
				entry:
				%0 = extractelement <2 x float> %b, i32 0
				store float %0, float* %a, align 4
				ret void
				}

	define void @test_vst1_lane_f64(double* %a, <1 x double> %b) {			define void @test_vst1_lane_f64(double* %a, <1 x double> %b) {
	; CHECK-LABEL: test_vst1_lane_f64:			; CHECK-LABEL: test_vst1_lane_f64:
	; CHECK: str {{d[0-9]+}}, [x0]			; CHECK: str {{d[0-9]+}}, [x0]
	entry:			entry:
	%0 = extractelement <1 x double> %b, i32 0			%0 = extractelement <1 x double> %b, i32 0
	store double %0, double* %a, align 8			store double %0, double* %a, align 8
	ret void			ret void
	}			}

llvm/trunk/test/CodeGen/AArch64/arm64-st1.ll

	; RUN: llc < %s -mtriple=arm64-eabi -aarch64-neon-syntax=apple -verify-machineinstrs \| FileCheck %s			; RUN: llc < %s -mtriple=arm64-eabi -aarch64-neon-syntax=apple -verify-machineinstrs \| FileCheck %s
	; RUN: llc < %s -mtriple=arm64-eabi -aarch64-neon-syntax=apple -verify-machineinstrs -mcpu=exynos-m1 \| FileCheck --check-prefix=EXYNOS %s			; RUN: llc < %s -mtriple=arm64-eabi -aarch64-neon-syntax=apple -verify-machineinstrs -mcpu=exynos-m1 \| FileCheck --check-prefix=EXYNOS %s
	; The instruction latencies of Exynos-M1 trigger the transform we see under the Exynos check.			; The instruction latencies of Exynos-M1 trigger the transform we see under the Exynos check.

	define void @st1lane_16b(<16 x i8> %A, i8* %D) {			define void @st1lane_16b(<16 x i8> %A, i8* %D) {
	; CHECK-LABEL: st1lane_16b			; CHECK-LABEL: st1lane_16b
	; CHECK: st1.b			; CHECK: st1.b
	%tmp = extractelement <16 x i8> %A, i32 1			%tmp = extractelement <16 x i8> %A, i32 1
	store i8 %tmp, i8* %D			store i8 %tmp, i8* %D
	ret void			ret void
	}			}

				define void @st1lane0_16b(<16 x i8> %A, i8* %D) {
				; CHECK-LABEL: st1lane0_16b
				; CHECK: st1.b
				%tmp = extractelement <16 x i8> %A, i32 0
				store i8 %tmp, i8* %D
				ret void
				}

				define void @st1lane0u_16b(<16 x i8> %A, i8* %D) {
				; CHECK-LABEL: st1lane0u_16b
				; CHECK: st1.b
				%ptr = getelementptr i8, i8* %D, i64 -1
				%tmp = extractelement <16 x i8> %A, i32 0
				store i8 %tmp, i8* %ptr
				ret void
				}

	define void @st1lane_ro_16b(<16 x i8> %A, i8* %D, i64 %offset) {			define void @st1lane_ro_16b(<16 x i8> %A, i8* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_16b			; CHECK-LABEL: st1lane_ro_16b
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.b { v0 }[1], [x[[XREG]]]			; CHECK: st1.b { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr i8, i8* %D, i64 %offset			%ptr = getelementptr i8, i8* %D, i64 %offset
	%tmp = extractelement <16 x i8> %A, i32 1			%tmp = extractelement <16 x i8> %A, i32 1
	store i8 %tmp, i8* %ptr			store i8 %tmp, i8* %ptr
	ret void			ret void
	Show All 12 Lines
	define void @st1lane_8h(<8 x i16> %A, i16* %D) {			define void @st1lane_8h(<8 x i16> %A, i16* %D) {
	; CHECK-LABEL: st1lane_8h			; CHECK-LABEL: st1lane_8h
	; CHECK: st1.h			; CHECK: st1.h
	%tmp = extractelement <8 x i16> %A, i32 1			%tmp = extractelement <8 x i16> %A, i32 1
	store i16 %tmp, i16* %D			store i16 %tmp, i16* %D
	ret void			ret void
	}			}

				define void @st1lane0_8h(<8 x i16> %A, i16* %D) {
				; CHECK-LABEL: st1lane0_8h
				; CHECK: str
				%tmp = extractelement <8 x i16> %A, i32 0
				store i16 %tmp, i16* %D
				ret void
				}

				define void @st1lane0u_8h(<8 x i16> %A, i16* %D) {
				; CHECK-LABEL: st1lane0u_8h
				; CHECK: st1.h
				%ptr = getelementptr i16, i16* %D, i64 -1
				%tmp = extractelement <8 x i16> %A, i32 0
				store i16 %tmp, i16* %ptr
				ret void
				}

	define void @st1lane_ro_8h(<8 x i16> %A, i16* %D, i64 %offset) {			define void @st1lane_ro_8h(<8 x i16> %A, i16* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_8h			; CHECK-LABEL: st1lane_ro_8h
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.h { v0 }[1], [x[[XREG]]]			; CHECK: st1.h { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr i16, i16* %D, i64 %offset			%ptr = getelementptr i16, i16* %D, i64 %offset
	%tmp = extractelement <8 x i16> %A, i32 1			%tmp = extractelement <8 x i16> %A, i32 1
	store i16 %tmp, i16* %ptr			store i16 %tmp, i16* %ptr
	ret void			ret void
	Show All 11 Lines
	define void @st1lane_4s(<4 x i32> %A, i32* %D) {			define void @st1lane_4s(<4 x i32> %A, i32* %D) {
	; CHECK-LABEL: st1lane_4s			; CHECK-LABEL: st1lane_4s
	; CHECK: st1.s			; CHECK: st1.s
	%tmp = extractelement <4 x i32> %A, i32 1			%tmp = extractelement <4 x i32> %A, i32 1
	store i32 %tmp, i32* %D			store i32 %tmp, i32* %D
	ret void			ret void
	}			}

				define void @st1lane0_4s(<4 x i32> %A, i32* %D) {
				; CHECK-LABEL: st1lane0_4s
				; CHECK: str
				%tmp = extractelement <4 x i32> %A, i32 0
				store i32 %tmp, i32* %D
				ret void
				}

				define void @st1lane0u_4s(<4 x i32> %A, i32* %D) {
				; CHECK-LABEL: st1lane0u_4s
				; CHECK: st1.s
				%ptr = getelementptr i32, i32* %D, i64 -1
				%tmp = extractelement <4 x i32> %A, i32 0
				store i32 %tmp, i32* %ptr
				ret void
				}

	define void @st1lane_ro_4s(<4 x i32> %A, i32* %D, i64 %offset) {			define void @st1lane_ro_4s(<4 x i32> %A, i32* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_4s			; CHECK-LABEL: st1lane_ro_4s
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.s { v0 }[1], [x[[XREG]]]			; CHECK: st1.s { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr i32, i32* %D, i64 %offset			%ptr = getelementptr i32, i32* %D, i64 %offset
	%tmp = extractelement <4 x i32> %A, i32 1			%tmp = extractelement <4 x i32> %A, i32 1
	store i32 %tmp, i32* %ptr			store i32 %tmp, i32* %ptr
	ret void			ret void
	Show All 11 Lines
	define void @st1lane_4s_float(<4 x float> %A, float* %D) {			define void @st1lane_4s_float(<4 x float> %A, float* %D) {
	; CHECK-LABEL: st1lane_4s_float			; CHECK-LABEL: st1lane_4s_float
	; CHECK: st1.s			; CHECK: st1.s
	%tmp = extractelement <4 x float> %A, i32 1			%tmp = extractelement <4 x float> %A, i32 1
	store float %tmp, float* %D			store float %tmp, float* %D
	ret void			ret void
	}			}

				define void @st1lane0_4s_float(<4 x float> %A, float* %D) {
				; CHECK-LABEL: st1lane0_4s_float
				; CHECK: str
				%tmp = extractelement <4 x float> %A, i32 0
				store float %tmp, float* %D
				ret void
				}

				define void @st1lane0u_4s_float(<4 x float> %A, float* %D) {
				; CHECK-LABEL: st1lane0u_4s_float
				; CHECK: st1.s
				%ptr = getelementptr float, float* %D, i64 -1
				%tmp = extractelement <4 x float> %A, i32 0
				store float %tmp, float* %ptr
				ret void
				}

	define void @st1lane_ro_4s_float(<4 x float> %A, float* %D, i64 %offset) {			define void @st1lane_ro_4s_float(<4 x float> %A, float* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_4s_float			; CHECK-LABEL: st1lane_ro_4s_float
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.s { v0 }[1], [x[[XREG]]]			; CHECK: st1.s { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr float, float* %D, i64 %offset			%ptr = getelementptr float, float* %D, i64 %offset
	%tmp = extractelement <4 x float> %A, i32 1			%tmp = extractelement <4 x float> %A, i32 1
	store float %tmp, float* %ptr			store float %tmp, float* %ptr
	ret void			ret void
	Show All 11 Lines
	define void @st1lane_2d(<2 x i64> %A, i64* %D) {			define void @st1lane_2d(<2 x i64> %A, i64* %D) {
	; CHECK-LABEL: st1lane_2d			; CHECK-LABEL: st1lane_2d
	; CHECK: st1.d			; CHECK: st1.d
	%tmp = extractelement <2 x i64> %A, i32 1			%tmp = extractelement <2 x i64> %A, i32 1
	store i64 %tmp, i64* %D			store i64 %tmp, i64* %D
	ret void			ret void
	}			}

				define void @st1lane0_2d(<2 x i64> %A, i64* %D) {
				; CHECK-LABEL: st1lane0_2d
				; CHECK: str
				%tmp = extractelement <2 x i64> %A, i32 0
				store i64 %tmp, i64* %D
				ret void
				}

				define void @st1lane0u_2d(<2 x i64> %A, i64* %D) {
				; CHECK-LABEL: st1lane0u_2d
				; CHECK: st1.d
				%ptr = getelementptr i64, i64* %D, i64 -1
				%tmp = extractelement <2 x i64> %A, i32 0
				store i64 %tmp, i64* %ptr
				ret void
				}

	define void @st1lane_ro_2d(<2 x i64> %A, i64* %D, i64 %offset) {			define void @st1lane_ro_2d(<2 x i64> %A, i64* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_2d			; CHECK-LABEL: st1lane_ro_2d
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.d { v0 }[1], [x[[XREG]]]			; CHECK: st1.d { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr i64, i64* %D, i64 %offset			%ptr = getelementptr i64, i64* %D, i64 %offset
	%tmp = extractelement <2 x i64> %A, i32 1			%tmp = extractelement <2 x i64> %A, i32 1
	store i64 %tmp, i64* %ptr			store i64 %tmp, i64* %ptr
	ret void			ret void
	Show All 11 Lines
	define void @st1lane_2d_double(<2 x double> %A, double* %D) {			define void @st1lane_2d_double(<2 x double> %A, double* %D) {
	; CHECK-LABEL: st1lane_2d_double			; CHECK-LABEL: st1lane_2d_double
	; CHECK: st1.d			; CHECK: st1.d
	%tmp = extractelement <2 x double> %A, i32 1			%tmp = extractelement <2 x double> %A, i32 1
	store double %tmp, double* %D			store double %tmp, double* %D
	ret void			ret void
	}			}

				define void @st1lane0_2d_double(<2 x double> %A, double* %D) {
				; CHECK-LABEL: st1lane0_2d_double
				; CHECK: str
				%tmp = extractelement <2 x double> %A, i32 0
				store double %tmp, double* %D
				ret void
				}

				define void @st1lane0u_2d_double(<2 x double> %A, double* %D) {
				; CHECK-LABEL: st1lane0u_2d_double
				; CHECK: st1.d
				%ptr = getelementptr double, double* %D, i64 -1
				%tmp = extractelement <2 x double> %A, i32 0
				store double %tmp, double* %ptr
				ret void
				}

	define void @st1lane_ro_2d_double(<2 x double> %A, double* %D, i64 %offset) {			define void @st1lane_ro_2d_double(<2 x double> %A, double* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_2d_double			; CHECK-LABEL: st1lane_ro_2d_double
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.d { v0 }[1], [x[[XREG]]]			; CHECK: st1.d { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr double, double* %D, i64 %offset			%ptr = getelementptr double, double* %D, i64 %offset
	%tmp = extractelement <2 x double> %A, i32 1			%tmp = extractelement <2 x double> %A, i32 1
	store double %tmp, double* %ptr			store double %tmp, double* %ptr
	ret void			ret void
	Show All 39 Lines
	define void @st1lane_4h(<4 x i16> %A, i16* %D) {			define void @st1lane_4h(<4 x i16> %A, i16* %D) {
	; CHECK-LABEL: st1lane_4h			; CHECK-LABEL: st1lane_4h
	; CHECK: st1.h			; CHECK: st1.h
	%tmp = extractelement <4 x i16> %A, i32 1			%tmp = extractelement <4 x i16> %A, i32 1
	store i16 %tmp, i16* %D			store i16 %tmp, i16* %D
	ret void			ret void
	}			}

				define void @st1lane0_4h(<4 x i16> %A, i16* %D) {
				; CHECK-LABEL: st1lane0_4h
				; CHECK: str
				%tmp = extractelement <4 x i16> %A, i32 0
				store i16 %tmp, i16* %D
				ret void
				}

				define void @st1lane0u_4h(<4 x i16> %A, i16* %D) {
				; CHECK-LABEL: st1lane0u_4h
				; CHECK: st1.h
				%ptr = getelementptr i16, i16* %D, i64 -1
				%tmp = extractelement <4 x i16> %A, i32 0
				store i16 %tmp, i16* %ptr
				ret void
				}

	define void @st1lane_ro_4h(<4 x i16> %A, i16* %D, i64 %offset) {			define void @st1lane_ro_4h(<4 x i16> %A, i16* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_4h			; CHECK-LABEL: st1lane_ro_4h
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.h { v0 }[1], [x[[XREG]]]			; CHECK: st1.h { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr i16, i16* %D, i64 %offset			%ptr = getelementptr i16, i16* %D, i64 %offset
	%tmp = extractelement <4 x i16> %A, i32 1			%tmp = extractelement <4 x i16> %A, i32 1
	store i16 %tmp, i16* %ptr			store i16 %tmp, i16* %ptr
	ret void			ret void
	Show All 11 Lines
	define void @st1lane_2s(<2 x i32> %A, i32* %D) {			define void @st1lane_2s(<2 x i32> %A, i32* %D) {
	; CHECK-LABEL: st1lane_2s			; CHECK-LABEL: st1lane_2s
	; CHECK: st1.s			; CHECK: st1.s
	%tmp = extractelement <2 x i32> %A, i32 1			%tmp = extractelement <2 x i32> %A, i32 1
	store i32 %tmp, i32* %D			store i32 %tmp, i32* %D
	ret void			ret void
	}			}

				define void @st1lane0_2s(<2 x i32> %A, i32* %D) {
				; CHECK-LABEL: st1lane0_2s
				; CHECK: str
				%tmp = extractelement <2 x i32> %A, i32 0
				store i32 %tmp, i32* %D
				ret void
				}

				define void @st1lane0u_2s(<2 x i32> %A, i32* %D) {
				; CHECK-LABEL: st1lane0u_2s
				; CHECK: st1.s
				%ptr = getelementptr i32, i32* %D, i64 -1
				%tmp = extractelement <2 x i32> %A, i32 0
				store i32 %tmp, i32* %ptr
				ret void
				}

	define void @st1lane_ro_2s(<2 x i32> %A, i32* %D, i64 %offset) {			define void @st1lane_ro_2s(<2 x i32> %A, i32* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_2s			; CHECK-LABEL: st1lane_ro_2s
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.s { v0 }[1], [x[[XREG]]]			; CHECK: st1.s { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr i32, i32* %D, i64 %offset			%ptr = getelementptr i32, i32* %D, i64 %offset
	%tmp = extractelement <2 x i32> %A, i32 1			%tmp = extractelement <2 x i32> %A, i32 1
	store i32 %tmp, i32* %ptr			store i32 %tmp, i32* %ptr
	ret void			ret void
	Show All 11 Lines
	define void @st1lane_2s_float(<2 x float> %A, float* %D) {			define void @st1lane_2s_float(<2 x float> %A, float* %D) {
	; CHECK-LABEL: st1lane_2s_float			; CHECK-LABEL: st1lane_2s_float
	; CHECK: st1.s			; CHECK: st1.s
	%tmp = extractelement <2 x float> %A, i32 1			%tmp = extractelement <2 x float> %A, i32 1
	store float %tmp, float* %D			store float %tmp, float* %D
	ret void			ret void
	}			}

				define void @st1lane0_2s_float(<2 x float> %A, float* %D) {
				; CHECK-LABEL: st1lane0_2s_float
				; CHECK: str
				%tmp = extractelement <2 x float> %A, i32 0
				store float %tmp, float* %D
				ret void
				}

				define void @st1lane0u_2s_float(<2 x float> %A, float* %D) {
				; CHECK-LABEL: st1lane0u_2s_float
				; CHECK: st1.s
				%ptr = getelementptr float, float* %D, i64 -1
				%tmp = extractelement <2 x float> %A, i32 0
				store float %tmp, float* %ptr
				ret void
				}

	define void @st1lane_ro_2s_float(<2 x float> %A, float* %D, i64 %offset) {			define void @st1lane_ro_2s_float(<2 x float> %A, float* %D, i64 %offset) {
	; CHECK-LABEL: st1lane_ro_2s_float			; CHECK-LABEL: st1lane_ro_2s_float
	; CHECK: add x[[XREG:[0-9]+]], x0, x1			; CHECK: add x[[XREG:[0-9]+]], x0, x1
	; CHECK: st1.s { v0 }[1], [x[[XREG]]]			; CHECK: st1.s { v0 }[1], [x[[XREG]]]
	%ptr = getelementptr float, float* %D, i64 %offset			%ptr = getelementptr float, float* %D, i64 %offset
	%tmp = extractelement <2 x float> %A, i32 1			%tmp = extractelement <2 x float> %A, i32 1
	store float %tmp, float* %ptr			store float %tmp, float* %ptr
	ret void			ret void
	}			}

	define void @st1lane0_ro_2s_float(<2 x float> %A, float* %D, i64 %offset) {			define void @st1lane0_ro_2s_float(<2 x float> %A, float* %D, i64 %offset) {
	; CHECK-LABEL: st1lane0_ro_2s_float			; CHECK-LABEL: st1lane0_ro_2s_float
	; CHECK: str s0, [x0, x1, lsl #2]			; CHECK: str s0, [x0, x1, lsl #2]
	%ptr = getelementptr float, float* %D, i64 %offset			%ptr = getelementptr float, float* %D, i64 %offset
	%tmp = extractelement <2 x float> %A, i32 0			%tmp = extractelement <2 x float> %A, i32 0
	store float %tmp, float* %ptr			store float %tmp, float* %ptr
	ret void			ret void
	}			}

				define void @st1lane0_1d(<1 x i64> %A, i64* %D) {
				; CHECK-LABEL: st1lane0_1d
				; CHECK: str
				%tmp = extractelement <1 x i64> %A, i32 0
				store i64 %tmp, i64* %D
				ret void
				}

				define void @st1lane0u_1d(<1 x i64> %A, i64* %D) {
				; CHECK-LABEL: st1lane0u_1d
				; CHECK: st1.d
				%ptr = getelementptr i64, i64* %D, i64 -1
				%tmp = extractelement <1 x i64> %A, i32 0
				store i64 %tmp, i64* %ptr
				ret void
				}

				define void @st1lane0_ro_1d(<1 x i64> %A, i64* %D, i64 %offset) {
				; CHECK-LABEL: st1lane0_ro_1d
				; CHECK: str d0, [x0, x1, lsl #3]
				%ptr = getelementptr i64, i64* %D, i64 %offset
				%tmp = extractelement <1 x i64> %A, i32 0
				store i64 %tmp, i64* %ptr
				ret void
				}

				define void @st1lane0_1d_double(<1 x double> %A, double* %D) {
				; CHECK-LABEL: st1lane0_1d_double
				; CHECK: str
				%tmp = extractelement <1 x double> %A, i32 0
				store double %tmp, double* %D
				ret void
				}

				define void @st1lane0u_1d_double(<1 x double> %A, double* %D) {
				; CHECK-LABEL: st1lane0u_1d_double
				; CHECK: stur
				%ptr = getelementptr double, double* %D, i64 -1
				%tmp = extractelement <1 x double> %A, i32 0
				store double %tmp, double* %ptr
				ret void
				}

				define void @st1lane0_ro_1d_double(<1 x double> %A, double* %D, i64 %offset) {
				; CHECK-LABEL: st1lane0_ro_1d_double
				; CHECK: str d0, [x0, x1, lsl #3]
				%ptr = getelementptr double, double* %D, i64 %offset
				%tmp = extractelement <1 x double> %A, i32 0
				store double %tmp, double* %ptr
				ret void
				}

	define void @st2lane_16b(<16 x i8> %A, <16 x i8> %B, i8* %D) {			define void @st2lane_16b(<16 x i8> %A, <16 x i8> %B, i8* %D) {
	; CHECK-LABEL: st2lane_16b			; CHECK-LABEL: st2lane_16b
	; CHECK: st2.b			; CHECK: st2.b
	call void @llvm.aarch64.neon.st2lane.v16i8.p0i8(<16 x i8> %A, <16 x i8> %B, i64 1, i8* %D)			call void @llvm.aarch64.neon.st2lane.v16i8.p0i8(<16 x i8> %A, <16 x i8> %B, i64 1, i8* %D)
	ret void			ret void
	}			}

	define void @st2lane_8h(<8 x i16> %A, <8 x i16> %B, i16* %D) {			define void @st2lane_8h(<8 x i16> %A, <8 x i16> %B, i16* %D) {
	▲ Show 20 Lines • Show All 692 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/AArch64/fp16-vector-load-store.ll

	Show First 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: store_lane_64:			; CHECK-LABEL: store_lane_64:
	; CHECK: st1 { v0.h }[2], [x0]			; CHECK: st1 { v0.h }[2], [x0]
	entry:			entry:
	%0 = extractelement <4 x half> %b, i32 2			%0 = extractelement <4 x half> %b, i32 2
	store half %0, half* %a, align 2			store half %0, half* %a, align 2
	ret void			ret void
	}			}

				define void @store_lane0_64(half* nocapture %a, <4 x half> %b) #1 {
				; CHECK-LABEL: store_lane0_64:
				; CHECK: str h0, [x0]
				entry:
				%0 = extractelement <4 x half> %b, i32 0
				store half %0, half* %a, align 2
				ret void
				}

				define void @storeu_lane0_64(half* nocapture %a, <4 x half> %b) #1 {
				; CHECK-LABEL: storeu_lane0_64:
				; CHECK: st1 { v0.h }[0], [x{{[0-9]+}}]
				entry:
				%0 = getelementptr half, half* %a, i64 -1
				%1 = extractelement <4 x half> %b, i32 0
				store half %1, half* %0, align 2
				ret void
				}

				define void @storero_lane_64(half* nocapture %a, <4 x half> %b, i64 %c) #1 {
				; CHECK-LABEL: storero_lane_64:
				; CHECK: st1 { v0.h }[2], [x{{[0-9]+}}]
				entry:
				%0 = getelementptr half, half* %a, i64 %c
				%1 = extractelement <4 x half> %b, i32 2
				store half %1, half* %0, align 2
				ret void
				}

				define void @storero_lane0_64(half* nocapture %a, <4 x half> %b, i64 %c) #1 {
				; CHECK-LABEL: storero_lane0_64:
				; CHECK: str h0, [x0, x1, lsl #1]
				entry:
				%0 = getelementptr half, half* %a, i64 %c
				%1 = extractelement <4 x half> %b, i32 0
				store half %1, half* %0, align 2
				ret void
				}

	; Store from one lane of v8f16			; Store from one lane of v8f16
	define void @store_lane_128(half* nocapture %a, <8 x half> %b) #1 {			define void @store_lane_128(half* nocapture %a, <8 x half> %b) #1 {
	; CHECK-LABEL: store_lane_128:			; CHECK-LABEL: store_lane_128:
	; CHECK: st1 { v0.h }[5], [x0]			; CHECK: st1 { v0.h }[5], [x0]
	entry:			entry:
	%0 = extractelement <8 x half> %b, i32 5			%0 = extractelement <8 x half> %b, i32 5
	store half %0, half* %a, align 2			store half %0, half* %a, align 2
	ret void			ret void
	}			}

				define void @store_lane0_128(half* nocapture %a, <8 x half> %b) #1 {
				; CHECK-LABEL: store_lane0_128:
				; CHECK: str h0, [x0]
				entry:
				%0 = extractelement <8 x half> %b, i32 0
				store half %0, half* %a, align 2
				ret void
				}

				define void @storeu_lane0_128(half* nocapture %a, <8 x half> %b) #1 {
				; CHECK-LABEL: storeu_lane0_128:
				; CHECK: st1 { v0.h }[0], [x{{[0-9]+}}]
				entry:
				%0 = getelementptr half, half* %a, i64 -1
				%1 = extractelement <8 x half> %b, i32 0
				store half %1, half* %0, align 2
				ret void
				}

				define void @storero_lane_128(half* nocapture %a, <8 x half> %b, i64 %c) #1 {
				; CHECK-LABEL: storero_lane_128:
				; CHECK: st1 { v0.h }[4], [x{{[0-9]+}}]
				entry:
				%0 = getelementptr half, half* %a, i64 %c
				%1 = extractelement <8 x half> %b, i32 4
				store half %1, half* %0, align 2
				ret void
				}

				define void @storero_lane0_128(half* nocapture %a, <8 x half> %b, i64 %c) #1 {
				; CHECK-LABEL: storero_lane0_128:
				; CHECK: str h0, [x0, x1, lsl #1]
				entry:
				%0 = getelementptr half, half* %a, i64 %c
				%1 = extractelement <8 x half> %b, i32 0
				store half %1, half* %0, align 2
				ret void
				}

	; NEON intrinsics - (de-)interleaving loads and stores			; NEON intrinsics - (de-)interleaving loads and stores
	declare { <4 x half>, <4 x half> } @llvm.aarch64.neon.ld2.v4f16.p0v4f16(<4 x half>*)			declare { <4 x half>, <4 x half> } @llvm.aarch64.neon.ld2.v4f16.p0v4f16(<4 x half>*)
	declare { <4 x half>, <4 x half>, <4 x half> } @llvm.aarch64.neon.ld3.v4f16.p0v4f16(<4 x half>*)			declare { <4 x half>, <4 x half>, <4 x half> } @llvm.aarch64.neon.ld3.v4f16.p0v4f16(<4 x half>*)
	declare { <4 x half>, <4 x half>, <4 x half>, <4 x half> } @llvm.aarch64.neon.ld4.v4f16.p0v4f16(<4 x half>*)			declare { <4 x half>, <4 x half>, <4 x half>, <4 x half> } @llvm.aarch64.neon.ld4.v4f16.p0v4f16(<4 x half>*)
	declare void @llvm.aarch64.neon.st2.v4f16.p0v4f16(<4 x half>, <4 x half>, <4 x half>*)			declare void @llvm.aarch64.neon.st2.v4f16.p0v4f16(<4 x half>, <4 x half>, <4 x half>*)
	declare void @llvm.aarch64.neon.st3.v4f16.p0v4f16(<4 x half>, <4 x half>, <4 x half>, <4 x half>*)			declare void @llvm.aarch64.neon.st3.v4f16.p0v4f16(<4 x half>, <4 x half>, <4 x half>, <4 x half>*)
	declare void @llvm.aarch64.neon.st4.v4f16.p0v4f16(<4 x half>, <4 x half>, <4 x half>, <4 x half>, <4 x half>*)			declare void @llvm.aarch64.neon.st4.v4f16.p0v4f16(<4 x half>, <4 x half>, <4 x half>, <4 x half>, <4 x half>*)
	declare { <8 x half>, <8 x half> } @llvm.aarch64.neon.ld2.v8f16.p0v8f16(<8 x half>*)			declare { <8 x half>, <8 x half> } @llvm.aarch64.neon.ld2.v8f16.p0v8f16(<8 x half>*)
	▲ Show 20 Lines • Show All 420 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Improve single vector lane stores
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 146619

llvm/trunk/lib/Target/AArch64/AArch64InstrInfo.td

llvm/trunk/test/CodeGen/AArch64/arm64-neon-copy.ll

llvm/trunk/test/CodeGen/AArch64/arm64-neon-simd-ldst-one.ll

llvm/trunk/test/CodeGen/AArch64/arm64-st1.ll

llvm/trunk/test/CodeGen/AArch64/fp16-vector-load-store.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Improve single vector lane storesClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 146619

llvm/trunk/lib/Target/AArch64/AArch64InstrInfo.td

llvm/trunk/test/CodeGen/AArch64/arm64-neon-copy.ll

llvm/trunk/test/CodeGen/AArch64/arm64-neon-simd-ldst-one.ll

llvm/trunk/test/CodeGen/AArch64/arm64-st1.ll

llvm/trunk/test/CodeGen/AArch64/fp16-vector-load-store.ll

[AArch64] Improve single vector lane stores
ClosedPublic