This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Add VLDx/VSTx sched defs for machine-schedulers. NFCI.
ClosedPublic

Authored by javed.absar on May 12 2017, 2:31 AM.

Download Raw Diff

Details

Reviewers

rovka
rengolin

Commits

rGa32e3a1acf67: [ARM] Add VLDx/VSTx sched defs for machine-schedulers. NFCI
rL303717: [ARM] Add VLDx/VSTx sched defs for machine-schedulers. NFCI

Summary

This patch adds missing scheds for Neon VLDx/VSTx instructions.
This will help one write schedulers easier/faster in the future for ARM sub-targets.
Existing models will not affected by this patch.

Diff Detail

Repository: rL LLVM

Event Timeline

javed.absar created this revision.May 12 2017, 2:31 AM

Herald added a subscriber: aemerson. · View Herald TranscriptMay 12 2017, 2:31 AM

Hi Javed,

This is an interesting addition, but without an idea how you're doing to use it, it looks like a lot of changes for not many improvements. Do you have a patch which can show this working on a target-specific basis?

Also, maybe the title should mention VLDx/VSTx, not "generic".

cheers,
--renato

Hi Renato:
Thanks for reviewing. I will soon come back with the use-case, as you suggested.
Best Regards
Javed

Hi Renato.

Here is one use for the sched-defs. I have simplified ARMScheduleR52.td where I found the cpu-specific vldx sched-defs to be equivalent to the generic ones.

The sched definitions provided here for vldx/vstx will help write schedulers quickly and efficiently in general. They wont cover all quirks for specific pipeleines of course.

Hi Javed,

Nice reduction! Do you have a rough idea of how much more we can save in complexity by this patch? For now, I think that one example is reason enough to do it anyway.

Just a small inline comment.

--renato

lib/Target/ARM/ARMScheduleR52.td
838 ↗	(On Diff #99805)	Why not the same for VSTx?

Hi Renato:
It depends a bit on how much 'special features' the sub-target pipeline has. In some cases, just defining WriteRes to associate resource and latency etc with each SchedWrite type could suffice (e.g. for the Cortex-R52 the default WriteVLDx is sufficient).

For VSTx, unfortunately you will notice that things are bit different - e.g. R52Read_F2 which has a ReadAdvance of +2 and the default Sched in ARMInstrNEON.td does not capture it.
One could annotate further SchedRead types in ARMInstrNEON.td to capture this, but I think that would make it unnecessarily too detailed there.
Best Regards
--Javed

Ok, I think it's good as it is. Looking forward to more patches in this area. :)

--renato

This revision is now accepted and ready to land.May 23 2017, 9:08 AM

Closed by commit rL303717: [ARM] Add VLDx/VSTx sched defs for machine-schedulers. NFCI (authored by javed.absar). · Explain WhyMay 23 2017, 10:33 PM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

ARM/

504 lines

11 lines

9 lines

103 lines

10 lines

Diff 100040

llvm/trunk/lib/Target/ARM/ARMInstrNEON.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 668 Lines • ▼ Show 20 Lines	: PseudoNLdSt<(outs QQQQPR:$dst, GPR:$wb),
"$addr.addr = $wb, $src = $dst">;		"$addr.addr = $wb, $src = $dst">;

let mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1 in {		let mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1 in {

// VLD1 : Vector Load (multiple single elements)		// VLD1 : Vector Load (multiple single elements)
class VLD1D<bits<4> op7_4, string Dt, Operand AddrMode>		class VLD1D<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<0,0b10,0b0111,op7_4, (outs VecListOneD:$Vd),		: NLdSt<0,0b10,0b0111,op7_4, (outs VecListOneD:$Vd),
(ins AddrMode:$Rn), IIC_VLD1,		(ins AddrMode:$Rn), IIC_VLD1,
"vld1", Dt, "$Vd, $Rn", "", []> {		"vld1", Dt, "$Vd, $Rn", "", []>, Sched<[WriteVLD1]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
class VLD1Q<bits<4> op7_4, string Dt, Operand AddrMode>		class VLD1Q<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<0,0b10,0b1010,op7_4, (outs VecListDPair:$Vd),		: NLdSt<0,0b10,0b1010,op7_4, (outs VecListDPair:$Vd),
(ins AddrMode:$Rn), IIC_VLD1x2,		(ins AddrMode:$Rn), IIC_VLD1x2,
"vld1", Dt, "$Vd, $Rn", "", []> {		"vld1", Dt, "$Vd, $Rn", "", []>, Sched<[WriteVLD2]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}

def VLD1d8 : VLD1D<{0,0,0,?}, "8", addrmode6align64>;		def VLD1d8 : VLD1D<{0,0,0,?}, "8", addrmode6align64>;
def VLD1d16 : VLD1D<{0,1,0,?}, "16", addrmode6align64>;		def VLD1d16 : VLD1D<{0,1,0,?}, "16", addrmode6align64>;
def VLD1d32 : VLD1D<{1,0,0,?}, "32", addrmode6align64>;		def VLD1d32 : VLD1D<{1,0,0,?}, "32", addrmode6align64>;
def VLD1d64 : VLD1D<{1,1,0,?}, "64", addrmode6align64>;		def VLD1d64 : VLD1D<{1,1,0,?}, "64", addrmode6align64>;

def VLD1q8 : VLD1Q<{0,0,?,?}, "8", addrmode6align64or128>;		def VLD1q8 : VLD1Q<{0,0,?,?}, "8", addrmode6align64or128>;
def VLD1q16 : VLD1Q<{0,1,?,?}, "16", addrmode6align64or128>;		def VLD1q16 : VLD1Q<{0,1,?,?}, "16", addrmode6align64or128>;
def VLD1q32 : VLD1Q<{1,0,?,?}, "32", addrmode6align64or128>;		def VLD1q32 : VLD1Q<{1,0,?,?}, "32", addrmode6align64or128>;
def VLD1q64 : VLD1Q<{1,1,?,?}, "64", addrmode6align64or128>;		def VLD1q64 : VLD1Q<{1,1,?,?}, "64", addrmode6align64or128>;

// ...with address register writeback:		// ...with address register writeback:
multiclass VLD1DWB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VLD1DWB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0,0b10, 0b0111,op7_4, (outs VecListOneD:$Vd, GPR:$wb),		def _fixed : NLdSt<0,0b10, 0b0111,op7_4, (outs VecListOneD:$Vd, GPR:$wb),
(ins AddrMode:$Rn), IIC_VLD1u,		(ins AddrMode:$Rn), IIC_VLD1u,
"vld1", Dt, "$Vd, $Rn!",		"vld1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD1]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
def _register : NLdSt<0,0b10,0b0111,op7_4, (outs VecListOneD:$Vd, GPR:$wb),		def _register : NLdSt<0,0b10,0b0111,op7_4, (outs VecListOneD:$Vd, GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1u,		(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1u,
"vld1", Dt, "$Vd, $Rn, $Rm",		"vld1", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD1]> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
}		}
multiclass VLD1QWB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VLD1QWB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0,0b10,0b1010,op7_4, (outs VecListDPair:$Vd, GPR:$wb),		def _fixed : NLdSt<0,0b10,0b1010,op7_4, (outs VecListDPair:$Vd, GPR:$wb),
(ins AddrMode:$Rn), IIC_VLD1x2u,		(ins AddrMode:$Rn), IIC_VLD1x2u,
"vld1", Dt, "$Vd, $Rn!",		"vld1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD2]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
def _register : NLdSt<0,0b10,0b1010,op7_4, (outs VecListDPair:$Vd, GPR:$wb),		def _register : NLdSt<0,0b10,0b1010,op7_4, (outs VecListDPair:$Vd, GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1x2u,		(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1x2u,
"vld1", Dt, "$Vd, $Rn, $Rm",		"vld1", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD2]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
}		}

defm VLD1d8wb : VLD1DWB<{0,0,0,?}, "8", addrmode6align64>;		defm VLD1d8wb : VLD1DWB<{0,0,0,?}, "8", addrmode6align64>;
defm VLD1d16wb : VLD1DWB<{0,1,0,?}, "16", addrmode6align64>;		defm VLD1d16wb : VLD1DWB<{0,1,0,?}, "16", addrmode6align64>;
defm VLD1d32wb : VLD1DWB<{1,0,0,?}, "32", addrmode6align64>;		defm VLD1d32wb : VLD1DWB<{1,0,0,?}, "32", addrmode6align64>;
defm VLD1d64wb : VLD1DWB<{1,1,0,?}, "64", addrmode6align64>;		defm VLD1d64wb : VLD1DWB<{1,1,0,?}, "64", addrmode6align64>;
defm VLD1q8wb : VLD1QWB<{0,0,?,?}, "8", addrmode6align64or128>;		defm VLD1q8wb : VLD1QWB<{0,0,?,?}, "8", addrmode6align64or128>;
defm VLD1q16wb : VLD1QWB<{0,1,?,?}, "16", addrmode6align64or128>;		defm VLD1q16wb : VLD1QWB<{0,1,?,?}, "16", addrmode6align64or128>;
defm VLD1q32wb : VLD1QWB<{1,0,?,?}, "32", addrmode6align64or128>;		defm VLD1q32wb : VLD1QWB<{1,0,?,?}, "32", addrmode6align64or128>;
defm VLD1q64wb : VLD1QWB<{1,1,?,?}, "64", addrmode6align64or128>;		defm VLD1q64wb : VLD1QWB<{1,1,?,?}, "64", addrmode6align64or128>;

// ...with 3 registers		// ...with 3 registers
class VLD1D3<bits<4> op7_4, string Dt, Operand AddrMode>		class VLD1D3<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<0,0b10,0b0110,op7_4, (outs VecListThreeD:$Vd),		: NLdSt<0,0b10,0b0110,op7_4, (outs VecListThreeD:$Vd),
(ins AddrMode:$Rn), IIC_VLD1x3, "vld1", Dt,		(ins AddrMode:$Rn), IIC_VLD1x3, "vld1", Dt,
"$Vd, $Rn", "", []> {		"$Vd, $Rn", "", []>, Sched<[WriteVLD3]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
multiclass VLD1D3WB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VLD1D3WB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0,0b10,0b0110, op7_4, (outs VecListThreeD:$Vd, GPR:$wb),		def _fixed : NLdSt<0,0b10,0b0110, op7_4, (outs VecListThreeD:$Vd, GPR:$wb),
(ins AddrMode:$Rn), IIC_VLD1x2u,		(ins AddrMode:$Rn), IIC_VLD1x2u,
"vld1", Dt, "$Vd, $Rn!",		"vld1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD3]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
def _register : NLdSt<0,0b10,0b0110,op7_4, (outs VecListThreeD:$Vd, GPR:$wb),		def _register : NLdSt<0,0b10,0b0110,op7_4, (outs VecListThreeD:$Vd, GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1x2u,		(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1x2u,
"vld1", Dt, "$Vd, $Rn, $Rm",		"vld1", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD3]> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
}		}

def VLD1d8T : VLD1D3<{0,0,0,?}, "8", addrmode6align64>;		def VLD1d8T : VLD1D3<{0,0,0,?}, "8", addrmode6align64>;
def VLD1d16T : VLD1D3<{0,1,0,?}, "16", addrmode6align64>;		def VLD1d16T : VLD1D3<{0,1,0,?}, "16", addrmode6align64>;
def VLD1d32T : VLD1D3<{1,0,0,?}, "32", addrmode6align64>;		def VLD1d32T : VLD1D3<{1,0,0,?}, "32", addrmode6align64>;
def VLD1d64T : VLD1D3<{1,1,0,?}, "64", addrmode6align64>;		def VLD1d64T : VLD1D3<{1,1,0,?}, "64", addrmode6align64>;

defm VLD1d8Twb : VLD1D3WB<{0,0,0,?}, "8", addrmode6align64>;		defm VLD1d8Twb : VLD1D3WB<{0,0,0,?}, "8", addrmode6align64>;
defm VLD1d16Twb : VLD1D3WB<{0,1,0,?}, "16", addrmode6align64>;		defm VLD1d16Twb : VLD1D3WB<{0,1,0,?}, "16", addrmode6align64>;
defm VLD1d32Twb : VLD1D3WB<{1,0,0,?}, "32", addrmode6align64>;		defm VLD1d32Twb : VLD1D3WB<{1,0,0,?}, "32", addrmode6align64>;
defm VLD1d64Twb : VLD1D3WB<{1,1,0,?}, "64", addrmode6align64>;		defm VLD1d64Twb : VLD1D3WB<{1,1,0,?}, "64", addrmode6align64>;

def VLD1d64TPseudo : VLDQQPseudo<IIC_VLD1x3>;		def VLD1d64TPseudo : VLDQQPseudo<IIC_VLD1x3>, Sched<[WriteVLD3]>;
def VLD1d64TPseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD1x3>;		def VLD1d64TPseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD1x3>, Sched<[WriteVLD3]>;
def VLD1d64TPseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD1x3>;		def VLD1d64TPseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD1x3>, Sched<[WriteVLD3]>;

// ...with 4 registers		// ...with 4 registers
class VLD1D4<bits<4> op7_4, string Dt, Operand AddrMode>		class VLD1D4<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<0, 0b10, 0b0010, op7_4, (outs VecListFourD:$Vd),		: NLdSt<0, 0b10, 0b0010, op7_4, (outs VecListFourD:$Vd),
(ins AddrMode:$Rn), IIC_VLD1x4, "vld1", Dt,		(ins AddrMode:$Rn), IIC_VLD1x4, "vld1", Dt,
"$Vd, $Rn", "", []> {		"$Vd, $Rn", "", []>, Sched<[WriteVLD4]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
multiclass VLD1D4WB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VLD1D4WB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0,0b10,0b0010, op7_4, (outs VecListFourD:$Vd, GPR:$wb),		def _fixed : NLdSt<0,0b10,0b0010, op7_4, (outs VecListFourD:$Vd, GPR:$wb),
(ins AddrMode:$Rn), IIC_VLD1x2u,		(ins AddrMode:$Rn), IIC_VLD1x2u,
"vld1", Dt, "$Vd, $Rn!",		"vld1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD4]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
def _register : NLdSt<0,0b10,0b0010,op7_4, (outs VecListFourD:$Vd, GPR:$wb),		def _register : NLdSt<0,0b10,0b0010,op7_4, (outs VecListFourD:$Vd, GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1x2u,		(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1x2u,
"vld1", Dt, "$Vd, $Rn, $Rm",		"vld1", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD4]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
}		}

def VLD1d8Q : VLD1D4<{0,0,?,?}, "8", addrmode6align64or128or256>;		def VLD1d8Q : VLD1D4<{0,0,?,?}, "8", addrmode6align64or128or256>;
def VLD1d16Q : VLD1D4<{0,1,?,?}, "16", addrmode6align64or128or256>;		def VLD1d16Q : VLD1D4<{0,1,?,?}, "16", addrmode6align64or128or256>;
def VLD1d32Q : VLD1D4<{1,0,?,?}, "32", addrmode6align64or128or256>;		def VLD1d32Q : VLD1D4<{1,0,?,?}, "32", addrmode6align64or128or256>;
def VLD1d64Q : VLD1D4<{1,1,?,?}, "64", addrmode6align64or128or256>;		def VLD1d64Q : VLD1D4<{1,1,?,?}, "64", addrmode6align64or128or256>;

defm VLD1d8Qwb : VLD1D4WB<{0,0,?,?}, "8", addrmode6align64or128or256>;		defm VLD1d8Qwb : VLD1D4WB<{0,0,?,?}, "8", addrmode6align64or128or256>;
defm VLD1d16Qwb : VLD1D4WB<{0,1,?,?}, "16", addrmode6align64or128or256>;		defm VLD1d16Qwb : VLD1D4WB<{0,1,?,?}, "16", addrmode6align64or128or256>;
defm VLD1d32Qwb : VLD1D4WB<{1,0,?,?}, "32", addrmode6align64or128or256>;		defm VLD1d32Qwb : VLD1D4WB<{1,0,?,?}, "32", addrmode6align64or128or256>;
defm VLD1d64Qwb : VLD1D4WB<{1,1,?,?}, "64", addrmode6align64or128or256>;		defm VLD1d64Qwb : VLD1D4WB<{1,1,?,?}, "64", addrmode6align64or128or256>;

def VLD1d64QPseudo : VLDQQPseudo<IIC_VLD1x4>;		def VLD1d64QPseudo : VLDQQPseudo<IIC_VLD1x4>, Sched<[WriteVLD4]>;
def VLD1d64QPseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD1x4>;		def VLD1d64QPseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD1x4>, Sched<[WriteVLD4]>;
def VLD1d64QPseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD1x4>;		def VLD1d64QPseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD1x4>, Sched<[WriteVLD4]>;

// VLD2 : Vector Load (multiple 2-element structures)		// VLD2 : Vector Load (multiple 2-element structures)
class VLD2<bits<4> op11_8, bits<4> op7_4, string Dt, RegisterOperand VdTy,		class VLD2<bits<4> op11_8, bits<4> op7_4, string Dt, RegisterOperand VdTy,
InstrItinClass itin, Operand AddrMode>		InstrItinClass itin, Operand AddrMode>
: NLdSt<0, 0b10, op11_8, op7_4, (outs VdTy:$Vd),		: NLdSt<0, 0b10, op11_8, op7_4, (outs VdTy:$Vd),
(ins AddrMode:$Rn), itin,		(ins AddrMode:$Rn), itin,
"vld2", Dt, "$Vd, $Rn", "", []> {		"vld2", Dt, "$Vd, $Rn", "", []> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST2Instruction";		let DecoderMethod = "DecodeVLDST2Instruction";
}		}

def VLD2d8 : VLD2<0b1000, {0,0,?,?}, "8", VecListDPair, IIC_VLD2,		def VLD2d8 : VLD2<0b1000, {0,0,?,?}, "8", VecListDPair, IIC_VLD2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
def VLD2d16 : VLD2<0b1000, {0,1,?,?}, "16", VecListDPair, IIC_VLD2,		def VLD2d16 : VLD2<0b1000, {0,1,?,?}, "16", VecListDPair, IIC_VLD2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
def VLD2d32 : VLD2<0b1000, {1,0,?,?}, "32", VecListDPair, IIC_VLD2,		def VLD2d32 : VLD2<0b1000, {1,0,?,?}, "32", VecListDPair, IIC_VLD2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;

def VLD2q8 : VLD2<0b0011, {0,0,?,?}, "8", VecListFourD, IIC_VLD2x2,		def VLD2q8 : VLD2<0b0011, {0,0,?,?}, "8", VecListFourD, IIC_VLD2x2,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVLD4]>;
def VLD2q16 : VLD2<0b0011, {0,1,?,?}, "16", VecListFourD, IIC_VLD2x2,		def VLD2q16 : VLD2<0b0011, {0,1,?,?}, "16", VecListFourD, IIC_VLD2x2,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVLD4]>;
def VLD2q32 : VLD2<0b0011, {1,0,?,?}, "32", VecListFourD, IIC_VLD2x2,		def VLD2q32 : VLD2<0b0011, {1,0,?,?}, "32", VecListFourD, IIC_VLD2x2,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVLD4]>;

def VLD2q8Pseudo : VLDQQPseudo<IIC_VLD2x2>;		def VLD2q8Pseudo : VLDQQPseudo<IIC_VLD2x2>, Sched<[WriteVLD4]>;
def VLD2q16Pseudo : VLDQQPseudo<IIC_VLD2x2>;		def VLD2q16Pseudo : VLDQQPseudo<IIC_VLD2x2>, Sched<[WriteVLD4]>;
def VLD2q32Pseudo : VLDQQPseudo<IIC_VLD2x2>;		def VLD2q32Pseudo : VLDQQPseudo<IIC_VLD2x2>, Sched<[WriteVLD4]>;

// ...with address register writeback:		// ...with address register writeback:
multiclass VLD2WB<bits<4> op11_8, bits<4> op7_4, string Dt,		multiclass VLD2WB<bits<4> op11_8, bits<4> op7_4, string Dt,
RegisterOperand VdTy, InstrItinClass itin, Operand AddrMode> {		RegisterOperand VdTy, InstrItinClass itin, Operand AddrMode> {
def _fixed : NLdSt<0, 0b10, op11_8, op7_4, (outs VdTy:$Vd, GPR:$wb),		def _fixed : NLdSt<0, 0b10, op11_8, op7_4, (outs VdTy:$Vd, GPR:$wb),
(ins AddrMode:$Rn), itin,		(ins AddrMode:$Rn), itin,
"vld2", Dt, "$Vd, $Rn!",		"vld2", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST2Instruction";		let DecoderMethod = "DecodeVLDST2Instruction";
}		}
def _register : NLdSt<0, 0b10, op11_8, op7_4, (outs VdTy:$Vd, GPR:$wb),		def _register : NLdSt<0, 0b10, op11_8, op7_4, (outs VdTy:$Vd, GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm), itin,		(ins AddrMode:$Rn, rGPR:$Rm), itin,
"vld2", Dt, "$Vd, $Rn, $Rm",		"vld2", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST2Instruction";		let DecoderMethod = "DecodeVLDST2Instruction";
}		}
}		}

defm VLD2d8wb : VLD2WB<0b1000, {0,0,?,?}, "8", VecListDPair, IIC_VLD2u,		defm VLD2d8wb : VLD2WB<0b1000, {0,0,?,?}, "8", VecListDPair, IIC_VLD2u,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
defm VLD2d16wb : VLD2WB<0b1000, {0,1,?,?}, "16", VecListDPair, IIC_VLD2u,		defm VLD2d16wb : VLD2WB<0b1000, {0,1,?,?}, "16", VecListDPair, IIC_VLD2u,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
defm VLD2d32wb : VLD2WB<0b1000, {1,0,?,?}, "32", VecListDPair, IIC_VLD2u,		defm VLD2d32wb : VLD2WB<0b1000, {1,0,?,?}, "32", VecListDPair, IIC_VLD2u,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;

defm VLD2q8wb : VLD2WB<0b0011, {0,0,?,?}, "8", VecListFourD, IIC_VLD2x2u,		defm VLD2q8wb : VLD2WB<0b0011, {0,0,?,?}, "8", VecListFourD, IIC_VLD2x2u,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVLD4]>;
defm VLD2q16wb : VLD2WB<0b0011, {0,1,?,?}, "16", VecListFourD, IIC_VLD2x2u,		defm VLD2q16wb : VLD2WB<0b0011, {0,1,?,?}, "16", VecListFourD, IIC_VLD2x2u,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVLD4]>;
defm VLD2q32wb : VLD2WB<0b0011, {1,0,?,?}, "32", VecListFourD, IIC_VLD2x2u,		defm VLD2q32wb : VLD2WB<0b0011, {1,0,?,?}, "32", VecListFourD, IIC_VLD2x2u,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVLD4]>;

def VLD2q8PseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD2x2u>;		def VLD2q8PseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD2x2u>, Sched<[WriteVLD4]>;
def VLD2q16PseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD2x2u>;		def VLD2q16PseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD2x2u>, Sched<[WriteVLD4]>;
def VLD2q32PseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD2x2u>;		def VLD2q32PseudoWB_fixed : VLDQQWBfixedPseudo<IIC_VLD2x2u>, Sched<[WriteVLD4]>;
def VLD2q8PseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD2x2u>;		def VLD2q8PseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD2x2u>, Sched<[WriteVLD4]>;
def VLD2q16PseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD2x2u>;		def VLD2q16PseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD2x2u>, Sched<[WriteVLD4]>;
def VLD2q32PseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD2x2u>;		def VLD2q32PseudoWB_register : VLDQQWBregisterPseudo<IIC_VLD2x2u>, Sched<[WriteVLD4]>;

// ...with double-spaced registers		// ...with double-spaced registers
def VLD2b8 : VLD2<0b1001, {0,0,?,?}, "8", VecListDPairSpaced, IIC_VLD2,		def VLD2b8 : VLD2<0b1001, {0,0,?,?}, "8", VecListDPairSpaced, IIC_VLD2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
def VLD2b16 : VLD2<0b1001, {0,1,?,?}, "16", VecListDPairSpaced, IIC_VLD2,		def VLD2b16 : VLD2<0b1001, {0,1,?,?}, "16", VecListDPairSpaced, IIC_VLD2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
def VLD2b32 : VLD2<0b1001, {1,0,?,?}, "32", VecListDPairSpaced, IIC_VLD2,		def VLD2b32 : VLD2<0b1001, {1,0,?,?}, "32", VecListDPairSpaced, IIC_VLD2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
defm VLD2b8wb : VLD2WB<0b1001, {0,0,?,?}, "8", VecListDPairSpaced, IIC_VLD2u,		defm VLD2b8wb : VLD2WB<0b1001, {0,0,?,?}, "8", VecListDPairSpaced, IIC_VLD2u,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
defm VLD2b16wb : VLD2WB<0b1001, {0,1,?,?}, "16", VecListDPairSpaced, IIC_VLD2u,		defm VLD2b16wb : VLD2WB<0b1001, {0,1,?,?}, "16", VecListDPairSpaced, IIC_VLD2u,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;
defm VLD2b32wb : VLD2WB<0b1001, {1,0,?,?}, "32", VecListDPairSpaced, IIC_VLD2u,		defm VLD2b32wb : VLD2WB<0b1001, {1,0,?,?}, "32", VecListDPairSpaced, IIC_VLD2u,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVLD2]>;

// VLD3 : Vector Load (multiple 3-element structures)		// VLD3 : Vector Load (multiple 3-element structures)
class VLD3D<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD3D<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdSt<0, 0b10, op11_8, op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3),		: NLdSt<0, 0b10, op11_8, op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3),
(ins addrmode6:$Rn), IIC_VLD3,		(ins addrmode6:$Rn), IIC_VLD3,
"vld3", Dt, "\\{$Vd, $dst2, $dst3\\}, $Rn", "", []> {		"vld3", Dt, "\\{$Vd, $dst2, $dst3\\}, $Rn", "", []>, Sched<[WriteVLD3]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST3Instruction";		let DecoderMethod = "DecodeVLDST3Instruction";
}		}

def VLD3d8 : VLD3D<0b0100, {0,0,0,?}, "8">;		def VLD3d8 : VLD3D<0b0100, {0,0,0,?}, "8">;
def VLD3d16 : VLD3D<0b0100, {0,1,0,?}, "16">;		def VLD3d16 : VLD3D<0b0100, {0,1,0,?}, "16">;
def VLD3d32 : VLD3D<0b0100, {1,0,0,?}, "32">;		def VLD3d32 : VLD3D<0b0100, {1,0,0,?}, "32">;

def VLD3d8Pseudo : VLDQQPseudo<IIC_VLD3>;		def VLD3d8Pseudo : VLDQQPseudo<IIC_VLD3>, Sched<[WriteVLD3]>;
def VLD3d16Pseudo : VLDQQPseudo<IIC_VLD3>;		def VLD3d16Pseudo : VLDQQPseudo<IIC_VLD3>, Sched<[WriteVLD3]>;
def VLD3d32Pseudo : VLDQQPseudo<IIC_VLD3>;		def VLD3d32Pseudo : VLDQQPseudo<IIC_VLD3>, Sched<[WriteVLD3]>;

// ...with address register writeback:		// ...with address register writeback:
class VLD3DWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD3DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdSt<0, 0b10, op11_8, op7_4,		: NLdSt<0, 0b10, op11_8, op7_4,
(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, GPR:$wb),		(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm), IIC_VLD3u,		(ins addrmode6:$Rn, am6offset:$Rm), IIC_VLD3u,
"vld3", Dt, "\\{$Vd, $dst2, $dst3\\}, $Rn$Rm",		"vld3", Dt, "\\{$Vd, $dst2, $dst3\\}, $Rn$Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD3]> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST3Instruction";		let DecoderMethod = "DecodeVLDST3Instruction";
}		}

def VLD3d8_UPD : VLD3DWB<0b0100, {0,0,0,?}, "8">;		def VLD3d8_UPD : VLD3DWB<0b0100, {0,0,0,?}, "8">;
def VLD3d16_UPD : VLD3DWB<0b0100, {0,1,0,?}, "16">;		def VLD3d16_UPD : VLD3DWB<0b0100, {0,1,0,?}, "16">;
def VLD3d32_UPD : VLD3DWB<0b0100, {1,0,0,?}, "32">;		def VLD3d32_UPD : VLD3DWB<0b0100, {1,0,0,?}, "32">;

def VLD3d8Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3u>;		def VLD3d8Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;
def VLD3d16Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3u>;		def VLD3d16Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;
def VLD3d32Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3u>;		def VLD3d32Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VLD3q8 : VLD3D<0b0101, {0,0,0,?}, "8">;		def VLD3q8 : VLD3D<0b0101, {0,0,0,?}, "8">;
def VLD3q16 : VLD3D<0b0101, {0,1,0,?}, "16">;		def VLD3q16 : VLD3D<0b0101, {0,1,0,?}, "16">;
def VLD3q32 : VLD3D<0b0101, {1,0,0,?}, "32">;		def VLD3q32 : VLD3D<0b0101, {1,0,0,?}, "32">;
def VLD3q8_UPD : VLD3DWB<0b0101, {0,0,0,?}, "8">;		def VLD3q8_UPD : VLD3DWB<0b0101, {0,0,0,?}, "8">;
def VLD3q16_UPD : VLD3DWB<0b0101, {0,1,0,?}, "16">;		def VLD3q16_UPD : VLD3DWB<0b0101, {0,1,0,?}, "16">;
def VLD3q32_UPD : VLD3DWB<0b0101, {1,0,0,?}, "32">;		def VLD3q32_UPD : VLD3DWB<0b0101, {1,0,0,?}, "32">;

def VLD3q8Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>;		def VLD3q8Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;
def VLD3q16Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>;		def VLD3q16Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;
def VLD3q32Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>;		def VLD3q32Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;

// ...alternate versions to be allocated odd register numbers:		// ...alternate versions to be allocated odd register numbers:
def VLD3q8oddPseudo : VLDQQQQPseudo<IIC_VLD3>;		def VLD3q8oddPseudo : VLDQQQQPseudo<IIC_VLD3>, Sched<[WriteVLD3]>;
def VLD3q16oddPseudo : VLDQQQQPseudo<IIC_VLD3>;		def VLD3q16oddPseudo : VLDQQQQPseudo<IIC_VLD3>, Sched<[WriteVLD3]>;
def VLD3q32oddPseudo : VLDQQQQPseudo<IIC_VLD3>;		def VLD3q32oddPseudo : VLDQQQQPseudo<IIC_VLD3>, Sched<[WriteVLD3]>;

def VLD3q8oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>;		def VLD3q8oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;
def VLD3q16oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>;		def VLD3q16oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;
def VLD3q32oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>;		def VLD3q32oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD3u>, Sched<[WriteVLD3]>;

// VLD4 : Vector Load (multiple 4-element structures)		// VLD4 : Vector Load (multiple 4-element structures)
class VLD4D<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD4D<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdSt<0, 0b10, op11_8, op7_4,		: NLdSt<0, 0b10, op11_8, op7_4,
(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4),		(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4),
(ins addrmode6:$Rn), IIC_VLD4,		(ins addrmode6:$Rn), IIC_VLD4,
"vld4", Dt, "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn", "", []> {		"vld4", Dt, "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn", "", []>,
		Sched<[WriteVLD4]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST4Instruction";		let DecoderMethod = "DecodeVLDST4Instruction";
}		}

def VLD4d8 : VLD4D<0b0000, {0,0,?,?}, "8">;		def VLD4d8 : VLD4D<0b0000, {0,0,?,?}, "8">;
def VLD4d16 : VLD4D<0b0000, {0,1,?,?}, "16">;		def VLD4d16 : VLD4D<0b0000, {0,1,?,?}, "16">;
def VLD4d32 : VLD4D<0b0000, {1,0,?,?}, "32">;		def VLD4d32 : VLD4D<0b0000, {1,0,?,?}, "32">;

def VLD4d8Pseudo : VLDQQPseudo<IIC_VLD4>;		def VLD4d8Pseudo : VLDQQPseudo<IIC_VLD4>, Sched<[WriteVLD4]>;
def VLD4d16Pseudo : VLDQQPseudo<IIC_VLD4>;		def VLD4d16Pseudo : VLDQQPseudo<IIC_VLD4>, Sched<[WriteVLD4]>;
def VLD4d32Pseudo : VLDQQPseudo<IIC_VLD4>;		def VLD4d32Pseudo : VLDQQPseudo<IIC_VLD4>, Sched<[WriteVLD4]>;

// ...with address register writeback:		// ...with address register writeback:
class VLD4DWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD4DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdSt<0, 0b10, op11_8, op7_4,		: NLdSt<0, 0b10, op11_8, op7_4,
(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4, GPR:$wb),		(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4, GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm), IIC_VLD4u,		(ins addrmode6:$Rn, am6offset:$Rm), IIC_VLD4u,
"vld4", Dt, "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn$Rm",		"vld4", Dt, "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn$Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD4]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST4Instruction";		let DecoderMethod = "DecodeVLDST4Instruction";
}		}

def VLD4d8_UPD : VLD4DWB<0b0000, {0,0,?,?}, "8">;		def VLD4d8_UPD : VLD4DWB<0b0000, {0,0,?,?}, "8">;
def VLD4d16_UPD : VLD4DWB<0b0000, {0,1,?,?}, "16">;		def VLD4d16_UPD : VLD4DWB<0b0000, {0,1,?,?}, "16">;
def VLD4d32_UPD : VLD4DWB<0b0000, {1,0,?,?}, "32">;		def VLD4d32_UPD : VLD4DWB<0b0000, {1,0,?,?}, "32">;

def VLD4d8Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4u>;		def VLD4d8Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;
def VLD4d16Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4u>;		def VLD4d16Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;
def VLD4d32Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4u>;		def VLD4d32Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VLD4q8 : VLD4D<0b0001, {0,0,?,?}, "8">;		def VLD4q8 : VLD4D<0b0001, {0,0,?,?}, "8">;
def VLD4q16 : VLD4D<0b0001, {0,1,?,?}, "16">;		def VLD4q16 : VLD4D<0b0001, {0,1,?,?}, "16">;
def VLD4q32 : VLD4D<0b0001, {1,0,?,?}, "32">;		def VLD4q32 : VLD4D<0b0001, {1,0,?,?}, "32">;
def VLD4q8_UPD : VLD4DWB<0b0001, {0,0,?,?}, "8">;		def VLD4q8_UPD : VLD4DWB<0b0001, {0,0,?,?}, "8">;
def VLD4q16_UPD : VLD4DWB<0b0001, {0,1,?,?}, "16">;		def VLD4q16_UPD : VLD4DWB<0b0001, {0,1,?,?}, "16">;
def VLD4q32_UPD : VLD4DWB<0b0001, {1,0,?,?}, "32">;		def VLD4q32_UPD : VLD4DWB<0b0001, {1,0,?,?}, "32">;

def VLD4q8Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>;		def VLD4q8Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;
def VLD4q16Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>;		def VLD4q16Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;
def VLD4q32Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>;		def VLD4q32Pseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;

// ...alternate versions to be allocated odd register numbers:		// ...alternate versions to be allocated odd register numbers:
def VLD4q8oddPseudo : VLDQQQQPseudo<IIC_VLD4>;		def VLD4q8oddPseudo : VLDQQQQPseudo<IIC_VLD4>, Sched<[WriteVLD4]>;
def VLD4q16oddPseudo : VLDQQQQPseudo<IIC_VLD4>;		def VLD4q16oddPseudo : VLDQQQQPseudo<IIC_VLD4>, Sched<[WriteVLD4]>;
def VLD4q32oddPseudo : VLDQQQQPseudo<IIC_VLD4>;		def VLD4q32oddPseudo : VLDQQQQPseudo<IIC_VLD4>, Sched<[WriteVLD4]>;

def VLD4q8oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>;		def VLD4q8oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;
def VLD4q16oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>;		def VLD4q16oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;
def VLD4q32oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>;		def VLD4q32oddPseudo_UPD : VLDQQQQWBPseudo<IIC_VLD4u>, Sched<[WriteVLD4]>;

} // mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1		} // mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1

// Classes for VLD*LN pseudo-instructions with multi-register operands.		// Classes for VLD*LN pseudo-instructions with multi-register operands.
// These are expanded to real instructions after register allocation.		// These are expanded to real instructions after register allocation.
class VLDQLNPseudo<InstrItinClass itin>		class VLDQLNPseudo<InstrItinClass itin>
: PseudoNLdSt<(outs QPR:$dst),		: PseudoNLdSt<(outs QPR:$dst),
(ins addrmode6:$addr, QPR:$src, nohash_imm:$lane),		(ins addrmode6:$addr, QPR:$src, nohash_imm:$lane),
Show All 35 Lines
class VLD1LN32<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,		class VLD1LN32<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,
PatFrag LoadOp>		PatFrag LoadOp>
: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd),		: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd),
(ins addrmode6oneL32:$Rn, DPR:$src, nohash_imm:$lane),		(ins addrmode6oneL32:$Rn, DPR:$src, nohash_imm:$lane),
IIC_VLD1ln, "vld1", Dt, "\\{$Vd[$lane]\\}, $Rn",		IIC_VLD1ln, "vld1", Dt, "\\{$Vd[$lane]\\}, $Rn",
"$src = $Vd",		"$src = $Vd",
[(set DPR:$Vd, (vector_insert (Ty DPR:$src),		[(set DPR:$Vd, (vector_insert (Ty DPR:$src),
(i32 (LoadOp addrmode6oneL32:$Rn)),		(i32 (LoadOp addrmode6oneL32:$Rn)),
imm:$lane))]> {		imm:$lane))]>, Sched<[WriteVLD1]> {
let Rm = 0b1111;		let Rm = 0b1111;
let DecoderMethod = "DecodeVLD1LN";		let DecoderMethod = "DecodeVLD1LN";
}		}
class VLD1QLNPseudo<ValueType Ty, PatFrag LoadOp> : VLDQLNPseudo<IIC_VLD1ln> {		class VLD1QLNPseudo<ValueType Ty, PatFrag LoadOp> : VLDQLNPseudo<IIC_VLD1ln>,
		Sched<[WriteVLD1]> {
let Pattern = [(set QPR:$dst, (vector_insert (Ty QPR:$src),		let Pattern = [(set QPR:$dst, (vector_insert (Ty QPR:$src),
(i32 (LoadOp addrmode6:$addr)),		(i32 (LoadOp addrmode6:$addr)),
imm:$lane))];		imm:$lane))];
}		}

def VLD1LNd8 : VLD1LN<0b0000, {?,?,?,0}, "8", v8i8, extloadi8> {		def VLD1LNd8 : VLD1LN<0b0000, {?,?,?,0}, "8", v8i8, extloadi8> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
Show All 20 Lines
let mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1 in {		let mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1 in {

// ...with address register writeback:		// ...with address register writeback:
class VLD1LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD1LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd, GPR:$wb),		: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd, GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm,		(ins addrmode6:$Rn, am6offset:$Rm,
DPR:$src, nohash_imm:$lane), IIC_VLD1lnu, "vld1", Dt,		DPR:$src, nohash_imm:$lane), IIC_VLD1lnu, "vld1", Dt,
"\\{$Vd[$lane]\\}, $Rn$Rm",		"\\{$Vd[$lane]\\}, $Rn$Rm",
"$src = $Vd, $Rn.addr = $wb", []> {		"$src = $Vd, $Rn.addr = $wb", []>, Sched<[WriteVLD1]> {
let DecoderMethod = "DecodeVLD1LN";		let DecoderMethod = "DecodeVLD1LN";
}		}

def VLD1LNd8_UPD : VLD1LNWB<0b0000, {?,?,?,0}, "8"> {		def VLD1LNd8_UPD : VLD1LNWB<0b0000, {?,?,?,0}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VLD1LNd16_UPD : VLD1LNWB<0b0100, {?,?,0,?}, "16"> {		def VLD1LNd16_UPD : VLD1LNWB<0b0100, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
}		}
def VLD1LNd32_UPD : VLD1LNWB<0b1000, {?,0,?,?}, "32"> {		def VLD1LNd32_UPD : VLD1LNWB<0b1000, {?,0,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{4};		let Inst{5} = Rn{4};
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
}		}

def VLD1LNq8Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD1lnu>;		def VLD1LNq8Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD1lnu>, Sched<[WriteVLD1]>;
def VLD1LNq16Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD1lnu>;		def VLD1LNq16Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD1lnu>, Sched<[WriteVLD1]>;
def VLD1LNq32Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD1lnu>;		def VLD1LNq32Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD1lnu>, Sched<[WriteVLD1]>;

// VLD2LN : Vector Load (single 2-element structure to one lane)		// VLD2LN : Vector Load (single 2-element structure to one lane)
class VLD2LN<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD2LN<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd, DPR:$dst2),		: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd, DPR:$dst2),
(ins addrmode6:$Rn, DPR:$src1, DPR:$src2, nohash_imm:$lane),		(ins addrmode6:$Rn, DPR:$src1, DPR:$src2, nohash_imm:$lane),
IIC_VLD2ln, "vld2", Dt, "\\{$Vd[$lane], $dst2[$lane]\\}, $Rn",		IIC_VLD2ln, "vld2", Dt, "\\{$Vd[$lane], $dst2[$lane]\\}, $Rn",
"$src1 = $Vd, $src2 = $dst2", []> {		"$src1 = $Vd, $src2 = $dst2", []>, Sched<[WriteVLD1]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD2LN";		let DecoderMethod = "DecodeVLD2LN";
}		}

def VLD2LNd8 : VLD2LN<0b0001, {?,?,?,?}, "8"> {		def VLD2LNd8 : VLD2LN<0b0001, {?,?,?,?}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VLD2LNd16 : VLD2LN<0b0101, {?,?,0,?}, "16"> {		def VLD2LNd16 : VLD2LN<0b0101, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD2LNd32 : VLD2LN<0b1001, {?,0,0,?}, "32"> {		def VLD2LNd32 : VLD2LN<0b1001, {?,0,0,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VLD2LNd8Pseudo : VLDQLNPseudo<IIC_VLD2ln>;		def VLD2LNd8Pseudo : VLDQLNPseudo<IIC_VLD2ln>, Sched<[WriteVLD1]>;
def VLD2LNd16Pseudo : VLDQLNPseudo<IIC_VLD2ln>;		def VLD2LNd16Pseudo : VLDQLNPseudo<IIC_VLD2ln>, Sched<[WriteVLD1]>;
def VLD2LNd32Pseudo : VLDQLNPseudo<IIC_VLD2ln>;		def VLD2LNd32Pseudo : VLDQLNPseudo<IIC_VLD2ln>, Sched<[WriteVLD1]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VLD2LNq16 : VLD2LN<0b0101, {?,?,1,?}, "16"> {		def VLD2LNq16 : VLD2LN<0b0101, {?,?,1,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD2LNq32 : VLD2LN<0b1001, {?,1,0,?}, "32"> {		def VLD2LNq32 : VLD2LN<0b1001, {?,1,0,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VLD2LNq16Pseudo : VLDQQLNPseudo<IIC_VLD2ln>;		def VLD2LNq16Pseudo : VLDQQLNPseudo<IIC_VLD2ln>, Sched<[WriteVLD1]>;
def VLD2LNq32Pseudo : VLDQQLNPseudo<IIC_VLD2ln>;		def VLD2LNq32Pseudo : VLDQQLNPseudo<IIC_VLD2ln>, Sched<[WriteVLD1]>;

// ...with address register writeback:		// ...with address register writeback:
class VLD2LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD2LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd, DPR:$dst2, GPR:$wb),		: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd, DPR:$dst2, GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm,		(ins addrmode6:$Rn, am6offset:$Rm,
DPR:$src1, DPR:$src2, nohash_imm:$lane), IIC_VLD2lnu, "vld2", Dt,		DPR:$src1, DPR:$src2, nohash_imm:$lane), IIC_VLD2lnu, "vld2", Dt,
"\\{$Vd[$lane], $dst2[$lane]\\}, $Rn$Rm",		"\\{$Vd[$lane], $dst2[$lane]\\}, $Rn$Rm",
"$src1 = $Vd, $src2 = $dst2, $Rn.addr = $wb", []> {		"$src1 = $Vd, $src2 = $dst2, $Rn.addr = $wb", []> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD2LN";		let DecoderMethod = "DecodeVLD2LN";
}		}

def VLD2LNd8_UPD : VLD2LNWB<0b0001, {?,?,?,?}, "8"> {		def VLD2LNd8_UPD : VLD2LNWB<0b0001, {?,?,?,?}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VLD2LNd16_UPD : VLD2LNWB<0b0101, {?,?,0,?}, "16"> {		def VLD2LNd16_UPD : VLD2LNWB<0b0101, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD2LNd32_UPD : VLD2LNWB<0b1001, {?,0,0,?}, "32"> {		def VLD2LNd32_UPD : VLD2LNWB<0b1001, {?,0,0,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VLD2LNd8Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD2lnu>;		def VLD2LNd8Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD2lnu>, Sched<[WriteVLD1]>;
def VLD2LNd16Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD2lnu>;		def VLD2LNd16Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD2lnu>, Sched<[WriteVLD1]>;
def VLD2LNd32Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD2lnu>;		def VLD2LNd32Pseudo_UPD : VLDQLNWBPseudo<IIC_VLD2lnu>, Sched<[WriteVLD1]>;

def VLD2LNq16_UPD : VLD2LNWB<0b0101, {?,?,1,?}, "16"> {		def VLD2LNq16_UPD : VLD2LNWB<0b0101, {?,?,1,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD2LNq32_UPD : VLD2LNWB<0b1001, {?,1,0,?}, "32"> {		def VLD2LNq32_UPD : VLD2LNWB<0b1001, {?,1,0,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VLD2LNq16Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD2lnu>;		def VLD2LNq16Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD2lnu>, Sched<[WriteVLD1]>;
def VLD2LNq32Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD2lnu>;		def VLD2LNq32Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD2lnu>, Sched<[WriteVLD1]>;

// VLD3LN : Vector Load (single 3-element structure to one lane)		// VLD3LN : Vector Load (single 3-element structure to one lane)
class VLD3LN<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD3LN<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3),		: NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3),
(ins addrmode6:$Rn, DPR:$src1, DPR:$src2, DPR:$src3,		(ins addrmode6:$Rn, DPR:$src1, DPR:$src2, DPR:$src3,
nohash_imm:$lane), IIC_VLD3ln, "vld3", Dt,		nohash_imm:$lane), IIC_VLD3ln, "vld3", Dt,
"\\{$Vd[$lane], $dst2[$lane], $dst3[$lane]\\}, $Rn",		"\\{$Vd[$lane], $dst2[$lane], $dst3[$lane]\\}, $Rn",
"$src1 = $Vd, $src2 = $dst2, $src3 = $dst3", []> {		"$src1 = $Vd, $src2 = $dst2, $src3 = $dst3", []>, Sched<[WriteVLD2]> {
let Rm = 0b1111;		let Rm = 0b1111;
let DecoderMethod = "DecodeVLD3LN";		let DecoderMethod = "DecodeVLD3LN";
}		}

def VLD3LNd8 : VLD3LN<0b0010, {?,?,?,0}, "8"> {		def VLD3LNd8 : VLD3LN<0b0010, {?,?,?,0}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VLD3LNd16 : VLD3LN<0b0110, {?,?,0,0}, "16"> {		def VLD3LNd16 : VLD3LN<0b0110, {?,?,0,0}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD3LNd32 : VLD3LN<0b1010, {?,0,0,0}, "32"> {		def VLD3LNd32 : VLD3LN<0b1010, {?,0,0,0}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VLD3LNd8Pseudo : VLDQQLNPseudo<IIC_VLD3ln>;		def VLD3LNd8Pseudo : VLDQQLNPseudo<IIC_VLD3ln>, Sched<[WriteVLD2]>;
def VLD3LNd16Pseudo : VLDQQLNPseudo<IIC_VLD3ln>;		def VLD3LNd16Pseudo : VLDQQLNPseudo<IIC_VLD3ln>, Sched<[WriteVLD2]>;
def VLD3LNd32Pseudo : VLDQQLNPseudo<IIC_VLD3ln>;		def VLD3LNd32Pseudo : VLDQQLNPseudo<IIC_VLD3ln>, Sched<[WriteVLD2]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VLD3LNq16 : VLD3LN<0b0110, {?,?,1,0}, "16"> {		def VLD3LNq16 : VLD3LN<0b0110, {?,?,1,0}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD3LNq32 : VLD3LN<0b1010, {?,1,0,0}, "32"> {		def VLD3LNq32 : VLD3LN<0b1010, {?,1,0,0}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VLD3LNq16Pseudo : VLDQQQQLNPseudo<IIC_VLD3ln>;		def VLD3LNq16Pseudo : VLDQQQQLNPseudo<IIC_VLD3ln>, Sched<[WriteVLD2]>;
def VLD3LNq32Pseudo : VLDQQQQLNPseudo<IIC_VLD3ln>;		def VLD3LNq32Pseudo : VLDQQQQLNPseudo<IIC_VLD3ln>, Sched<[WriteVLD2]>;

// ...with address register writeback:		// ...with address register writeback:
class VLD3LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD3LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b10, op11_8, op7_4,		: NLdStLn<1, 0b10, op11_8, op7_4,
(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, GPR:$wb),		(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm,		(ins addrmode6:$Rn, am6offset:$Rm,
DPR:$src1, DPR:$src2, DPR:$src3, nohash_imm:$lane),		DPR:$src1, DPR:$src2, DPR:$src3, nohash_imm:$lane),
IIC_VLD3lnu, "vld3", Dt,		IIC_VLD3lnu, "vld3", Dt,
"\\{$Vd[$lane], $dst2[$lane], $dst3[$lane]\\}, $Rn$Rm",		"\\{$Vd[$lane], $dst2[$lane], $dst3[$lane]\\}, $Rn$Rm",
"$src1 = $Vd, $src2 = $dst2, $src3 = $dst3, $Rn.addr = $wb",		"$src1 = $Vd, $src2 = $dst2, $src3 = $dst3, $Rn.addr = $wb",
[]> {		[]>, Sched<[WriteVLD2]> {
let DecoderMethod = "DecodeVLD3LN";		let DecoderMethod = "DecodeVLD3LN";
}		}

def VLD3LNd8_UPD : VLD3LNWB<0b0010, {?,?,?,0}, "8"> {		def VLD3LNd8_UPD : VLD3LNWB<0b0010, {?,?,?,0}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VLD3LNd16_UPD : VLD3LNWB<0b0110, {?,?,0,0}, "16"> {		def VLD3LNd16_UPD : VLD3LNWB<0b0110, {?,?,0,0}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD3LNd32_UPD : VLD3LNWB<0b1010, {?,0,0,0}, "32"> {		def VLD3LNd32_UPD : VLD3LNWB<0b1010, {?,0,0,0}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VLD3LNd8Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD3lnu>;		def VLD3LNd8Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD3lnu>, Sched<[WriteVLD2]>;
def VLD3LNd16Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD3lnu>;		def VLD3LNd16Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD3lnu>, Sched<[WriteVLD2]>;
def VLD3LNd32Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD3lnu>;		def VLD3LNd32Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD3lnu>, Sched<[WriteVLD2]>;

def VLD3LNq16_UPD : VLD3LNWB<0b0110, {?,?,1,0}, "16"> {		def VLD3LNq16_UPD : VLD3LNWB<0b0110, {?,?,1,0}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD3LNq32_UPD : VLD3LNWB<0b1010, {?,1,0,0}, "32"> {		def VLD3LNq32_UPD : VLD3LNWB<0b1010, {?,1,0,0}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VLD3LNq16Pseudo_UPD : VLDQQQQLNWBPseudo<IIC_VLD3lnu>;		def VLD3LNq16Pseudo_UPD : VLDQQQQLNWBPseudo<IIC_VLD3lnu>, Sched<[WriteVLD2]>;
def VLD3LNq32Pseudo_UPD : VLDQQQQLNWBPseudo<IIC_VLD3lnu>;		def VLD3LNq32Pseudo_UPD : VLDQQQQLNWBPseudo<IIC_VLD3lnu>, Sched<[WriteVLD2]>;

// VLD4LN : Vector Load (single 4-element structure to one lane)		// VLD4LN : Vector Load (single 4-element structure to one lane)
class VLD4LN<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD4LN<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b10, op11_8, op7_4,		: NLdStLn<1, 0b10, op11_8, op7_4,
(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4),		(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4),
(ins addrmode6:$Rn, DPR:$src1, DPR:$src2, DPR:$src3, DPR:$src4,		(ins addrmode6:$Rn, DPR:$src1, DPR:$src2, DPR:$src3, DPR:$src4,
nohash_imm:$lane), IIC_VLD4ln, "vld4", Dt,		nohash_imm:$lane), IIC_VLD4ln, "vld4", Dt,
"\\{$Vd[$lane], $dst2[$lane], $dst3[$lane], $dst4[$lane]\\}, $Rn",		"\\{$Vd[$lane], $dst2[$lane], $dst3[$lane], $dst4[$lane]\\}, $Rn",
"$src1 = $Vd, $src2 = $dst2, $src3 = $dst3, $src4 = $dst4", []> {		"$src1 = $Vd, $src2 = $dst2, $src3 = $dst3, $src4 = $dst4", []>,
		Sched<[WriteVLD2]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD4LN";		let DecoderMethod = "DecodeVLD4LN";
}		}

def VLD4LNd8 : VLD4LN<0b0011, {?,?,?,?}, "8"> {		def VLD4LNd8 : VLD4LN<0b0011, {?,?,?,?}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VLD4LNd16 : VLD4LN<0b0111, {?,?,0,?}, "16"> {		def VLD4LNd16 : VLD4LN<0b0111, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD4LNd32 : VLD4LN<0b1011, {?,0,?,?}, "32"> {		def VLD4LNd32 : VLD4LN<0b1011, {?,0,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{5};		let Inst{5} = Rn{5};
}		}

def VLD4LNd8Pseudo : VLDQQLNPseudo<IIC_VLD4ln>;		def VLD4LNd8Pseudo : VLDQQLNPseudo<IIC_VLD4ln>, Sched<[WriteVLD2]>;
def VLD4LNd16Pseudo : VLDQQLNPseudo<IIC_VLD4ln>;		def VLD4LNd16Pseudo : VLDQQLNPseudo<IIC_VLD4ln>, Sched<[WriteVLD2]>;
def VLD4LNd32Pseudo : VLDQQLNPseudo<IIC_VLD4ln>;		def VLD4LNd32Pseudo : VLDQQLNPseudo<IIC_VLD4ln>, Sched<[WriteVLD2]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VLD4LNq16 : VLD4LN<0b0111, {?,?,1,?}, "16"> {		def VLD4LNq16 : VLD4LN<0b0111, {?,?,1,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD4LNq32 : VLD4LN<0b1011, {?,1,?,?}, "32"> {		def VLD4LNq32 : VLD4LN<0b1011, {?,1,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{5};		let Inst{5} = Rn{5};
}		}

def VLD4LNq16Pseudo : VLDQQQQLNPseudo<IIC_VLD4ln>;		def VLD4LNq16Pseudo : VLDQQQQLNPseudo<IIC_VLD4ln>, Sched<[WriteVLD2]>;
def VLD4LNq32Pseudo : VLDQQQQLNPseudo<IIC_VLD4ln>;		def VLD4LNq32Pseudo : VLDQQQQLNPseudo<IIC_VLD4ln>, Sched<[WriteVLD2]>;

// ...with address register writeback:		// ...with address register writeback:
class VLD4LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VLD4LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b10, op11_8, op7_4,		: NLdStLn<1, 0b10, op11_8, op7_4,
(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4, GPR:$wb),		(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4, GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm,		(ins addrmode6:$Rn, am6offset:$Rm,
DPR:$src1, DPR:$src2, DPR:$src3, DPR:$src4, nohash_imm:$lane),		DPR:$src1, DPR:$src2, DPR:$src3, DPR:$src4, nohash_imm:$lane),
IIC_VLD4lnu, "vld4", Dt,		IIC_VLD4lnu, "vld4", Dt,
Show All 10 Lines
def VLD4LNd16_UPD : VLD4LNWB<0b0111, {?,?,0,?}, "16"> {		def VLD4LNd16_UPD : VLD4LNWB<0b0111, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD4LNd32_UPD : VLD4LNWB<0b1011, {?,0,?,?}, "32"> {		def VLD4LNd32_UPD : VLD4LNWB<0b1011, {?,0,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{5};		let Inst{5} = Rn{5};
}		}

def VLD4LNd8Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD4lnu>;		def VLD4LNd8Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD4lnu>, Sched<[WriteVLD2]>;
def VLD4LNd16Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD4lnu>;		def VLD4LNd16Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD4lnu>, Sched<[WriteVLD2]>;
def VLD4LNd32Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD4lnu>;		def VLD4LNd32Pseudo_UPD : VLDQQLNWBPseudo<IIC_VLD4lnu>, Sched<[WriteVLD2]>;

def VLD4LNq16_UPD : VLD4LNWB<0b0111, {?,?,1,?}, "16"> {		def VLD4LNq16_UPD : VLD4LNWB<0b0111, {?,?,1,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VLD4LNq32_UPD : VLD4LNWB<0b1011, {?,1,?,?}, "32"> {		def VLD4LNq32_UPD : VLD4LNWB<0b1011, {?,1,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{5};		let Inst{5} = Rn{5};
}		}

def VLD4LNq16Pseudo_UPD : VLDQQQQLNWBPseudo<IIC_VLD4lnu>;		def VLD4LNq16Pseudo_UPD : VLDQQQQLNWBPseudo<IIC_VLD4lnu>, Sched<[WriteVLD2]>;
def VLD4LNq32Pseudo_UPD : VLDQQQQLNWBPseudo<IIC_VLD4lnu>;		def VLD4LNq32Pseudo_UPD : VLDQQQQLNWBPseudo<IIC_VLD4lnu>, Sched<[WriteVLD2]>;

} // mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1		} // mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1

// VLD1DUP : Vector Load (single element to all lanes)		// VLD1DUP : Vector Load (single element to all lanes)
class VLD1DUP<bits<4> op7_4, string Dt, ValueType Ty, PatFrag LoadOp,		class VLD1DUP<bits<4> op7_4, string Dt, ValueType Ty, PatFrag LoadOp,
Operand AddrMode>		Operand AddrMode>
: NLdSt<1, 0b10, 0b1100, op7_4, (outs VecListOneDAllLanes:$Vd),		: NLdSt<1, 0b10, 0b1100, op7_4, (outs VecListOneDAllLanes:$Vd),
(ins AddrMode:$Rn),		(ins AddrMode:$Rn),
IIC_VLD1dup, "vld1", Dt, "$Vd, $Rn", "",		IIC_VLD1dup, "vld1", Dt, "$Vd, $Rn", "",
[(set VecListOneDAllLanes:$Vd,		[(set VecListOneDAllLanes:$Vd,
(Ty (NEONvdup (i32 (LoadOp AddrMode:$Rn)))))]> {		(Ty (NEONvdup (i32 (LoadOp AddrMode:$Rn)))))]>,
		Sched<[WriteVLD2]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD1DupInstruction";		let DecoderMethod = "DecodeVLD1DupInstruction";
}		}
def VLD1DUPd8 : VLD1DUP<{0,0,0,?}, "8", v8i8, extloadi8,		def VLD1DUPd8 : VLD1DUP<{0,0,0,?}, "8", v8i8, extloadi8,
addrmode6dupalignNone>;		addrmode6dupalignNone>;
def VLD1DUPd16 : VLD1DUP<{0,1,0,?}, "16", v4i16, extloadi16,		def VLD1DUPd16 : VLD1DUP<{0,1,0,?}, "16", v4i16, extloadi16,
addrmode6dupalign16>;		addrmode6dupalign16>;
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	def _register : NLdSt<1, 0b10, 0b1100, op7_4,
let DecoderMethod = "DecodeVLD1DupInstruction";		let DecoderMethod = "DecodeVLD1DupInstruction";
}		}
}		}
multiclass VLD1QDUPWB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VLD1QDUPWB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<1, 0b10, 0b1100, op7_4,		def _fixed : NLdSt<1, 0b10, 0b1100, op7_4,
(outs VecListDPairAllLanes:$Vd, GPR:$wb),		(outs VecListDPairAllLanes:$Vd, GPR:$wb),
(ins AddrMode:$Rn), IIC_VLD1dupu,		(ins AddrMode:$Rn), IIC_VLD1dupu,
"vld1", Dt, "$Vd, $Rn!",		"vld1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD1]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD1DupInstruction";		let DecoderMethod = "DecodeVLD1DupInstruction";
}		}
def _register : NLdSt<1, 0b10, 0b1100, op7_4,		def _register : NLdSt<1, 0b10, 0b1100, op7_4,
(outs VecListDPairAllLanes:$Vd, GPR:$wb),		(outs VecListDPairAllLanes:$Vd, GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1dupu,		(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD1dupu,
"vld1", Dt, "$Vd, $Rn, $Rm",		"vld1", Dt, "$Vd, $Rn, $Rm",
Show All 40 Lines

// ...with address register writeback:		// ...with address register writeback:
multiclass VLD2DUPWB<bits<4> op7_4, string Dt, RegisterOperand VdTy,		multiclass VLD2DUPWB<bits<4> op7_4, string Dt, RegisterOperand VdTy,
Operand AddrMode> {		Operand AddrMode> {
def _fixed : NLdSt<1, 0b10, 0b1101, op7_4,		def _fixed : NLdSt<1, 0b10, 0b1101, op7_4,
(outs VdTy:$Vd, GPR:$wb),		(outs VdTy:$Vd, GPR:$wb),
(ins AddrMode:$Rn), IIC_VLD2dupu,		(ins AddrMode:$Rn), IIC_VLD2dupu,
"vld2", Dt, "$Vd, $Rn!",		"vld2", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD1]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD2DupInstruction";		let DecoderMethod = "DecodeVLD2DupInstruction";
}		}
def _register : NLdSt<1, 0b10, 0b1101, op7_4,		def _register : NLdSt<1, 0b10, 0b1101, op7_4,
(outs VdTy:$Vd, GPR:$wb),		(outs VdTy:$Vd, GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD2dupu,		(ins AddrMode:$Rn, rGPR:$Rm), IIC_VLD2dupu,
"vld2", Dt, "$Vd, $Rn, $Rm",		"vld2", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD1]> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD2DupInstruction";		let DecoderMethod = "DecodeVLD2DupInstruction";
}		}
}		}

defm VLD2DUPd8wb : VLD2DUPWB<{0,0,0,0}, "8", VecListDPairAllLanes,		defm VLD2DUPd8wb : VLD2DUPWB<{0,0,0,0}, "8", VecListDPairAllLanes,
addrmode6dupalign16>;		addrmode6dupalign16>;
defm VLD2DUPd16wb : VLD2DUPWB<{0,1,0,?}, "16", VecListDPairAllLanes,		defm VLD2DUPd16wb : VLD2DUPWB<{0,1,0,?}, "16", VecListDPairAllLanes,
addrmode6dupalign32>;		addrmode6dupalign32>;
defm VLD2DUPd32wb : VLD2DUPWB<{1,0,0,?}, "32", VecListDPairAllLanes,		defm VLD2DUPd32wb : VLD2DUPWB<{1,0,0,?}, "32", VecListDPairAllLanes,
addrmode6dupalign64>;		addrmode6dupalign64>;

defm VLD2DUPd8x2wb : VLD2DUPWB<{0,0,1,0}, "8", VecListDPairSpacedAllLanes,		defm VLD2DUPd8x2wb : VLD2DUPWB<{0,0,1,0}, "8", VecListDPairSpacedAllLanes,
addrmode6dupalign16>;		addrmode6dupalign16>;
defm VLD2DUPd16x2wb : VLD2DUPWB<{0,1,1,?}, "16", VecListDPairSpacedAllLanes,		defm VLD2DUPd16x2wb : VLD2DUPWB<{0,1,1,?}, "16", VecListDPairSpacedAllLanes,
addrmode6dupalign32>;		addrmode6dupalign32>;
defm VLD2DUPd32x2wb : VLD2DUPWB<{1,0,1,?}, "32", VecListDPairSpacedAllLanes,		defm VLD2DUPd32x2wb : VLD2DUPWB<{1,0,1,?}, "32", VecListDPairSpacedAllLanes,
addrmode6dupalign64>;		addrmode6dupalign64>;

// VLD3DUP : Vector Load (single 3-element structure to all lanes)		// VLD3DUP : Vector Load (single 3-element structure to all lanes)
class VLD3DUP<bits<4> op7_4, string Dt>		class VLD3DUP<bits<4> op7_4, string Dt>
: NLdSt<1, 0b10, 0b1110, op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3),		: NLdSt<1, 0b10, 0b1110, op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3),
(ins addrmode6dup:$Rn), IIC_VLD3dup,		(ins addrmode6dup:$Rn), IIC_VLD3dup,
"vld3", Dt, "\\{$Vd[], $dst2[], $dst3[]\\}, $Rn", "", []> {		"vld3", Dt, "\\{$Vd[], $dst2[], $dst3[]\\}, $Rn", "", []>,
		Sched<[WriteVLD2]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = 0;		let Inst{4} = 0;
let DecoderMethod = "DecodeVLD3DupInstruction";		let DecoderMethod = "DecodeVLD3DupInstruction";
}		}

def VLD3DUPd8 : VLD3DUP<{0,0,0,?}, "8">;		def VLD3DUPd8 : VLD3DUP<{0,0,0,?}, "8">;
def VLD3DUPd16 : VLD3DUP<{0,1,0,?}, "16">;		def VLD3DUPd16 : VLD3DUP<{0,1,0,?}, "16">;
def VLD3DUPd32 : VLD3DUP<{1,0,0,?}, "32">;		def VLD3DUPd32 : VLD3DUP<{1,0,0,?}, "32">;

def VLD3DUPd8Pseudo : VLDQQPseudo<IIC_VLD3dup>;		def VLD3DUPd8Pseudo : VLDQQPseudo<IIC_VLD3dup>, Sched<[WriteVLD2]>;
def VLD3DUPd16Pseudo : VLDQQPseudo<IIC_VLD3dup>;		def VLD3DUPd16Pseudo : VLDQQPseudo<IIC_VLD3dup>, Sched<[WriteVLD2]>;
def VLD3DUPd32Pseudo : VLDQQPseudo<IIC_VLD3dup>;		def VLD3DUPd32Pseudo : VLDQQPseudo<IIC_VLD3dup>, Sched<[WriteVLD2]>;

// ...with double-spaced registers (not used for codegen):		// ...with double-spaced registers (not used for codegen):
def VLD3DUPq8 : VLD3DUP<{0,0,1,?}, "8">;		def VLD3DUPq8 : VLD3DUP<{0,0,1,?}, "8">;
def VLD3DUPq16 : VLD3DUP<{0,1,1,?}, "16">;		def VLD3DUPq16 : VLD3DUP<{0,1,1,?}, "16">;
def VLD3DUPq32 : VLD3DUP<{1,0,1,?}, "32">;		def VLD3DUPq32 : VLD3DUP<{1,0,1,?}, "32">;

// ...with address register writeback:		// ...with address register writeback:
class VLD3DUPWB<bits<4> op7_4, string Dt, Operand AddrMode>		class VLD3DUPWB<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<1, 0b10, 0b1110, op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3, GPR:$wb),		: NLdSt<1, 0b10, 0b1110, op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3, GPR:$wb),
(ins AddrMode:$Rn, am6offset:$Rm), IIC_VLD3dupu,		(ins AddrMode:$Rn, am6offset:$Rm), IIC_VLD3dupu,
"vld3", Dt, "\\{$Vd[], $dst2[], $dst3[]\\}, $Rn$Rm",		"vld3", Dt, "\\{$Vd[], $dst2[], $dst3[]\\}, $Rn$Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD2]> {
let Inst{4} = 0;		let Inst{4} = 0;
let DecoderMethod = "DecodeVLD3DupInstruction";		let DecoderMethod = "DecodeVLD3DupInstruction";
}		}

def VLD3DUPd8_UPD : VLD3DUPWB<{0,0,0,0}, "8", addrmode6dupalign64>;		def VLD3DUPd8_UPD : VLD3DUPWB<{0,0,0,0}, "8", addrmode6dupalign64>;
def VLD3DUPd16_UPD : VLD3DUPWB<{0,1,0,?}, "16", addrmode6dupalign64>;		def VLD3DUPd16_UPD : VLD3DUPWB<{0,1,0,?}, "16", addrmode6dupalign64>;
def VLD3DUPd32_UPD : VLD3DUPWB<{1,0,0,?}, "32", addrmode6dupalign64>;		def VLD3DUPd32_UPD : VLD3DUPWB<{1,0,0,?}, "32", addrmode6dupalign64>;

def VLD3DUPq8_UPD : VLD3DUPWB<{0,0,1,0}, "8", addrmode6dupalign64>;		def VLD3DUPq8_UPD : VLD3DUPWB<{0,0,1,0}, "8", addrmode6dupalign64>;
def VLD3DUPq16_UPD : VLD3DUPWB<{0,1,1,?}, "16", addrmode6dupalign64>;		def VLD3DUPq16_UPD : VLD3DUPWB<{0,1,1,?}, "16", addrmode6dupalign64>;
def VLD3DUPq32_UPD : VLD3DUPWB<{1,0,1,?}, "32", addrmode6dupalign64>;		def VLD3DUPq32_UPD : VLD3DUPWB<{1,0,1,?}, "32", addrmode6dupalign64>;

def VLD3DUPd8Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3dupu>;		def VLD3DUPd8Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3dupu>, Sched<[WriteVLD2]>;
def VLD3DUPd16Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3dupu>;		def VLD3DUPd16Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3dupu>, Sched<[WriteVLD2]>;
def VLD3DUPd32Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3dupu>;		def VLD3DUPd32Pseudo_UPD : VLDQQWBPseudo<IIC_VLD3dupu>, Sched<[WriteVLD2]>;

// VLD4DUP : Vector Load (single 4-element structure to all lanes)		// VLD4DUP : Vector Load (single 4-element structure to all lanes)
class VLD4DUP<bits<4> op7_4, string Dt>		class VLD4DUP<bits<4> op7_4, string Dt>
: NLdSt<1, 0b10, 0b1111, op7_4,		: NLdSt<1, 0b10, 0b1111, op7_4,
(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4),		(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4),
(ins addrmode6dup:$Rn), IIC_VLD4dup,		(ins addrmode6dup:$Rn), IIC_VLD4dup,
"vld4", Dt, "\\{$Vd[], $dst2[], $dst3[], $dst4[]\\}, $Rn", "", []> {		"vld4", Dt, "\\{$Vd[], $dst2[], $dst3[], $dst4[]\\}, $Rn", "", []> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD4DupInstruction";		let DecoderMethod = "DecodeVLD4DupInstruction";
}		}

def VLD4DUPd8 : VLD4DUP<{0,0,0,?}, "8">;		def VLD4DUPd8 : VLD4DUP<{0,0,0,?}, "8">;
def VLD4DUPd16 : VLD4DUP<{0,1,0,?}, "16">;		def VLD4DUPd16 : VLD4DUP<{0,1,0,?}, "16">;
def VLD4DUPd32 : VLD4DUP<{1,?,0,?}, "32"> { let Inst{6} = Rn{5}; }		def VLD4DUPd32 : VLD4DUP<{1,?,0,?}, "32"> { let Inst{6} = Rn{5}; }

def VLD4DUPd8Pseudo : VLDQQPseudo<IIC_VLD4dup>;		def VLD4DUPd8Pseudo : VLDQQPseudo<IIC_VLD4dup>, Sched<[WriteVLD2]>;
def VLD4DUPd16Pseudo : VLDQQPseudo<IIC_VLD4dup>;		def VLD4DUPd16Pseudo : VLDQQPseudo<IIC_VLD4dup>, Sched<[WriteVLD2]>;
def VLD4DUPd32Pseudo : VLDQQPseudo<IIC_VLD4dup>;		def VLD4DUPd32Pseudo : VLDQQPseudo<IIC_VLD4dup>, Sched<[WriteVLD2]>;

// ...with double-spaced registers (not used for codegen):		// ...with double-spaced registers (not used for codegen):
def VLD4DUPq8 : VLD4DUP<{0,0,1,?}, "8">;		def VLD4DUPq8 : VLD4DUP<{0,0,1,?}, "8">;
def VLD4DUPq16 : VLD4DUP<{0,1,1,?}, "16">;		def VLD4DUPq16 : VLD4DUP<{0,1,1,?}, "16">;
def VLD4DUPq32 : VLD4DUP<{1,?,1,?}, "32"> { let Inst{6} = Rn{5}; }		def VLD4DUPq32 : VLD4DUP<{1,?,1,?}, "32"> { let Inst{6} = Rn{5}; }

// ...with address register writeback:		// ...with address register writeback:
class VLD4DUPWB<bits<4> op7_4, string Dt>		class VLD4DUPWB<bits<4> op7_4, string Dt>
: NLdSt<1, 0b10, 0b1111, op7_4,		: NLdSt<1, 0b10, 0b1111, op7_4,
(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4, GPR:$wb),		(outs DPR:$Vd, DPR:$dst2, DPR:$dst3, DPR:$dst4, GPR:$wb),
(ins addrmode6dup:$Rn, am6offset:$Rm), IIC_VLD4dupu,		(ins addrmode6dup:$Rn, am6offset:$Rm), IIC_VLD4dupu,
"vld4", Dt, "\\{$Vd[], $dst2[], $dst3[], $dst4[]\\}, $Rn$Rm",		"vld4", Dt, "\\{$Vd[], $dst2[], $dst3[], $dst4[]\\}, $Rn$Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVLD2]> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLD4DupInstruction";		let DecoderMethod = "DecodeVLD4DupInstruction";
}		}

def VLD4DUPd8_UPD : VLD4DUPWB<{0,0,0,0}, "8">;		def VLD4DUPd8_UPD : VLD4DUPWB<{0,0,0,0}, "8">;
def VLD4DUPd16_UPD : VLD4DUPWB<{0,1,0,?}, "16">;		def VLD4DUPd16_UPD : VLD4DUPWB<{0,1,0,?}, "16">;
def VLD4DUPd32_UPD : VLD4DUPWB<{1,?,0,?}, "32"> { let Inst{6} = Rn{5}; }		def VLD4DUPd32_UPD : VLD4DUPWB<{1,?,0,?}, "32"> { let Inst{6} = Rn{5}; }

def VLD4DUPq8_UPD : VLD4DUPWB<{0,0,1,0}, "8">;		def VLD4DUPq8_UPD : VLD4DUPWB<{0,0,1,0}, "8">;
def VLD4DUPq16_UPD : VLD4DUPWB<{0,1,1,?}, "16">;		def VLD4DUPq16_UPD : VLD4DUPWB<{0,1,1,?}, "16">;
def VLD4DUPq32_UPD : VLD4DUPWB<{1,?,1,?}, "32"> { let Inst{6} = Rn{5}; }		def VLD4DUPq32_UPD : VLD4DUPWB<{1,?,1,?}, "32"> { let Inst{6} = Rn{5}; }

def VLD4DUPd8Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4dupu>;		def VLD4DUPd8Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4dupu>, Sched<[WriteVLD2]>;
def VLD4DUPd16Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4dupu>;		def VLD4DUPd16Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4dupu>, Sched<[WriteVLD2]>;
def VLD4DUPd32Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4dupu>;		def VLD4DUPd32Pseudo_UPD : VLDQQWBPseudo<IIC_VLD4dupu>, Sched<[WriteVLD2]>;

} // mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1		} // mayLoad = 1, hasSideEffects = 0, hasExtraDefRegAllocReq = 1

let mayStore = 1, hasSideEffects = 0, hasExtraSrcRegAllocReq = 1 in {		let mayStore = 1, hasSideEffects = 0, hasExtraSrcRegAllocReq = 1 in {

// Classes for VST* pseudo-instructions with multi-register operands.		// Classes for VST* pseudo-instructions with multi-register operands.
// These are expanded to real instructions after register allocation.		// These are expanded to real instructions after register allocation.
class VSTQPseudo<InstrItinClass itin>		class VSTQPseudo<InstrItinClass itin>
Show All 30 Lines
class VSTQQQQWBPseudo<InstrItinClass itin>		class VSTQQQQWBPseudo<InstrItinClass itin>
: PseudoNLdSt<(outs GPR:$wb),		: PseudoNLdSt<(outs GPR:$wb),
(ins addrmode6:$addr, am6offset:$offset, QQQQPR:$src), itin,		(ins addrmode6:$addr, am6offset:$offset, QQQQPR:$src), itin,
"$addr.addr = $wb">;		"$addr.addr = $wb">;

// VST1 : Vector Store (multiple single elements)		// VST1 : Vector Store (multiple single elements)
class VST1D<bits<4> op7_4, string Dt, Operand AddrMode>		class VST1D<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<0,0b00,0b0111,op7_4, (outs), (ins AddrMode:$Rn, VecListOneD:$Vd),		: NLdSt<0,0b00,0b0111,op7_4, (outs), (ins AddrMode:$Rn, VecListOneD:$Vd),
IIC_VST1, "vst1", Dt, "$Vd, $Rn", "", []> {		IIC_VST1, "vst1", Dt, "$Vd, $Rn", "", []>, Sched<[WriteVST1]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
class VST1Q<bits<4> op7_4, string Dt, Operand AddrMode>		class VST1Q<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<0,0b00,0b1010,op7_4, (outs), (ins AddrMode:$Rn, VecListDPair:$Vd),		: NLdSt<0,0b00,0b1010,op7_4, (outs), (ins AddrMode:$Rn, VecListDPair:$Vd),
IIC_VST1x2, "vst1", Dt, "$Vd, $Rn", "", []> {		IIC_VST1x2, "vst1", Dt, "$Vd, $Rn", "", []>, Sched<[WriteVST2]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}

def VST1d8 : VST1D<{0,0,0,?}, "8", addrmode6align64>;		def VST1d8 : VST1D<{0,0,0,?}, "8", addrmode6align64>;
def VST1d16 : VST1D<{0,1,0,?}, "16", addrmode6align64>;		def VST1d16 : VST1D<{0,1,0,?}, "16", addrmode6align64>;
def VST1d32 : VST1D<{1,0,0,?}, "32", addrmode6align64>;		def VST1d32 : VST1D<{1,0,0,?}, "32", addrmode6align64>;
def VST1d64 : VST1D<{1,1,0,?}, "64", addrmode6align64>;		def VST1d64 : VST1D<{1,1,0,?}, "64", addrmode6align64>;

def VST1q8 : VST1Q<{0,0,?,?}, "8", addrmode6align64or128>;		def VST1q8 : VST1Q<{0,0,?,?}, "8", addrmode6align64or128>;
def VST1q16 : VST1Q<{0,1,?,?}, "16", addrmode6align64or128>;		def VST1q16 : VST1Q<{0,1,?,?}, "16", addrmode6align64or128>;
def VST1q32 : VST1Q<{1,0,?,?}, "32", addrmode6align64or128>;		def VST1q32 : VST1Q<{1,0,?,?}, "32", addrmode6align64or128>;
def VST1q64 : VST1Q<{1,1,?,?}, "64", addrmode6align64or128>;		def VST1q64 : VST1Q<{1,1,?,?}, "64", addrmode6align64or128>;

// ...with address register writeback:		// ...with address register writeback:
multiclass VST1DWB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VST1DWB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0,0b00, 0b0111,op7_4, (outs GPR:$wb),		def _fixed : NLdSt<0,0b00, 0b0111,op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, VecListOneD:$Vd), IIC_VLD1u,		(ins AddrMode:$Rn, VecListOneD:$Vd), IIC_VLD1u,
"vst1", Dt, "$Vd, $Rn!",		"vst1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST1]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
def _register : NLdSt<0,0b00,0b0111,op7_4, (outs GPR:$wb),		def _register : NLdSt<0,0b00,0b0111,op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm, VecListOneD:$Vd),		(ins AddrMode:$Rn, rGPR:$Rm, VecListOneD:$Vd),
IIC_VLD1u,		IIC_VLD1u,
"vst1", Dt, "$Vd, $Rn, $Rm",		"vst1", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST1]> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
}		}
multiclass VST1QWB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VST1QWB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0,0b00,0b1010,op7_4, (outs GPR:$wb),		def _fixed : NLdSt<0,0b00,0b1010,op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, VecListDPair:$Vd), IIC_VLD1x2u,		(ins AddrMode:$Rn, VecListDPair:$Vd), IIC_VLD1x2u,
"vst1", Dt, "$Vd, $Rn!",		"vst1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST2]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
def _register : NLdSt<0,0b00,0b1010,op7_4, (outs GPR:$wb),		def _register : NLdSt<0,0b00,0b1010,op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm, VecListDPair:$Vd),		(ins AddrMode:$Rn, rGPR:$Rm, VecListDPair:$Vd),
IIC_VLD1x2u,		IIC_VLD1x2u,
"vst1", Dt, "$Vd, $Rn, $Rm",		"vst1", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST2]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
}		}

defm VST1d8wb : VST1DWB<{0,0,0,?}, "8", addrmode6align64>;		defm VST1d8wb : VST1DWB<{0,0,0,?}, "8", addrmode6align64>;
defm VST1d16wb : VST1DWB<{0,1,0,?}, "16", addrmode6align64>;		defm VST1d16wb : VST1DWB<{0,1,0,?}, "16", addrmode6align64>;
defm VST1d32wb : VST1DWB<{1,0,0,?}, "32", addrmode6align64>;		defm VST1d32wb : VST1DWB<{1,0,0,?}, "32", addrmode6align64>;
defm VST1d64wb : VST1DWB<{1,1,0,?}, "64", addrmode6align64>;		defm VST1d64wb : VST1DWB<{1,1,0,?}, "64", addrmode6align64>;

defm VST1q8wb : VST1QWB<{0,0,?,?}, "8", addrmode6align64or128>;		defm VST1q8wb : VST1QWB<{0,0,?,?}, "8", addrmode6align64or128>;
defm VST1q16wb : VST1QWB<{0,1,?,?}, "16", addrmode6align64or128>;		defm VST1q16wb : VST1QWB<{0,1,?,?}, "16", addrmode6align64or128>;
defm VST1q32wb : VST1QWB<{1,0,?,?}, "32", addrmode6align64or128>;		defm VST1q32wb : VST1QWB<{1,0,?,?}, "32", addrmode6align64or128>;
defm VST1q64wb : VST1QWB<{1,1,?,?}, "64", addrmode6align64or128>;		defm VST1q64wb : VST1QWB<{1,1,?,?}, "64", addrmode6align64or128>;

// ...with 3 registers		// ...with 3 registers
class VST1D3<bits<4> op7_4, string Dt, Operand AddrMode>		class VST1D3<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<0, 0b00, 0b0110, op7_4, (outs),		: NLdSt<0, 0b00, 0b0110, op7_4, (outs),
(ins AddrMode:$Rn, VecListThreeD:$Vd),		(ins AddrMode:$Rn, VecListThreeD:$Vd),
IIC_VST1x3, "vst1", Dt, "$Vd, $Rn", "", []> {		IIC_VST1x3, "vst1", Dt, "$Vd, $Rn", "", []>, Sched<[WriteVST3]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
multiclass VST1D3WB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VST1D3WB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0,0b00,0b0110,op7_4, (outs GPR:$wb),		def _fixed : NLdSt<0,0b00,0b0110,op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, VecListThreeD:$Vd), IIC_VLD1x3u,		(ins AddrMode:$Rn, VecListThreeD:$Vd), IIC_VLD1x3u,
"vst1", Dt, "$Vd, $Rn!",		"vst1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST3]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
def _register : NLdSt<0,0b00,0b0110,op7_4, (outs GPR:$wb),		def _register : NLdSt<0,0b00,0b0110,op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm, VecListThreeD:$Vd),		(ins AddrMode:$Rn, rGPR:$Rm, VecListThreeD:$Vd),
IIC_VLD1x3u,		IIC_VLD1x3u,
"vst1", Dt, "$Vd, $Rn, $Rm",		"vst1", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST3]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
}		}

def VST1d8T : VST1D3<{0,0,0,?}, "8", addrmode6align64>;		def VST1d8T : VST1D3<{0,0,0,?}, "8", addrmode6align64>;
def VST1d16T : VST1D3<{0,1,0,?}, "16", addrmode6align64>;		def VST1d16T : VST1D3<{0,1,0,?}, "16", addrmode6align64>;
def VST1d32T : VST1D3<{1,0,0,?}, "32", addrmode6align64>;		def VST1d32T : VST1D3<{1,0,0,?}, "32", addrmode6align64>;
def VST1d64T : VST1D3<{1,1,0,?}, "64", addrmode6align64>;		def VST1d64T : VST1D3<{1,1,0,?}, "64", addrmode6align64>;

defm VST1d8Twb : VST1D3WB<{0,0,0,?}, "8", addrmode6align64>;		defm VST1d8Twb : VST1D3WB<{0,0,0,?}, "8", addrmode6align64>;
defm VST1d16Twb : VST1D3WB<{0,1,0,?}, "16", addrmode6align64>;		defm VST1d16Twb : VST1D3WB<{0,1,0,?}, "16", addrmode6align64>;
defm VST1d32Twb : VST1D3WB<{1,0,0,?}, "32", addrmode6align64>;		defm VST1d32Twb : VST1D3WB<{1,0,0,?}, "32", addrmode6align64>;
defm VST1d64Twb : VST1D3WB<{1,1,0,?}, "64", addrmode6align64>;		defm VST1d64Twb : VST1D3WB<{1,1,0,?}, "64", addrmode6align64>;

def VST1d64TPseudo : VSTQQPseudo<IIC_VST1x3>;		def VST1d64TPseudo : VSTQQPseudo<IIC_VST1x3>, Sched<[WriteVST3]>;
def VST1d64TPseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST1x3u>;		def VST1d64TPseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST1x3u>, Sched<[WriteVST3]>;
def VST1d64TPseudoWB_register : VSTQQWBPseudo<IIC_VST1x3u>;		def VST1d64TPseudoWB_register : VSTQQWBPseudo<IIC_VST1x3u>, Sched<[WriteVST3]>;

// ...with 4 registers		// ...with 4 registers
class VST1D4<bits<4> op7_4, string Dt, Operand AddrMode>		class VST1D4<bits<4> op7_4, string Dt, Operand AddrMode>
: NLdSt<0, 0b00, 0b0010, op7_4, (outs),		: NLdSt<0, 0b00, 0b0010, op7_4, (outs),
(ins AddrMode:$Rn, VecListFourD:$Vd),		(ins AddrMode:$Rn, VecListFourD:$Vd),
IIC_VST1x4, "vst1", Dt, "$Vd, $Rn", "",		IIC_VST1x4, "vst1", Dt, "$Vd, $Rn", "",
[]> {		[]>, Sched<[WriteVST4]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
multiclass VST1D4WB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VST1D4WB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0,0b00,0b0010,op7_4, (outs GPR:$wb),		def _fixed : NLdSt<0,0b00,0b0010,op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, VecListFourD:$Vd), IIC_VLD1x4u,		(ins AddrMode:$Rn, VecListFourD:$Vd), IIC_VLD1x4u,
"vst1", Dt, "$Vd, $Rn!",		"vst1", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST4]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
def _register : NLdSt<0,0b00,0b0010,op7_4, (outs GPR:$wb),		def _register : NLdSt<0,0b00,0b0010,op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm, VecListFourD:$Vd),		(ins AddrMode:$Rn, rGPR:$Rm, VecListFourD:$Vd),
IIC_VLD1x4u,		IIC_VLD1x4u,
"vst1", Dt, "$Vd, $Rn, $Rm",		"vst1", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST4]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST1Instruction";		let DecoderMethod = "DecodeVLDST1Instruction";
}		}
}		}

def VST1d8Q : VST1D4<{0,0,?,?}, "8", addrmode6align64or128or256>;		def VST1d8Q : VST1D4<{0,0,?,?}, "8", addrmode6align64or128or256>;
def VST1d16Q : VST1D4<{0,1,?,?}, "16", addrmode6align64or128or256>;		def VST1d16Q : VST1D4<{0,1,?,?}, "16", addrmode6align64or128or256>;
def VST1d32Q : VST1D4<{1,0,?,?}, "32", addrmode6align64or128or256>;		def VST1d32Q : VST1D4<{1,0,?,?}, "32", addrmode6align64or128or256>;
def VST1d64Q : VST1D4<{1,1,?,?}, "64", addrmode6align64or128or256>;		def VST1d64Q : VST1D4<{1,1,?,?}, "64", addrmode6align64or128or256>;

defm VST1d8Qwb : VST1D4WB<{0,0,?,?}, "8", addrmode6align64or128or256>;		defm VST1d8Qwb : VST1D4WB<{0,0,?,?}, "8", addrmode6align64or128or256>;
defm VST1d16Qwb : VST1D4WB<{0,1,?,?}, "16", addrmode6align64or128or256>;		defm VST1d16Qwb : VST1D4WB<{0,1,?,?}, "16", addrmode6align64or128or256>;
defm VST1d32Qwb : VST1D4WB<{1,0,?,?}, "32", addrmode6align64or128or256>;		defm VST1d32Qwb : VST1D4WB<{1,0,?,?}, "32", addrmode6align64or128or256>;
defm VST1d64Qwb : VST1D4WB<{1,1,?,?}, "64", addrmode6align64or128or256>;		defm VST1d64Qwb : VST1D4WB<{1,1,?,?}, "64", addrmode6align64or128or256>;

def VST1d64QPseudo : VSTQQPseudo<IIC_VST1x4>;		def VST1d64QPseudo : VSTQQPseudo<IIC_VST1x4>, Sched<[WriteVST4]>;
def VST1d64QPseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST1x4u>;		def VST1d64QPseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST1x4u>, Sched<[WriteVST4]>;
def VST1d64QPseudoWB_register : VSTQQWBPseudo<IIC_VST1x4u>;		def VST1d64QPseudoWB_register : VSTQQWBPseudo<IIC_VST1x4u>, Sched<[WriteVST4]>;

// VST2 : Vector Store (multiple 2-element structures)		// VST2 : Vector Store (multiple 2-element structures)
class VST2<bits<4> op11_8, bits<4> op7_4, string Dt, RegisterOperand VdTy,		class VST2<bits<4> op11_8, bits<4> op7_4, string Dt, RegisterOperand VdTy,
InstrItinClass itin, Operand AddrMode>		InstrItinClass itin, Operand AddrMode>
: NLdSt<0, 0b00, op11_8, op7_4, (outs), (ins AddrMode:$Rn, VdTy:$Vd),		: NLdSt<0, 0b00, op11_8, op7_4, (outs), (ins AddrMode:$Rn, VdTy:$Vd),
itin, "vst2", Dt, "$Vd, $Rn", "", []> {		itin, "vst2", Dt, "$Vd, $Rn", "", []> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST2Instruction";		let DecoderMethod = "DecodeVLDST2Instruction";
}		}

def VST2d8 : VST2<0b1000, {0,0,?,?}, "8", VecListDPair, IIC_VST2,		def VST2d8 : VST2<0b1000, {0,0,?,?}, "8", VecListDPair, IIC_VST2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVST2]>;
def VST2d16 : VST2<0b1000, {0,1,?,?}, "16", VecListDPair, IIC_VST2,		def VST2d16 : VST2<0b1000, {0,1,?,?}, "16", VecListDPair, IIC_VST2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVST2]>;
def VST2d32 : VST2<0b1000, {1,0,?,?}, "32", VecListDPair, IIC_VST2,		def VST2d32 : VST2<0b1000, {1,0,?,?}, "32", VecListDPair, IIC_VST2,
addrmode6align64or128>;		addrmode6align64or128>, Sched<[WriteVST2]>;

def VST2q8 : VST2<0b0011, {0,0,?,?}, "8", VecListFourD, IIC_VST2x2,		def VST2q8 : VST2<0b0011, {0,0,?,?}, "8", VecListFourD, IIC_VST2x2,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVST4]>;
def VST2q16 : VST2<0b0011, {0,1,?,?}, "16", VecListFourD, IIC_VST2x2,		def VST2q16 : VST2<0b0011, {0,1,?,?}, "16", VecListFourD, IIC_VST2x2,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVST4]>;
def VST2q32 : VST2<0b0011, {1,0,?,?}, "32", VecListFourD, IIC_VST2x2,		def VST2q32 : VST2<0b0011, {1,0,?,?}, "32", VecListFourD, IIC_VST2x2,
addrmode6align64or128or256>;		addrmode6align64or128or256>, Sched<[WriteVST4]>;

def VST2q8Pseudo : VSTQQPseudo<IIC_VST2x2>;		def VST2q8Pseudo : VSTQQPseudo<IIC_VST2x2>, Sched<[WriteVST4]>;
def VST2q16Pseudo : VSTQQPseudo<IIC_VST2x2>;		def VST2q16Pseudo : VSTQQPseudo<IIC_VST2x2>, Sched<[WriteVST4]>;
def VST2q32Pseudo : VSTQQPseudo<IIC_VST2x2>;		def VST2q32Pseudo : VSTQQPseudo<IIC_VST2x2>, Sched<[WriteVST4]>;

// ...with address register writeback:		// ...with address register writeback:
multiclass VST2DWB<bits<4> op11_8, bits<4> op7_4, string Dt,		multiclass VST2DWB<bits<4> op11_8, bits<4> op7_4, string Dt,
RegisterOperand VdTy, Operand AddrMode> {		RegisterOperand VdTy, Operand AddrMode> {
def _fixed : NLdSt<0, 0b00, op11_8, op7_4, (outs GPR:$wb),		def _fixed : NLdSt<0, 0b00, op11_8, op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, VdTy:$Vd), IIC_VLD1u,		(ins AddrMode:$Rn, VdTy:$Vd), IIC_VLD1u,
"vst2", Dt, "$Vd, $Rn!",		"vst2", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST2]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST2Instruction";		let DecoderMethod = "DecodeVLDST2Instruction";
}		}
def _register : NLdSt<0, 0b00, op11_8, op7_4, (outs GPR:$wb),		def _register : NLdSt<0, 0b00, op11_8, op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm, VdTy:$Vd), IIC_VLD1u,		(ins AddrMode:$Rn, rGPR:$Rm, VdTy:$Vd), IIC_VLD1u,
"vst2", Dt, "$Vd, $Rn, $Rm",		"vst2", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST2]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST2Instruction";		let DecoderMethod = "DecodeVLDST2Instruction";
}		}
}		}
multiclass VST2QWB<bits<4> op7_4, string Dt, Operand AddrMode> {		multiclass VST2QWB<bits<4> op7_4, string Dt, Operand AddrMode> {
def _fixed : NLdSt<0, 0b00, 0b0011, op7_4, (outs GPR:$wb),		def _fixed : NLdSt<0, 0b00, 0b0011, op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, VecListFourD:$Vd), IIC_VLD1u,		(ins AddrMode:$Rn, VecListFourD:$Vd), IIC_VLD1u,
"vst2", Dt, "$Vd, $Rn!",		"vst2", Dt, "$Vd, $Rn!",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST4]> {
let Rm = 0b1101; // NLdSt will assign to the right encoding bits.		let Rm = 0b1101; // NLdSt will assign to the right encoding bits.
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST2Instruction";		let DecoderMethod = "DecodeVLDST2Instruction";
}		}
def _register : NLdSt<0, 0b00, 0b0011, op7_4, (outs GPR:$wb),		def _register : NLdSt<0, 0b00, 0b0011, op7_4, (outs GPR:$wb),
(ins AddrMode:$Rn, rGPR:$Rm, VecListFourD:$Vd),		(ins AddrMode:$Rn, rGPR:$Rm, VecListFourD:$Vd),
IIC_VLD1u,		IIC_VLD1u,
"vst2", Dt, "$Vd, $Rn, $Rm",		"vst2", Dt, "$Vd, $Rn, $Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST4]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST2Instruction";		let DecoderMethod = "DecodeVLDST2Instruction";
}		}
}		}

defm VST2d8wb : VST2DWB<0b1000, {0,0,?,?}, "8", VecListDPair,		defm VST2d8wb : VST2DWB<0b1000, {0,0,?,?}, "8", VecListDPair,
addrmode6align64or128>;		addrmode6align64or128>;
defm VST2d16wb : VST2DWB<0b1000, {0,1,?,?}, "16", VecListDPair,		defm VST2d16wb : VST2DWB<0b1000, {0,1,?,?}, "16", VecListDPair,
addrmode6align64or128>;		addrmode6align64or128>;
defm VST2d32wb : VST2DWB<0b1000, {1,0,?,?}, "32", VecListDPair,		defm VST2d32wb : VST2DWB<0b1000, {1,0,?,?}, "32", VecListDPair,
addrmode6align64or128>;		addrmode6align64or128>;

defm VST2q8wb : VST2QWB<{0,0,?,?}, "8", addrmode6align64or128or256>;		defm VST2q8wb : VST2QWB<{0,0,?,?}, "8", addrmode6align64or128or256>;
defm VST2q16wb : VST2QWB<{0,1,?,?}, "16", addrmode6align64or128or256>;		defm VST2q16wb : VST2QWB<{0,1,?,?}, "16", addrmode6align64or128or256>;
defm VST2q32wb : VST2QWB<{1,0,?,?}, "32", addrmode6align64or128or256>;		defm VST2q32wb : VST2QWB<{1,0,?,?}, "32", addrmode6align64or128or256>;

def VST2q8PseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST2x2u>;		def VST2q8PseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST2x2u>, Sched<[WriteVST4]>;
def VST2q16PseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST2x2u>;		def VST2q16PseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST2x2u>, Sched<[WriteVST4]>;
def VST2q32PseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST2x2u>;		def VST2q32PseudoWB_fixed : VSTQQWBfixedPseudo<IIC_VST2x2u>, Sched<[WriteVST4]>;
def VST2q8PseudoWB_register : VSTQQWBregisterPseudo<IIC_VST2x2u>;		def VST2q8PseudoWB_register : VSTQQWBregisterPseudo<IIC_VST2x2u>, Sched<[WriteVST4]>;
def VST2q16PseudoWB_register : VSTQQWBregisterPseudo<IIC_VST2x2u>;		def VST2q16PseudoWB_register : VSTQQWBregisterPseudo<IIC_VST2x2u>, Sched<[WriteVST4]>;
def VST2q32PseudoWB_register : VSTQQWBregisterPseudo<IIC_VST2x2u>;		def VST2q32PseudoWB_register : VSTQQWBregisterPseudo<IIC_VST2x2u>, Sched<[WriteVST4]>;

// ...with double-spaced registers		// ...with double-spaced registers
def VST2b8 : VST2<0b1001, {0,0,?,?}, "8", VecListDPairSpaced, IIC_VST2,		def VST2b8 : VST2<0b1001, {0,0,?,?}, "8", VecListDPairSpaced, IIC_VST2,
addrmode6align64or128>;		addrmode6align64or128>;
def VST2b16 : VST2<0b1001, {0,1,?,?}, "16", VecListDPairSpaced, IIC_VST2,		def VST2b16 : VST2<0b1001, {0,1,?,?}, "16", VecListDPairSpaced, IIC_VST2,
addrmode6align64or128>;		addrmode6align64or128>;
def VST2b32 : VST2<0b1001, {1,0,?,?}, "32", VecListDPairSpaced, IIC_VST2,		def VST2b32 : VST2<0b1001, {1,0,?,?}, "32", VecListDPairSpaced, IIC_VST2,
addrmode6align64or128>;		addrmode6align64or128>;
defm VST2b8wb : VST2DWB<0b1001, {0,0,?,?}, "8", VecListDPairSpaced,		defm VST2b8wb : VST2DWB<0b1001, {0,0,?,?}, "8", VecListDPairSpaced,
addrmode6align64or128>;		addrmode6align64or128>;
defm VST2b16wb : VST2DWB<0b1001, {0,1,?,?}, "16", VecListDPairSpaced,		defm VST2b16wb : VST2DWB<0b1001, {0,1,?,?}, "16", VecListDPairSpaced,
addrmode6align64or128>;		addrmode6align64or128>;
defm VST2b32wb : VST2DWB<0b1001, {1,0,?,?}, "32", VecListDPairSpaced,		defm VST2b32wb : VST2DWB<0b1001, {1,0,?,?}, "32", VecListDPairSpaced,
addrmode6align64or128>;		addrmode6align64or128>;

// VST3 : Vector Store (multiple 3-element structures)		// VST3 : Vector Store (multiple 3-element structures)
class VST3D<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST3D<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdSt<0, 0b00, op11_8, op7_4, (outs),		: NLdSt<0, 0b00, op11_8, op7_4, (outs),
(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, DPR:$src3), IIC_VST3,		(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, DPR:$src3), IIC_VST3,
"vst3", Dt, "\\{$Vd, $src2, $src3\\}, $Rn", "", []> {		"vst3", Dt, "\\{$Vd, $src2, $src3\\}, $Rn", "", []>, Sched<[WriteVST3]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST3Instruction";		let DecoderMethod = "DecodeVLDST3Instruction";
}		}

def VST3d8 : VST3D<0b0100, {0,0,0,?}, "8">;		def VST3d8 : VST3D<0b0100, {0,0,0,?}, "8">;
def VST3d16 : VST3D<0b0100, {0,1,0,?}, "16">;		def VST3d16 : VST3D<0b0100, {0,1,0,?}, "16">;
def VST3d32 : VST3D<0b0100, {1,0,0,?}, "32">;		def VST3d32 : VST3D<0b0100, {1,0,0,?}, "32">;

def VST3d8Pseudo : VSTQQPseudo<IIC_VST3>;		def VST3d8Pseudo : VSTQQPseudo<IIC_VST3>, Sched<[WriteVST3]>;
def VST3d16Pseudo : VSTQQPseudo<IIC_VST3>;		def VST3d16Pseudo : VSTQQPseudo<IIC_VST3>, Sched<[WriteVST3]>;
def VST3d32Pseudo : VSTQQPseudo<IIC_VST3>;		def VST3d32Pseudo : VSTQQPseudo<IIC_VST3>, Sched<[WriteVST3]>;

// ...with address register writeback:		// ...with address register writeback:
class VST3DWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST3DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdSt<0, 0b00, op11_8, op7_4, (outs GPR:$wb),		: NLdSt<0, 0b00, op11_8, op7_4, (outs GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm,		(ins addrmode6:$Rn, am6offset:$Rm,
DPR:$Vd, DPR:$src2, DPR:$src3), IIC_VST3u,		DPR:$Vd, DPR:$src2, DPR:$src3), IIC_VST3u,
"vst3", Dt, "\\{$Vd, $src2, $src3\\}, $Rn$Rm",		"vst3", Dt, "\\{$Vd, $src2, $src3\\}, $Rn$Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST3]> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVLDST3Instruction";		let DecoderMethod = "DecodeVLDST3Instruction";
}		}

def VST3d8_UPD : VST3DWB<0b0100, {0,0,0,?}, "8">;		def VST3d8_UPD : VST3DWB<0b0100, {0,0,0,?}, "8">;
def VST3d16_UPD : VST3DWB<0b0100, {0,1,0,?}, "16">;		def VST3d16_UPD : VST3DWB<0b0100, {0,1,0,?}, "16">;
def VST3d32_UPD : VST3DWB<0b0100, {1,0,0,?}, "32">;		def VST3d32_UPD : VST3DWB<0b0100, {1,0,0,?}, "32">;

def VST3d8Pseudo_UPD : VSTQQWBPseudo<IIC_VST3u>;		def VST3d8Pseudo_UPD : VSTQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;
def VST3d16Pseudo_UPD : VSTQQWBPseudo<IIC_VST3u>;		def VST3d16Pseudo_UPD : VSTQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;
def VST3d32Pseudo_UPD : VSTQQWBPseudo<IIC_VST3u>;		def VST3d32Pseudo_UPD : VSTQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VST3q8 : VST3D<0b0101, {0,0,0,?}, "8">;		def VST3q8 : VST3D<0b0101, {0,0,0,?}, "8">;
def VST3q16 : VST3D<0b0101, {0,1,0,?}, "16">;		def VST3q16 : VST3D<0b0101, {0,1,0,?}, "16">;
def VST3q32 : VST3D<0b0101, {1,0,0,?}, "32">;		def VST3q32 : VST3D<0b0101, {1,0,0,?}, "32">;
def VST3q8_UPD : VST3DWB<0b0101, {0,0,0,?}, "8">;		def VST3q8_UPD : VST3DWB<0b0101, {0,0,0,?}, "8">;
def VST3q16_UPD : VST3DWB<0b0101, {0,1,0,?}, "16">;		def VST3q16_UPD : VST3DWB<0b0101, {0,1,0,?}, "16">;
def VST3q32_UPD : VST3DWB<0b0101, {1,0,0,?}, "32">;		def VST3q32_UPD : VST3DWB<0b0101, {1,0,0,?}, "32">;

def VST3q8Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>;		def VST3q8Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;
def VST3q16Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>;		def VST3q16Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;
def VST3q32Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>;		def VST3q32Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;

// ...alternate versions to be allocated odd register numbers:		// ...alternate versions to be allocated odd register numbers:
def VST3q8oddPseudo : VSTQQQQPseudo<IIC_VST3>;		def VST3q8oddPseudo : VSTQQQQPseudo<IIC_VST3>, Sched<[WriteVST3]>;
def VST3q16oddPseudo : VSTQQQQPseudo<IIC_VST3>;		def VST3q16oddPseudo : VSTQQQQPseudo<IIC_VST3>, Sched<[WriteVST3]>;
def VST3q32oddPseudo : VSTQQQQPseudo<IIC_VST3>;		def VST3q32oddPseudo : VSTQQQQPseudo<IIC_VST3>, Sched<[WriteVST3]>;

def VST3q8oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>;		def VST3q8oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;
def VST3q16oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>;		def VST3q16oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;
def VST3q32oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>;		def VST3q32oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST3u>, Sched<[WriteVST3]>;

// VST4 : Vector Store (multiple 4-element structures)		// VST4 : Vector Store (multiple 4-element structures)
class VST4D<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST4D<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdSt<0, 0b00, op11_8, op7_4, (outs),		: NLdSt<0, 0b00, op11_8, op7_4, (outs),
(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, DPR:$src3, DPR:$src4),		(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, DPR:$src3, DPR:$src4),
IIC_VST4, "vst4", Dt, "\\{$Vd, $src2, $src3, $src4\\}, $Rn",		IIC_VST4, "vst4", Dt, "\\{$Vd, $src2, $src3, $src4\\}, $Rn",
"", []> {		"", []>, Sched<[WriteVST4]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST4Instruction";		let DecoderMethod = "DecodeVLDST4Instruction";
}		}

def VST4d8 : VST4D<0b0000, {0,0,?,?}, "8">;		def VST4d8 : VST4D<0b0000, {0,0,?,?}, "8">;
def VST4d16 : VST4D<0b0000, {0,1,?,?}, "16">;		def VST4d16 : VST4D<0b0000, {0,1,?,?}, "16">;
def VST4d32 : VST4D<0b0000, {1,0,?,?}, "32">;		def VST4d32 : VST4D<0b0000, {1,0,?,?}, "32">;

def VST4d8Pseudo : VSTQQPseudo<IIC_VST4>;		def VST4d8Pseudo : VSTQQPseudo<IIC_VST4>, Sched<[WriteVST4]>;
def VST4d16Pseudo : VSTQQPseudo<IIC_VST4>;		def VST4d16Pseudo : VSTQQPseudo<IIC_VST4>, Sched<[WriteVST4]>;
def VST4d32Pseudo : VSTQQPseudo<IIC_VST4>;		def VST4d32Pseudo : VSTQQPseudo<IIC_VST4>, Sched<[WriteVST4]>;

// ...with address register writeback:		// ...with address register writeback:
class VST4DWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST4DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdSt<0, 0b00, op11_8, op7_4, (outs GPR:$wb),		: NLdSt<0, 0b00, op11_8, op7_4, (outs GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm,		(ins addrmode6:$Rn, am6offset:$Rm,
DPR:$Vd, DPR:$src2, DPR:$src3, DPR:$src4), IIC_VST4u,		DPR:$Vd, DPR:$src2, DPR:$src3, DPR:$src4), IIC_VST4u,
"vst4", Dt, "\\{$Vd, $src2, $src3, $src4\\}, $Rn$Rm",		"vst4", Dt, "\\{$Vd, $src2, $src3, $src4\\}, $Rn$Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []>, Sched<[WriteVST4]> {
let Inst{5-4} = Rn{5-4};		let Inst{5-4} = Rn{5-4};
let DecoderMethod = "DecodeVLDST4Instruction";		let DecoderMethod = "DecodeVLDST4Instruction";
}		}

def VST4d8_UPD : VST4DWB<0b0000, {0,0,?,?}, "8">;		def VST4d8_UPD : VST4DWB<0b0000, {0,0,?,?}, "8">;
def VST4d16_UPD : VST4DWB<0b0000, {0,1,?,?}, "16">;		def VST4d16_UPD : VST4DWB<0b0000, {0,1,?,?}, "16">;
def VST4d32_UPD : VST4DWB<0b0000, {1,0,?,?}, "32">;		def VST4d32_UPD : VST4DWB<0b0000, {1,0,?,?}, "32">;

def VST4d8Pseudo_UPD : VSTQQWBPseudo<IIC_VST4u>;		def VST4d8Pseudo_UPD : VSTQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;
def VST4d16Pseudo_UPD : VSTQQWBPseudo<IIC_VST4u>;		def VST4d16Pseudo_UPD : VSTQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;
def VST4d32Pseudo_UPD : VSTQQWBPseudo<IIC_VST4u>;		def VST4d32Pseudo_UPD : VSTQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VST4q8 : VST4D<0b0001, {0,0,?,?}, "8">;		def VST4q8 : VST4D<0b0001, {0,0,?,?}, "8">;
def VST4q16 : VST4D<0b0001, {0,1,?,?}, "16">;		def VST4q16 : VST4D<0b0001, {0,1,?,?}, "16">;
def VST4q32 : VST4D<0b0001, {1,0,?,?}, "32">;		def VST4q32 : VST4D<0b0001, {1,0,?,?}, "32">;
def VST4q8_UPD : VST4DWB<0b0001, {0,0,?,?}, "8">;		def VST4q8_UPD : VST4DWB<0b0001, {0,0,?,?}, "8">;
def VST4q16_UPD : VST4DWB<0b0001, {0,1,?,?}, "16">;		def VST4q16_UPD : VST4DWB<0b0001, {0,1,?,?}, "16">;
def VST4q32_UPD : VST4DWB<0b0001, {1,0,?,?}, "32">;		def VST4q32_UPD : VST4DWB<0b0001, {1,0,?,?}, "32">;

def VST4q8Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>;		def VST4q8Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;
def VST4q16Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>;		def VST4q16Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;
def VST4q32Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>;		def VST4q32Pseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;

// ...alternate versions to be allocated odd register numbers:		// ...alternate versions to be allocated odd register numbers:
def VST4q8oddPseudo : VSTQQQQPseudo<IIC_VST4>;		def VST4q8oddPseudo : VSTQQQQPseudo<IIC_VST4>, Sched<[WriteVST4]>;
def VST4q16oddPseudo : VSTQQQQPseudo<IIC_VST4>;		def VST4q16oddPseudo : VSTQQQQPseudo<IIC_VST4>, Sched<[WriteVST4]>;
def VST4q32oddPseudo : VSTQQQQPseudo<IIC_VST4>;		def VST4q32oddPseudo : VSTQQQQPseudo<IIC_VST4>, Sched<[WriteVST4]>;

def VST4q8oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>;		def VST4q8oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;
def VST4q16oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>;		def VST4q16oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;
def VST4q32oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>;		def VST4q32oddPseudo_UPD : VSTQQQQWBPseudo<IIC_VST4u>, Sched<[WriteVST4]>;

} // mayStore = 1, hasSideEffects = 0, hasExtraSrcRegAllocReq = 1		} // mayStore = 1, hasSideEffects = 0, hasExtraSrcRegAllocReq = 1

// Classes for VST*LN pseudo-instructions with multi-register operands.		// Classes for VST*LN pseudo-instructions with multi-register operands.
// These are expanded to real instructions after register allocation.		// These are expanded to real instructions after register allocation.
class VSTQLNPseudo<InstrItinClass itin>		class VSTQLNPseudo<InstrItinClass itin>
: PseudoNLdSt<(outs), (ins addrmode6:$addr, QPR:$src, nohash_imm:$lane),		: PseudoNLdSt<(outs), (ins addrmode6:$addr, QPR:$src, nohash_imm:$lane),
itin, "">;		itin, "">;
Show All 17 Lines	: PseudoNLdSt<(outs GPR:$wb),
nohash_imm:$lane), itin, "$addr.addr = $wb">;		nohash_imm:$lane), itin, "$addr.addr = $wb">;

// VST1LN : Vector Store (single element from one lane)		// VST1LN : Vector Store (single element from one lane)
class VST1LN<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,		class VST1LN<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,
PatFrag StoreOp, SDNode ExtractOp, Operand AddrMode>		PatFrag StoreOp, SDNode ExtractOp, Operand AddrMode>
: NLdStLn<1, 0b00, op11_8, op7_4, (outs),		: NLdStLn<1, 0b00, op11_8, op7_4, (outs),
(ins AddrMode:$Rn, DPR:$Vd, nohash_imm:$lane),		(ins AddrMode:$Rn, DPR:$Vd, nohash_imm:$lane),
IIC_VST1ln, "vst1", Dt, "\\{$Vd[$lane]\\}, $Rn", "",		IIC_VST1ln, "vst1", Dt, "\\{$Vd[$lane]\\}, $Rn", "",
[(StoreOp (ExtractOp (Ty DPR:$Vd), imm:$lane), AddrMode:$Rn)]> {		[(StoreOp (ExtractOp (Ty DPR:$Vd), imm:$lane), AddrMode:$Rn)]>,
		Sched<[WriteVST1]> {
let Rm = 0b1111;		let Rm = 0b1111;
let DecoderMethod = "DecodeVST1LN";		let DecoderMethod = "DecodeVST1LN";
}		}
class VST1QLNPseudo<ValueType Ty, PatFrag StoreOp, SDNode ExtractOp>		class VST1QLNPseudo<ValueType Ty, PatFrag StoreOp, SDNode ExtractOp>
: VSTQLNPseudo<IIC_VST1ln> {		: VSTQLNPseudo<IIC_VST1ln>, Sched<[WriteVST1]> {
let Pattern = [(StoreOp (ExtractOp (Ty QPR:$src), imm:$lane),		let Pattern = [(StoreOp (ExtractOp (Ty QPR:$src), imm:$lane),
addrmode6:$addr)];		addrmode6:$addr)];
}		}

def VST1LNd8 : VST1LN<0b0000, {?,?,?,0}, "8", v8i8, truncstorei8,		def VST1LNd8 : VST1LN<0b0000, {?,?,?,0}, "8", v8i8, truncstorei8,
NEONvgetlaneu, addrmode6> {		NEONvgetlaneu, addrmode6> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
Show All 22 Lines
class VST1LNWB<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,		class VST1LNWB<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,
PatFrag StoreOp, SDNode ExtractOp, Operand AdrMode>		PatFrag StoreOp, SDNode ExtractOp, Operand AdrMode>
: NLdStLn<1, 0b00, op11_8, op7_4, (outs GPR:$wb),		: NLdStLn<1, 0b00, op11_8, op7_4, (outs GPR:$wb),
(ins AdrMode:$Rn, am6offset:$Rm,		(ins AdrMode:$Rn, am6offset:$Rm,
DPR:$Vd, nohash_imm:$lane), IIC_VST1lnu, "vst1", Dt,		DPR:$Vd, nohash_imm:$lane), IIC_VST1lnu, "vst1", Dt,
"\\{$Vd[$lane]\\}, $Rn$Rm",		"\\{$Vd[$lane]\\}, $Rn$Rm",
"$Rn.addr = $wb",		"$Rn.addr = $wb",
[(set GPR:$wb, (StoreOp (ExtractOp (Ty DPR:$Vd), imm:$lane),		[(set GPR:$wb, (StoreOp (ExtractOp (Ty DPR:$Vd), imm:$lane),
AdrMode:$Rn, am6offset:$Rm))]> {		AdrMode:$Rn, am6offset:$Rm))]>,
		Sched<[WriteVST1]> {
let DecoderMethod = "DecodeVST1LN";		let DecoderMethod = "DecodeVST1LN";
}		}
class VST1QLNWBPseudo<ValueType Ty, PatFrag StoreOp, SDNode ExtractOp>		class VST1QLNWBPseudo<ValueType Ty, PatFrag StoreOp, SDNode ExtractOp>
: VSTQLNWBPseudo<IIC_VST1lnu> {		: VSTQLNWBPseudo<IIC_VST1lnu>, Sched<[WriteVST1]> {
let Pattern = [(set GPR:$wb, (StoreOp (ExtractOp (Ty QPR:$src), imm:$lane),		let Pattern = [(set GPR:$wb, (StoreOp (ExtractOp (Ty QPR:$src), imm:$lane),
addrmode6:$addr, am6offset:$offset))];		addrmode6:$addr, am6offset:$offset))];
}		}

def VST1LNd8_UPD : VST1LNWB<0b0000, {?,?,?,0}, "8", v8i8, post_truncsti8,		def VST1LNd8_UPD : VST1LNWB<0b0000, {?,?,?,0}, "8", v8i8, post_truncsti8,
NEONvgetlaneu, addrmode6> {		NEONvgetlaneu, addrmode6> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
Show All 14 Lines

let mayStore = 1, hasSideEffects = 0, hasExtraSrcRegAllocReq = 1 in {		let mayStore = 1, hasSideEffects = 0, hasExtraSrcRegAllocReq = 1 in {

// VST2LN : Vector Store (single 2-element structure from one lane)		// VST2LN : Vector Store (single 2-element structure from one lane)
class VST2LN<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST2LN<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b00, op11_8, op7_4, (outs),		: NLdStLn<1, 0b00, op11_8, op7_4, (outs),
(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, nohash_imm:$lane),		(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, nohash_imm:$lane),
IIC_VST2ln, "vst2", Dt, "\\{$Vd[$lane], $src2[$lane]\\}, $Rn",		IIC_VST2ln, "vst2", Dt, "\\{$Vd[$lane], $src2[$lane]\\}, $Rn",
"", []> {		"", []>, Sched<[WriteVST1]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVST2LN";		let DecoderMethod = "DecodeVST2LN";
}		}

def VST2LNd8 : VST2LN<0b0001, {?,?,?,?}, "8"> {		def VST2LNd8 : VST2LN<0b0001, {?,?,?,?}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VST2LNd16 : VST2LN<0b0101, {?,?,0,?}, "16"> {		def VST2LNd16 : VST2LN<0b0101, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST2LNd32 : VST2LN<0b1001, {?,0,0,?}, "32"> {		def VST2LNd32 : VST2LN<0b1001, {?,0,0,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VST2LNd8Pseudo : VSTQLNPseudo<IIC_VST2ln>;		def VST2LNd8Pseudo : VSTQLNPseudo<IIC_VST2ln>, Sched<[WriteVST1]>;
def VST2LNd16Pseudo : VSTQLNPseudo<IIC_VST2ln>;		def VST2LNd16Pseudo : VSTQLNPseudo<IIC_VST2ln>, Sched<[WriteVST1]>;
def VST2LNd32Pseudo : VSTQLNPseudo<IIC_VST2ln>;		def VST2LNd32Pseudo : VSTQLNPseudo<IIC_VST2ln>, Sched<[WriteVST1]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VST2LNq16 : VST2LN<0b0101, {?,?,1,?}, "16"> {		def VST2LNq16 : VST2LN<0b0101, {?,?,1,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
}		}
def VST2LNq32 : VST2LN<0b1001, {?,1,0,?}, "32"> {		def VST2LNq32 : VST2LN<0b1001, {?,1,0,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
}		}

def VST2LNq16Pseudo : VSTQQLNPseudo<IIC_VST2ln>;		def VST2LNq16Pseudo : VSTQQLNPseudo<IIC_VST2ln>, Sched<[WriteVST1]>;
def VST2LNq32Pseudo : VSTQQLNPseudo<IIC_VST2ln>;		def VST2LNq32Pseudo : VSTQQLNPseudo<IIC_VST2ln>, Sched<[WriteVST1]>;

// ...with address register writeback:		// ...with address register writeback:
class VST2LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST2LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b00, op11_8, op7_4, (outs GPR:$wb),		: NLdStLn<1, 0b00, op11_8, op7_4, (outs GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm,		(ins addrmode6:$Rn, am6offset:$Rm,
DPR:$Vd, DPR:$src2, nohash_imm:$lane), IIC_VST2lnu, "vst2", Dt,		DPR:$Vd, DPR:$src2, nohash_imm:$lane), IIC_VST2lnu, "vst2", Dt,
"\\{$Vd[$lane], $src2[$lane]\\}, $Rn$Rm",		"\\{$Vd[$lane], $src2[$lane]\\}, $Rn$Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVST2LN";		let DecoderMethod = "DecodeVST2LN";
}		}

def VST2LNd8_UPD : VST2LNWB<0b0001, {?,?,?,?}, "8"> {		def VST2LNd8_UPD : VST2LNWB<0b0001, {?,?,?,?}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VST2LNd16_UPD : VST2LNWB<0b0101, {?,?,0,?}, "16"> {		def VST2LNd16_UPD : VST2LNWB<0b0101, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST2LNd32_UPD : VST2LNWB<0b1001, {?,0,0,?}, "32"> {		def VST2LNd32_UPD : VST2LNWB<0b1001, {?,0,0,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VST2LNd8Pseudo_UPD : VSTQLNWBPseudo<IIC_VST2lnu>;		def VST2LNd8Pseudo_UPD : VSTQLNWBPseudo<IIC_VST2lnu>, Sched<[WriteVST1]>;
def VST2LNd16Pseudo_UPD : VSTQLNWBPseudo<IIC_VST2lnu>;		def VST2LNd16Pseudo_UPD : VSTQLNWBPseudo<IIC_VST2lnu>, Sched<[WriteVST1]>;
def VST2LNd32Pseudo_UPD : VSTQLNWBPseudo<IIC_VST2lnu>;		def VST2LNd32Pseudo_UPD : VSTQLNWBPseudo<IIC_VST2lnu>, Sched<[WriteVST1]>;

def VST2LNq16_UPD : VST2LNWB<0b0101, {?,?,1,?}, "16"> {		def VST2LNq16_UPD : VST2LNWB<0b0101, {?,?,1,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST2LNq32_UPD : VST2LNWB<0b1001, {?,1,0,?}, "32"> {		def VST2LNq32_UPD : VST2LNWB<0b1001, {?,1,0,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VST2LNq16Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST2lnu>;		def VST2LNq16Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST2lnu>, Sched<[WriteVST1]>;
def VST2LNq32Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST2lnu>;		def VST2LNq32Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST2lnu>, Sched<[WriteVST1]>;

// VST3LN : Vector Store (single 3-element structure from one lane)		// VST3LN : Vector Store (single 3-element structure from one lane)
class VST3LN<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST3LN<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b00, op11_8, op7_4, (outs),		: NLdStLn<1, 0b00, op11_8, op7_4, (outs),
(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, DPR:$src3,		(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, DPR:$src3,
nohash_imm:$lane), IIC_VST3ln, "vst3", Dt,		nohash_imm:$lane), IIC_VST3ln, "vst3", Dt,
"\\{$Vd[$lane], $src2[$lane], $src3[$lane]\\}, $Rn", "", []> {		"\\{$Vd[$lane], $src2[$lane], $src3[$lane]\\}, $Rn", "", []>,
		Sched<[WriteVST2]> {
let Rm = 0b1111;		let Rm = 0b1111;
let DecoderMethod = "DecodeVST3LN";		let DecoderMethod = "DecodeVST3LN";
}		}

def VST3LNd8 : VST3LN<0b0010, {?,?,?,0}, "8"> {		def VST3LNd8 : VST3LN<0b0010, {?,?,?,0}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VST3LNd16 : VST3LN<0b0110, {?,?,0,0}, "16"> {		def VST3LNd16 : VST3LN<0b0110, {?,?,0,0}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST3LNd32 : VST3LN<0b1010, {?,0,0,0}, "32"> {		def VST3LNd32 : VST3LN<0b1010, {?,0,0,0}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VST3LNd8Pseudo : VSTQQLNPseudo<IIC_VST3ln>;		def VST3LNd8Pseudo : VSTQQLNPseudo<IIC_VST3ln>, Sched<[WriteVST2]>;
def VST3LNd16Pseudo : VSTQQLNPseudo<IIC_VST3ln>;		def VST3LNd16Pseudo : VSTQQLNPseudo<IIC_VST3ln>, Sched<[WriteVST2]>;
def VST3LNd32Pseudo : VSTQQLNPseudo<IIC_VST3ln>;		def VST3LNd32Pseudo : VSTQQLNPseudo<IIC_VST3ln>, Sched<[WriteVST2]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VST3LNq16 : VST3LN<0b0110, {?,?,1,0}, "16"> {		def VST3LNq16 : VST3LN<0b0110, {?,?,1,0}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST3LNq32 : VST3LN<0b1010, {?,1,0,0}, "32"> {		def VST3LNq32 : VST3LN<0b1010, {?,1,0,0}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}
Show All 17 Lines
}		}
def VST3LNd16_UPD : VST3LNWB<0b0110, {?,?,0,0}, "16"> {		def VST3LNd16_UPD : VST3LNWB<0b0110, {?,?,0,0}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST3LNd32_UPD : VST3LNWB<0b1010, {?,0,0,0}, "32"> {		def VST3LNd32_UPD : VST3LNWB<0b1010, {?,0,0,0}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VST3LNd8Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST3lnu>;		def VST3LNd8Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST3lnu>, Sched<[WriteVST2]>;
def VST3LNd16Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST3lnu>;		def VST3LNd16Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST3lnu>, Sched<[WriteVST2]>;
def VST3LNd32Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST3lnu>;		def VST3LNd32Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST3lnu>, Sched<[WriteVST2]>;

def VST3LNq16_UPD : VST3LNWB<0b0110, {?,?,1,0}, "16"> {		def VST3LNq16_UPD : VST3LNWB<0b0110, {?,?,1,0}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST3LNq32_UPD : VST3LNWB<0b1010, {?,1,0,0}, "32"> {		def VST3LNq32_UPD : VST3LNWB<0b1010, {?,1,0,0}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
}		}

def VST3LNq16Pseudo_UPD : VSTQQQQLNWBPseudo<IIC_VST3lnu>;		def VST3LNq16Pseudo_UPD : VSTQQQQLNWBPseudo<IIC_VST3lnu>, Sched<[WriteVST2]>;
def VST3LNq32Pseudo_UPD : VSTQQQQLNWBPseudo<IIC_VST3lnu>;		def VST3LNq32Pseudo_UPD : VSTQQQQLNWBPseudo<IIC_VST3lnu>, Sched<[WriteVST2]>;

// VST4LN : Vector Store (single 4-element structure from one lane)		// VST4LN : Vector Store (single 4-element structure from one lane)
class VST4LN<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST4LN<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b00, op11_8, op7_4, (outs),		: NLdStLn<1, 0b00, op11_8, op7_4, (outs),
(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, DPR:$src3, DPR:$src4,		(ins addrmode6:$Rn, DPR:$Vd, DPR:$src2, DPR:$src3, DPR:$src4,
nohash_imm:$lane), IIC_VST4ln, "vst4", Dt,		nohash_imm:$lane), IIC_VST4ln, "vst4", Dt,
"\\{$Vd[$lane], $src2[$lane], $src3[$lane], $src4[$lane]\\}, $Rn",		"\\{$Vd[$lane], $src2[$lane], $src3[$lane], $src4[$lane]\\}, $Rn",
"", []> {		"", []>, Sched<[WriteVST2]> {
let Rm = 0b1111;		let Rm = 0b1111;
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVST4LN";		let DecoderMethod = "DecodeVST4LN";
}		}

def VST4LNd8 : VST4LN<0b0011, {?,?,?,?}, "8"> {		def VST4LNd8 : VST4LN<0b0011, {?,?,?,?}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VST4LNd16 : VST4LN<0b0111, {?,?,0,?}, "16"> {		def VST4LNd16 : VST4LN<0b0111, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST4LNd32 : VST4LN<0b1011, {?,0,?,?}, "32"> {		def VST4LNd32 : VST4LN<0b1011, {?,0,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{5};		let Inst{5} = Rn{5};
}		}

def VST4LNd8Pseudo : VSTQQLNPseudo<IIC_VST4ln>;		def VST4LNd8Pseudo : VSTQQLNPseudo<IIC_VST4ln>, Sched<[WriteVST2]>;
def VST4LNd16Pseudo : VSTQQLNPseudo<IIC_VST4ln>;		def VST4LNd16Pseudo : VSTQQLNPseudo<IIC_VST4ln>, Sched<[WriteVST2]>;
def VST4LNd32Pseudo : VSTQQLNPseudo<IIC_VST4ln>;		def VST4LNd32Pseudo : VSTQQLNPseudo<IIC_VST4ln>, Sched<[WriteVST2]>;

// ...with double-spaced registers:		// ...with double-spaced registers:
def VST4LNq16 : VST4LN<0b0111, {?,?,1,?}, "16"> {		def VST4LNq16 : VST4LN<0b0111, {?,?,1,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST4LNq32 : VST4LN<0b1011, {?,1,?,?}, "32"> {		def VST4LNq32 : VST4LN<0b1011, {?,1,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{5};		let Inst{5} = Rn{5};
}		}

def VST4LNq16Pseudo : VSTQQQQLNPseudo<IIC_VST4ln>;		def VST4LNq16Pseudo : VSTQQQQLNPseudo<IIC_VST4ln>, Sched<[WriteVST2]>;
def VST4LNq32Pseudo : VSTQQQQLNPseudo<IIC_VST4ln>;		def VST4LNq32Pseudo : VSTQQQQLNPseudo<IIC_VST4ln>, Sched<[WriteVST2]>;

// ...with address register writeback:		// ...with address register writeback:
class VST4LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>		class VST4LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
: NLdStLn<1, 0b00, op11_8, op7_4, (outs GPR:$wb),		: NLdStLn<1, 0b00, op11_8, op7_4, (outs GPR:$wb),
(ins addrmode6:$Rn, am6offset:$Rm,		(ins addrmode6:$Rn, am6offset:$Rm,
DPR:$Vd, DPR:$src2, DPR:$src3, DPR:$src4, nohash_imm:$lane),		DPR:$Vd, DPR:$src2, DPR:$src3, DPR:$src4, nohash_imm:$lane),
IIC_VST4lnu, "vst4", Dt,		IIC_VST4lnu, "vst4", Dt,
"\\{$Vd[$lane], $src2[$lane], $src3[$lane], $src4[$lane]\\}, $Rn$Rm",		"\\{$Vd[$lane], $src2[$lane], $src3[$lane], $src4[$lane]\\}, $Rn$Rm",
"$Rn.addr = $wb", []> {		"$Rn.addr = $wb", []> {
let Inst{4} = Rn{4};		let Inst{4} = Rn{4};
let DecoderMethod = "DecodeVST4LN";		let DecoderMethod = "DecodeVST4LN";
}		}

def VST4LNd8_UPD : VST4LNWB<0b0011, {?,?,?,?}, "8"> {		def VST4LNd8_UPD : VST4LNWB<0b0011, {?,?,?,?}, "8"> {
let Inst{7-5} = lane{2-0};		let Inst{7-5} = lane{2-0};
}		}
def VST4LNd16_UPD : VST4LNWB<0b0111, {?,?,0,?}, "16"> {		def VST4LNd16_UPD : VST4LNWB<0b0111, {?,?,0,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST4LNd32_UPD : VST4LNWB<0b1011, {?,0,?,?}, "32"> {		def VST4LNd32_UPD : VST4LNWB<0b1011, {?,0,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{5};		let Inst{5} = Rn{5};
}		}

def VST4LNd8Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST4lnu>;		def VST4LNd8Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST4lnu>, Sched<[WriteVST2]>;
def VST4LNd16Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST4lnu>;		def VST4LNd16Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST4lnu>, Sched<[WriteVST2]>;
def VST4LNd32Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST4lnu>;		def VST4LNd32Pseudo_UPD : VSTQQLNWBPseudo<IIC_VST4lnu>, Sched<[WriteVST2]>;

def VST4LNq16_UPD : VST4LNWB<0b0111, {?,?,1,?}, "16"> {		def VST4LNq16_UPD : VST4LNWB<0b0111, {?,?,1,?}, "16"> {
let Inst{7-6} = lane{1-0};		let Inst{7-6} = lane{1-0};
}		}
def VST4LNq32_UPD : VST4LNWB<0b1011, {?,1,?,?}, "32"> {		def VST4LNq32_UPD : VST4LNWB<0b1011, {?,1,?,?}, "32"> {
let Inst{7} = lane{0};		let Inst{7} = lane{0};
let Inst{5} = Rn{5};		let Inst{5} = Rn{5};
}		}

def VST4LNq16Pseudo_UPD : VSTQQQQLNWBPseudo<IIC_VST4lnu>;		def VST4LNq16Pseudo_UPD : VSTQQQQLNWBPseudo<IIC_VST4lnu>, Sched<[WriteVST2]>;
def VST4LNq32Pseudo_UPD : VSTQQQQLNWBPseudo<IIC_VST4lnu>;		def VST4LNq32Pseudo_UPD : VSTQQQQLNWBPseudo<IIC_VST4lnu>, Sched<[WriteVST2]>;

} // mayStore = 1, hasSideEffects = 0, hasExtraSrcRegAllocReq = 1		} // mayStore = 1, hasSideEffects = 0, hasExtraSrcRegAllocReq = 1

// Use vld1/vst1 for unaligned f64 load / store		// Use vld1/vst1 for unaligned f64 load / store
def : Pat<(f64 (hword_alignedload addrmode6:$addr)),		def : Pat<(f64 (hword_alignedload addrmode6:$addr)),
(VLD1d16 addrmode6:$addr)>, Requires<[IsLE]>;		(VLD1d16 addrmode6:$addr)>, Requires<[IsLE]>;
def : Pat<(hword_alignedstore (f64 DPR:$value), addrmode6:$addr),		def : Pat<(hword_alignedstore (f64 DPR:$value), addrmode6:$addr),
(VST1d16 addrmode6:$addr, DPR:$value)>, Requires<[IsLE]>;		(VST1d16 addrmode6:$addr, DPR:$value)>, Requires<[IsLE]>;
▲ Show 20 Lines • Show All 5,867 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/ARM/ARMSchedule.td

	Show First 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	// Division			// Division
	def WriteFPDIV32 : SchedWrite;			def WriteFPDIV32 : SchedWrite;
	def WriteFPDIV64 : SchedWrite;			def WriteFPDIV64 : SchedWrite;

	// Square-root			// Square-root
	def WriteFPSQRT32 : SchedWrite;			def WriteFPSQRT32 : SchedWrite;
	def WriteFPSQRT64 : SchedWrite;			def WriteFPSQRT64 : SchedWrite;

				// Vector load and stores
				def WriteVLD1 : SchedWrite;
				def WriteVLD2 : SchedWrite;
				def WriteVLD3 : SchedWrite;
				def WriteVLD4 : SchedWrite;
				def WriteVST1 : SchedWrite;
				def WriteVST2 : SchedWrite;
				def WriteVST3 : SchedWrite;
				def WriteVST4 : SchedWrite;


	// Define TII for use in SchedVariant Predicates.			// Define TII for use in SchedVariant Predicates.
	def : PredicateProlog<[{			def : PredicateProlog<[{
	const ARMBaseInstrInfo *TII =			const ARMBaseInstrInfo *TII =
	static_cast<const ARMBaseInstrInfo*>(SchedModel->getInstrInfo());			static_cast<const ARMBaseInstrInfo*>(SchedModel->getInstrInfo());
	(void)TII;			(void)TII;
	}]>;			}]>;

	def IsPredicatedPred : SchedPredicate<[{TII->isPredicated(*MI)}]>;			def IsPredicatedPred : SchedPredicate<[{TII->isPredicated(*MI)}]>;
	▲ Show 20 Lines • Show All 270 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/ARM/ARMScheduleA9.td

	Show First 20 Lines • Show All 1,975 Lines • ▼ Show 20 Lines
	def A9WriteV3 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 3; }			def A9WriteV3 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 3; }
	def A9WriteV4 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 4; }			def A9WriteV4 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 4; }
	def A9WriteV5 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 5; }			def A9WriteV5 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 5; }
	def A9WriteV6 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 6; }			def A9WriteV6 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 6; }
	def A9WriteV7 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 7; }			def A9WriteV7 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 7; }
	def A9WriteV9 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 9; }			def A9WriteV9 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 9; }
	def A9WriteV10 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 10; }			def A9WriteV10 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> { let Latency = 10; }

				def : WriteRes<WriteVLD1, []>;
				def : WriteRes<WriteVLD2, []>;
				def : WriteRes<WriteVLD3, []>;
				def : WriteRes<WriteVLD4, []>;
				def : WriteRes<WriteVST1, []>;
				def : WriteRes<WriteVST2, []>;
				def : WriteRes<WriteVST3, []>;
				def : WriteRes<WriteVST4, []>;

	// Reserve A9UnitFP for 2 consecutive cycles.			// Reserve A9UnitFP for 2 consecutive cycles.
	def A9Write2V4 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> {			def A9Write2V4 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> {
	let Latency = 4;			let Latency = 4;
	let ResourceCycles = [2];			let ResourceCycles = [2];
	}			}
	def A9Write2V7 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> {			def A9Write2V7 : SchedWriteRes<[A9UnitFP, A9UnitAGU]> {
	let Latency = 7;			let Latency = 7;
	let ResourceCycles = [2];			let ResourceCycles = [2];
	▲ Show 20 Lines • Show All 577 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/ARM/ARMScheduleR52.td

Show First 20 Lines • Show All 114 Lines • ▼ Show 20 Lines
def : WriteRes<WriteFPDIV64, [R52UnitDiv]> {		def : WriteRes<WriteFPDIV64, [R52UnitDiv]> {
let Latency = 17;		let Latency = 17;
let ResourceCycles = [17];		let ResourceCycles = [17];
}		}

def : WriteRes<WriteFPSQRT32, [R52UnitDiv]> { let Latency = 7; }		def : WriteRes<WriteFPSQRT32, [R52UnitDiv]> { let Latency = 7; }
def : WriteRes<WriteFPSQRT64, [R52UnitDiv]> { let Latency = 17; }		def : WriteRes<WriteFPSQRT64, [R52UnitDiv]> { let Latency = 17; }

		// Overriden via InstRW for this processor.
		def : WriteRes<WriteVST1, []>;
		def : WriteRes<WriteVST2, []>;
		def : WriteRes<WriteVST3, []>;
		def : WriteRes<WriteVST4, []>;

def : ReadAdvance<ReadFPMUL, 1>; // mul operand read in F1		def : ReadAdvance<ReadFPMUL, 1>; // mul operand read in F1
def : ReadAdvance<ReadFPMAC, 1>; // fp-mac operand read in F1		def : ReadAdvance<ReadFPMAC, 1>; // fp-mac operand read in F1

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Subtarget-specific SchedReadWrites.		// Subtarget-specific SchedReadWrites.

// Forwarding information - based on when an operand is read		// Forwarding information - based on when an operand is read
def : ReadAdvance<R52Read_ISS, 0>;		def : ReadAdvance<R52Read_ISS, 0>;
▲ Show 20 Lines • Show All 576 Lines • ▼ Show 20 Lines	def R52WriteSTM : SchedWriteVariant<[
SchedVar<R52LMAddrPred15, [R52WriteSTM12]>,		SchedVar<R52LMAddrPred15, [R52WriteSTM12]>,
SchedVar<R52LMAddrPred16, [R52WriteSTM12]>,		SchedVar<R52LMAddrPred16, [R52WriteSTM12]>,
// unknown number of registers, just use resources for two		// unknown number of registers, just use resources for two
SchedVar<NoSchedPred, [R52WriteSTM6]>		SchedVar<NoSchedPred, [R52WriteSTM6]>
]>;		]>;

// Vector Load/Stores. Can issue only in slot-0. Can dual-issue with		// Vector Load/Stores. Can issue only in slot-0. Can dual-issue with
// another instruction in slot-1, but only in the last issue.		// another instruction in slot-1, but only in the last issue.
def R52WriteVLD1Mem : SchedWriteRes<[R52UnitLd]> { let Latency = 5;}		def : WriteRes<WriteVLD1, [R52UnitLd]> { let Latency = 5;}
def R52WriteVLD2Mem : SchedWriteRes<[R52UnitLd]> {		def : WriteRes<WriteVLD2, [R52UnitLd]> {
let Latency = 6;		let Latency = 6;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [2];		let ResourceCycles = [2];
let SingleIssue = 1;		let SingleIssue = 1;
}		}
def R52WriteVLD3Mem : SchedWriteRes<[R52UnitLd]> {		def : WriteRes<WriteVLD3, [R52UnitLd]> {
let Latency = 7;		let Latency = 7;
let NumMicroOps = 5;		let NumMicroOps = 5;
let ResourceCycles = [3];		let ResourceCycles = [3];
let SingleIssue = 1;		let SingleIssue = 1;
}		}
def R52WriteVLD4Mem : SchedWriteRes<[R52UnitLd]> {		def : WriteRes<WriteVLD4, [R52UnitLd]> {
let Latency = 8;		let Latency = 8;
let NumMicroOps = 7;		let NumMicroOps = 7;
let ResourceCycles = [4];		let ResourceCycles = [4];
let SingleIssue = 1;		let SingleIssue = 1;
}		}
def R52WriteVST1Mem : SchedWriteRes<[R52UnitLd]> {		def R52WriteVST1Mem : SchedWriteRes<[R52UnitLd]> {
let Latency = 5;		let Latency = 5;
let NumMicroOps = 1;		let NumMicroOps = 1;
▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
def : InstRW<[R52Write2FPMAC_F5, R52Read_F1, R52Read_F1, R52Read_F1], (instregex "VQDMLAL", "VQDMLSL")>;		def : InstRW<[R52Write2FPMAC_F5, R52Read_F1, R52Read_F1, R52Read_F1], (instregex "VQDMLAL", "VQDMLSL")>;
def : InstRW<[R52WriteFPMUL_F5, R52Read_F1, R52Read_F1, R52Read_F1], (instregex "VQDMUL","VQRDMUL")>;		def : InstRW<[R52WriteFPMUL_F5, R52Read_F1, R52Read_F1, R52Read_F1], (instregex "VQDMUL","VQRDMUL")>;
def : InstRW<[R52WriteFPALU_F5, R52Read_F1, R52Read_F1],		def : InstRW<[R52WriteFPALU_F5, R52Read_F1, R52Read_F1],
(instregex "VQMOVN", "VQNEG", "VQSHL", "VQSHRN")>;		(instregex "VQMOVN", "VQNEG", "VQSHL", "VQSHRN")>;
def : InstRW<[R52WriteFPALU_F4, R52Read_F1, R52Read_F1], (instregex "VRSHL", "VRSHR", "VRSHRN", "VTB")>;		def : InstRW<[R52WriteFPALU_F4, R52Read_F1, R52Read_F1], (instregex "VRSHL", "VRSHR", "VRSHRN", "VTB")>;
def : InstRW<[R52WriteFPALU_F3, R52Read_F1, R52Read_F1], (instregex "VSWP", "VTRN", "VUZP", "VZIP")>;		def : InstRW<[R52WriteFPALU_F3, R52Read_F1, R52Read_F1], (instregex "VSWP", "VTRN", "VUZP", "VZIP")>;

//---		//---
// VLDx. Vector Loads
//---
// 1-element structure load
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD1d(8\|16\|32\|64)$")>;
def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD1q(8\|16\|32\|64)$")>;
def : InstRW<[R52WriteVLD3Mem, R52Read_ISS], (instregex "VLD1d(8\|16\|32\|64)T$")>;
def : InstRW<[R52WriteVLD4Mem, R52Read_ISS], (instregex "VLD1d(8\|16\|32\|64)Q$")>;
def : InstRW<[R52WriteVLD3Mem, R52Read_ISS], (instregex "VLD1d64TPseudo$")>;
def : InstRW<[R52WriteVLD4Mem, R52Read_ISS], (instregex "VLD1d64QPseudo$")>;

def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD1(LN\|DUP)d(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD1LNdAsm_(8\|16\|32)")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD1(LN\|DUP)q(8\|16\|32)Pseudo$")>;

def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1d(8\|16\|32\|64)wb")>;
def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1q(8\|16\|32\|64)wb")>;
def : InstRW<[R52WriteVLD3Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1d(8\|16\|32\|64)Twb")>;
def : InstRW<[R52WriteVLD4Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1d(8\|16\|32\|64)Qwb")>;
def : InstRW<[R52WriteVLD3Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1d64TPseudoWB")>;
def : InstRW<[R52WriteVLD4Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1d64QPseudoWB")>;

def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1LNd(8\|16\|32)_UPD")>;
def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1LNdWB_(fixed\|register)_Asm_(8\|16\|32)")>;
def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1DUP(d\|q)(8\|16\|32)wb")>;
def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD1(LN\|DUP)q(8\|16\|32)Pseudo_UPD")>;

// 2-element structure load
def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD2(d\|b)(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD4Mem, R52Read_ISS], (instregex "VLD2q(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2(d\|b)(8\|16\|32)wb")>;
def : InstRW<[R52WriteVLD4Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2q(8\|16\|32)wb")>;
def : InstRW<[R52WriteVLD4Mem, R52Read_ISS], (instregex "VLD2q(8\|16\|32)Pseudo$")>;
def : InstRW<[R52WriteVLD4Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2q(8\|16\|32)PseudoWB")>;

def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD2LNd(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD2LNdAsm_(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD2LNq(16\|32)$")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD2LNqAsm_(16\|32)$")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD2DUPd(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD2DUPd(8\|16\|32)x2$")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD2LNd(8\|16\|32)Pseudo")>;
def : InstRW<[R52WriteVLD1Mem, R52Read_ISS], (instregex "VLD2LNq(16\|32)Pseudo")>;

def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2LNd(8\|16\|32)_UPD")>;
def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2LNdWB_(fixed\|register)_Asm_(8\|16\|32)")>;

def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2LNq(16\|32)_UPD")>;
def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2LNqWB_(fixed\|register)_Asm_(16\|32)")>;

def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2DUPd(8\|16\|32)wb")>;
def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2DUPd(8\|16\|32)x2wb")>;
def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2LNd(8\|16\|32)Pseudo_UPD")>;
def : InstRW<[R52WriteVLD1Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD2LNq(16\|32)Pseudo_UPD")>;

// 3-element structure load
def : InstRW<[R52WriteVLD3Mem, R52Read_ISS], (instregex "VLD3(d\|q)(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD3Mem, R52Read_ISS], (instregex "VLD3(d\|q)Asm_(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD3Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD3(d\|q)(8\|16\|32)_UPD")>;
def : InstRW<[R52WriteVLD3Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD3(d\|q)WB_(fixed\|register)_Asm_(8\|16\|32)")>;
def : InstRW<[R52WriteVLD3Mem, R52Read_ISS], (instregex "VLD3(d\|q)(8\|16\|32)(oddP\|P)seudo")>;
def : InstRW<[R52WriteVLD3Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD3(d\|q)(8\|16\|32)(oddP\|P)seudo_UPD")>;

def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD3(LN\|DUP)(d\|q)(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD3(LN\|DUP)(d\|q)Asm_(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD3(LN\|DUP)(d\|q)(8\|16\|32)Pseudo$")>;

def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD3(LN\|DUP)(d\|q)(8\|16\|32)_UPD")>;
def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD3(LN\|DUP)(d\|q)WB_(fixed\|register)_Asm_(8\|16\|32)")>;
def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD3(LN\|DUP)(d\|q)WB_(fixed\|register)_Asm_(8\|16\|32)")>;
def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD3(LN\|DUP)(d\|q)(8\|16\|32)Pseudo_UPD")>;

// 4-element structure load
def : InstRW<[R52WriteVLD4Mem, R52Read_ISS], (instregex "VLD4(d\|q)(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD4Mem, R52Read_ISS], (instregex "VLD4(d\|q)Asm_(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD4Mem, R52Read_ISS], (instregex "VLD4(d\|q)(8\|16\|32)(oddP\|P)seudo")>;
def : InstRW<[R52WriteVLD4Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD4(d\|q)(8\|16\|32)_UPD")>;
def : InstRW<[R52WriteVLD4Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD4(d\|q)WB_(fixed\|register)_Asm_(8\|16\|32)")>;
def : InstRW<[R52WriteVLD4Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD4(d\|q)(8\|16\|32)(oddP\|P)seudo_UPD")>;


def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD4(LN\|DUP)(d\|q)(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD4(LN\|DUP)(d\|q)Asm_(8\|16\|32)$")>;
def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD4LN(d\|q)(8\|16\|32)Pseudo$")>;
def : InstRW<[R52WriteVLD2Mem, R52Read_ISS], (instregex "VLD4DUPd(8\|16\|32)Pseudo$")>;
def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD4(LN\|DUP)(d\|q)(8\|16\|32)_UPD")>;
def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD4(LN\|DUP)(d\|q)WB_(fixed\|register)_Asm_(8\|16\|32)")>;
def : InstRW<[R52WriteVLD2Mem, R52WriteAdr, R52Read_ISS], (instregex "VLD4(LN\|DUP)(d\|q)(8\|16\|32)Pseudo_UPD")>;

//---
// VSTx. Vector Stores		// VSTx. Vector Stores
//---		//---
// 1-element structure store		// 1-element structure store
def : InstRW<[R52WriteVST1Mem, R52Read_ISS, R52Read_F2], (instregex "VST1d(8\|16\|32\|64)$")>;		def : InstRW<[R52WriteVST1Mem, R52Read_ISS, R52Read_F2], (instregex "VST1d(8\|16\|32\|64)$")>;
def : InstRW<[R52WriteVST2Mem, R52Read_ISS, R52Read_F2], (instregex "VST1q(8\|16\|32\|64)$")>;		def : InstRW<[R52WriteVST2Mem, R52Read_ISS, R52Read_F2], (instregex "VST1q(8\|16\|32\|64)$")>;
def : InstRW<[R52WriteVST3Mem, R52Read_ISS, R52Read_F2], (instregex "VST1d(8\|16\|32\|64)T$")>;		def : InstRW<[R52WriteVST3Mem, R52Read_ISS, R52Read_F2], (instregex "VST1d(8\|16\|32\|64)T$")>;
def : InstRW<[R52WriteVST4Mem, R52Read_ISS, R52Read_F2], (instregex "VST1d(8\|16\|32\|64)Q$")>;		def : InstRW<[R52WriteVST4Mem, R52Read_ISS, R52Read_F2], (instregex "VST1d(8\|16\|32\|64)Q$")>;
def : InstRW<[R52WriteVST3Mem, R52Read_ISS, R52Read_F2], (instregex "VST1d64TPseudo$")>;		def : InstRW<[R52WriteVST3Mem, R52Read_ISS, R52Read_F2], (instregex "VST1d64TPseudo$")>;
▲ Show 20 Lines • Show All 87 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/ARM/ARMScheduleSwift.td

	Show First 20 Lines • Show All 1,064 Lines • ▼ Show 20 Lines
	def : SchedAlias<WriteFPSQRT32, SwiftDiv17>;			def : SchedAlias<WriteFPSQRT32, SwiftDiv17>;

	def : SchedAlias<WriteFPDIV64, SwiftDiv32>;			def : SchedAlias<WriteFPDIV64, SwiftDiv32>;
	def : SchedAlias<WriteFPSQRT64, SwiftDiv32>;			def : SchedAlias<WriteFPSQRT64, SwiftDiv32>;

	def : ReadAdvance<ReadFPMUL, 0>;			def : ReadAdvance<ReadFPMUL, 0>;
	def : ReadAdvance<ReadFPMAC, 0>;			def : ReadAdvance<ReadFPMAC, 0>;

				// Overriden via InstRW for this processor.
				def : WriteRes<WriteVLD1, []>;
				def : WriteRes<WriteVLD2, []>;
				def : WriteRes<WriteVLD3, []>;
				def : WriteRes<WriteVLD4, []>;
				def : WriteRes<WriteVST1, []>;
				def : WriteRes<WriteVST2, []>;
				def : WriteRes<WriteVST3, []>;
				def : WriteRes<WriteVST4, []>;

	// Not specified.			// Not specified.
	def : InstRW<[SwiftWriteP01OneCycle2x], (instregex "ABS")>;			def : InstRW<[SwiftWriteP01OneCycle2x], (instregex "ABS")>;
	// Preload.			// Preload.
	def : WriteRes<WritePreLd, [SwiftUnitP2]> { let Latency = 0;			def : WriteRes<WritePreLd, [SwiftUnitP2]> { let Latency = 0;
	let ResourceCycles = [0];			let ResourceCycles = [0];
	}			}

	}			}