This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Cortex-M4 schedule
ClosedPublic

Authored by dmgreen on Nov 6 2018, 2:46 AM.

Download Raw Diff

Details

Reviewers

javed.absar
fhahn
john.brawn
t.p.northover

Commits

rZORG729610c90d1d: [ARM] Cortex-M4 schedule
rZORGd0a9cc6fae24: [ARM] Cortex-M4 schedule
rG729610c90d1d: [ARM] Cortex-M4 schedule
rGd0a9cc6fae24: [ARM] Cortex-M4 schedule
rGd2d0f46cd2ae: [ARM] Cortex-M4 schedule
rL360768: [ARM] Cortex-M4 schedule

Summary

This patch adds a simple Cortex-M4 schedule, renaming the existing M3
schedule to M4 and filling in the latencies as-per the Cortex-M4 TRM:
https://developer.arm.com/docs/ddi0439/latest

Most of these are 1, with the important exception being loads taking 2
cycles. A few others are also higher, but I don't believe they make a
large difference. I've repurposed the M3 schedule as the latencies are
mostly the same between the two cores, with the M4 having more FP and
DSP instructions. We also turn on MISched and UseAA for the cores that
now use this.

It also adds some schedule Write's to various instruction to make things
simpler.

Diff Detail

Repository: rL LLVM

Event Timeline

dmgreen created this revision.Nov 6 2018, 2:46 AM

Herald added subscribers: chrib, kristof.beyls. · View Herald TranscriptNov 6 2018, 2:46 AM

Unfortunately, this also increased codesize a little at -Oz, which I will have to look into.

test/CodeGen/Thumb2/ifcvt-no-branch-predictor.ll
122 ↗	(On Diff #172722)	This test in the past, seemed to not take into account that the loads would take two cycles. (Or alternatively, the cycle count for this isn't taking into account that the load will be pipelined, only taking a single cycle). I've changed things to an add to hopefully keep the intent of the test.

javed.absar added inline comments.Nov 6 2018, 3:46 AM

lib/Target/ARM/ARM.td
980 ↗	(On Diff #172722)	Would it be better to rename CortexM4Model as something more generic e.g. CortexMEfficientModel if it really benefits more than just M4.
lib/Target/ARM/ARMScheduleM4.td
24 ↗	(On Diff #172722)	wrong indentation for let
26 ↗	(On Diff #172722)	Is this (BufferSize = 0) necessary here for in-order (given, MicroOpBufferSize = 0)?
46 ↗	(On Diff #172722)	You might be able to simplify the code below by creating a new local class as: class Lat1Type<SchedWrite write> : WriteRes<write, [M4Unit]>; def : Lat1Type<WriteALU>; def : Lat1Type<WriteALUsi>; .. OR foreach write = [WriteALU, Write ....] in def : Lay1Type<write>;

Cleanup using tablegen classes.

lib/Target/ARM/ARM.td
980 ↗	(On Diff #172722)	I think M4 makes sense. It does use the latencies from that core, and the others are just close-enough that it still makes sense to use it. In the same way that we still use the A57 schedule for the A72. I don't believe this model would be used for v6m targets like the M0/M23, or for larger things like the M7.
lib/Target/ARM/ARMScheduleM4.td
24 ↗	(On Diff #172722)	I think this is the same as for other schedules, such as the R52 or the AArch64's A53. Unless I am missing what you mean? I will move the M4Unit above it though.
26 ↗	(On Diff #172722)	It seems that if BufferSize is left off, it gets a default value of -1 in the generated ARMGenSubtargetInfo file. I added a comment.

LGTM. Thanks for this.

lib/Target/ARM/ARMScheduleM4.td
57 ↗	(On Diff #172913)	unnecessary extra line

This revision is now accepted and ready to land.Nov 9 2018, 5:52 AM

Hi Dave, do you plan to commit this anytime soon?

Herald added a subscriber: jdoerfert. · View Herald TranscriptMar 7 2019, 9:53 AM

Hello. This was increasing codesize by more that I'd like, which was why I never committed it. The performance results would probably make it worthwhile, but at -Oz, it's not something people should be paying for.

I had a look into turning this off at minsize, but that felt like a bit of a hack and IIRC there was a test failing because of it. I just re-ran the results and there are some performance regressions I'd like to look into before committing too.

dmgreen mentioned this in D61882: [ARM] Don't use the Machine Scheduler for cortex-m at minsize.May 14 2019, 12:49 AM

Closed by commit rL360768: [ARM] Cortex-M4 schedule (authored by dmgreen). · Explain WhyMay 15 2019, 5:39 AM

This revision was automatically updated to reflect the committed changes.

Herald added a project: Restricted Project. · View Herald TranscriptMay 15 2019, 5:39 AM

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

ARM/

20 lines

28 lines

52 lines

2 lines

20 lines

119 lines

test/

CodeGen/

ARM/

ParallelDSP/

multi-use-loads.ll

30 lines

aapcs-hfa-code.ll

4 lines

useaa.ll

2 lines

Thumb2/

ifcvt-no-branch-predictor.ll

6 lines

m4-sched-ldr.mir

60 lines

m4-sched-regs.ll

52 lines

Diff 199586

llvm/trunk/lib/Target/ARM/ARM.td

Show First 20 Lines • Show All 972 Lines • ▼ Show 20 Lines	def : ProcessorModel<"cortex-r8", CortexA8Model, [ARMv7r,
FeatureD16,		FeatureD16,
FeatureFP16,		FeatureFP16,
FeatureMP,		FeatureMP,
FeatureSlowFPBrcc,		FeatureSlowFPBrcc,
FeatureHWDivARM,		FeatureHWDivARM,
FeatureHasSlowFPVMLx,		FeatureHasSlowFPVMLx,
FeatureAvoidPartialCPSR]>;		FeatureAvoidPartialCPSR]>;

def : ProcessorModel<"cortex-m3", CortexM3Model, [ARMv7m,		def : ProcessorModel<"cortex-m3", CortexM4Model, [ARMv7m,
ProcM3,		ProcM3,
FeaturePrefLoopAlign32,		FeaturePrefLoopAlign32,
		FeatureUseMISched,
		FeatureUseAA,
FeatureHasNoBranchPredictor]>;		FeatureHasNoBranchPredictor]>;

def : ProcessorModel<"sc300", CortexM3Model, [ARMv7m,		def : ProcessorModel<"sc300", CortexM4Model, [ARMv7m,
ProcM3,		ProcM3,
		FeatureUseMISched,
		FeatureUseAA,
FeatureHasNoBranchPredictor]>;		FeatureHasNoBranchPredictor]>;

def : ProcessorModel<"cortex-m4", CortexM3Model, [ARMv7em,		def : ProcessorModel<"cortex-m4", CortexM4Model, [ARMv7em,
FeatureVFP4,		FeatureVFP4,
FeatureVFPOnlySP,		FeatureVFPOnlySP,
FeatureD16,		FeatureD16,
FeaturePrefLoopAlign32,		FeaturePrefLoopAlign32,
FeatureHasSlowFPVMLx,		FeatureHasSlowFPVMLx,
		FeatureUseMISched,
		FeatureUseAA,
FeatureHasNoBranchPredictor]>;		FeatureHasNoBranchPredictor]>;

def : ProcNoItin<"cortex-m7", [ARMv7em,		def : ProcNoItin<"cortex-m7", [ARMv7em,
FeatureFPARMv8,		FeatureFPARMv8,
FeatureD16]>;		FeatureD16]>;

def : ProcNoItin<"cortex-m23", [ARMv8mBaseline,		def : ProcNoItin<"cortex-m23", [ARMv8mBaseline,
FeatureNoMovt]>;		FeatureNoMovt]>;

def : ProcessorModel<"cortex-m33", CortexM3Model, [ARMv8mMainline,		def : ProcessorModel<"cortex-m33", CortexM4Model, [ARMv8mMainline,
FeatureDSP,		FeatureDSP,
FeatureFPARMv8,		FeatureFPARMv8,
FeatureD16,		FeatureD16,
FeatureVFPOnlySP,		FeatureVFPOnlySP,
FeaturePrefLoopAlign32,		FeaturePrefLoopAlign32,
FeatureHasSlowFPVMLx,		FeatureHasSlowFPVMLx,
		FeatureUseMISched,
		FeatureUseAA,
FeatureHasNoBranchPredictor]>;		FeatureHasNoBranchPredictor]>;

def : ProcessorModel<"cortex-m35p", CortexM3Model, [ARMv8mMainline,		def : ProcessorModel<"cortex-m35p", CortexM4Model, [ARMv8mMainline,
FeatureDSP,		FeatureDSP,
FeatureFPARMv8,		FeatureFPARMv8,
FeatureD16,		FeatureD16,
FeatureVFPOnlySP,		FeatureVFPOnlySP,
FeaturePrefLoopAlign32,		FeaturePrefLoopAlign32,
FeatureHasSlowFPVMLx,		FeatureHasSlowFPVMLx,
		FeatureUseMISched,
		FeatureUseAA,
FeatureHasNoBranchPredictor]>;		FeatureHasNoBranchPredictor]>;


def : ProcNoItin<"cortex-a32", [ARMv8a,		def : ProcNoItin<"cortex-a32", [ARMv8a,
FeatureHWDivThumb,		FeatureHWDivThumb,
FeatureHWDivARM,		FeatureHWDivARM,
FeatureCrypto,		FeatureCrypto,
FeatureCRC]>;		FeatureCRC]>;
▲ Show 20 Lines • Show All 141 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/ARM/ARMInstrThumb.td

Show First 20 Lines • Show All 657 Lines • ▼ Show 20 Lines

// PC-relative loads need to be matched first as constant pool accesses need to		// PC-relative loads need to be matched first as constant pool accesses need to
// always be PC-relative. We do this using AddedComplexity, as the pattern is		// always be PC-relative. We do this using AddedComplexity, as the pattern is
// simpler than the patterns of the other load instructions.		// simpler than the patterns of the other load instructions.
let canFoldAsLoad = 1, isReMaterializable = 1, AddedComplexity = 10 in		let canFoldAsLoad = 1, isReMaterializable = 1, AddedComplexity = 10 in
def tLDRpci : T1pIs<(outs tGPR:$Rt), (ins t_addrmode_pc:$addr), IIC_iLoad_i,		def tLDRpci : T1pIs<(outs tGPR:$Rt), (ins t_addrmode_pc:$addr), IIC_iLoad_i,
"ldr", "\t$Rt, $addr",		"ldr", "\t$Rt, $addr",
[(set tGPR:$Rt, (load (ARMWrapper tconstpool:$addr)))]>,		[(set tGPR:$Rt, (load (ARMWrapper tconstpool:$addr)))]>,
T1Encoding<{0,1,0,0,1,?}> {		T1Encoding<{0,1,0,0,1,?}>, Sched<[WriteLd]> {
// A6.2 & A8.6.59		// A6.2 & A8.6.59
bits<3> Rt;		bits<3> Rt;
bits<8> addr;		bits<8> addr;
let Inst{10-8} = Rt;		let Inst{10-8} = Rt;
let Inst{7-0} = addr;		let Inst{7-0} = addr;
}		}

// SP-relative loads should be matched before standard immediate-offset loads as		// SP-relative loads should be matched before standard immediate-offset loads as
// it means we avoid having to move SP to another register.		// it means we avoid having to move SP to another register.
let canFoldAsLoad = 1 in		let canFoldAsLoad = 1 in
def tLDRspi : T1pIs<(outs tGPR:$Rt), (ins t_addrmode_sp:$addr), IIC_iLoad_i,		def tLDRspi : T1pIs<(outs tGPR:$Rt), (ins t_addrmode_sp:$addr), IIC_iLoad_i,
"ldr", "\t$Rt, $addr",		"ldr", "\t$Rt, $addr",
[(set tGPR:$Rt, (load t_addrmode_sp:$addr))]>,		[(set tGPR:$Rt, (load t_addrmode_sp:$addr))]>,
T1LdStSP<{1,?,?}> {		T1LdStSP<{1,?,?}>, Sched<[WriteLd]> {
bits<3> Rt;		bits<3> Rt;
bits<8> addr;		bits<8> addr;
let Inst{10-8} = Rt;		let Inst{10-8} = Rt;
let Inst{7-0} = addr;		let Inst{7-0} = addr;
}		}

// Loads: reg/reg and reg/imm5		// Loads: reg/reg and reg/imm5
let canFoldAsLoad = 1, isReMaterializable = 1 in		let canFoldAsLoad = 1, isReMaterializable = 1 in
Show All 34 Lines	T1pILdStEncode<reg_opc,
am, itin_r, asm, "\t$Rt, $addr",		am, itin_r, asm, "\t$Rt, $addr",
[(opnode tGPR:$Rt, AddrMode_r:$addr)]>;		[(opnode tGPR:$Rt, AddrMode_r:$addr)]>;
}		}

// A8.6.57 & A8.6.60		// A8.6.57 & A8.6.60
defm tLDR : thumb_ld_rr_ri_enc<0b100, 0b0110, t_addrmode_rr,		defm tLDR : thumb_ld_rr_ri_enc<0b100, 0b0110, t_addrmode_rr,
t_addrmode_is4, AddrModeT1_4,		t_addrmode_is4, AddrModeT1_4,
IIC_iLoad_r, IIC_iLoad_i, "ldr",		IIC_iLoad_r, IIC_iLoad_i, "ldr",
load>;		load>, Sched<[WriteLd]>;

// A8.6.64 & A8.6.61		// A8.6.64 & A8.6.61
defm tLDRB : thumb_ld_rr_ri_enc<0b110, 0b0111, t_addrmode_rr,		defm tLDRB : thumb_ld_rr_ri_enc<0b110, 0b0111, t_addrmode_rr,
t_addrmode_is1, AddrModeT1_1,		t_addrmode_is1, AddrModeT1_1,
IIC_iLoad_bh_r, IIC_iLoad_bh_i, "ldrb",		IIC_iLoad_bh_r, IIC_iLoad_bh_i, "ldrb",
zextloadi8>;		zextloadi8>, Sched<[WriteLd]>;

// A8.6.76 & A8.6.73		// A8.6.76 & A8.6.73
defm tLDRH : thumb_ld_rr_ri_enc<0b101, 0b1000, t_addrmode_rr,		defm tLDRH : thumb_ld_rr_ri_enc<0b101, 0b1000, t_addrmode_rr,
t_addrmode_is2, AddrModeT1_2,		t_addrmode_is2, AddrModeT1_2,
IIC_iLoad_bh_r, IIC_iLoad_bh_i, "ldrh",		IIC_iLoad_bh_r, IIC_iLoad_bh_i, "ldrh",
zextloadi16>;		zextloadi16>, Sched<[WriteLd]>;

let AddedComplexity = 10 in		let AddedComplexity = 10 in
def tLDRSB : // A8.6.80		def tLDRSB : // A8.6.80
T1pILdStEncode<0b011, (outs tGPR:$Rt), (ins t_addrmode_rr_sext:$addr),		T1pILdStEncode<0b011, (outs tGPR:$Rt), (ins t_addrmode_rr_sext:$addr),
AddrModeT1_1, IIC_iLoad_bh_r,		AddrModeT1_1, IIC_iLoad_bh_r,
"ldrsb", "\t$Rt, $addr",		"ldrsb", "\t$Rt, $addr",
[(set tGPR:$Rt, (sextloadi8 t_addrmode_rr_sext:$addr))]>;		[(set tGPR:$Rt, (sextloadi8 t_addrmode_rr_sext:$addr))]>, Sched<[WriteLd]>;

let AddedComplexity = 10 in		let AddedComplexity = 10 in
def tLDRSH : // A8.6.84		def tLDRSH : // A8.6.84
T1pILdStEncode<0b111, (outs tGPR:$Rt), (ins t_addrmode_rr_sext:$addr),		T1pILdStEncode<0b111, (outs tGPR:$Rt), (ins t_addrmode_rr_sext:$addr),
AddrModeT1_2, IIC_iLoad_bh_r,		AddrModeT1_2, IIC_iLoad_bh_r,
"ldrsh", "\t$Rt, $addr",		"ldrsh", "\t$Rt, $addr",
[(set tGPR:$Rt, (sextloadi16 t_addrmode_rr_sext:$addr))]>;		[(set tGPR:$Rt, (sextloadi16 t_addrmode_rr_sext:$addr))]>, Sched<[WriteLd]>;


def tSTRspi : T1pIs<(outs), (ins tGPR:$Rt, t_addrmode_sp:$addr), IIC_iStore_i,		def tSTRspi : T1pIs<(outs), (ins tGPR:$Rt, t_addrmode_sp:$addr), IIC_iStore_i,
"str", "\t$Rt, $addr",		"str", "\t$Rt, $addr",
[(store tGPR:$Rt, t_addrmode_sp:$addr)]>,		[(store tGPR:$Rt, t_addrmode_sp:$addr)]>,
T1LdStSP<{0,?,?}> {		T1LdStSP<{0,?,?}>, Sched<[WriteST]> {
bits<3> Rt;		bits<3> Rt;
bits<8> addr;		bits<8> addr;
let Inst{10-8} = Rt;		let Inst{10-8} = Rt;
let Inst{7-0} = addr;		let Inst{7-0} = addr;
}		}

// A8.6.194 & A8.6.192		// A8.6.194 & A8.6.192
defm tSTR : thumb_st_rr_ri_enc<0b000, 0b0110, t_addrmode_rr,		defm tSTR : thumb_st_rr_ri_enc<0b000, 0b0110, t_addrmode_rr,
t_addrmode_is4, AddrModeT1_4,		t_addrmode_is4, AddrModeT1_4,
IIC_iStore_r, IIC_iStore_i, "str",		IIC_iStore_r, IIC_iStore_i, "str",
store>;		store>, Sched<[WriteST]>;

// A8.6.197 & A8.6.195		// A8.6.197 & A8.6.195
defm tSTRB : thumb_st_rr_ri_enc<0b010, 0b0111, t_addrmode_rr,		defm tSTRB : thumb_st_rr_ri_enc<0b010, 0b0111, t_addrmode_rr,
t_addrmode_is1, AddrModeT1_1,		t_addrmode_is1, AddrModeT1_1,
IIC_iStore_bh_r, IIC_iStore_bh_i, "strb",		IIC_iStore_bh_r, IIC_iStore_bh_i, "strb",
truncstorei8>;		truncstorei8>, Sched<[WriteST]>;

// A8.6.207 & A8.6.205		// A8.6.207 & A8.6.205
defm tSTRH : thumb_st_rr_ri_enc<0b001, 0b1000, t_addrmode_rr,		defm tSTRH : thumb_st_rr_ri_enc<0b001, 0b1000, t_addrmode_rr,
t_addrmode_is2, AddrModeT1_2,		t_addrmode_is2, AddrModeT1_2,
IIC_iStore_bh_r, IIC_iStore_bh_i, "strh",		IIC_iStore_bh_r, IIC_iStore_bh_i, "strh",
truncstorei16>;		truncstorei16>, Sched<[WriteST]>;


//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Load / store multiple Instructions.		// Load / store multiple Instructions.
//		//

// These require base address to be written back or one of the loaded regs.		// These require base address to be written back or one of the loaded regs.
let hasSideEffects = 0 in {		let hasSideEffects = 0 in {
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	def : InstAlias<"ldm${p} $Rn!, $regs",
(tLDMIA tGPR:$Rn, pred:$p, reglist:$regs), 0>,		(tLDMIA tGPR:$Rn, pred:$p, reglist:$regs), 0>,
Requires<[IsThumb, IsThumb1Only]>;		Requires<[IsThumb, IsThumb1Only]>;

let mayLoad = 1, Uses = [SP], Defs = [SP], hasExtraDefRegAllocReq = 1,		let mayLoad = 1, Uses = [SP], Defs = [SP], hasExtraDefRegAllocReq = 1,
variadicOpsAreDefs = 1 in		variadicOpsAreDefs = 1 in
def tPOP : T1I<(outs), (ins pred:$p, reglist:$regs, variable_ops),		def tPOP : T1I<(outs), (ins pred:$p, reglist:$regs, variable_ops),
IIC_iPop,		IIC_iPop,
"pop${p}\t$regs", []>,		"pop${p}\t$regs", []>,
T1Misc<{1,1,0,?,?,?,?}> {		T1Misc<{1,1,0,?,?,?,?}>, Sched<[WriteLd]> {
bits<16> regs;		bits<16> regs;
let Inst{8} = regs{15};		let Inst{8} = regs{15};
let Inst{7-0} = regs{7-0};		let Inst{7-0} = regs{7-0};
}		}

let mayStore = 1, Uses = [SP], Defs = [SP], hasExtraSrcRegAllocReq = 1 in		let mayStore = 1, Uses = [SP], Defs = [SP], hasExtraSrcRegAllocReq = 1 in
def tPUSH : T1I<(outs), (ins pred:$p, reglist:$regs, variable_ops),		def tPUSH : T1I<(outs), (ins pred:$p, reglist:$regs, variable_ops),
IIC_iStore_m,		IIC_iStore_m,
"push${p}\t$regs", []>,		"push${p}\t$regs", []>,
T1Misc<{0,1,0,?,?,?,?}> {		T1Misc<{0,1,0,?,?,?,?}>, Sched<[WriteST]> {
bits<16> regs;		bits<16> regs;
let Inst{8} = regs{14};		let Inst{8} = regs{14};
let Inst{7-0} = regs{7-0};		let Inst{7-0} = regs{7-0};
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Arithmetic Instructions.		// Arithmetic Instructions.
//		//
▲ Show 20 Lines • Show All 344 Lines • ▼ Show 20 Lines
} // hasSideEffects		} // hasSideEffects

// Multiply register		// Multiply register
let isCommutable = 1 in		let isCommutable = 1 in
def tMUL : // A8.6.105 T1		def tMUL : // A8.6.105 T1
Thumb1sI<(outs tGPR:$Rd), (ins tGPR:$Rn, tGPR:$Rm), AddrModeNone, 2,		Thumb1sI<(outs tGPR:$Rd), (ins tGPR:$Rn, tGPR:$Rm), AddrModeNone, 2,
IIC_iMUL32, "mul", "\t$Rd, $Rn, $Rm", "$Rm = $Rd",		IIC_iMUL32, "mul", "\t$Rd, $Rn, $Rm", "$Rm = $Rd",
[(set tGPR:$Rd, (mul tGPR:$Rn, tGPR:$Rm))]>,		[(set tGPR:$Rd, (mul tGPR:$Rn, tGPR:$Rm))]>,
T1DataProcessing<0b1101> {		T1DataProcessing<0b1101>, Sched<[WriteMUL32, ReadMUL, ReadMUL]> {
bits<3> Rd;		bits<3> Rd;
bits<3> Rn;		bits<3> Rn;
let Inst{5-3} = Rn;		let Inst{5-3} = Rn;
let Inst{2-0} = Rd;		let Inst{2-0} = Rd;
let AsmMatchConverter = "cvtThumbMultiply";		let AsmMatchConverter = "cvtThumbMultiply";
}		}

def :tInstAlias<"mul${s}${p} $Rdm, $Rn", (tMUL tGPR:$Rdm, s_cc_out:$s, tGPR:$Rn,		def :tInstAlias<"mul${s}${p} $Rdm, $Rn", (tMUL tGPR:$Rdm, s_cc_out:$s, tGPR:$Rn,
▲ Show 20 Lines • Show All 511 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/ARM/ARMInstrThumb2.td

Show First 20 Lines • Show All 1,327 Lines • ▼ Show 20 Lines	def t2LDRB_PRE : T2Ipreldst<0, 0b00, 1, 1, (outs GPR:$Rt, GPR:$Rn_wb),
(ins t2addrmode_imm8_pre:$addr),		(ins t2addrmode_imm8_pre:$addr),
AddrModeT2_i8, IndexModePre, IIC_iLoad_bh_iu,		AddrModeT2_i8, IndexModePre, IIC_iLoad_bh_iu,
"ldrb", "\t$Rt, $addr!", "$addr.base = $Rn_wb", []>,		"ldrb", "\t$Rt, $addr!", "$addr.base = $Rn_wb", []>,
Sched<[WriteLd]>;		Sched<[WriteLd]>;

def t2LDRB_POST : T2Ipostldst<0, 0b00, 1, 0, (outs GPR:$Rt, GPR:$Rn_wb),		def t2LDRB_POST : T2Ipostldst<0, 0b00, 1, 0, (outs GPR:$Rt, GPR:$Rn_wb),
(ins addr_offset_none:$Rn, t2am_imm8_offset:$offset),		(ins addr_offset_none:$Rn, t2am_imm8_offset:$offset),
AddrModeT2_i8, IndexModePost, IIC_iLoad_bh_iu,		AddrModeT2_i8, IndexModePost, IIC_iLoad_bh_iu,
"ldrb", "\t$Rt, $Rn$offset", "$Rn = $Rn_wb", []>;		"ldrb", "\t$Rt, $Rn$offset", "$Rn = $Rn_wb", []>,
		Sched<[WriteLd]>;

def t2LDRH_PRE : T2Ipreldst<0, 0b01, 1, 1, (outs GPR:$Rt, GPR:$Rn_wb),		def t2LDRH_PRE : T2Ipreldst<0, 0b01, 1, 1, (outs GPR:$Rt, GPR:$Rn_wb),
(ins t2addrmode_imm8_pre:$addr),		(ins t2addrmode_imm8_pre:$addr),
AddrModeT2_i8, IndexModePre, IIC_iLoad_bh_iu,		AddrModeT2_i8, IndexModePre, IIC_iLoad_bh_iu,
"ldrh", "\t$Rt, $addr!", "$addr.base = $Rn_wb", []>,		"ldrh", "\t$Rt, $addr!", "$addr.base = $Rn_wb", []>,
Sched<[WriteLd]>;		Sched<[WriteLd]>;

def t2LDRH_POST : T2Ipostldst<0, 0b01, 1, 0, (outs GPR:$Rt, GPR:$Rn_wb),		def t2LDRH_POST : T2Ipostldst<0, 0b01, 1, 0, (outs GPR:$Rt, GPR:$Rn_wb),
▲ Show 20 Lines • Show All 981 Lines • ▼ Show 20 Lines	class T2SatI<dag iops, string opc, string asm>
let Inst{11-8} = Rd;		let Inst{11-8} = Rd;
let Inst{7-6} = sh{1-0};		let Inst{7-6} = sh{1-0};
let Inst{5} = 0;		let Inst{5} = 0;
let Inst{4-0} = sat_imm;		let Inst{4-0} = sat_imm;
}		}

def t2SSAT: T2SatI<(ins imm1_32:$sat_imm, rGPR:$Rn, t2_shift_imm:$sh),		def t2SSAT: T2SatI<(ins imm1_32:$sat_imm, rGPR:$Rn, t2_shift_imm:$sh),
"ssat", "\t$Rd, $sat_imm, $Rn$sh">,		"ssat", "\t$Rd, $sat_imm, $Rn$sh">,
Requires<[IsThumb2]> {		Requires<[IsThumb2]>, Sched<[WriteALU]> {
let Inst{23-22} = 0b00;		let Inst{23-22} = 0b00;
let Inst{5} = 0;		let Inst{5} = 0;
}		}

def t2SSAT16: T2SatI<(ins imm1_16:$sat_imm, rGPR:$Rn),		def t2SSAT16: T2SatI<(ins imm1_16:$sat_imm, rGPR:$Rn),
"ssat16", "\t$Rd, $sat_imm, $Rn">,		"ssat16", "\t$Rd, $sat_imm, $Rn">,
Requires<[IsThumb2, HasDSP]> {		Requires<[IsThumb2, HasDSP]>, Sched<[WriteALU]> {
let Inst{23-22} = 0b00;		let Inst{23-22} = 0b00;
let sh = 0b100000;		let sh = 0b100000;
let Inst{4} = 0;		let Inst{4} = 0;
}		}

def t2USAT: T2SatI<(ins imm0_31:$sat_imm, rGPR:$Rn, t2_shift_imm:$sh),		def t2USAT: T2SatI<(ins imm0_31:$sat_imm, rGPR:$Rn, t2_shift_imm:$sh),
"usat", "\t$Rd, $sat_imm, $Rn$sh">,		"usat", "\t$Rd, $sat_imm, $Rn$sh">,
Requires<[IsThumb2]> {		Requires<[IsThumb2]>, Sched<[WriteALU]> {
let Inst{23-22} = 0b10;		let Inst{23-22} = 0b10;
}		}

def t2USAT16: T2SatI<(ins imm0_15:$sat_imm, rGPR:$Rn),		def t2USAT16: T2SatI<(ins imm0_15:$sat_imm, rGPR:$Rn),
"usat16", "\t$Rd, $sat_imm, $Rn">,		"usat16", "\t$Rd, $sat_imm, $Rn">,
Requires<[IsThumb2, HasDSP]> {		Requires<[IsThumb2, HasDSP]>, Sched<[WriteALU]> {
let Inst{23-22} = 0b10;		let Inst{23-22} = 0b10;
let sh = 0b100000;		let sh = 0b100000;
let Inst{4} = 0;		let Inst{4} = 0;
}		}

def : T2Pat<(ARMssatnoshift GPRnopc:$Rn, imm0_31:$imm),		def : T2Pat<(ARMssatnoshift GPRnopc:$Rn, imm0_31:$imm),
(t2SSAT imm0_31:$imm, GPRnopc:$Rn, 0)>;		(t2SSAT imm0_31:$imm, GPRnopc:$Rn, 0)>;
def : T2Pat<(ARMusatnoshift GPRnopc:$Rn, imm0_31:$imm),		def : T2Pat<(ARMusatnoshift GPRnopc:$Rn, imm0_31:$imm),
▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines	class T2TwoRegBitFI<dag oops, dag iops, InstrItinClass itin,
bits<4> Rn;		bits<4> Rn;

let Inst{19-16} = Rn;		let Inst{19-16} = Rn;
}		}

let Constraints = "$src = $Rd" in		let Constraints = "$src = $Rd" in
def t2BFC : T2BitFI<(outs rGPR:$Rd), (ins rGPR:$src, bf_inv_mask_imm:$imm),		def t2BFC : T2BitFI<(outs rGPR:$Rd), (ins rGPR:$src, bf_inv_mask_imm:$imm),
IIC_iUNAsi, "bfc", "\t$Rd, $imm",		IIC_iUNAsi, "bfc", "\t$Rd, $imm",
[(set rGPR:$Rd, (and rGPR:$src, bf_inv_mask_imm:$imm))]> {		[(set rGPR:$Rd, (and rGPR:$src, bf_inv_mask_imm:$imm))]>, Sched<[WriteALU]> {
let Inst{31-27} = 0b11110;		let Inst{31-27} = 0b11110;
let Inst{26} = 0; // should be 0.		let Inst{26} = 0; // should be 0.
let Inst{25} = 1;		let Inst{25} = 1;
let Inst{24-20} = 0b10110;		let Inst{24-20} = 0b10110;
let Inst{19-16} = 0b1111; // Rn		let Inst{19-16} = 0b1111; // Rn
let Inst{15} = 0;		let Inst{15} = 0;
let Inst{5} = 0; // should be 0.		let Inst{5} = 0; // should be 0.

bits<10> imm;		bits<10> imm;
let msb{4-0} = imm{9-5};		let msb{4-0} = imm{9-5};
let lsb{4-0} = imm{4-0};		let lsb{4-0} = imm{4-0};
}		}

def t2SBFX: T2TwoRegBitFI<		def t2SBFX: T2TwoRegBitFI<
(outs rGPR:$Rd), (ins rGPR:$Rn, imm0_31:$lsb, imm1_32:$msb),		(outs rGPR:$Rd), (ins rGPR:$Rn, imm0_31:$lsb, imm1_32:$msb),
IIC_iUNAsi, "sbfx", "\t$Rd, $Rn, $lsb, $msb", []> {		IIC_iUNAsi, "sbfx", "\t$Rd, $Rn, $lsb, $msb", []>, Sched<[WriteALU]> {
let Inst{31-27} = 0b11110;		let Inst{31-27} = 0b11110;
let Inst{25} = 1;		let Inst{25} = 1;
let Inst{24-20} = 0b10100;		let Inst{24-20} = 0b10100;
let Inst{15} = 0;		let Inst{15} = 0;
}		}

def t2UBFX: T2TwoRegBitFI<		def t2UBFX: T2TwoRegBitFI<
(outs rGPR:$Rd), (ins rGPR:$Rn, imm0_31:$lsb, imm1_32:$msb),		(outs rGPR:$Rd), (ins rGPR:$Rn, imm0_31:$lsb, imm1_32:$msb),
IIC_iUNAsi, "ubfx", "\t$Rd, $Rn, $lsb, $msb", []> {		IIC_iUNAsi, "ubfx", "\t$Rd, $Rn, $lsb, $msb", []>, Sched<[WriteALU]> {
let Inst{31-27} = 0b11110;		let Inst{31-27} = 0b11110;
let Inst{25} = 1;		let Inst{25} = 1;
let Inst{24-20} = 0b11100;		let Inst{24-20} = 0b11100;
let Inst{15} = 0;		let Inst{15} = 0;
}		}

// A8.8.247 UDF - Undefined (Encoding T2)		// A8.8.247 UDF - Undefined (Encoding T2)
def t2UDF : T2XI<(outs), (ins imm0_65535:$imm16), IIC_Br, "udf.w\t$imm16",		def t2UDF : T2XI<(outs), (ins imm0_65535:$imm16), IIC_Br, "udf.w\t$imm16",
Show All 9 Lines
}		}

// A8.6.18 BFI - Bitfield insert (Encoding T1)		// A8.6.18 BFI - Bitfield insert (Encoding T1)
let Constraints = "$src = $Rd" in {		let Constraints = "$src = $Rd" in {
def t2BFI : T2TwoRegBitFI<(outs rGPR:$Rd),		def t2BFI : T2TwoRegBitFI<(outs rGPR:$Rd),
(ins rGPR:$src, rGPR:$Rn, bf_inv_mask_imm:$imm),		(ins rGPR:$src, rGPR:$Rn, bf_inv_mask_imm:$imm),
IIC_iBITi, "bfi", "\t$Rd, $Rn, $imm",		IIC_iBITi, "bfi", "\t$Rd, $Rn, $imm",
[(set rGPR:$Rd, (ARMbfi rGPR:$src, rGPR:$Rn,		[(set rGPR:$Rd, (ARMbfi rGPR:$src, rGPR:$Rn,
bf_inv_mask_imm:$imm))]> {		bf_inv_mask_imm:$imm))]>, Sched<[WriteALU]> {
let Inst{31-27} = 0b11110;		let Inst{31-27} = 0b11110;
let Inst{26} = 0; // should be 0.		let Inst{26} = 0; // should be 0.
let Inst{25} = 1;		let Inst{25} = 1;
let Inst{24-20} = 0b10110;		let Inst{24-20} = 0b10110;
let Inst{15} = 0;		let Inst{15} = 0;
let Inst{5} = 0; // should be 0.		let Inst{5} = 0; // should be 0.

bits<10> imm;		bits<10> imm;
▲ Show 20 Lines • Show All 737 Lines • ▼ Show 20 Lines	class T2I_strex<bits<4> opcod, dag oops, dag iops, AddrMode am, int sz,
let Inst{15-12} = Rt;		let Inst{15-12} = Rt;
}		}

let mayLoad = 1 in {		let mayLoad = 1 in {
def t2LDREXB : T2I_ldrex<0b0100, (outs rGPR:$Rt), (ins addr_offset_none:$addr),		def t2LDREXB : T2I_ldrex<0b0100, (outs rGPR:$Rt), (ins addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"ldrexb", "\t$Rt, $addr", "",		"ldrexb", "\t$Rt, $addr", "",
[(set rGPR:$Rt, (ldrex_1 addr_offset_none:$addr))]>,		[(set rGPR:$Rt, (ldrex_1 addr_offset_none:$addr))]>,
Requires<[IsThumb, HasV8MBaseline]>;		Requires<[IsThumb, HasV8MBaseline]>, Sched<[WriteLd]>;
def t2LDREXH : T2I_ldrex<0b0101, (outs rGPR:$Rt), (ins addr_offset_none:$addr),		def t2LDREXH : T2I_ldrex<0b0101, (outs rGPR:$Rt), (ins addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"ldrexh", "\t$Rt, $addr", "",		"ldrexh", "\t$Rt, $addr", "",
[(set rGPR:$Rt, (ldrex_2 addr_offset_none:$addr))]>,		[(set rGPR:$Rt, (ldrex_2 addr_offset_none:$addr))]>,
Requires<[IsThumb, HasV8MBaseline]>;		Requires<[IsThumb, HasV8MBaseline]>, Sched<[WriteLd]>;
def t2LDREX : Thumb2I<(outs rGPR:$Rt), (ins t2addrmode_imm0_1020s4:$addr),		def t2LDREX : Thumb2I<(outs rGPR:$Rt), (ins t2addrmode_imm0_1020s4:$addr),
AddrModeT2_ldrex, 4, NoItinerary,		AddrModeT2_ldrex, 4, NoItinerary,
"ldrex", "\t$Rt, $addr", "",		"ldrex", "\t$Rt, $addr", "",
[(set rGPR:$Rt, (ldrex_4 t2addrmode_imm0_1020s4:$addr))]>,		[(set rGPR:$Rt, (ldrex_4 t2addrmode_imm0_1020s4:$addr))]>,
Requires<[IsThumb, HasV8MBaseline]> {		Requires<[IsThumb, HasV8MBaseline]>, Sched<[WriteLd]> {
bits<4> Rt;		bits<4> Rt;
bits<12> addr;		bits<12> addr;
let Inst{31-27} = 0b11101;		let Inst{31-27} = 0b11101;
let Inst{26-20} = 0b0000101;		let Inst{26-20} = 0b0000101;
let Inst{19-16} = addr{11-8};		let Inst{19-16} = addr{11-8};
let Inst{15-12} = Rt;		let Inst{15-12} = Rt;
let Inst{11-8} = 0b1111;		let Inst{11-8} = 0b1111;
let Inst{7-0} = addr{7-0};		let Inst{7-0} = addr{7-0};
}		}
let hasExtraDefRegAllocReq = 1 in		let hasExtraDefRegAllocReq = 1 in
def t2LDREXD : T2I_ldrex<0b0111, (outs rGPR:$Rt, rGPR:$Rt2),		def t2LDREXD : T2I_ldrex<0b0111, (outs rGPR:$Rt, rGPR:$Rt2),
(ins addr_offset_none:$addr),		(ins addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"ldrexd", "\t$Rt, $Rt2, $addr", "",		"ldrexd", "\t$Rt, $Rt2, $addr", "",
[], {?, ?, ?, ?}>,		[], {?, ?, ?, ?}>,
Requires<[IsThumb2, IsNotMClass]> {		Requires<[IsThumb2, IsNotMClass]>, Sched<[WriteLd]> {
bits<4> Rt2;		bits<4> Rt2;
let Inst{11-8} = Rt2;		let Inst{11-8} = Rt2;
}		}
def t2LDAEXB : T2I_ldrex<0b1100, (outs rGPR:$Rt), (ins addr_offset_none:$addr),		def t2LDAEXB : T2I_ldrex<0b1100, (outs rGPR:$Rt), (ins addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"ldaexb", "\t$Rt, $addr", "",		"ldaexb", "\t$Rt, $addr", "",
[(set rGPR:$Rt, (ldaex_1 addr_offset_none:$addr))]>,		[(set rGPR:$Rt, (ldaex_1 addr_offset_none:$addr))]>,
Requires<[IsThumb, HasAcquireRelease, HasV7Clrex]>;		Requires<[IsThumb, HasAcquireRelease, HasV7Clrex]>, Sched<[WriteLd]>;
def t2LDAEXH : T2I_ldrex<0b1101, (outs rGPR:$Rt), (ins addr_offset_none:$addr),		def t2LDAEXH : T2I_ldrex<0b1101, (outs rGPR:$Rt), (ins addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"ldaexh", "\t$Rt, $addr", "",		"ldaexh", "\t$Rt, $addr", "",
[(set rGPR:$Rt, (ldaex_2 addr_offset_none:$addr))]>,		[(set rGPR:$Rt, (ldaex_2 addr_offset_none:$addr))]>,
Requires<[IsThumb, HasAcquireRelease, HasV7Clrex]>;		Requires<[IsThumb, HasAcquireRelease, HasV7Clrex]>, Sched<[WriteLd]>;
def t2LDAEX : Thumb2I<(outs rGPR:$Rt), (ins addr_offset_none:$addr),		def t2LDAEX : Thumb2I<(outs rGPR:$Rt), (ins addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"ldaex", "\t$Rt, $addr", "",		"ldaex", "\t$Rt, $addr", "",
[(set rGPR:$Rt, (ldaex_4 addr_offset_none:$addr))]>,		[(set rGPR:$Rt, (ldaex_4 addr_offset_none:$addr))]>,
Requires<[IsThumb, HasAcquireRelease, HasV7Clrex]> {		Requires<[IsThumb, HasAcquireRelease, HasV7Clrex]>, Sched<[WriteLd]> {
bits<4> Rt;		bits<4> Rt;
bits<4> addr;		bits<4> addr;
let Inst{31-27} = 0b11101;		let Inst{31-27} = 0b11101;
let Inst{26-20} = 0b0001101;		let Inst{26-20} = 0b0001101;
let Inst{19-16} = addr;		let Inst{19-16} = addr;
let Inst{15-12} = Rt;		let Inst{15-12} = Rt;
let Inst{11-8} = 0b1111;		let Inst{11-8} = 0b1111;
let Inst{7-0} = 0b11101111;		let Inst{7-0} = 0b11101111;
}		}
let hasExtraDefRegAllocReq = 1 in		let hasExtraDefRegAllocReq = 1 in
def t2LDAEXD : T2I_ldrex<0b1111, (outs rGPR:$Rt, rGPR:$Rt2),		def t2LDAEXD : T2I_ldrex<0b1111, (outs rGPR:$Rt, rGPR:$Rt2),
(ins addr_offset_none:$addr),		(ins addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"ldaexd", "\t$Rt, $Rt2, $addr", "",		"ldaexd", "\t$Rt, $Rt2, $addr", "",
[], {?, ?, ?, ?}>, Requires<[IsThumb,		[], {?, ?, ?, ?}>, Requires<[IsThumb,
HasAcquireRelease, HasV7Clrex, IsNotMClass]> {		HasAcquireRelease, HasV7Clrex, IsNotMClass]>, Sched<[WriteLd]> {
bits<4> Rt2;		bits<4> Rt2;
let Inst{11-8} = Rt2;		let Inst{11-8} = Rt2;

let Inst{7} = 1;		let Inst{7} = 1;
}		}
}		}

let mayStore = 1, Constraints = "@earlyclobber $Rd" in {		let mayStore = 1, Constraints = "@earlyclobber $Rd" in {
def t2STREXB : T2I_strex<0b0100, (outs rGPR:$Rd),		def t2STREXB : T2I_strex<0b0100, (outs rGPR:$Rd),
(ins rGPR:$Rt, addr_offset_none:$addr),		(ins rGPR:$Rt, addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"strexb", "\t$Rd, $Rt, $addr", "",		"strexb", "\t$Rd, $Rt, $addr", "",
[(set rGPR:$Rd,		[(set rGPR:$Rd,
(strex_1 rGPR:$Rt, addr_offset_none:$addr))]>,		(strex_1 rGPR:$Rt, addr_offset_none:$addr))]>,
Requires<[IsThumb, HasV8MBaseline]>;		Requires<[IsThumb, HasV8MBaseline]>, Sched<[WriteST]>;
def t2STREXH : T2I_strex<0b0101, (outs rGPR:$Rd),		def t2STREXH : T2I_strex<0b0101, (outs rGPR:$Rd),
(ins rGPR:$Rt, addr_offset_none:$addr),		(ins rGPR:$Rt, addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"strexh", "\t$Rd, $Rt, $addr", "",		"strexh", "\t$Rd, $Rt, $addr", "",
[(set rGPR:$Rd,		[(set rGPR:$Rd,
(strex_2 rGPR:$Rt, addr_offset_none:$addr))]>,		(strex_2 rGPR:$Rt, addr_offset_none:$addr))]>,
Requires<[IsThumb, HasV8MBaseline]>;		Requires<[IsThumb, HasV8MBaseline]>, Sched<[WriteST]>;

def t2STREX : Thumb2I<(outs rGPR:$Rd), (ins rGPR:$Rt,		def t2STREX : Thumb2I<(outs rGPR:$Rd), (ins rGPR:$Rt,
t2addrmode_imm0_1020s4:$addr),		t2addrmode_imm0_1020s4:$addr),
AddrModeT2_ldrex, 4, NoItinerary,		AddrModeT2_ldrex, 4, NoItinerary,
"strex", "\t$Rd, $Rt, $addr", "",		"strex", "\t$Rd, $Rt, $addr", "",
[(set rGPR:$Rd,		[(set rGPR:$Rd,
(strex_4 rGPR:$Rt, t2addrmode_imm0_1020s4:$addr))]>,		(strex_4 rGPR:$Rt, t2addrmode_imm0_1020s4:$addr))]>,
Requires<[IsThumb, HasV8MBaseline]> {		Requires<[IsThumb, HasV8MBaseline]>, Sched<[WriteST]> {
bits<4> Rd;		bits<4> Rd;
bits<4> Rt;		bits<4> Rt;
bits<12> addr;		bits<12> addr;
let Inst{31-27} = 0b11101;		let Inst{31-27} = 0b11101;
let Inst{26-20} = 0b0000100;		let Inst{26-20} = 0b0000100;
let Inst{19-16} = addr{11-8};		let Inst{19-16} = addr{11-8};
let Inst{15-12} = Rt;		let Inst{15-12} = Rt;
let Inst{11-8} = Rd;		let Inst{11-8} = Rd;
let Inst{7-0} = addr{7-0};		let Inst{7-0} = addr{7-0};
}		}
let hasExtraSrcRegAllocReq = 1 in		let hasExtraSrcRegAllocReq = 1 in
def t2STREXD : T2I_strex<0b0111, (outs rGPR:$Rd),		def t2STREXD : T2I_strex<0b0111, (outs rGPR:$Rd),
(ins rGPR:$Rt, rGPR:$Rt2, addr_offset_none:$addr),		(ins rGPR:$Rt, rGPR:$Rt2, addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"strexd", "\t$Rd, $Rt, $Rt2, $addr", "", [],		"strexd", "\t$Rd, $Rt, $Rt2, $addr", "", [],
{?, ?, ?, ?}>,		{?, ?, ?, ?}>,
Requires<[IsThumb2, IsNotMClass]> {		Requires<[IsThumb2, IsNotMClass]>, Sched<[WriteST]> {
bits<4> Rt2;		bits<4> Rt2;
let Inst{11-8} = Rt2;		let Inst{11-8} = Rt2;
}		}
def t2STLEXB : T2I_strex<0b1100, (outs rGPR:$Rd),		def t2STLEXB : T2I_strex<0b1100, (outs rGPR:$Rd),
(ins rGPR:$Rt, addr_offset_none:$addr),		(ins rGPR:$Rt, addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"stlexb", "\t$Rd, $Rt, $addr", "",		"stlexb", "\t$Rd, $Rt, $addr", "",
[(set rGPR:$Rd,		[(set rGPR:$Rd,
(stlex_1 rGPR:$Rt, addr_offset_none:$addr))]>,		(stlex_1 rGPR:$Rt, addr_offset_none:$addr))]>,
Requires<[IsThumb, HasAcquireRelease,		Requires<[IsThumb, HasAcquireRelease,
HasV7Clrex]>;		HasV7Clrex]>, Sched<[WriteST]>;

def t2STLEXH : T2I_strex<0b1101, (outs rGPR:$Rd),		def t2STLEXH : T2I_strex<0b1101, (outs rGPR:$Rd),
(ins rGPR:$Rt, addr_offset_none:$addr),		(ins rGPR:$Rt, addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"stlexh", "\t$Rd, $Rt, $addr", "",		"stlexh", "\t$Rd, $Rt, $addr", "",
[(set rGPR:$Rd,		[(set rGPR:$Rd,
(stlex_2 rGPR:$Rt, addr_offset_none:$addr))]>,		(stlex_2 rGPR:$Rt, addr_offset_none:$addr))]>,
Requires<[IsThumb, HasAcquireRelease,		Requires<[IsThumb, HasAcquireRelease,
HasV7Clrex]>;		HasV7Clrex]>, Sched<[WriteST]>;

def t2STLEX : Thumb2I<(outs rGPR:$Rd), (ins rGPR:$Rt,		def t2STLEX : Thumb2I<(outs rGPR:$Rd), (ins rGPR:$Rt,
addr_offset_none:$addr),		addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"stlex", "\t$Rd, $Rt, $addr", "",		"stlex", "\t$Rd, $Rt, $addr", "",
[(set rGPR:$Rd,		[(set rGPR:$Rd,
(stlex_4 rGPR:$Rt, addr_offset_none:$addr))]>,		(stlex_4 rGPR:$Rt, addr_offset_none:$addr))]>,
Requires<[IsThumb, HasAcquireRelease, HasV7Clrex]> {		Requires<[IsThumb, HasAcquireRelease, HasV7Clrex]>,
		Sched<[WriteST]> {
bits<4> Rd;		bits<4> Rd;
bits<4> Rt;		bits<4> Rt;
bits<4> addr;		bits<4> addr;
let Inst{31-27} = 0b11101;		let Inst{31-27} = 0b11101;
let Inst{26-20} = 0b0001100;		let Inst{26-20} = 0b0001100;
let Inst{19-16} = addr;		let Inst{19-16} = addr;
let Inst{15-12} = Rt;		let Inst{15-12} = Rt;
let Inst{11-4} = 0b11111110;		let Inst{11-4} = 0b11111110;
let Inst{3-0} = Rd;		let Inst{3-0} = Rd;
}		}
let hasExtraSrcRegAllocReq = 1 in		let hasExtraSrcRegAllocReq = 1 in
def t2STLEXD : T2I_strex<0b1111, (outs rGPR:$Rd),		def t2STLEXD : T2I_strex<0b1111, (outs rGPR:$Rd),
(ins rGPR:$Rt, rGPR:$Rt2, addr_offset_none:$addr),		(ins rGPR:$Rt, rGPR:$Rt2, addr_offset_none:$addr),
AddrModeNone, 4, NoItinerary,		AddrModeNone, 4, NoItinerary,
"stlexd", "\t$Rd, $Rt, $Rt2, $addr", "", [],		"stlexd", "\t$Rd, $Rt, $Rt2, $addr", "", [],
{?, ?, ?, ?}>, Requires<[IsThumb, HasAcquireRelease,		{?, ?, ?, ?}>, Requires<[IsThumb, HasAcquireRelease,
HasV7Clrex, IsNotMClass]> {		HasV7Clrex, IsNotMClass]>, Sched<[WriteST]> {
bits<4> Rt2;		bits<4> Rt2;
let Inst{11-8} = Rt2;		let Inst{11-8} = Rt2;
}		}
}		}

def t2CLREX : T2I<(outs), (ins), NoItinerary, "clrex", "", [(int_arm_clrex)]>,		def t2CLREX : T2I<(outs), (ins), NoItinerary, "clrex", "", [(int_arm_clrex)]>,
Requires<[IsThumb, HasV7Clrex]> {		Requires<[IsThumb, HasV7Clrex]> {
let Inst{31-16} = 0xf3bf;		let Inst{31-16} = 0xf3bf;
▲ Show 20 Lines • Show All 1,450 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/ARM/ARMSchedule.td

	Show First 20 Lines • Show All 418 Lines • ▼ Show 20 Lines
	// Processor instruction itineraries.			// Processor instruction itineraries.

	include "ARMScheduleV6.td"			include "ARMScheduleV6.td"
	include "ARMScheduleA8.td"			include "ARMScheduleA8.td"
	include "ARMScheduleA9.td"			include "ARMScheduleA9.td"
	include "ARMScheduleSwift.td"			include "ARMScheduleSwift.td"
	include "ARMScheduleR52.td"			include "ARMScheduleR52.td"
	include "ARMScheduleA57.td"			include "ARMScheduleA57.td"
	include "ARMScheduleM3.td"			include "ARMScheduleM4.td"

llvm/trunk/lib/Target/ARM/ARMScheduleM3.td

	//=- ARMScheduleM3.td - ARM Cortex-M3 Scheduling Definitions -- tablegen --=//
	//
	// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
	// See https://llvm.org/LICENSE.txt for license information.
	// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
	//
	//===----------------------------------------------------------------------===//
	//
	// This file defines the machine model for the ARM Cortex-M3 processor.
	//
	//===----------------------------------------------------------------------===//

	def CortexM3Model : SchedMachineModel {
	let IssueWidth = 1; // Only IT can be dual-issued, so assume single-issue
	let MicroOpBufferSize = 0; // In-order
	let LoadLatency = 2; // Latency when not pipelined, not pc-relative
	let MispredictPenalty = 2; // Best case branch taken cost

	let CompleteModel = 0;
	}

llvm/trunk/lib/Target/ARM/ARMScheduleM4.td

				//==- ARMScheduleM4.td - Cortex-M4 Scheduling Definitions -- tablegen --====//
				//
				// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
				// See https://llvm.org/LICENSE.txt for license information.
				// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
				//
				//===----------------------------------------------------------------------===//
				//
				// This file defines the SchedRead/Write data for the ARM Cortex-M4 processor.
				//
				//===----------------------------------------------------------------------===//

				def CortexM4Model : SchedMachineModel {
				let IssueWidth = 1; // Only IT can be dual-issued, so assume single-issue
				let MicroOpBufferSize = 0; // In-order
				let LoadLatency = 2; // Latency when not pipelined, not pc-relative
				let MispredictPenalty = 2; // Best case branch taken cost
				let PostRAScheduler = 1;

				let CompleteModel = 0;
				}


				// We model the entire cpu as a single pipeline with a BufferSize = 0 since
				// Cortex-M4 is in-order.

				def M4Unit : ProcResource<1> { let BufferSize = 0; }


				let SchedModel = CortexM4Model in {

				// Some definitions of latencies we apply to different instructions

				class M4UnitL1<SchedWrite write> : WriteRes<write, [M4Unit]> { let Latency = 1; }
				class M4UnitL2<SchedWrite write> : WriteRes<write, [M4Unit]> { let Latency = 2; }
				class M4UnitL3<SchedWrite write> : WriteRes<write, [M4Unit]> { let Latency = 3; }
				class M4UnitL14<SchedWrite write> : WriteRes<write, [M4Unit]> { let Latency = 14; }
				def M4UnitL1_wr : SchedWriteRes<[M4Unit]> { let Latency = 1; }
				def M4UnitL2_wr : SchedWriteRes<[M4Unit]> { let Latency = 2; }
				class M4UnitL1I<dag instr> : InstRW<[M4UnitL1_wr], instr>;
				class M4UnitL2I<dag instr> : InstRW<[M4UnitL2_wr], instr>;


				// Loads, MAC's and DIV all get a higher latency of 2
				def : M4UnitL2<WriteLd>;
				def : M4UnitL2<WriteMAC32>;
				def : M4UnitL2<WriteMAC64Hi>;
				def : M4UnitL2<WriteMAC64Lo>;
				def : M4UnitL2<WriteMAC16>;
				def : M4UnitL2<WriteDIV>;

				def : M4UnitL2I<(instregex "(t\|t2)LDM")>;


				// Stores we use a latency of 1 as they have no outputs

				def : M4UnitL1<WriteST>;
				def : M4UnitL1I<(instregex "(t\|t2)STM")>;


				// Everything else has a Latency of 1

				def : M4UnitL1<WriteALU>;
				def : M4UnitL1<WriteALUsi>;
				def : M4UnitL1<WriteALUsr>;
				def : M4UnitL1<WriteALUSsr>;
				def : M4UnitL1<WriteBr>;
				def : M4UnitL1<WriteBrL>;
				def : M4UnitL1<WriteBrTbl>;
				def : M4UnitL1<WriteCMPsi>;
				def : M4UnitL1<WriteCMPsr>;
				def : M4UnitL1<WriteCMP>;
				def : M4UnitL1<WriteMUL32>;
				def : M4UnitL1<WriteMUL64Hi>;
				def : M4UnitL1<WriteMUL64Lo>;
				def : M4UnitL1<WriteMUL16>;
				def : M4UnitL1<WriteNoop>;
				def : M4UnitL1<WritePreLd>;
				def : M4UnitL1I<(instregex "(t\|t2)MOV")>;
				def : M4UnitL1I<(instrs COPY)>;
				def : M4UnitL1I<(instregex "t2IT")>;
				def : M4UnitL1I<(instregex "t2SEL", "t2USAD8",
				"t2(S\|Q\|SH\|U\|UQ\|UH)(ADD16\|ASX\|SAX\|SUB16\|ADD8\|SUB8)", "t2USADA8", "(t\|t2)REV")>;

				def : ReadAdvance<ReadALU, 0>;
				def : ReadAdvance<ReadALUsr, 0>;
				def : ReadAdvance<ReadMUL, 0>;
				def : ReadAdvance<ReadMAC, 0>;

				// Most FP instructions are single-cycle latency, except MAC's, Div's and Sqrt's.
				// Loads still take 2 cycles.

				def : M4UnitL1<WriteFPCVT>;
				def : M4UnitL1<WriteFPMOV>;
				def : M4UnitL1<WriteFPALU32>;
				def : M4UnitL1<WriteFPALU64>;
				def : M4UnitL1<WriteFPMUL32>;
				def : M4UnitL1<WriteFPMUL64>;
				def : M4UnitL2I<(instregex "VLD")>;
				def : M4UnitL1I<(instregex "VST")>;
				def : M4UnitL3<WriteFPMAC32>;
				def : M4UnitL3<WriteFPMAC64>;
				def : M4UnitL14<WriteFPDIV32>;
				def : M4UnitL14<WriteFPDIV64>;
				def : M4UnitL14<WriteFPSQRT32>;
				def : M4UnitL14<WriteFPSQRT64>;
				def : M4UnitL1<WriteVLD1>;
				def : M4UnitL1<WriteVLD2>;
				def : M4UnitL1<WriteVLD3>;
				def : M4UnitL1<WriteVLD4>;
				def : M4UnitL1<WriteVST1>;
				def : M4UnitL1<WriteVST2>;
				def : M4UnitL1<WriteVST3>;
				def : M4UnitL1<WriteVST4>;

				def : ReadAdvance<ReadFPMUL, 0>;
				def : ReadAdvance<ReadFPMAC, 0>;

				}

llvm/trunk/test/CodeGen/ARM/ParallelDSP/multi-use-loads.ll

; RUN: llc -O3 -mtriple=arm-arm-eabi -mcpu=cortex-m33 < %s \| FileCheck %s		; RUN: llc -O3 -mtriple=arm-arm-eabi -mcpu=cortex-m33 < %s \| FileCheck %s
; RUN: llc -O3 -mtriple=armeb-arm-eabi -mcpu=cortex-m33 < %s \| FileCheck %s --check-prefix=CHECK-UNSUPPORTED		; RUN: llc -O3 -mtriple=armeb-arm-eabi -mcpu=cortex-m33 < %s \| FileCheck %s --check-prefix=CHECK-UNSUPPORTED

; CHECK-UNSUPPORTED-NOT: smlad		; CHECK-UNSUPPORTED-NOT: smlad

; CHECK-LABEL: add_user		; CHECK-LABEL: add_user
; CHECK: %for.body		; CHECK: %for.body
; CHECK: ldr [[A:r[0-9]+]],{{.*}}, #2]!		; CHECK: ldr [[A:[rl0-9]+]],{{.*}}, #2]!
; CHECK: ldr [[B:r[0-9]+]],{{.*}}, #2]!		; CHECK: ldr [[B:[rl0-9]+]],{{.*}}, #2]!
; CHECK: smlad [[ACC:r[0-9]+]], [[B]], [[A]], [[ACC]]
; CHECK: sxtah [[COUNT:r[0-9]+]], [[COUNT]], [[A]]		; CHECK: sxtah [[COUNT:r[0-9]+]], [[COUNT]], [[A]]
		; CHECK: smlad [[ACC:r[0-9]+]], [[B]], [[A]], [[ACC]]
define i32 @add_user(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {		define i32 @add_user(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {
entry:		entry:
%cmp24 = icmp sgt i32 %arg, 0		%cmp24 = icmp sgt i32 %arg, 0
br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup		br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup

for.body.preheader:		for.body.preheader:
%.pre = load i16, i16* %arg3, align 2		%.pre = load i16, i16* %arg3, align 2
%.pre27 = load i16, i16* %arg2, align 2		%.pre27 = load i16, i16* %arg2, align 2
Show All 28 Lines	for.body:
%add10 = add i32 %mul, %mac1.026		%add10 = add i32 %mul, %mac1.026
%add11 = add i32 %mul9, %add10		%add11 = add i32 %mul9, %add10
%exitcond = icmp ne i32 %add, %arg		%exitcond = icmp ne i32 %add, %arg
br i1 %exitcond, label %for.body, label %for.cond.cleanup		br i1 %exitcond, label %for.body, label %for.cond.cleanup
}		}

; CHECK-LABEL: mul_bottom_user		; CHECK-LABEL: mul_bottom_user
; CHECK: %for.body		; CHECK: %for.body
; CHECK: ldr [[A:r[0-9]+]],{{.*}}, #2]!		; CHECK: ldr [[A:[rl0-9]+]],{{.*}}, #2]!
; CHECK: ldr [[B:r[0-9]+]],{{.*}}, #2]!		; CHECK: ldr [[B:[rl0-9]+]],{{.*}}, #2]!
; CHECK: smlad [[ACC:r[0-9]+]], [[B]], [[A]], [[ACC]]
; CHECK: sxth [[SXT:r[0-9]+]], [[A]]		; CHECK: sxth [[SXT:r[0-9]+]], [[A]]
		; CHECK: smlad [[ACC:r[0-9]+]], [[B]], [[A]], [[ACC]]
; CHECK: mul [[COUNT:r[0-9]+]],{{.*}}[[SXT]]		; CHECK: mul [[COUNT:r[0-9]+]],{{.*}}[[SXT]]
define i32 @mul_bottom_user(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {		define i32 @mul_bottom_user(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {
entry:		entry:
%cmp24 = icmp sgt i32 %arg, 0		%cmp24 = icmp sgt i32 %arg, 0
br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup		br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup

for.body.preheader:		for.body.preheader:
%.pre = load i16, i16* %arg3, align 2		%.pre = load i16, i16* %arg3, align 2
Show All 31 Lines	for.body:
%exitcond = icmp ne i32 %add, %arg		%exitcond = icmp ne i32 %add, %arg
br i1 %exitcond, label %for.body, label %for.cond.cleanup		br i1 %exitcond, label %for.body, label %for.cond.cleanup
}		}

; CHECK-LABEL: mul_top_user		; CHECK-LABEL: mul_top_user
; CHECK: %for.body		; CHECK: %for.body
; CHECK: ldr [[A:[rl0-9]+]],{{.*}}, #2]!		; CHECK: ldr [[A:[rl0-9]+]],{{.*}}, #2]!
; CHECK: ldr [[B:[rl0-9]+]],{{.*}}, #2]!		; CHECK: ldr [[B:[rl0-9]+]],{{.*}}, #2]!
; CHECK: smlad [[ACC:[rl0-9]+]], [[B]], [[A]], [[ACC]]		; CHECK: asrs [[ASR:[rl0-9]+]], [[A]], #16
; CHECK: asr.w [[ASR:[rl0-9]+]], [[B]], #16		; CHECK: smlad [[ACC:[rl0-9]+]], [[A]], [[B]], [[ACC]]
; CHECK: mul [[COUNT:[rl0-9]+]],{{.}}[[ASR]]		; CHECK: mul [[COUNT:[rl0-9]+]],{{.}}[[ASR]]
define i32 @mul_top_user(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {		define i32 @mul_top_user(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {
entry:		entry:
%cmp24 = icmp sgt i32 %arg, 0		%cmp24 = icmp sgt i32 %arg, 0
br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup		br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup

for.body.preheader:		for.body.preheader:
%.pre = load i16, i16* %arg3, align 2		%.pre = load i16, i16* %arg3, align 2
Show All 29 Lines	for.body:
%add11 = add i32 %mul9, %add10		%add11 = add i32 %mul9, %add10
%count.next = mul i32 %conv7, %count		%count.next = mul i32 %conv7, %count
%exitcond = icmp ne i32 %add, %arg		%exitcond = icmp ne i32 %add, %arg
br i1 %exitcond, label %for.body, label %for.cond.cleanup		br i1 %exitcond, label %for.body, label %for.cond.cleanup
}		}

; CHECK-LABEL: and_user		; CHECK-LABEL: and_user
; CHECK: %for.body		; CHECK: %for.body
; CHECK: ldr [[A:r[0-9]+]],{{.*}}, #2]!		; CHECK: ldr [[A:[rl0-9]+]],{{.*}}, #2]!
; CHECK: ldr [[B:r[0-9]+]],{{.*}}, #2]!		; CHECK: ldr [[B:[rl0-9]+]],{{.*}}, #2]!
; CHECK: smlad [[ACC:r[0-9]+]], [[B]], [[A]], [[ACC]]
; CHECK: uxth [[UXT:r[0-9]+]], [[A]]		; CHECK: uxth [[UXT:r[0-9]+]], [[A]]
		; CHECK: smlad [[ACC:r[0-9]+]], [[B]], [[A]], [[ACC]]
; CHECK: mul [[MUL:r[0-9]+]],{{.*}}[[UXT]]		; CHECK: mul [[MUL:r[0-9]+]],{{.*}}[[UXT]]
define i32 @and_user(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {		define i32 @and_user(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {
entry:		entry:
%cmp24 = icmp sgt i32 %arg, 0		%cmp24 = icmp sgt i32 %arg, 0
br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup		br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup

for.body.preheader:		for.body.preheader:
%.pre = load i16, i16* %arg3, align 2		%.pre = load i16, i16* %arg3, align 2
Show All 30 Lines	for.body:
%add11 = add i32 %mul9, %add10		%add11 = add i32 %mul9, %add10
%count.next = mul i32 %bottom, %count		%count.next = mul i32 %bottom, %count
%exitcond = icmp ne i32 %add, %arg		%exitcond = icmp ne i32 %add, %arg
br i1 %exitcond, label %for.body, label %for.cond.cleanup		br i1 %exitcond, label %for.body, label %for.cond.cleanup
}		}

; CHECK-LABEL: multi_uses		; CHECK-LABEL: multi_uses
; CHECK: %for.body		; CHECK: %for.body
; CHECK: ldr [[A:r[0-9]+]], [{{.*}}, #2]!		; CHECK: ldr [[A:[rl0-9]+]], [{{.*}}, #2]!
; CHECK: ldr [[B:r[0-9]+]], [{{.*}}, #2]!		; CHECK: ldr [[B:[rl0-9]+]], [{{.*}}, #2]!
; CHECK: smlad [[ACC:[rl0-9]+]], [[B]], [[A]], [[ACC]]
; CHECK: sxth [[SXT:r[0-9]+]], [[A]]		; CHECK: sxth [[SXT:r[0-9]+]], [[A]]
		; CHECK: smlad [[ACC:[rl0-9]+]], [[B]], [[A]], [[ACC]]
; CHECK: eor.w [[EOR:r[0-9]+]], [[SXT]], [[SHIFT:r[0-9]+]]		; CHECK: eor.w [[EOR:r[0-9]+]], [[SXT]], [[SHIFT:r[0-9]+]]
; CHECK: mul [[MUL:r[0-9]+]],{{.*}}[[SXT]]		; CHECK: muls [[MUL:r[0-9]+]],{{.*}}[[SXT]]
; CHECK: lsl.w [[SHIFT]], [[MUL]], #16		; CHECK: lsl.w [[SHIFT]], [[MUL]], #16
define i32 @multi_uses(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {		define i32 @multi_uses(i32 %arg, i32* nocapture readnone %arg1, i16* nocapture readonly %arg2, i16* nocapture readonly %arg3) {
entry:		entry:
%cmp24 = icmp sgt i32 %arg, 0		%cmp24 = icmp sgt i32 %arg, 0
br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup		br i1 %cmp24, label %for.body.preheader, label %for.cond.cleanup

for.body.preheader:		for.body.preheader:
%.pre = load i16, i16* %arg3, align 2		%.pre = load i16, i16* %arg3, align 2
Show All 37 Lines

llvm/trunk/test/CodeGen/ARM/aapcs-hfa-code.ll

	Show First 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	; CHECK-DAG: mov [[ONELO:r[0-9]+]], #0			; CHECK-DAG: mov [[ONELO:r[0-9]+]], #0
	; CHECK-DAG: movw [[ONEHI:r[0-9]+]], #0			; CHECK-DAG: movw [[ONEHI:r[0-9]+]], #0
	; CHECK-DAG: movt [[ONEHI]], #16368			; CHECK-DAG: movt [[ONEHI]], #16368
	; CHECK: strd [[ONELO]], [[ONEHI]], [sp]			; CHECK: strd [[ONELO]], [[ONEHI]], [sp]
	; CHECK: bl test_1double_nosplit			; CHECK: bl test_1double_nosplit

	; CHECK-M4F-LABEL: test_1double_nosplit:			; CHECK-M4F-LABEL: test_1double_nosplit:
	; CHECK-M4F: movs [[ONEHI:r[0-9]+]], #0			; CHECK-M4F: movs [[ONEHI:r[0-9]+]], #0
	; CHECK-M4F: movs [[ONELO:r[0-9]+]], #0
	; CHECK-M4F: movt [[ONEHI]], #16368			; CHECK-M4F: movt [[ONEHI]], #16368
				; CHECK-M4F: movs [[ONELO:r[0-9]+]], #0
	; CHECK-M4F: strd [[ONELO]], [[ONEHI]], [sp]			; CHECK-M4F: strd [[ONELO]], [[ONEHI]], [sp]
	; CHECK-M4F: bl test_1double_nosplit			; CHECK-M4F: bl test_1double_nosplit
	call arm_aapcs_vfpcc void @test_1double_nosplit([4 x float] undef, [4 x double] undef, [3 x float] undef, double 1.0)			call arm_aapcs_vfpcc void @test_1double_nosplit([4 x float] undef, [4 x double] undef, [3 x float] undef, double 1.0)
	ret void			ret void
	}			}

	; Final double argument might go at [sp, #4] if we're careless. Should go at			; Final double argument might go at [sp, #4] if we're careless. Should go at
	; [sp, #8] to preserve alignment.			; [sp, #8] to preserve alignment.
	define arm_aapcs_vfpcc void @test_1double_misaligned([4 x double], [4 x double], float, double) {			define arm_aapcs_vfpcc void @test_1double_misaligned([4 x double], [4 x double], float, double) {
	call arm_aapcs_vfpcc void @test_1double_misaligned([4 x double] undef, [4 x double] undef, float undef, double 1.0)			call arm_aapcs_vfpcc void @test_1double_misaligned([4 x double] undef, [4 x double] undef, float undef, double 1.0)

	; CHECK-LABEL: test_1double_misaligned:			; CHECK-LABEL: test_1double_misaligned:
	; CHECK-DAG: movw [[ONEHI:r[0-9]+]], #0			; CHECK-DAG: movw [[ONEHI:r[0-9]+]], #0
	; CHECK-DAG: mov [[ONELO:r[0-9]+]], #0			; CHECK-DAG: mov [[ONELO:r[0-9]+]], #0
	; CHECK-DAG: movt [[ONEHI]], #16368			; CHECK-DAG: movt [[ONEHI]], #16368
	; CHECK-DAG: strd [[ONELO]], [[ONEHI]], [sp, #8]			; CHECK-DAG: strd [[ONELO]], [[ONEHI]], [sp, #8]

	; CHECK-M4F-LABEL: test_1double_misaligned:			; CHECK-M4F-LABEL: test_1double_misaligned:
	; CHECK-M4F: movs [[ONEHI:r[0-9]+]], #0			; CHECK-M4F: movs [[ONEHI:r[0-9]+]], #0
	; CHECK-M4F: movs [[ONELO:r[0-9]+]], #0
	; CHECK-M4F: movt [[ONEHI]], #16368			; CHECK-M4F: movt [[ONEHI]], #16368
				; CHECK-M4F: movs [[ONELO:r[0-9]+]], #0
	; CHECK-M4F: strd [[ONELO]], [[ONEHI]], [sp, #8]			; CHECK-M4F: strd [[ONELO]], [[ONEHI]], [sp, #8]
	; CHECK-M4F: bl test_1double_misaligned			; CHECK-M4F: bl test_1double_misaligned

	ret void			ret void
	}			}

llvm/trunk/test/CodeGen/ARM/useaa.ll

	; RUN: llc < %s -mtriple=armv8r-eabi -mcpu=cortex-r52 \| FileCheck %s --check-prefix=CHECK --check-prefix=USEAA			; RUN: llc < %s -mtriple=armv8r-eabi -mcpu=cortex-r52 \| FileCheck %s --check-prefix=CHECK --check-prefix=USEAA
				; RUN: llc < %s -mtriple=armv7m-eabi -mcpu=cortex-m4 \| FileCheck %s --check-prefix=CHECK --check-prefix=USEAA
				; RUN: llc < %s -mtriple=armv8m-eabi -mcpu=cortex-m33 \| FileCheck %s --check-prefix=CHECK --check-prefix=USEAA
	; RUN: llc < %s -mtriple=armv8r-eabi -mcpu=generic \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC			; RUN: llc < %s -mtriple=armv8r-eabi -mcpu=generic \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC

	; Check we use AA during codegen, so can interleave these loads/stores.			; Check we use AA during codegen, so can interleave these loads/stores.

	; CHECK-LABEL: test			; CHECK-LABEL: test
	; GENERIC: ldr			; GENERIC: ldr
	; GENERIC: str			; GENERIC: str
	; GENERIC: ldr			; GENERIC: ldr
	Show All 17 Lines

llvm/trunk/test/CodeGen/Thumb2/ifcvt-no-branch-predictor.ll

	Show First 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
	}			}

	; CHECK-LABEL: diamond2:			; CHECK-LABEL: diamond2:
	; CHECK-BP: cbz			; CHECK-BP: cbz
	; CHECK-BP: str			; CHECK-BP: str
	; CHECK-BP: str			; CHECK-BP: str
	; CHECK-BP: b			; CHECK-BP: b
	; CHECK-BP: str			; CHECK-BP: str
	; CHECK-BP: ldr			; CHECK-BP: add
	; CHECK-NOBP: ittee			; CHECK-NOBP: ittee
	; CHECK-NOBP: streq			; CHECK-NOBP: streq
	; CHECK-NOBP: ldreq			; CHECK-NOBP: addeq
	; CHECK-NOBP: strne			; CHECK-NOBP: strne
	; CHECK-NOBP: strne			; CHECK-NOBP: strne
	define i32 @diamond2(i32 %n, i32* %p, i32* %q) {			define i32 @diamond2(i32 %n, i32* %p, i32* %q) {
	entry:			entry:
	%tobool = icmp eq i32 %n, 0			%tobool = icmp eq i32 %n, 0
	br i1 %tobool, label %if.else, label %if.then			br i1 %tobool, label %if.else, label %if.then

	if.then:			if.then:
	store i32 %n, i32* %p, align 4			store i32 %n, i32* %p, align 4
	%arrayidx = getelementptr inbounds i32, i32* %p, i32 2			%arrayidx = getelementptr inbounds i32, i32* %p, i32 2
	store i32 %n, i32* %arrayidx, align 4			store i32 %n, i32* %arrayidx, align 4
	br label %if.end			br label %if.end

	if.else:			if.else:
	store i32 %n, i32* %q, align 4			store i32 %n, i32* %q, align 4
	%0 = load i32, i32* %p, align 4			%0 = add i32 %n, 10
	br label %if.end			br label %if.end

	if.end:			if.end:
	%n.addr.0 = phi i32 [ %n, %if.then ], [ %0, %if.else ]			%n.addr.0 = phi i32 [ %n, %if.then ], [ %0, %if.else ]
	tail call void @otherfn()			tail call void @otherfn()
	ret i32 %n.addr.0			ret i32 %n.addr.0
	}			}

	Show All 28 Lines

llvm/trunk/test/CodeGen/Thumb2/m4-sched-ldr.mir

				# RUN: llc %s -run-pass machine-scheduler -o - \| FileCheck %s

				# CHECK-LABEL: bb.0.
				# CHECK: t2LDRi12
				# CHECK-NEXT: t2LDRi12
				# CHECK-NEXT: t2ADDri
				# CHECK-NEXT: t2ADDri
				--- \|
				target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-a:0:32-n32-S64"
				target triple = "thumbv7em-arm-none-eabi"

				; Function Attrs: norecurse nounwind optsize readonly
				define dso_local i32 @test(i32* nocapture readonly %a, i32* nocapture readonly %b) local_unnamed_addr #0 {
				entry:
				%0 = load i32, i32* %a, align 4
				%add = add nsw i32 %0, 10
				%1 = load i32, i32* %b, align 4
				%add1 = add nsw i32 %1, 20
				%mul = mul nsw i32 %add1, %add
				ret i32 %mul
				}

				attributes #0 = { "target-cpu"="cortex-m4" }

				...
				---
				name: test
				alignment: 1
				exposesReturnsTwice: false
				legalized: false
				regBankSelected: false
				selected: false
				failedISel: false
				tracksRegLiveness: true
				registers:
				- { id: 0, class: gpr, preferred-register: '' }
				- { id: 1, class: gpr, preferred-register: '' }
				- { id: 2, class: gprnopc, preferred-register: '' }
				- { id: 3, class: rgpr, preferred-register: '' }
				- { id: 4, class: gprnopc, preferred-register: '' }
				- { id: 5, class: rgpr, preferred-register: '' }
				- { id: 6, class: rgpr, preferred-register: '' }
				liveins:
				- { reg: '$r0', virtual-reg: '%0' }
				- { reg: '$r1', virtual-reg: '%1' }
				body: \|
				bb.0.entry:
				liveins: $r0, $r1

				%1:gpr = COPY $r1
				%0:gpr = COPY $r0
				%2:gprnopc = t2LDRi12 %0, 0, 14, $noreg :: (load 4 from %ir.a)
				%3:rgpr = nsw t2ADDri %2, 10, 14, $noreg, $noreg
				%4:gprnopc = t2LDRi12 %1, 0, 14, $noreg :: (load 4 from %ir.b)
				%5:rgpr = nsw t2ADDri %4, 20, 14, $noreg, $noreg
				%6:rgpr = nsw t2MUL %5, %3, 14, $noreg
				$r0 = COPY %6
				tBX_RET 14, $noreg, implicit $r0

				...

llvm/trunk/test/CodeGen/Thumb2/m4-sched-regs.ll

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc %s -o - \| FileCheck %s

				target datalayout = "e-m:e-p:32:32-Fi8-i64:64-v128:64:128-a:0:32-n32-S64"
				target triple = "thumbv7em-arm-none-eabi"

				%struct.a = type { i32, %struct.b, i8, i8, i8, i8, i8, %struct.b*, i16, i16, i16, i16, i16, i16, i16, i16, i32, i32, i32, i32, i32, i32, i32 }
				%struct.b = type { i8, i8, i8, i8, i32, i16, i16, i32, i32, i32, i32, [16 x i8], [64 x i8], [128 x i8], i32, [68 x i8] }

				define void @test(%struct.a* nocapture %dhcp, i16 zeroext %value) #0 {
				; CHECK-LABEL: test:
				; CHECK: @ %bb.0: @ %entry
				; CHECK-NEXT: .save {r7, lr}
				; CHECK-NEXT: push {r7, lr}
				; CHECK-NEXT: ldrh r3, [r0, #20]
				; CHECK-NEXT: ldr.w lr, [r0, #16]
				; CHECK-NEXT: lsr.w r12, r1, #8
				; CHECK-NEXT: adds r2, r3, #1
				; CHECK-NEXT: strh r2, [r0, #20]
				; CHECK-NEXT: add.w r2, lr, r3
				; CHECK-NEXT: strb.w r12, [r2, #240]
				; CHECK-NEXT: ldrh r2, [r0, #20]
				; CHECK-NEXT: ldr.w r12, [r0, #16]
				; CHECK-NEXT: adds r3, r2, #1
				; CHECK-NEXT: strh r3, [r0, #20]
				; CHECK-NEXT: add.w r0, r12, r2
				; CHECK-NEXT: strb.w r1, [r0, #240]
				; CHECK-NEXT: pop {r7, pc}
				entry:
				%shr = lshr i16 %value, 8
				%conv1 = trunc i16 %shr to i8
				%msg_out = getelementptr inbounds %struct.a, %struct.a* %dhcp, i32 0, i32 7
				%0 = load %struct.b, %struct.b* %msg_out, align 4
				%options_out_len = getelementptr inbounds %struct.a, %struct.a* %dhcp, i32 0, i32 8
				%1 = load i16, i16* %options_out_len, align 4
				%inc = add i16 %1, 1
				store i16 %inc, i16* %options_out_len, align 4
				%idxprom = zext i16 %1 to i32
				%arrayidx = getelementptr inbounds %struct.b, %struct.b* %0, i32 0, i32 15, i32 %idxprom
				store i8 %conv1, i8* %arrayidx, align 1
				%conv4 = trunc i16 %value to i8
				%2 = load %struct.b, %struct.b* %msg_out, align 4
				%3 = load i16, i16* %options_out_len, align 4
				%inc8 = add i16 %3, 1
				store i16 %inc8, i16* %options_out_len, align 4
				%idxprom9 = zext i16 %3 to i32
				%arrayidx10 = getelementptr inbounds %struct.b, %struct.b* %2, i32 0, i32 15, i32 %idxprom9
				store i8 %conv4, i8* %arrayidx10, align 1
				ret void
				}

				attributes #0 = { minsize optsize "target-cpu"="cortex-m4" }