llvm · Sep 6, 2019
diff --git a/‎llvm/include/llvm/IR/IntrinsicsARM.td
+4 b/‎llvm/include/llvm/IR/IntrinsicsARM.td
+4
diff --git a/‎llvm/lib/Target/ARM/ARM.h
+2 b/‎llvm/lib/Target/ARM/ARM.h
+2
diff --git a/‎llvm/lib/Target/ARM/ARMTargetMachine.cpp
+4-1 b/‎llvm/lib/Target/ARM/ARMTargetMachine.cpp
+4-1
diff --git a/‎llvm/lib/Target/ARM/CMakeLists.txt
+1 b/‎llvm/lib/Target/ARM/CMakeLists.txt
+1
@@ -777,6 +777,10 @@ class Neon_Dot_Intrinsic
 def int_arm_neon_udot : Neon_Dot_Intrinsic;
 def int_arm_neon_sdot : Neon_Dot_Intrinsic;
 
+def int_arm_vctp8  : Intrinsic<[llvm_v16i1_ty], [llvm_i32_ty], [IntrNoMem]>;
+def int_arm_vctp16 : Intrinsic<[llvm_v8i1_ty], [llvm_i32_ty], [IntrNoMem]>;
+def int_arm_vctp32 : Intrinsic<[llvm_v4i1_ty], [llvm_i32_ty], [IntrNoMem]>;
+def int_arm_vctp64 : Intrinsic<[llvm_v2i1_ty], [llvm_i32_ty], [IntrNoMem]>;
 
 // GNU eabi mcount
 def int_arm_gnu_eabi_mcount : Intrinsic<[],
 
@@ -35,6 +35,7 @@ class MachineInstr;
 class MCInst;
 class PassRegistry;
 
+Pass *createMVETailPredicationPass();
 FunctionPass *createARMLowOverheadLoopsPass();
 Pass *createARMParallelDSPPass();
 FunctionPass *createARMISelDag(ARMBaseTargetMachine &TM,
@@ -67,6 +68,7 @@ void initializeThumb2SizeReducePass(PassRegistry &);
 void initializeThumb2ITBlockPass(PassRegistry &);
 void initializeMVEVPTBlockPass(PassRegistry &);
 void initializeARMLowOverheadLoopsPass(PassRegistry &);
+void initializeMVETailPredicationPass(PassRegistry &);
 
 } // end namespace llvm
 
 
@@ -96,6 +96,7 @@ extern "C" void LLVMInitializeARMTarget() {
   initializeARMExpandPseudoPass(Registry);
   initializeThumb2SizeReducePass(Registry);
   initializeMVEVPTBlockPass(Registry);
+  initializeMVETailPredicationPass(Registry);
   initializeARMLowOverheadLoopsPass(Registry);
 }
 
@@ -447,8 +448,10 @@ bool ARMPassConfig::addPreISel() {
                                   MergeExternalByDefault));
   }
 
-  if (TM->getOptLevel() != CodeGenOpt::None)
+  if (TM->getOptLevel() != CodeGenOpt::None) {
     addPass(createHardwareLoopsPass());
+    addPass(createMVETailPredicationPass());
+  }
 
   return false;
 }
 
@@ -52,6 +52,7 @@ add_llvm_target(ARMCodeGen
   ARMTargetObjectFile.cpp
   ARMTargetTransformInfo.cpp
   MLxExpansionPass.cpp
+  MVETailPredication.cpp
   MVEVPTBlockPass.cpp
   Thumb1FrameLowering.cpp
   Thumb1InstrInfo.cpp
Original file line number	Diff line number	Diff line change
`@@ -96,6 +96,7 @@ extern "C" void LLVMInitializeARMTarget() {`
`96`	`96`	`initializeARMExpandPseudoPass(Registry);`
`97`	`97`	`initializeThumb2SizeReducePass(Registry);`
`98`	`98`	`initializeMVEVPTBlockPass(Registry);`
	`99`	`+ initializeMVETailPredicationPass(Registry);`
`99`	`100`	`initializeARMLowOverheadLoopsPass(Registry);`
`100`	`101`	`}`
`101`	`102`
`@@ -447,8 +448,10 @@ bool ARMPassConfig::addPreISel() {`
`447`	`448`	`MergeExternalByDefault));`
`448`	`449`	`}`
`449`	`450`
`450`		`- if (TM->getOptLevel() != CodeGenOpt::None)`
	`451`	`+ if (TM->getOptLevel() != CodeGenOpt::None) {`
`451`	`452`	`addPass(createHardwareLoopsPass());`
	`453`	`+ addPass(createMVETailPredicationPass());`
	`454`	`+ }`
`452`	`455`
`453`	`456`	`return false;`
`454`	`457`	`}`