This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
clang/
-
include/clang/
-
clang/
-
Basic/
-
Attr.td
-
DiagnosticParseKinds.td
-
DiagnosticSemaKinds.td
-
Parse/
-
Parser.h
-
Sema/
-
Sema.h
-
lib/
-
AST/
-
AttrImpl.cpp
-
CodeGen/
13/13
CGDecl.cpp
2/2
CGOpenMPRuntime.cpp
-
CodeGenModule.h
-
CodeGenModule.cpp
-
Parse/
9/9
ParseOpenMP.cpp
-
Sema/
-
SemaDecl.cpp
-
SemaOpenMP.cpp
-
test/
-
Headers/
-
nvptx_device_math_complex.c
-
OpenMP/
-
declare_target_codegen_globalization.cpp
-
declare_target_device_only_compilation.cpp
-
declare_target_messages.cpp
-
declare_target_only_one_side_compilation.cpp
-
for_firstprivate_codegen.cpp
-
irbuilder_for_iterator.cpp
-
irbuilder_for_rangefor.cpp
-
irbuilder_for_unsigned.c
-
irbuilder_nested_openmp_parallel_empty.c
-
irbuilder_nested_parallel_for.c
-
nvptx_declare_target_var_ctor_dtor_codegen.cpp
-
nvptx_declare_variant_name_mangling.cpp
-
nvptx_multi_target_parallel_codegen.cpp
-
nvptx_nested_parallel_codegen.cpp
-
nvptx_target_codegen.cpp
-
parallel_for_codegen.cpp
-
parallel_master_taskloop_codegen.cpp
-
parallel_master_taskloop_simd_codegen.cpp
-
remarks_parallel_in_multiple_target_state_machines.c
-
remarks_parallel_in_target_state_machine.c
-
sections_firstprivate_codegen.cpp
-
single_codegen.cpp
-
single_firstprivate_codegen.cpp
-
task_codegen.cpp
-
taskgroup_codegen.cpp
-
threadprivate_codegen.cpp
-
tile_codegen.cpp
-
utils/update_cc_test_checks/Inputs/
-
update_cc_test_checks/
-
Inputs/
-
generated-funcs.c.generated.expected
-
generated-funcs.c.no-generated.expected
-
llvm/include/llvm/Frontend/OpenMP/
-
include/
-
llvm/
-
Frontend/
-
OpenMP/
-
OMP.td

Differential D101030

[OpenMP] Overhaul `declare target` handling
ClosedPublic

Authored by jdoerfert on Apr 22 2021, 1:39 AM.

Download Raw Diff

Details

Reviewers

ABataev
grokos
dreachem
cchen
JonChesterfield
bollu
aaron.ballman

Commits

rGdf729e2b82b3: [OpenMP] Overhaul `declare target` handling

Summary

This patch fixes various issues with our prior declare target handling
and extends it to support omp begin declare target as well.

This started with PR49649 in mind, trying to provide a way for users to
avoid the "ref" global use introduced for globals with internal linkage.
From there it went down the rabbit hole, e.g., all variables, even
nohost ones, were emitted into the device code so it was impossible to
determine if "ref" was needed late in the game (based on the name only).
To make it really useful, begin declare target was needed as it can
carry the device_type. Not emitting variables eagerly had a ripple
effect. Finally, the precedence of the (explicit) declare target list
items needed to be taken into account, that meant we cannot just look
for any declare target attribute to make a decision. This caused the
handling of functions to require fixup as well.

I tried to clean up things while I was at it, e.g., we should not "parse
declarations and defintions" as part of OpenMP parsing, this will always
break at some point. Instead, we keep track what region we are in and
act on definitions and declarations instead, this is what we do for
declare variant and other begin/end directives already.

Highlights:

new diagnosis for restrictions specificed in the standard,
delayed emission of globals not mentioned in an explicit list of a declare target,
omission of nohost globals on the host and host globals on the device,
no explicit parsing of declarations in-between omp [begin] declare variant and the corresponding end anymore, regular parsing instead,
precedence for explicit mentions in declare target lists over implicit mentions in the declaration-definition-seq, and
omp allocate declarations will now replace an earlier emitted global, if necessary.

Notes:

The patch is larger than I hoped but it turns out that most changes do
on their own lead to "inconsistent states", which seem less desirable
overall.

After working through this I feel the standard should remove the
explicit declare target forms as the delayed emission is horrible.
That said, while we delay things anyway, it seems to me we check too
often for the current status even though that is often not sufficient to
act upon. There seems to be a lot of duplication that can probably be
trimmed down. Eagerly emitting some things seems pretty weak as an
argument to keep so much logic around.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

jdoerfert created this revision.Apr 22 2021, 1:39 AM

Herald added a reviewer: bollu. · View Herald TranscriptApr 22 2021, 1:39 AM

Herald added a reviewer: aaron.ballman. · View Herald Transcript

Herald added subscribers: guansong, yaxunl. · View Herald Transcript

jdoerfert requested review of this revision.Apr 22 2021, 1:39 AM

Herald added projects: Restricted Project, Restricted Project. · View Herald TranscriptApr 22 2021, 1:39 AM

Herald added subscribers: llvm-commits, sstefan1. · View Herald Transcript

Harbormaster completed remote builds in B100185: Diff 339514.Apr 22 2021, 1:39 AM

Could you check that it does not break the tests from https://github.com/clang-ykt/omptests? IIRC, "ref" was introduced to fix a bug with too early optimizations of the declare target variables defined in other modules. Check t-same-name-definitions especially, though I'm not sure that exactly this test caused adding of $refs.

clang/lib/CodeGen/CGOpenMPRuntime.cpp
2998–2999	Why did you decide to drop this?
clang/lib/Parse/ParseOpenMP.cpp
1736	Looks like it is still required to consume `tok::annot_pragma_openmp_end`
1742	`try_emplace(ND, MI)`

In D101030#2708277, @ABataev wrote:

Could you check that it does not break the tests from https://github.com/clang-ykt/omptests? IIRC, "ref" was introduced to fix a bug with too early optimizations of the declare target variables defined in other modules. Check t-same-name-definitions especially, though I'm not sure that exactly this test caused adding of $refs.

I did run that test, works fine. The "$ref"s are still generated, except if you don't have a host version of a variable. Without it, there is no reason to have a ref because you cannot actually address the device version.

clang/lib/CodeGen/CGOpenMPRuntime.cpp
2998–2999	Because a missing host version should mean we do not create a region entry. Take a look at all the situations in `clang/test/OpenMP/declare_target_only_one_side_compilation.cpp` for which we are missing a host entry. None of them should create a region entry info.
clang/lib/Parse/ParseOpenMP.cpp
1736	That's done in the caller now because the clauses are not always parsed.

ABataev added inline comments.Apr 22 2021, 9:11 AM

clang/lib/Parse/ParseOpenMP.cpp
2134–2151	Add a RAII to control these new/delete or just create local var

jdoerfert marked an inline comment as done.Apr 22 2021, 9:32 AM

jdoerfert added inline comments.

clang/lib/Parse/ParseOpenMP.cpp
2134–2151	Local variable and RAII do not always work, there is a delete in the `end_declare_target` below as well.

ABataev added inline comments.Apr 23 2021, 6:40 AM

clang/lib/Parse/ParseOpenMP.cpp
2134–2151	But here you have new/delete pair within a single block. Either you can put the ar into stack/RAII or some extra checks are missing. Maybe must be something like this: if (DKind == OMPD_declare_target) delete DTCI; ?

jdoerfert added inline comments.Apr 23 2021, 8:52 AM

clang/lib/Parse/ParseOpenMP.cpp
2134–2151	If this is a directive without implicit mappings, the DTCI will be deleted right away. It is just used to collect the clauses (which include explicit mappings). If this is a directive with implicit mappings, which we cannot tell from the DKind alone, the DTCI will be stored in Sema until we reach the corresponding end directive. For the former case we could do stack/RAII, but not for the latter case, the scope is left and DTCI survives. I'll look into this again and try to avoid new/delete, feel free to look at the rest of the patch.

ABataev added inline comments.Apr 23 2021, 9:17 AM

clang/lib/Parse/ParseOpenMP.cpp
2134–2151	Everything else looks good, just need to clarify the question with this new/delete. I missed `if (HasImplicitMappings)` check, so maybe this is correct but better to double-check.

I'm testing a new version that does not allocate the structure on the heap. Instead we copy it. It is really infrequent and it should be <40 bytes when that happens, let's not over-optimize ;)

In D101030#2712738, @jdoerfert wrote:

I'm testing a new version that does not allocate the structure on the heap. Instead we copy it. It is really infrequent and it should be <40 bytes when that happens, let's not over-optimize ;)

I don't worry about optimizations here, just about possible memory leak.

Avoid heap memory, copy when necessary, add documentation, address comments

Looks good, but would be nice to check with sanitizers that there are no uses-after-delete.

clang/lib/CodeGen/CGDecl.cpp
2619–2620	`const auto *`
clang/lib/Parse/ParseOpenMP.cpp
2142–2143	Would be good to check how it works with sanitizers.

In D101030#2713117, @ABataev wrote:

Looks good, but would be nice to check with sanitizers that there are no uses-after-delete.

There is no heap allocation anymore but I guess I could have messed up the stack stuff.
I don't have a sanitizer build handy but the buildbots will yell at me if I messed up, is that sufficient?

This revision is now accepted and ready to land.Apr 23 2021, 1:07 PM

Harbormaster completed remote builds in B100643: Diff 340126.Apr 23 2021, 2:51 PM

I'm fixing the tests now, also realized that the omp allocate handling now always creates definitions, which is bad.
I'll upload a new version soon, test case for this, which shows we also don't do a good job now, is here: https://godbolt.org/z/T9od5Mq7h

jdoerfert mentioned this in D99350: [OPENMP]Fix PR49649: The introduction of $ref globals is not always valid..Apr 27 2021, 9:54 PM

Fix tests by not always emitting a definition for omp allocate

ABataev added inline comments.May 3 2021, 9:45 AM

clang/lib/CodeGen/CGDecl.cpp
2618	Why need to remove constantness here?
2622	`Skip`
2623–2624	What about static locals, will it work?

jdoerfert added inline comments.May 3 2021, 10:01 AM

clang/lib/CodeGen/CGDecl.cpp
2618	The problem is that the declaration, which might have been already generated in IR or not, had no address space attached before. Now we want to do that after the fact, potentially way later. To reuse the general codegen mechanism I modify the VarDecl (temporarily) by attaching the new address space and calling codegen again. If you have a better idea, I'm happy to change this.
2623–2624	need to check, will add a test.

Harbormaster completed remote builds in B102304: Diff 342419.May 3 2021, 10:53 AM

ABataev added inline comments.May 3 2021, 12:52 PM

clang/lib/CodeGen/CGDecl.cpp
2618	Why not just create it manually rather than rely on `GetOrCreateLLVMGlobal`?

jdoerfert added inline comments.May 3 2021, 1:20 PM

clang/lib/CodeGen/CGDecl.cpp
2618	I'm not sure I follow. Creating a global is complicated, need to make sure all the linkage, visibility, address space stuff is set up, mangling, etc. Why would we duplicate all that code and risk messing things up now or in the future?

ABataev added inline comments.May 3 2021, 1:26 PM

clang/lib/CodeGen/CGDecl.cpp
2618	And what about just setting the address-space on the LLVM type directly?

jdoerfert added inline comments.May 3 2021, 5:44 PM

clang/lib/CodeGen/CGDecl.cpp
2618	It's part of the type, we can't change it after the fact (at least that is not an existing API).

ABataev added inline comments.May 3 2021, 6:09 PM

clang/lib/CodeGen/CGDecl.cpp
2618	What about `Value::mutateType`?

jdoerfert added inline comments.May 4 2021, 7:57 AM

clang/lib/CodeGen/CGDecl.cpp

2618

I'll give it a shot, though the comment makes me nervous:

/// Mutate the type of this Value to be of the specified type.                                                                                                                                                                                             
///
/// Note that this is an extremely dangerous operation which can create
/// completely invalid IR very easily.  It is strongly recommended that you
/// recreate IR objects with the right types instead of mutating them in
/// place.

Use mutateType, add test for static variable in function with allocate directive

Remove const cast, clang-format

jdoerfert marked 7 inline comments as done.May 4 2021, 9:09 AM

jdoerfert added inline comments.

clang/lib/CodeGen/CGDecl.cpp
2618	Seems to work with the mutate API. Let's try it out ;)

I'll wait for @ggeorgakoudis to update the tests with the script, then I'll adjust all clang tests again. FWIW, this also fixes an issue in OpenMC where declare target triggered this:

llvm-project/clang/lib/CodeGen/CodeGenFunction.cpp:719: void clang::CodeGen::CodeGenFunction::StartFunction(clang::GlobalDecl, clang::QualType, llvm::Function *, const clang::CodeGen::CGFunctionInfo &, const clang::CodeGen::FunctionArgList &, clang::SourceLocation, clang::SourceLocation): Assertion `CurFn->isDeclaration() && "Function already has body?"' failed.

In D101030#2736508, @jdoerfert wrote:
I'll wait for @ggeorgakoudis to update the tests with the script, then I'll adjust all clang tests again. FWIW, this also fixes an issue in OpenMC where declare target triggered this:
llvm-project/clang/lib/CodeGen/CodeGenFunction.cpp:719: void clang::CodeGen::CodeGenFunction::StartFunction(clang::GlobalDecl, clang::QualType, llvm::Function *, const clang::CodeGen::CGFunctionInfo &, const clang::CodeGen::FunctionArgList &, clang::SourceLocation, clang::SourceLocation): Assertion `CurFn->isDeclaration() && "Function already has body?"' failed.

Nice!

Harbormaster completed remote builds in B102549: Diff 342765.May 4 2021, 9:44 AM

Update tests

Herald added a subscriber: jfb. · View Herald TranscriptMay 5 2021, 9:51 PM

Reapply test changes accidentally dropped

Harbormaster completed remote builds in B102912: Diff 343285.May 5 2021, 10:57 PM

Address the last test failures (all ordering)

Harbormaster completed remote builds in B102917: Diff 343290.May 5 2021, 11:46 PM

Closed by commit rGdf729e2b82b3: [OpenMP] Overhaul `declare target` handling (authored by jdoerfert). · Explain WhyMay 6 2021, 12:11 AM

This revision was automatically updated to reflect the committed changes.

jdoerfert added a commit: rGdf729e2b82b3: [OpenMP] Overhaul `declare target` handling.

Hello, We are maintaining a downstream version of the monorepo based on the LLVM main branch. We have not transitioned to the new PM yet. In a recent attempt to merge the latest upstream commits into our monorepo we came across the following test failures after your commit.

failed_report.txt9 KBDownload

For below test cases:

remarks_parallel_in_multiple_target_state_machines.c
remarks_parallel_in_target_state_machine.c

Thanks
greg

In D101030#2745429, @gregmiller wrote:
Hello, We are maintaining a downstream version of the monorepo based on the LLVM main branch. We have not transitioned to the new PM yet. In a recent attempt to merge the latest upstream commits into our monorepo we came across the following test failures after your commit.

failed_report.txt9 KBDownload

For below test cases:
remarks_parallel_in_multiple_target_state_machines.c
remarks_parallel_in_target_state_machine.c
Thanks
greg

Can you add (and if you want upstream) a change that forces the use of the new pass manager for those tests?

In D101030#2745513, @jdoerfert wrote:
In D101030#2745429, @gregmiller wrote:
Hello, We are maintaining a downstream version of the monorepo based on the LLVM main branch. We have not transitioned to the new PM yet. In a recent attempt to merge the latest upstream commits into our monorepo we came across the following test failures after your commit.

failed_report.txt9 KBDownload

For below test cases:
remarks_parallel_in_multiple_target_state_machines.c
remarks_parallel_in_target_state_machine.c
Thanks
greg
Can you add (and if you want upstream) a change that forces the use of the new pass manager for those tests?

Since the old pass manager is still supported upstream, I think it would make more sense for you to update your changes to the failing tests instead.

In D101030#2746770, @gregmiller wrote:
In D101030#2745513, @jdoerfert wrote:
In D101030#2745429, @gregmiller wrote:
Hello, We are maintaining a downstream version of the monorepo based on the LLVM main branch. We have not transitioned to the new PM yet. In a recent attempt to merge the latest upstream commits into our monorepo we came across the following test failures after your commit.

failed_report.txt9 KBDownload

For below test cases:
remarks_parallel_in_multiple_target_state_machines.c
remarks_parallel_in_target_state_machine.c
Thanks
greg
Can you add (and if you want upstream) a change that forces the use of the new pass manager for those tests?
Since the old pass manager is still supported upstream, I think it would make more sense for you to update your changes to the failing tests instead.

Sure. I'll do that when I find a minute.
Given that you have a setup with the old PM set as default I figured it might be easier for you to test the minimal change to the run lines but I am happy to do it myself next chance I get to setup everything and such.

In D101030#2746957, @jdoerfert wrote:
In D101030#2746770, @gregmiller wrote:
In D101030#2745513, @jdoerfert wrote:
In D101030#2745429, @gregmiller wrote:
Hello, We are maintaining a downstream version of the monorepo based on the LLVM main branch. We have not transitioned to the new PM yet. In a recent attempt to merge the latest upstream commits into our monorepo we came across the following test failures after your commit.

failed_report.txt9 KBDownload

For below test cases:
remarks_parallel_in_multiple_target_state_machines.c
remarks_parallel_in_target_state_machine.c
Thanks
greg
Can you add (and if you want upstream) a change that forces the use of the new pass manager for those tests?
Since the old pass manager is still supported upstream, I think it would make more sense for you to update your changes to the failing tests instead.
Sure. I'll do that when I find a minute.
Given that you have a setup with the old PM set as default I figured it might be easier for you to test the minimal change to the run lines but I am happy to do it myself next chance I get to setup everything and such.

Thanks. That would be much appreciated.

alanphipps added a subscriber: alanphipps.May 10 2021, 10:02 AM

JonChesterfield added a subscriber: JonChesterfield.Aug 25 2021, 1:20 AM

Revision Contents

Path

Size

clang/

include/

clang/

Basic/

Attr.td

1 line

DiagnosticParseKinds.td

10 lines

DiagnosticSemaKinds.td

2 lines

Parse/

Parser.h

8 lines

Sema/

Sema.h

48 lines

lib/

AST/

AttrImpl.cpp

51 lines

CodeGen/

54 lines

54 lines

4 lines

25 lines

Parse/

ParseOpenMP.cpp

174 lines

Sema/

SemaDecl.cpp

2 lines

SemaOpenMP.cpp

91 lines

test/

Headers/

nvptx_device_math_complex.c

24 lines

OpenMP/

declare_target_codegen_globalization.cpp

43 lines

declare_target_device_only_compilation.cpp

declare_target_messages.cpp

24 lines

declare_target_only_one_side_compilation.cpp

75 lines

for_firstprivate_codegen.cpp

312 lines

irbuilder_for_iterator.cpp

18 lines

irbuilder_for_rangefor.cpp

22 lines

irbuilder_for_unsigned.c

16 lines

irbuilder_nested_openmp_parallel_empty.c

12 lines

irbuilder_nested_parallel_for.c

134 lines

nvptx_declare_target_var_ctor_dtor_codegen.cpp

6 lines

nvptx_declare_variant_name_mangling.cpp

4 lines

nvptx_multi_target_parallel_codegen.cpp

135 lines

nvptx_nested_parallel_codegen.cpp

279 lines

nvptx_target_codegen.cpp

270 lines

parallel_for_codegen.cpp

52 lines

parallel_master_taskloop_codegen.cpp

144 lines

parallel_master_taskloop_simd_codegen.cpp

140 lines

remarks_parallel_in_multiple_target_state_machines.c

28 lines

remarks_parallel_in_target_state_machine.c

8 lines

sections_firstprivate_codegen.cpp

312 lines

single_codegen.cpp

586 lines

single_firstprivate_codegen.cpp

312 lines

task_codegen.cpp

536 lines

taskgroup_codegen.cpp

308 lines

threadprivate_codegen.cpp

7050 lines

tile_codegen.cpp

36 lines

utils/

update_cc_test_checks/

Inputs/

generated-funcs.c.generated.expected

18 lines

generated-funcs.c.no-generated.expected

4 lines

llvm/

include/

llvm/

Frontend/

OpenMP/

OMP.td

7 lines

Diff 343305

clang/include/clang/Basic/Attr.td

Show First 20 Lines • Show All 3,600 Lines • ▼ Show 20 Lines	EnumArgument<"DevType", "DevTypeTy",
[ "host", "nohost", "any" ],		[ "host", "nohost", "any" ],
[ "DT_Host", "DT_NoHost", "DT_Any" ]>,		[ "DT_Host", "DT_NoHost", "DT_Any" ]>,
UnsignedArgument<"Level">		UnsignedArgument<"Level">
];		];
let AdditionalMembers = [{		let AdditionalMembers = [{
void printPrettyPragma(raw_ostream &OS, const PrintingPolicy &Policy) const;		void printPrettyPragma(raw_ostream &OS, const PrintingPolicy &Policy) const;
static llvm::Optional<MapTypeTy>		static llvm::Optional<MapTypeTy>
isDeclareTargetDeclaration(const ValueDecl *VD);		isDeclareTargetDeclaration(const ValueDecl *VD);
		static llvm::Optional<OMPDeclareTargetDeclAttr> getActiveAttr(const ValueDecl VD);
static llvm::Optional<DevTypeTy> getDeviceType(const ValueDecl *VD);		static llvm::Optional<DevTypeTy> getDeviceType(const ValueDecl *VD);
static llvm::Optional<SourceLocation> getLocation(const ValueDecl *VD);		static llvm::Optional<SourceLocation> getLocation(const ValueDecl *VD);
}];		}];
}		}

def OMPAllocateDecl : InheritableAttr {		def OMPAllocateDecl : InheritableAttr {
// This attribute has no spellings as it is only ever created implicitly.		// This attribute has no spellings as it is only ever created implicitly.
let Spellings = [];		let Spellings = [];
▲ Show 20 Lines • Show All 173 Lines • Show Last 20 Lines

clang/include/clang/Basic/DiagnosticParseKinds.td

Show First 20 Lines • Show All 1,308 Lines • ▼ Show 20 Lines	def warn_omp_unknown_assumption_clause_missing_id
: Warning<"valid %0 clauses start with %1; %select{token\|tokens}2 will be ignored">,		: Warning<"valid %0 clauses start with %1; %select{token\|tokens}2 will be ignored">,
InGroup<OpenMPClauses>;		InGroup<OpenMPClauses>;
def warn_omp_unknown_assumption_clause_without_args		def warn_omp_unknown_assumption_clause_without_args
: Warning<"%0 clause should not be followed by arguments; tokens will be ignored">,		: Warning<"%0 clause should not be followed by arguments; tokens will be ignored">,
InGroup<OpenMPClauses>;		InGroup<OpenMPClauses>;
def note_omp_assumption_clause_continue_here		def note_omp_assumption_clause_continue_here
: Note<"the ignored tokens spans until here">;		: Note<"the ignored tokens spans until here">;
def err_omp_declare_target_unexpected_clause: Error<		def err_omp_declare_target_unexpected_clause: Error<
"unexpected '%0' clause, only %select{'to' or 'link'\|'to', 'link' or 'device_type'}1 clauses expected">;		"unexpected '%0' clause, only %select{'device_type'\|'to' or 'link'\|'to', 'link' or 'device_type'}1 clauses expected">;
		def err_omp_begin_declare_target_unexpected_implicit_to_clause: Error<
		"unexpected '(', only 'to', 'link' or 'device_type' clauses expected for 'begin declare target' directive">;
		def err_omp_declare_target_unexpected_clause_after_implicit_to: Error<
		"unexpected clause after an implicit 'to' clause">;
		def err_omp_declare_target_missing_to_or_link_clause: Error<
		"expected at least one 'to' or 'link' clause">;
		def err_omp_declare_target_multiple : Error<
		"%0 appears multiple times in clauses on the same declare target directive">;
def err_omp_expected_clause: Error<		def err_omp_expected_clause: Error<
"expected at least one clause on '#pragma omp %0' directive">;		"expected at least one clause on '#pragma omp %0' directive">;
def err_omp_mapper_illegal_identifier : Error<		def err_omp_mapper_illegal_identifier : Error<
"illegal OpenMP user-defined mapper identifier">;		"illegal OpenMP user-defined mapper identifier">;
def err_omp_mapper_expected_declarator : Error<		def err_omp_mapper_expected_declarator : Error<
"expected declarator on 'omp declare mapper' directive">;		"expected declarator on 'omp declare mapper' directive">;
def err_omp_declare_variant_wrong_clause : Error<		def err_omp_declare_variant_wrong_clause : Error<
"expected '%0' clause on 'omp declare variant' directive">;		"expected '%0' clause on 'omp declare variant' directive">;
▲ Show 20 Lines • Show All 195 Lines • Show Last 20 Lines

clang/include/clang/Basic/DiagnosticSemaKinds.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 10,225 Lines • ▼ Show 20 Lines
	def warn_omp_linear_step_zero : Warning<			def warn_omp_linear_step_zero : Warning<
	"zero linear step (%0 %select{\|and other variables in clause }1should probably be const)">,			"zero linear step (%0 %select{\|and other variables in clause }1should probably be const)">,
	InGroup<OpenMPClauses>;			InGroup<OpenMPClauses>;
	def warn_omp_alignment_not_power_of_two : Warning<			def warn_omp_alignment_not_power_of_two : Warning<
	"aligned clause will be ignored because the requested alignment is not a power of 2">,			"aligned clause will be ignored because the requested alignment is not a power of 2">,
	InGroup<OpenMPClauses>;			InGroup<OpenMPClauses>;
	def err_omp_invalid_target_decl : Error<			def err_omp_invalid_target_decl : Error<
	"%0 used in declare target directive is not a variable or a function name">;			"%0 used in declare target directive is not a variable or a function name">;
	def err_omp_declare_target_multiple : Error<
	"%0 appears multiple times in clauses on the same declare target directive">;
	def err_omp_declare_target_to_and_link : Error<			def err_omp_declare_target_to_and_link : Error<
	"%0 must not appear in both clauses 'to' and 'link'">;			"%0 must not appear in both clauses 'to' and 'link'">;
	def warn_omp_not_in_target_context : Warning<			def warn_omp_not_in_target_context : Warning<
	"declaration is not declared in any declare target region">,			"declaration is not declared in any declare target region">,
	InGroup<OpenMPTarget>;			InGroup<OpenMPTarget>;
	def err_omp_function_in_link_clause : Error<			def err_omp_function_in_link_clause : Error<
	"function name is not allowed in 'link' clause">;			"function name is not allowed in 'link' clause">;
	def err_omp_aligned_expected_array_or_ptr : Error<			def err_omp_aligned_expected_array_or_ptr : Error<
	▲ Show 20 Lines • Show All 1,029 Lines • Show Last 20 Lines

clang/include/clang/Parse/Parser.h

Show First 20 Lines • Show All 3,175 Lines • ▼ Show 20 Lines	private:

/// Parse 'omp [begin] assume[s]' directive.		/// Parse 'omp [begin] assume[s]' directive.
void ParseOpenMPAssumesDirective(OpenMPDirectiveKind DKind,		void ParseOpenMPAssumesDirective(OpenMPDirectiveKind DKind,
SourceLocation Loc);		SourceLocation Loc);

/// Parse 'omp end assumes' directive.		/// Parse 'omp end assumes' directive.
void ParseOpenMPEndAssumesDirective(SourceLocation Loc);		void ParseOpenMPEndAssumesDirective(SourceLocation Loc);

/// Parse clauses for '#pragma omp declare target'.		/// Parse clauses for '#pragma omp [begin] declare target'.
DeclGroupPtrTy ParseOMPDeclareTargetClauses();		void ParseOMPDeclareTargetClauses(Sema::DeclareTargetContextInfo &DTCI);

/// Parse '#pragma omp end declare target'.		/// Parse '#pragma omp end declare target'.
void ParseOMPEndDeclareTargetDirective(OpenMPDirectiveKind DKind,		void ParseOMPEndDeclareTargetDirective(OpenMPDirectiveKind BeginDKind,
		OpenMPDirectiveKind EndDKind,
SourceLocation Loc);		SourceLocation Loc);

/// Skip tokens until a `annot_pragma_openmp_end` was found. Emit a warning if		/// Skip tokens until a `annot_pragma_openmp_end` was found. Emit a warning if
/// it is not the current token.		/// it is not the current token.
void skipUntilPragmaOpenMPEnd(OpenMPDirectiveKind DKind);		void skipUntilPragmaOpenMPEnd(OpenMPDirectiveKind DKind);

/// Check the \p FoundKind against the \p ExpectedKind, if not issue an error		/// Check the \p FoundKind against the \p ExpectedKind, if not issue an error
/// that the "end" matching the "begin" directive of kind \p BeginKind was not		/// that the "end" matching the "begin" directive of kind \p BeginKind was not
▲ Show 20 Lines • Show All 298 Lines • Show Last 20 Lines

clang/include/clang/Sema/Sema.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 10,203 Lines • ▼ Show 20 Lines	public:
/// \return true if type is disabled.		/// \return true if type is disabled.
bool checkOpenCLDisabledDecl(const NamedDecl &D, const Expr &E);		bool checkOpenCLDisabledDecl(const NamedDecl &D, const Expr &E);

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// OpenMP directives and clauses.		// OpenMP directives and clauses.
//		//
private:		private:
void *VarDataSharingAttributesStack;		void *VarDataSharingAttributesStack;

		struct DeclareTargetContextInfo {
		struct MapInfo {
		OMPDeclareTargetDeclAttr::MapTypeTy MT;
		SourceLocation Loc;
		};
		/// Explicitly listed variables and functions in a 'to' or 'link' clause.
		llvm::DenseMap<NamedDecl *, MapInfo> ExplicitlyMapped;

		/// The 'device_type' as parsed from the clause.
		OMPDeclareTargetDeclAttr::DevTypeTy DT = OMPDeclareTargetDeclAttr::DT_Any;

		/// The directive kind, `begin declare target` or `declare target`.
		OpenMPDirectiveKind Kind;

		/// The directive location.
		SourceLocation Loc;

		DeclareTargetContextInfo(OpenMPDirectiveKind Kind, SourceLocation Loc)
		: Kind(Kind), Loc(Loc) {}
		};

/// Number of nested '#pragma omp declare target' directives.		/// Number of nested '#pragma omp declare target' directives.
SmallVector<SourceLocation, 4> DeclareTargetNesting;		SmallVector<DeclareTargetContextInfo, 4> DeclareTargetNesting;

/// Initialization of data-sharing attributes stack.		/// Initialization of data-sharing attributes stack.
void InitDataSharingAttributesStack();		void InitDataSharingAttributesStack();
void DestroyDataSharingAttributesStack();		void DestroyDataSharingAttributesStack();
ExprResult		ExprResult
VerifyPositiveIntegerConstantInClause(Expr *Op, OpenMPClauseKind CKind,		VerifyPositiveIntegerConstantInClause(Expr *Op, OpenMPClauseKind CKind,
bool StrictlyPositive = true);		bool StrictlyPositive = true);
/// Returns OpenMP nesting level for current directive.		/// Returns OpenMP nesting level for current directive.
unsigned getOpenMPNestingLevel() const;		unsigned getOpenMPNestingLevel() const;
▲ Show 20 Lines • Show All 249 Lines • ▼ Show 20 Lines	public:
ExprResult ActOnOpenMPDeclareMapperDirectiveVarDecl(Scope *S,		ExprResult ActOnOpenMPDeclareMapperDirectiveVarDecl(Scope *S,
QualType MapperType,		QualType MapperType,
SourceLocation StartLoc,		SourceLocation StartLoc,
DeclarationName VN);		DeclarationName VN);
bool isOpenMPDeclareMapperVarDeclAllowed(const VarDecl *VD) const;		bool isOpenMPDeclareMapperVarDeclAllowed(const VarDecl *VD) const;
const ValueDecl *getOpenMPDeclareMapperVarName() const;		const ValueDecl *getOpenMPDeclareMapperVarName() const;

/// Called on the start of target region i.e. '#pragma omp declare target'.		/// Called on the start of target region i.e. '#pragma omp declare target'.
bool ActOnStartOpenMPDeclareTargetDirective(SourceLocation Loc);		bool ActOnStartOpenMPDeclareTargetContext(DeclareTargetContextInfo &DTCI);
/// Called at the end of target region i.e. '#pragme omp end declare target'.
void ActOnFinishOpenMPDeclareTargetDirective();		/// Called at the end of target region i.e. '#pragma omp end declare target'.
		const DeclareTargetContextInfo ActOnOpenMPEndDeclareTargetDirective();

		/// Called once a target context is completed, that can be when a
		/// '#pragma omp end declare target' was encountered or when a
		/// '#pragma omp declare target' without declaration-definition-seq was
		/// encountered.
		void ActOnFinishedOpenMPDeclareTargetContext(DeclareTargetContextInfo &DTCI);

/// Searches for the provided declaration name for OpenMP declare target		/// Searches for the provided declaration name for OpenMP declare target
/// directive.		/// directive.
NamedDecl *		NamedDecl lookupOpenMPDeclareTargetName(Scope CurScope,
lookupOpenMPDeclareTargetName(Scope *CurScope, CXXScopeSpec &ScopeSpec,		CXXScopeSpec &ScopeSpec,
const DeclarationNameInfo &Id,		const DeclarationNameInfo &Id);
NamedDeclSetType &SameDirectiveDecls);
/// Called on correct id-expression from the '#pragma omp declare target'.		/// Called on correct id-expression from the '#pragma omp declare target'.
void ActOnOpenMPDeclareTargetName(NamedDecl *ND, SourceLocation Loc,		void ActOnOpenMPDeclareTargetName(NamedDecl *ND, SourceLocation Loc,
OMPDeclareTargetDeclAttr::MapTypeTy MT,		OMPDeclareTargetDeclAttr::MapTypeTy MT,
OMPDeclareTargetDeclAttr::DevTypeTy DT);		OMPDeclareTargetDeclAttr::DevTypeTy DT);

/// Check declaration inside target region.		/// Check declaration inside target region.
void		void
checkDeclIsAllowedInOpenMPTarget(Expr E, Decl D,		checkDeclIsAllowedInOpenMPTarget(Expr E, Decl D,
SourceLocation IdLoc = SourceLocation());		SourceLocation IdLoc = SourceLocation());
/// Finishes analysis of the deferred functions calls that may be declared as		/// Finishes analysis of the deferred functions calls that may be declared as
/// host/nohost during device/host compilation.		/// host/nohost during device/host compilation.
void finalizeOpenMPDelayedAnalysis(const FunctionDecl *Caller,		void finalizeOpenMPDelayedAnalysis(const FunctionDecl *Caller,
const FunctionDecl *Callee,		const FunctionDecl *Callee,
▲ Show 20 Lines • Show All 2,512 Lines • Show Last 20 Lines

clang/lib/AST/AttrImpl.cpp

Show First 20 Lines • Show All 135 Lines • ▼ Show 20 Lines	void OMPDeclareTargetDeclAttr::printPrettyPragma(
raw_ostream &OS, const PrintingPolicy &Policy) const {		raw_ostream &OS, const PrintingPolicy &Policy) const {
// Use fake syntax because it is for testing and debugging purpose only.		// Use fake syntax because it is for testing and debugging purpose only.
if (getDevType() != DT_Any)		if (getDevType() != DT_Any)
OS << " device_type(" << ConvertDevTypeTyToStr(getDevType()) << ")";		OS << " device_type(" << ConvertDevTypeTyToStr(getDevType()) << ")";
if (getMapType() != MT_To)		if (getMapType() != MT_To)
OS << ' ' << ConvertMapTypeTyToStr(getMapType());		OS << ' ' << ConvertMapTypeTyToStr(getMapType());
}		}

llvm::Optional<OMPDeclareTargetDeclAttr::MapTypeTy>		llvm::Optional<OMPDeclareTargetDeclAttr *>
OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(const ValueDecl *VD) {		OMPDeclareTargetDeclAttr::getActiveAttr(const ValueDecl *VD) {
if (!VD->hasAttrs())		if (!VD->hasAttrs())
return llvm::None;		return llvm::None;
unsigned Level = 0;		unsigned Level = 0;
const OMPDeclareTargetDeclAttr *FoundAttr = nullptr;		OMPDeclareTargetDeclAttr *FoundAttr = nullptr;
for (const auto *Attr : VD->specific_attrs<OMPDeclareTargetDeclAttr>()) {		for (auto *Attr : VD->specific_attrs<OMPDeclareTargetDeclAttr>()) {
if (Level < Attr->getLevel()) {		if (Level <= Attr->getLevel()) {
Level = Attr->getLevel();		Level = Attr->getLevel();
FoundAttr = Attr;		FoundAttr = Attr;
}		}
}		}
if (FoundAttr)		if (FoundAttr)
return FoundAttr->getMapType();		return FoundAttr;

return llvm::None;		return llvm::None;
}		}

llvm::Optional<OMPDeclareTargetDeclAttr::DevTypeTy>		llvm::Optional<OMPDeclareTargetDeclAttr::MapTypeTy>
OMPDeclareTargetDeclAttr::getDeviceType(const ValueDecl *VD) {		OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(const ValueDecl *VD) {
if (!VD->hasAttrs())		llvm::Optional<OMPDeclareTargetDeclAttr *> ActiveAttr = getActiveAttr(VD);
		if (ActiveAttr.hasValue())
		return ActiveAttr.getValue()->getMapType();
return llvm::None;		return llvm::None;
unsigned Level = 0;
const OMPDeclareTargetDeclAttr *FoundAttr = nullptr;
for (const auto *Attr : VD->specific_attrs<OMPDeclareTargetDeclAttr>()) {
if (Level < Attr->getLevel()) {
Level = Attr->getLevel();
FoundAttr = Attr;
}
}		}
if (FoundAttr)
return FoundAttr->getDevType();

		llvm::Optional<OMPDeclareTargetDeclAttr::DevTypeTy>
		OMPDeclareTargetDeclAttr::getDeviceType(const ValueDecl *VD) {
		llvm::Optional<OMPDeclareTargetDeclAttr *> ActiveAttr = getActiveAttr(VD);
		if (ActiveAttr.hasValue())
		return ActiveAttr.getValue()->getDevType();
return llvm::None;		return llvm::None;
}		}

llvm::Optional<SourceLocation>		llvm::Optional<SourceLocation>
OMPDeclareTargetDeclAttr::getLocation(const ValueDecl *VD) {		OMPDeclareTargetDeclAttr::getLocation(const ValueDecl *VD) {
if (!VD->hasAttrs())		llvm::Optional<OMPDeclareTargetDeclAttr *> ActiveAttr = getActiveAttr(VD);
return llvm::None;		if (ActiveAttr.hasValue())
unsigned Level = 0;		return ActiveAttr.getValue()->getRange().getBegin();
const OMPDeclareTargetDeclAttr *FoundAttr = nullptr;
for (const auto *Attr : VD->specific_attrs<OMPDeclareTargetDeclAttr>()) {
if (Level < Attr->getLevel()) {
Level = Attr->getLevel();
FoundAttr = Attr;
}
}
if (FoundAttr)
return FoundAttr->getRange().getBegin();

return llvm::None;		return llvm::None;
}		}

namespace clang {		namespace clang {
llvm::raw_ostream &operator<<(llvm::raw_ostream &OS, const OMPTraitInfo &TI);		llvm::raw_ostream &operator<<(llvm::raw_ostream &OS, const OMPTraitInfo &TI);
llvm::raw_ostream &operator<<(llvm::raw_ostream &OS, const OMPTraitInfo *TI);		llvm::raw_ostream &operator<<(llvm::raw_ostream &OS, const OMPTraitInfo *TI);
}		}

Show All 11 Lines

clang/lib/CodeGen/CGDecl.cpp

Show First 20 Lines • Show All 2,607 Lines • ▼ Show 20 Lines	if (!LangOpts.OpenMP \|\| LangOpts.OpenMPSimd \|\|
(!LangOpts.EmitAllDecls && !D->isUsed()))		(!LangOpts.EmitAllDecls && !D->isUsed()))
return;		return;
getOpenMPRuntime().emitUserDefinedMapper(D, CGF);		getOpenMPRuntime().emitUserDefinedMapper(D, CGF);
}		}

void CodeGenModule::EmitOMPRequiresDecl(const OMPRequiresDecl *D) {		void CodeGenModule::EmitOMPRequiresDecl(const OMPRequiresDecl *D) {
getOpenMPRuntime().processRequiresDirective(D);		getOpenMPRuntime().processRequiresDirective(D);
}		}

		void CodeGenModule::EmitOMPAllocateDecl(const OMPAllocateDecl *D) {
		for (const Expr *E : D->varlists()) {
		ABataevUnsubmitted Done Reply Inline Actions Why need to remove constantness here? ABataev: Why need to remove constantness here?
		jdoerfertAuthorUnsubmitted Done Reply Inline Actions The problem is that the declaration, which might have been already generated in IR or not, had no address space attached before. Now we want to do that after the fact, potentially way later. To reuse the general codegen mechanism I modify the VarDecl (temporarily) by attaching the new address space and calling codegen again. If you have a better idea, I'm happy to change this. jdoerfert: The problem is that the declaration, which might have been already generated in IR or not, had…
		ABataevUnsubmitted Done Reply Inline Actions Why not just create it manually rather than rely on `GetOrCreateLLVMGlobal`? ABataev: Why not just create it manually rather than rely on `GetOrCreateLLVMGlobal`?
		jdoerfertAuthorUnsubmitted Done Reply Inline Actions I'm not sure I follow. Creating a global is complicated, need to make sure all the linkage, visibility, address space stuff is set up, mangling, etc. Why would we duplicate all that code and risk messing things up now or in the future? jdoerfert: I'm not sure I follow. Creating a global is complicated, need to make sure all the linkage…
		ABataevUnsubmitted Done Reply Inline Actions And what about just setting the address-space on the LLVM type directly? ABataev: And what about just setting the address-space on the LLVM type directly?
		jdoerfertAuthorUnsubmitted Done Reply Inline Actions It's part of the type, we can't change it after the fact (at least that is not an existing API). jdoerfert: It's part of the type, we can't change it after the fact (at least that is not an existing API).
		ABataevUnsubmitted Done Reply Inline Actions What about `Value::mutateType`? ABataev: What about `Value::mutateType`?
		jdoerfertAuthorUnsubmitted Done Reply Inline Actions I'll give it a shot, though the comment makes me nervous: /// Mutate the type of this Value to be of the specified type. /// /// Note that this is an extremely dangerous operation which can create /// completely invalid IR very easily. It is strongly recommended that you /// recreate IR objects with the right types instead of mutating them in /// place. jdoerfert: I'll give it a shot, though the comment makes me nervous: ``` /// Mutate the type of this…
		jdoerfertAuthorUnsubmitted Done Reply Inline Actions Seems to work with the mutate API. Let's try it out ;) jdoerfert: Seems to work with the mutate API. Let's try it out ;)
		const auto *DE = cast<DeclRefExpr>(E);
		const auto *VD = cast<VarDecl>(DE->getDecl());
		ABataevUnsubmitted Done Reply Inline Actions `const auto ` ABataev:* `const auto *`

		// Skip all but globals.
		ABataevUnsubmitted Done Reply Inline Actions `Skip` ABataev: `Skip`
		if (!VD->hasGlobalStorage())
		continue;
		ABataevUnsubmitted Done Reply Inline Actions What about static locals, will it work? ABataev: What about static locals, will it work?
		jdoerfertAuthorUnsubmitted Done Reply Inline Actions need to check, will add a test. jdoerfert: need to check, will add a test.

		// Check if the global has been materialized yet or not. If not, we are done
		// as any later generation will utilize the OMPAllocateDeclAttr. However, if
		// we already emitted the global we might have done so before the
		// OMPAllocateDeclAttr was attached, leading to the wrong address space
		// (potentially). While not pretty, common practise is to remove the old IR
		// global and generate a new one, so we do that here too. Uses are replaced
		// properly.
		StringRef MangledName = getMangledName(VD);
		llvm::GlobalValue *Entry = GetGlobalValue(MangledName);
		if (!Entry)
		continue;

		// We can also keep the existing global if the address space is what we
		// expect it to be, if not, it is replaced.
		QualType ASTTy = VD->getType();
		clang::LangAS GVAS = GetGlobalVarAddressSpace(VD);
		auto TargetAS = getContext().getTargetAddressSpace(GVAS);
		if (Entry->getType()->getAddressSpace() == TargetAS)
		continue;

		// Make a new global with the correct type / address space.
		llvm::Type *Ty = getTypes().ConvertTypeForMem(ASTTy);
		llvm::PointerType *PTy = llvm::PointerType::get(Ty, TargetAS);

		// Replace all uses of the old global with a cast. Since we mutate the type
		// in place we neeed an intermediate that takes the spot of the old entry
		// until we can create the cast.
		llvm::GlobalVariable *DummyGV = new llvm::GlobalVariable(
		getModule(), Entry->getValueType(), false,
		llvm::GlobalValue::CommonLinkage, nullptr, "dummy", nullptr,
		llvm::GlobalVariable::NotThreadLocal, Entry->getAddressSpace());
		Entry->replaceAllUsesWith(DummyGV);

		Entry->mutateType(PTy);
		llvm::Constant *NewPtrForOldDecl =
		llvm::ConstantExpr::getPointerBitCastOrAddrSpaceCast(
		Entry, DummyGV->getType());

		// Now we have a casted version of the changed global, the dummy can be
		// replaced and deleted.
		DummyGV->replaceAllUsesWith(NewPtrForOldDecl);
		DummyGV->eraseFromParent();
		}
		}

clang/lib/CodeGen/CGOpenMPRuntime.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 9 Lines
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

#include "CGOpenMPRuntime.h"		#include "CGOpenMPRuntime.h"
#include "CGCXXABI.h"		#include "CGCXXABI.h"
#include "CGCleanup.h"		#include "CGCleanup.h"
#include "CGRecordLayout.h"		#include "CGRecordLayout.h"
#include "CodeGenFunction.h"		#include "CodeGenFunction.h"
		#include "clang/AST/APValue.h"
#include "clang/AST/Attr.h"		#include "clang/AST/Attr.h"
#include "clang/AST/Decl.h"		#include "clang/AST/Decl.h"
#include "clang/AST/OpenMPClause.h"		#include "clang/AST/OpenMPClause.h"
#include "clang/AST/StmtOpenMP.h"		#include "clang/AST/StmtOpenMP.h"
#include "clang/AST/StmtVisitor.h"		#include "clang/AST/StmtVisitor.h"
#include "clang/Basic/BitmaskEnum.h"		#include "clang/Basic/BitmaskEnum.h"
#include "clang/Basic/FileManager.h"		#include "clang/Basic/FileManager.h"
#include "clang/Basic/OpenMPKinds.h"		#include "clang/Basic/OpenMPKinds.h"
▲ Show 20 Lines • Show All 2,964 Lines • ▼ Show 20 Lines	registerTargetRegionEntryInfo(unsigned DeviceID, unsigned FileID,
StringRef ParentName, unsigned LineNum,		StringRef ParentName, unsigned LineNum,
llvm::Constant Addr, llvm::Constant ID,		llvm::Constant Addr, llvm::Constant ID,
OMPTargetRegionEntryKind Flags) {		OMPTargetRegionEntryKind Flags) {
// If we are emitting code for a target, the entry is already initialized,		// If we are emitting code for a target, the entry is already initialized,
// only has to be registered.		// only has to be registered.
if (CGM.getLangOpts().OpenMPIsDevice) {		if (CGM.getLangOpts().OpenMPIsDevice) {
// This could happen if the device compilation is invoked standalone.		// This could happen if the device compilation is invoked standalone.
if (!hasTargetRegionEntryInfo(DeviceID, FileID, ParentName, LineNum))		if (!hasTargetRegionEntryInfo(DeviceID, FileID, ParentName, LineNum))
initializeTargetRegionEntryInfo(DeviceID, FileID, ParentName, LineNum,		return;
OffloadingEntriesNum);
ABataevUnsubmitted Done Reply Inline Actions Why did you decide to drop this? ABataev: Why did you decide to drop this?
jdoerfertAuthorUnsubmitted Done Reply Inline Actions Because a missing host version should mean we do not create a region entry. Take a look at all the situations in `clang/test/OpenMP/declare_target_only_one_side_compilation.cpp` for which we are missing a host entry. None of them should create a region entry info. jdoerfert: Because a missing host version should mean we do not create a region entry. Take a look at all…
auto &Entry =		auto &Entry =
OffloadEntriesTargetRegion[DeviceID][FileID][ParentName][LineNum];		OffloadEntriesTargetRegion[DeviceID][FileID][ParentName][LineNum];
Entry.setAddress(Addr);		Entry.setAddress(Addr);
Entry.setID(ID);		Entry.setID(ID);
Entry.setFlags(Flags);		Entry.setFlags(Flags);
} else {		} else {
if (Flags ==		if (Flags ==
OffloadEntriesInfoManagerTy::OMPTargetRegionEntryTargetRegion &&		OffloadEntriesInfoManagerTy::OMPTargetRegionEntryTargetRegion &&
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
void CGOpenMPRuntime::OffloadEntriesInfoManagerTy::		void CGOpenMPRuntime::OffloadEntriesInfoManagerTy::
registerDeviceGlobalVarEntryInfo(StringRef VarName, llvm::Constant *Addr,		registerDeviceGlobalVarEntryInfo(StringRef VarName, llvm::Constant *Addr,
CharUnits VarSize,		CharUnits VarSize,
OMPTargetGlobalVarEntryKind Flags,		OMPTargetGlobalVarEntryKind Flags,
llvm::GlobalValue::LinkageTypes Linkage) {		llvm::GlobalValue::LinkageTypes Linkage) {
if (CGM.getLangOpts().OpenMPIsDevice) {		if (CGM.getLangOpts().OpenMPIsDevice) {
// This could happen if the device compilation is invoked standalone.		// This could happen if the device compilation is invoked standalone.
if (!hasDeviceGlobalVarEntryInfo(VarName))		if (!hasDeviceGlobalVarEntryInfo(VarName))
initializeDeviceGlobalVarEntryInfo(VarName, Flags, OffloadingEntriesNum);		return;
auto &Entry = OffloadEntriesDeviceGlobalVar[VarName];		auto &Entry = OffloadEntriesDeviceGlobalVar[VarName];
assert((!Entry.getAddress() \|\| Entry.getAddress() == Addr) &&
"Resetting with the new address.");
if (Entry.getAddress() && hasDeviceGlobalVarEntryInfo(VarName)) {		if (Entry.getAddress() && hasDeviceGlobalVarEntryInfo(VarName)) {
if (Entry.getVarSize().isZero()) {		if (Entry.getVarSize().isZero()) {
Entry.setVarSize(VarSize);		Entry.setVarSize(VarSize);
Entry.setLinkage(Linkage);		Entry.setLinkage(Linkage);
}		}
return;		return;
}		}
Entry.setVarSize(VarSize);		Entry.setVarSize(VarSize);
Entry.setLinkage(Linkage);		Entry.setLinkage(Linkage);
Entry.setAddress(Addr);		Entry.setAddress(Addr);
} else {		} else {
if (hasDeviceGlobalVarEntryInfo(VarName)) {		if (hasDeviceGlobalVarEntryInfo(VarName)) {
auto &Entry = OffloadEntriesDeviceGlobalVar[VarName];		auto &Entry = OffloadEntriesDeviceGlobalVar[VarName];
assert(Entry.isValid() && Entry.getFlags() == Flags &&		assert(Entry.isValid() && Entry.getFlags() == Flags &&
"Entry not initialized!");		"Entry not initialized!");
assert((!Entry.getAddress() \|\| Entry.getAddress() == Addr) &&
"Resetting with the new address.");
if (Entry.getVarSize().isZero()) {		if (Entry.getVarSize().isZero()) {
Entry.setVarSize(VarSize);		Entry.setVarSize(VarSize);
Entry.setLinkage(Linkage);		Entry.setLinkage(Linkage);
}		}
return;		return;
}		}
OffloadEntriesDeviceGlobalVar.try_emplace(		OffloadEntriesDeviceGlobalVar.try_emplace(
VarName, OffloadingEntriesNum, Addr, VarSize, Flags, Linkage);		VarName, OffloadingEntriesNum, Addr, VarSize, Flags, Linkage);
▲ Show 20 Lines • Show All 7,394 Lines • ▼ Show 20 Lines	void CGOpenMPRuntime::scanForTargetRegionsFunctions(const Stmt *S,
if (const auto *L = dyn_cast<LambdaExpr>(S))		if (const auto *L = dyn_cast<LambdaExpr>(S))
S = L->getBody();		S = L->getBody();

// Keep looking for target regions recursively.		// Keep looking for target regions recursively.
for (const Stmt *II : S->children())		for (const Stmt *II : S->children())
scanForTargetRegionsFunctions(II, ParentName);		scanForTargetRegionsFunctions(II, ParentName);
}		}

		static bool isAssumedToBeNotEmitted(const ValueDecl *VD, bool IsDevice) {
		Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =
		OMPDeclareTargetDeclAttr::getDeviceType(VD);
		if (!DevTy)
		return false;
		// Do not emit device_type(nohost) functions for the host.
		if (!IsDevice && DevTy == OMPDeclareTargetDeclAttr::DT_NoHost)
		return true;
		// Do not emit device_type(host) functions for the device.
		if (IsDevice && DevTy == OMPDeclareTargetDeclAttr::DT_Host)
		return true;
		return false;
		}

bool CGOpenMPRuntime::emitTargetFunctions(GlobalDecl GD) {		bool CGOpenMPRuntime::emitTargetFunctions(GlobalDecl GD) {
// If emitting code for the host, we do not process FD here. Instead we do		// If emitting code for the host, we do not process FD here. Instead we do
// the normal code generation.		// the normal code generation.
if (!CGM.getLangOpts().OpenMPIsDevice) {		if (!CGM.getLangOpts().OpenMPIsDevice) {
if (const auto *FD = dyn_cast<FunctionDecl>(GD.getDecl())) {		if (const auto *FD = dyn_cast<FunctionDecl>(GD.getDecl()))
Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =		if (isAssumedToBeNotEmitted(cast<ValueDecl>(FD),
OMPDeclareTargetDeclAttr::getDeviceType(FD);		CGM.getLangOpts().OpenMPIsDevice))
// Do not emit device_type(nohost) functions for the host.
if (DevTy && *DevTy == OMPDeclareTargetDeclAttr::DT_NoHost)
return true;		return true;
}
return false;		return false;
}		}

const ValueDecl *VD = cast<ValueDecl>(GD.getDecl());		const ValueDecl *VD = cast<ValueDecl>(GD.getDecl());
// Try to detect target regions in the function.		// Try to detect target regions in the function.
if (const auto *FD = dyn_cast<FunctionDecl>(VD)) {		if (const auto *FD = dyn_cast<FunctionDecl>(VD)) {
StringRef Name = CGM.getMangledName(GD);		StringRef Name = CGM.getMangledName(GD);
scanForTargetRegionsFunctions(FD->getBody(), Name);		scanForTargetRegionsFunctions(FD->getBody(), Name);
Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =		if (isAssumedToBeNotEmitted(cast<ValueDecl>(FD),
OMPDeclareTargetDeclAttr::getDeviceType(FD);		CGM.getLangOpts().OpenMPIsDevice))
// Do not emit device_type(nohost) functions for the host.
if (DevTy && *DevTy == OMPDeclareTargetDeclAttr::DT_Host)
return true;		return true;
}		}

// Do not to emit function if it is not marked as declare target.		// Do not to emit function if it is not marked as declare target.
return !OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD) &&		return !OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD) &&
AlreadyEmittedTargetDecls.count(VD) == 0;		AlreadyEmittedTargetDecls.count(VD) == 0;
}		}

bool CGOpenMPRuntime::emitTargetGlobalVariable(GlobalDecl GD) {		bool CGOpenMPRuntime::emitTargetGlobalVariable(GlobalDecl GD) {
		if (isAssumedToBeNotEmitted(cast<ValueDecl>(GD.getDecl()),
		CGM.getLangOpts().OpenMPIsDevice))
		return true;

if (!CGM.getLangOpts().OpenMPIsDevice)		if (!CGM.getLangOpts().OpenMPIsDevice)
return false;		return false;

// Check if there are Ctors/Dtors in this declaration and look for target		// Check if there are Ctors/Dtors in this declaration and look for target
// regions in it. We use the complete variant to produce the kernel name		// regions in it. We use the complete variant to produce the kernel name
// mangling.		// mangling.
QualType RDTy = cast<VarDecl>(GD.getDecl())->getType();		QualType RDTy = cast<VarDecl>(GD.getDecl())->getType();
if (const auto *RD = RDTy->getBaseElementTypeUnsafe()->getAsCXXRecordDecl()) {		if (const auto *RD = RDTy->getBaseElementTypeUnsafe()->getAsCXXRecordDecl()) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	CGOpenMPRuntime::registerTargetFirstprivateCopy(CodeGenFunction &CGF,
return Addr;		return Addr;
}		}

void CGOpenMPRuntime::registerTargetGlobalVariable(const VarDecl *VD,		void CGOpenMPRuntime::registerTargetGlobalVariable(const VarDecl *VD,
llvm::Constant *Addr) {		llvm::Constant *Addr) {
if (CGM.getLangOpts().OMPTargetTriples.empty() &&		if (CGM.getLangOpts().OMPTargetTriples.empty() &&
!CGM.getLangOpts().OpenMPIsDevice)		!CGM.getLangOpts().OpenMPIsDevice)
return;		return;

		// If we have host/nohost variables, they do not need to be registered.
		Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =
		OMPDeclareTargetDeclAttr::getDeviceType(VD);
		if (DevTy && DevTy.getValue() != OMPDeclareTargetDeclAttr::DT_Any)
		return;

llvm::Optional<OMPDeclareTargetDeclAttr::MapTypeTy> Res =		llvm::Optional<OMPDeclareTargetDeclAttr::MapTypeTy> Res =
OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD);		OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD);
if (!Res) {		if (!Res) {
if (CGM.getLangOpts().OpenMPIsDevice) {		if (CGM.getLangOpts().OpenMPIsDevice) {
// Register non-target variables being emitted in device code (debug info		// Register non-target variables being emitted in device code (debug info
// may cause this).		// may cause this).
StringRef VarName = CGM.getMangledName(VD);		StringRef VarName = CGM.getMangledName(VD);
EmittedNonTargetVariables.try_emplace(VarName, Addr);		EmittedNonTargetVariables.try_emplace(VarName, Addr);
Show All 14 Lines	if (VD->hasDefinition(CGM.getContext()) != VarDecl::DeclarationOnly) {
VarSize = CGM.getContext().getTypeSizeInChars(VD->getType());		VarSize = CGM.getContext().getTypeSizeInChars(VD->getType());
assert(!VarSize.isZero() && "Expected non-zero size of the variable");		assert(!VarSize.isZero() && "Expected non-zero size of the variable");
} else {		} else {
VarSize = CharUnits::Zero();		VarSize = CharUnits::Zero();
}		}
Linkage = CGM.getLLVMLinkageVarDefinition(VD, /IsConstant=/false);		Linkage = CGM.getLLVMLinkageVarDefinition(VD, /IsConstant=/false);
// Temp solution to prevent optimizations of the internal variables.		// Temp solution to prevent optimizations of the internal variables.
if (CGM.getLangOpts().OpenMPIsDevice && !VD->isExternallyVisible()) {		if (CGM.getLangOpts().OpenMPIsDevice && !VD->isExternallyVisible()) {
		// Do not create a "ref-variable" if the original is not also available
		// on the host.
		if (!OffloadEntriesInfoManager.hasDeviceGlobalVarEntryInfo(VarName))
		return;
std::string RefName = getName({VarName, "ref"});		std::string RefName = getName({VarName, "ref"});
if (!CGM.GetGlobalValue(RefName)) {		if (!CGM.GetGlobalValue(RefName)) {
llvm::Constant *AddrRef =		llvm::Constant *AddrRef =
getOrCreateInternalVariable(Addr->getType(), RefName);		getOrCreateInternalVariable(Addr->getType(), RefName);
auto *GVAddrRef = cast<llvm::GlobalVariable>(AddrRef);		auto *GVAddrRef = cast<llvm::GlobalVariable>(AddrRef);
GVAddrRef->setConstant(/Val=/true);		GVAddrRef->setConstant(/Val=/true);
GVAddrRef->setLinkage(llvm::GlobalValue::InternalLinkage);		GVAddrRef->setLinkage(llvm::GlobalValue::InternalLinkage);
GVAddrRef->setInitializer(Addr);		GVAddrRef->setInitializer(Addr);
▲ Show 20 Lines • Show All 2,235 Lines • Show Last 20 Lines

clang/lib/CodeGen/CodeGenModule.h

Show First 20 Lines • Show All 1,350 Lines • ▼ Show 20 Lines	public:
/// Emit a code for declare mapper construct.		/// Emit a code for declare mapper construct.
void EmitOMPDeclareMapper(const OMPDeclareMapperDecl *D,		void EmitOMPDeclareMapper(const OMPDeclareMapperDecl *D,
CodeGenFunction *CGF = nullptr);		CodeGenFunction *CGF = nullptr);

/// Emit a code for requires directive.		/// Emit a code for requires directive.
/// \param D Requires declaration		/// \param D Requires declaration
void EmitOMPRequiresDecl(const OMPRequiresDecl *D);		void EmitOMPRequiresDecl(const OMPRequiresDecl *D);

		/// Emit a code for the allocate directive.
		/// \param D The allocate declaration
		void EmitOMPAllocateDecl(const OMPAllocateDecl *D);

/// Returns whether the given record has hidden LTO visibility and therefore		/// Returns whether the given record has hidden LTO visibility and therefore
/// may participate in (single-module) CFI and whole-program vtable		/// may participate in (single-module) CFI and whole-program vtable
/// optimization.		/// optimization.
bool HasHiddenLTOVisibility(const CXXRecordDecl *RD);		bool HasHiddenLTOVisibility(const CXXRecordDecl *RD);

/// Returns whether the given record has public std LTO visibility		/// Returns whether the given record has public std LTO visibility
/// and therefore may not participate in (single-module) CFI and whole-program		/// and therefore may not participate in (single-module) CFI and whole-program
/// vtable optimization.		/// vtable optimization.
▲ Show 20 Lines • Show All 265 Lines • Show Last 20 Lines

clang/lib/CodeGen/CodeGenModule.cpp

Show First 20 Lines • Show All 2,663 Lines • ▼ Show 20 Lines	if (VD && VD->getType().isConstQualified() &&
VD->getStorageDuration() == SD_Static)		VD->getStorageDuration() == SD_Static)
return true;		return true;
}		}

return getContext().DeclMustBeEmitted(Global);		return getContext().DeclMustBeEmitted(Global);
}		}

bool CodeGenModule::MayBeEmittedEagerly(const ValueDecl *Global) {		bool CodeGenModule::MayBeEmittedEagerly(const ValueDecl *Global) {
		// In OpenMP 5.0 variables and function may be marked as
		// device_type(host/nohost) and we should not emit them eagerly unless we sure
		// that they must be emitted on the host/device. To be sure we need to have
		// seen a declare target with an explicit mentioning of the function, we know
		// we have if the level of the declare target attribute is -1. Note that we
		// check somewhere else if we should emit this at all.
		if (LangOpts.OpenMP >= 50 && !LangOpts.OpenMPSimd) {
		llvm::Optional<OMPDeclareTargetDeclAttr *> ActiveAttr =
		OMPDeclareTargetDeclAttr::getActiveAttr(Global);
		if (!ActiveAttr \|\| (*ActiveAttr)->getLevel() != (unsigned)-1)
		return false;
		}

if (const auto *FD = dyn_cast<FunctionDecl>(Global)) {		if (const auto *FD = dyn_cast<FunctionDecl>(Global)) {
if (FD->getTemplateSpecializationKind() == TSK_ImplicitInstantiation)		if (FD->getTemplateSpecializationKind() == TSK_ImplicitInstantiation)
// Implicit template instantiations may change linkage if they are later		// Implicit template instantiations may change linkage if they are later
// explicitly instantiated, so they should not be emitted eagerly.		// explicitly instantiated, so they should not be emitted eagerly.
return false;		return false;
// In OpenMP 5.0 function may be marked as device_type(nohost) and we should
// not emit them eagerly unless we sure that the function must be emitted on
// the host.
if (LangOpts.OpenMP >= 50 && !LangOpts.OpenMPSimd &&
!LangOpts.OpenMPIsDevice &&
!OMPDeclareTargetDeclAttr::getDeviceType(FD) &&
!FD->isUsed(/CheckUsedAttr=/false) && !FD->isReferenced())
return false;
}		}
if (const auto *VD = dyn_cast<VarDecl>(Global))		if (const auto *VD = dyn_cast<VarDecl>(Global))
if (Context.getInlineVariableDefinitionKind(VD) ==		if (Context.getInlineVariableDefinitionKind(VD) ==
ASTContext::InlineVariableDefinitionKind::WeakUnknown)		ASTContext::InlineVariableDefinitionKind::WeakUnknown)
// A definition of an inline constexpr static data member may change		// A definition of an inline constexpr static data member may change
// linkage later if it's redeclared outside the class.		// linkage later if it's redeclared outside the class.
return false;		return false;
// If OpenMP is enabled and threadprivates must be generated like TLS, delay		// If OpenMP is enabled and threadprivates must be generated like TLS, delay
▲ Show 20 Lines • Show All 1,664 Lines • ▼ Show 20 Lines	if (!GV \|\| GV->getValueType() != InitType \|\|

// Make a new global with the correct type, this is now guaranteed to work.		// Make a new global with the correct type, this is now guaranteed to work.
GV = cast<llvm::GlobalVariable>(		GV = cast<llvm::GlobalVariable>(
GetAddrOfGlobalVar(D, InitType, ForDefinition_t(!IsTentative))		GetAddrOfGlobalVar(D, InitType, ForDefinition_t(!IsTentative))
->stripPointerCasts());		->stripPointerCasts());

// Replace all uses of the old global with the new global		// Replace all uses of the old global with the new global
llvm::Constant *NewPtrForOldDecl =		llvm::Constant *NewPtrForOldDecl =
llvm::ConstantExpr::getBitCast(GV, Entry->getType());		llvm::ConstantExpr::getPointerBitCastOrAddrSpaceCast(GV,
		Entry->getType());
Entry->replaceAllUsesWith(NewPtrForOldDecl);		Entry->replaceAllUsesWith(NewPtrForOldDecl);

// Erase the old global, since it is no longer used.		// Erase the old global, since it is no longer used.
cast<llvm::GlobalValue>(Entry)->eraseFromParent();		cast<llvm::GlobalValue>(Entry)->eraseFromParent();
}		}

MaybeHandleStaticInExternC(D, GV);		MaybeHandleStaticInExternC(D, GV);

▲ Show 20 Lines • Show All 1,494 Lines • ▼ Show 20 Lines	case Decl::Export:
EmitDeclContext(cast<ExportDecl>(D));		EmitDeclContext(cast<ExportDecl>(D));
break;		break;

case Decl::OMPThreadPrivate:		case Decl::OMPThreadPrivate:
EmitOMPThreadPrivateDecl(cast<OMPThreadPrivateDecl>(D));		EmitOMPThreadPrivateDecl(cast<OMPThreadPrivateDecl>(D));
break;		break;

case Decl::OMPAllocate:		case Decl::OMPAllocate:
		EmitOMPAllocateDecl(cast<OMPAllocateDecl>(D));
break;		break;

case Decl::OMPDeclareReduction:		case Decl::OMPDeclareReduction:
EmitOMPDeclareReduction(cast<OMPDeclareReductionDecl>(D));		EmitOMPDeclareReduction(cast<OMPDeclareReductionDecl>(D));
break;		break;

case Decl::OMPDeclareMapper:		case Decl::OMPDeclareMapper:
EmitOMPDeclareMapper(cast<OMPDeclareMapperDecl>(D));		EmitOMPDeclareMapper(cast<OMPDeclareMapperDecl>(D));
▲ Show 20 Lines • Show All 516 Lines • Show Last 20 Lines

clang/lib/Parse/ParseOpenMP.cpp

Show First 20 Lines • Show All 125 Lines • ▼ Show 20 Lines	static const OpenMPDirectiveKindExWrapper F[][3] = {
{OMPD_end, OMPD_declare, OMPD_end_declare},		{OMPD_end, OMPD_declare, OMPD_end_declare},
{OMPD_end, OMPD_assumes, OMPD_end_assumes},		{OMPD_end, OMPD_assumes, OMPD_end_assumes},
{OMPD_cancellation, OMPD_point, OMPD_cancellation_point},		{OMPD_cancellation, OMPD_point, OMPD_cancellation_point},
{OMPD_declare, OMPD_reduction, OMPD_declare_reduction},		{OMPD_declare, OMPD_reduction, OMPD_declare_reduction},
{OMPD_declare, OMPD_mapper, OMPD_declare_mapper},		{OMPD_declare, OMPD_mapper, OMPD_declare_mapper},
{OMPD_declare, OMPD_simd, OMPD_declare_simd},		{OMPD_declare, OMPD_simd, OMPD_declare_simd},
{OMPD_declare, OMPD_target, OMPD_declare_target},		{OMPD_declare, OMPD_target, OMPD_declare_target},
{OMPD_declare, OMPD_variant, OMPD_declare_variant},		{OMPD_declare, OMPD_variant, OMPD_declare_variant},
		{OMPD_begin_declare, OMPD_target, OMPD_begin_declare_target},
{OMPD_begin_declare, OMPD_variant, OMPD_begin_declare_variant},		{OMPD_begin_declare, OMPD_variant, OMPD_begin_declare_variant},
{OMPD_end_declare, OMPD_variant, OMPD_end_declare_variant},		{OMPD_end_declare, OMPD_variant, OMPD_end_declare_variant},
{OMPD_distribute, OMPD_parallel, OMPD_distribute_parallel},		{OMPD_distribute, OMPD_parallel, OMPD_distribute_parallel},
{OMPD_distribute_parallel, OMPD_for, OMPD_distribute_parallel_for},		{OMPD_distribute_parallel, OMPD_for, OMPD_distribute_parallel_for},
{OMPD_distribute_parallel_for, OMPD_simd,		{OMPD_distribute_parallel_for, OMPD_simd,
OMPD_distribute_parallel_for_simd},		OMPD_distribute_parallel_for_simd},
{OMPD_distribute, OMPD_simd, OMPD_distribute_simd},		{OMPD_distribute, OMPD_simd, OMPD_distribute_simd},
{OMPD_end_declare, OMPD_target, OMPD_end_declare_target},		{OMPD_end_declare, OMPD_target, OMPD_end_declare_target},
▲ Show 20 Lines • Show All 1,517 Lines • ▼ Show 20 Lines	parseOpenMPSimpleClause(Parser &P, OpenMPClauseKind Kind) {
// Parse ')'.		// Parse ')'.
SourceLocation RLoc = Tok.getLocation();		SourceLocation RLoc = Tok.getLocation();
if (!T.consumeClose())		if (!T.consumeClose())
RLoc = T.getCloseLocation();		RLoc = T.getCloseLocation();

return SimpleClauseData(Type, Loc, LOpen, TypeLoc, RLoc);		return SimpleClauseData(Type, Loc, LOpen, TypeLoc, RLoc);
}		}

Parser::DeclGroupPtrTy Parser::ParseOMPDeclareTargetClauses() {		void Parser::ParseOMPDeclareTargetClauses(
// OpenMP 4.5 syntax with list of entities.		Sema::DeclareTargetContextInfo &DTCI) {
Sema::NamedDeclSetType SameDirectiveDecls;
SmallVector<std::tuple<OMPDeclareTargetDeclAttr::MapTypeTy, SourceLocation,
NamedDecl *>,
4>
DeclareTargetDecls;
OMPDeclareTargetDeclAttr::DevTypeTy DT = OMPDeclareTargetDeclAttr::DT_Any;
SourceLocation DeviceTypeLoc;		SourceLocation DeviceTypeLoc;
		bool RequiresToOrLinkClause = false;
		bool HasToOrLinkClause = false;
while (Tok.isNot(tok::annot_pragma_openmp_end)) {		while (Tok.isNot(tok::annot_pragma_openmp_end)) {
OMPDeclareTargetDeclAttr::MapTypeTy MT = OMPDeclareTargetDeclAttr::MT_To;		OMPDeclareTargetDeclAttr::MapTypeTy MT = OMPDeclareTargetDeclAttr::MT_To;
if (Tok.is(tok::identifier)) {		bool HasIdentifier = Tok.is(tok::identifier);
		if (HasIdentifier) {
		// If we see any clause we need a to or link clause.
		RequiresToOrLinkClause = true;
IdentifierInfo *II = Tok.getIdentifierInfo();		IdentifierInfo *II = Tok.getIdentifierInfo();
StringRef ClauseName = II->getName();		StringRef ClauseName = II->getName();
bool IsDeviceTypeClause =		bool IsDeviceTypeClause =
getLangOpts().OpenMP >= 50 &&		getLangOpts().OpenMP >= 50 &&
getOpenMPClauseKind(ClauseName) == OMPC_device_type;		getOpenMPClauseKind(ClauseName) == OMPC_device_type;
// Parse 'to\|link\|device_type' clauses.
if (!OMPDeclareTargetDeclAttr::ConvertStrToMapTypeTy(ClauseName, MT) &&		bool IsToOrLinkClause =
!IsDeviceTypeClause) {		OMPDeclareTargetDeclAttr::ConvertStrToMapTypeTy(ClauseName, MT);
		assert((!IsDeviceTypeClause \|\| !IsToOrLinkClause) && "Cannot be both!");

		if (!IsDeviceTypeClause && DTCI.Kind == OMPD_begin_declare_target) {
Diag(Tok, diag::err_omp_declare_target_unexpected_clause)		Diag(Tok, diag::err_omp_declare_target_unexpected_clause)
<< ClauseName << (getLangOpts().OpenMP >= 50 ? 1 : 0);		<< ClauseName << 0;
break;		break;
}		}
		if (!IsDeviceTypeClause && !IsToOrLinkClause) {
		Diag(Tok, diag::err_omp_declare_target_unexpected_clause)
		<< ClauseName << (getLangOpts().OpenMP >= 50 ? 2 : 1);
		break;
		}

		if (IsToOrLinkClause)
		HasToOrLinkClause = true;

// Parse 'device_type' clause and go to next clause if any.		// Parse 'device_type' clause and go to next clause if any.
if (IsDeviceTypeClause) {		if (IsDeviceTypeClause) {
Optional<SimpleClauseData> DevTypeData =		Optional<SimpleClauseData> DevTypeData =
parseOpenMPSimpleClause(*this, OMPC_device_type);		parseOpenMPSimpleClause(*this, OMPC_device_type);
if (DevTypeData.hasValue()) {		if (DevTypeData.hasValue()) {
if (DeviceTypeLoc.isValid()) {		if (DeviceTypeLoc.isValid()) {
// We already saw another device_type clause, diagnose it.		// We already saw another device_type clause, diagnose it.
Diag(DevTypeData.getValue().Loc,		Diag(DevTypeData.getValue().Loc,
diag::warn_omp_more_one_device_type_clause);		diag::warn_omp_more_one_device_type_clause);
		break;
}		}
switch (static_cast<OpenMPDeviceType>(DevTypeData.getValue().Type)) {		switch (static_cast<OpenMPDeviceType>(DevTypeData.getValue().Type)) {
case OMPC_DEVICE_TYPE_any:		case OMPC_DEVICE_TYPE_any:
DT = OMPDeclareTargetDeclAttr::DT_Any;		DTCI.DT = OMPDeclareTargetDeclAttr::DT_Any;
break;		break;
case OMPC_DEVICE_TYPE_host:		case OMPC_DEVICE_TYPE_host:
DT = OMPDeclareTargetDeclAttr::DT_Host;		DTCI.DT = OMPDeclareTargetDeclAttr::DT_Host;
break;		break;
case OMPC_DEVICE_TYPE_nohost:		case OMPC_DEVICE_TYPE_nohost:
DT = OMPDeclareTargetDeclAttr::DT_NoHost;		DTCI.DT = OMPDeclareTargetDeclAttr::DT_NoHost;
break;		break;
case OMPC_DEVICE_TYPE_unknown:		case OMPC_DEVICE_TYPE_unknown:
llvm_unreachable("Unexpected device_type");		llvm_unreachable("Unexpected device_type");
}		}
DeviceTypeLoc = DevTypeData.getValue().Loc;		DeviceTypeLoc = DevTypeData.getValue().Loc;
}		}
continue;		continue;
}		}
ConsumeToken();		ConsumeToken();
}		}
auto &&Callback = [this, MT, &DeclareTargetDecls, &SameDirectiveDecls](
CXXScopeSpec &SS, DeclarationNameInfo NameInfo) {		if (DTCI.Kind == OMPD_declare_target \|\| HasIdentifier) {
NamedDecl *ND = Actions.lookupOpenMPDeclareTargetName(		auto &&Callback = [this, MT, &DTCI](CXXScopeSpec &SS,
getCurScope(), SS, NameInfo, SameDirectiveDecls);		DeclarationNameInfo NameInfo) {
if (ND)		NamedDecl *ND =
DeclareTargetDecls.emplace_back(MT, NameInfo.getLoc(), ND);		Actions.lookupOpenMPDeclareTargetName(getCurScope(), SS, NameInfo);
		if (!ND)
		return;
		Sema::DeclareTargetContextInfo::MapInfo MI{MT, NameInfo.getLoc()};
		bool FirstMapping = DTCI.ExplicitlyMapped.try_emplace(ND, MI).second;
		ABataevUnsubmitted Done Reply Inline Actions `try_emplace(ND, MI)` ABataev: `try_emplace(ND, MI)`
		if (!FirstMapping)
		Diag(NameInfo.getLoc(), diag::err_omp_declare_target_multiple)
		<< NameInfo.getName();
};		};
if (ParseOpenMPSimpleVarList(OMPD_declare_target, Callback,		if (ParseOpenMPSimpleVarList(OMPD_declare_target, Callback,
/AllowScopeSpecifier=/true))		/AllowScopeSpecifier=/true))
break;		break;
		}

		if (Tok.is(tok::l_paren)) {
		Diag(Tok,
		diag::err_omp_begin_declare_target_unexpected_implicit_to_clause);
		break;
		}
		if (!HasIdentifier && Tok.isNot(tok::annot_pragma_openmp_end)) {
		Diag(Tok,
		diag::err_omp_declare_target_unexpected_clause_after_implicit_to);
		break;
		}

// Consume optional ','.		// Consume optional ','.
if (Tok.is(tok::comma))		if (Tok.is(tok::comma))
ConsumeToken();		ConsumeToken();
}		}

		// For declare target require at least 'to' or 'link' to be present.
		if (DTCI.Kind == OMPD_declare_target && RequiresToOrLinkClause &&
		!HasToOrLinkClause)
		Diag(DTCI.Loc, diag::err_omp_declare_target_missing_to_or_link_clause);

SkipUntil(tok::annot_pragma_openmp_end, StopBeforeMatch);		SkipUntil(tok::annot_pragma_openmp_end, StopBeforeMatch);
ConsumeAnyToken();
ABataevUnsubmitted Done Reply Inline Actions Looks like it is still required to consume `tok::annot_pragma_openmp_end` ABataev: Looks like it is still required to consume `tok::annot_pragma_openmp_end`
jdoerfertAuthorUnsubmitted Done Reply Inline Actions That's done in the caller now because the clauses are not always parsed. jdoerfert: That's done in the caller now because the clauses are not always parsed.
for (auto &MTLocDecl : DeclareTargetDecls) {
OMPDeclareTargetDeclAttr::MapTypeTy MT;
SourceLocation Loc;
NamedDecl *ND;
std::tie(MT, Loc, ND) = MTLocDecl;
// device_type clause is applied only to functions.
Actions.ActOnOpenMPDeclareTargetName(
ND, Loc, MT, isa<VarDecl>(ND) ? OMPDeclareTargetDeclAttr::DT_Any : DT);
}
SmallVector<Decl *, 4> Decls(SameDirectiveDecls.begin(),
SameDirectiveDecls.end());
if (Decls.empty())
return DeclGroupPtrTy();
return Actions.BuildDeclaratorGroup(Decls);
}		}

void Parser::skipUntilPragmaOpenMPEnd(OpenMPDirectiveKind DKind) {		void Parser::skipUntilPragmaOpenMPEnd(OpenMPDirectiveKind DKind) {
// The last seen token is annot_pragma_openmp_end - need to check for		// The last seen token is annot_pragma_openmp_end - need to check for
// extra tokens.		// extra tokens.
if (Tok.is(tok::annot_pragma_openmp_end))		if (Tok.is(tok::annot_pragma_openmp_end))
return;		return;

Show All 20 Lines	void Parser::parseOMPEndDirective(OpenMPDirectiveKind BeginKind,
Diag(FoundLoc, diag::err_expected_end_declare_target_or_variant)		Diag(FoundLoc, diag::err_expected_end_declare_target_or_variant)
<< DiagSelection;		<< DiagSelection;
Diag(BeginLoc, diag::note_matching)		Diag(BeginLoc, diag::note_matching)
<< ("'#pragma omp " + getOpenMPDirectiveName(BeginKind) + "'").str();		<< ("'#pragma omp " + getOpenMPDirectiveName(BeginKind) + "'").str();
if (SkipUntilOpenMPEnd)		if (SkipUntilOpenMPEnd)
SkipUntil(tok::annot_pragma_openmp_end, StopBeforeMatch);		SkipUntil(tok::annot_pragma_openmp_end, StopBeforeMatch);
}		}

void Parser::ParseOMPEndDeclareTargetDirective(OpenMPDirectiveKind DKind,		void Parser::ParseOMPEndDeclareTargetDirective(OpenMPDirectiveKind BeginDKind,
		OpenMPDirectiveKind EndDKind,
SourceLocation DKLoc) {		SourceLocation DKLoc) {
parseOMPEndDirective(OMPD_declare_target, OMPD_end_declare_target, DKind,		parseOMPEndDirective(BeginDKind, OMPD_end_declare_target, EndDKind, DKLoc,
DKLoc, Tok.getLocation(),		Tok.getLocation(),
/* SkipUntilOpenMPEnd */ false);		/* SkipUntilOpenMPEnd */ false);
// Skip the last annot_pragma_openmp_end.		// Skip the last annot_pragma_openmp_end.
if (Tok.is(tok::annot_pragma_openmp_end))		if (Tok.is(tok::annot_pragma_openmp_end))
ConsumeAnnotationToken();		ConsumeAnnotationToken();
}		}

/// Parsing of declarative OpenMP directives.		/// Parsing of declarative OpenMP directives.
///		///
▲ Show 20 Lines • Show All 297 Lines • ▼ Show 20 Lines	case OMPD_declare_simd: {
}		}
if (DKind == OMPD_declare_simd)		if (DKind == OMPD_declare_simd)
return ParseOMPDeclareSimdClauses(Ptr, Toks, Loc);		return ParseOMPDeclareSimdClauses(Ptr, Toks, Loc);
assert(DKind == OMPD_declare_variant &&		assert(DKind == OMPD_declare_variant &&
"Expected declare variant directive only");		"Expected declare variant directive only");
ParseOMPDeclareVariantClauses(Ptr, Toks, Loc);		ParseOMPDeclareVariantClauses(Ptr, Toks, Loc);
return Ptr;		return Ptr;
}		}
		case OMPD_begin_declare_target:
case OMPD_declare_target: {		case OMPD_declare_target: {
SourceLocation DTLoc = ConsumeAnyToken();		SourceLocation DTLoc = ConsumeAnyToken();
if (Tok.isNot(tok::annot_pragma_openmp_end)) {		bool HasClauses = Tok.isNot(tok::annot_pragma_openmp_end);
return ParseOMPDeclareTargetClauses();		bool HasImplicitMappings =
}		DKind == OMPD_begin_declare_target \|\| !HasClauses;
		Sema::DeclareTargetContextInfo DTCI(DKind, DTLoc);
		if (HasClauses)
		ParseOMPDeclareTargetClauses(DTCI);

// Skip the last annot_pragma_openmp_end.		// Skip the last annot_pragma_openmp_end.
ConsumeAnyToken();		ConsumeAnyToken();

if (!Actions.ActOnStartOpenMPDeclareTargetDirective(DTLoc))		if (HasImplicitMappings) {
return DeclGroupPtrTy();		Actions.ActOnStartOpenMPDeclareTargetContext(DTCI);
		return nullptr;
		ABataevUnsubmitted Done Reply Inline Actions Would be good to check how it works with sanitizers. ABataev: Would be good to check how it works with sanitizers.
		}

ParsingOpenMPDirectiveRAII NormalScope(this, /Value=*/false);		Actions.ActOnFinishedOpenMPDeclareTargetContext(DTCI);
llvm::SmallVector<Decl *, 4> Decls;		llvm::SmallVector<Decl *, 4> Decls;
while (Tok.isNot(tok::eof) && Tok.isNot(tok::r_brace)) {		for (auto &It : DTCI.ExplicitlyMapped)
if (Tok.isAnnotation() && Tok.is(tok::annot_pragma_openmp)) {		Decls.push_back(It.first);
TentativeParsingAction TPA(*this);		return Actions.BuildDeclaratorGroup(Decls);
ConsumeAnnotationToken();
DKind = parseOpenMPDirectiveKind(*this);
if (DKind != OMPD_end_declare_target)
TPA.Revert();
else
TPA.Commit();
}		}
		ABataevUnsubmitted Done Reply Inline Actions Add a RAII to control these new/delete or just create local var ABataev: Add a RAII to control these new/delete or just create local var
		jdoerfertAuthorUnsubmitted Done Reply Inline Actions Local variable and RAII do not always work, there is a delete in the `end_declare_target` below as well. jdoerfert: Local variable and RAII do not always work, there is a delete in the `end_declare_target` below…
		ABataevUnsubmitted Done Reply Inline Actions But here you have new/delete pair within a single block. Either you can put the ar into stack/RAII or some extra checks are missing. Maybe must be something like this: if (DKind == OMPD_declare_target) delete DTCI; ? ABataev: But here you have new/delete pair within a single block. Either you can put the ar into…
		jdoerfertAuthorUnsubmitted Done Reply Inline Actions If this is a directive without implicit mappings, the DTCI will be deleted right away. It is just used to collect the clauses (which include explicit mappings). If this is a directive with implicit mappings, which we cannot tell from the DKind alone, the DTCI will be stored in Sema until we reach the corresponding end directive. For the former case we could do stack/RAII, but not for the latter case, the scope is left and DTCI survives. I'll look into this again and try to avoid new/delete, feel free to look at the rest of the patch. jdoerfert: If this is a directive without implicit mappings, the DTCI will be deleted right away. It is…
		ABataevUnsubmitted Done Reply Inline Actions Everything else looks good, just need to clarify the question with this new/delete. I missed `if (HasImplicitMappings)` check, so maybe this is correct but better to double-check. ABataev: Everything else looks good, just need to clarify the question with this new/delete. I missed…
if (DKind == OMPD_end_declare_target)		case OMPD_end_declare_target: {
		if (!Actions.isInOpenMPDeclareTargetContext()) {
		Diag(Tok, diag::err_omp_unexpected_directive)
		<< 1 << getOpenMPDirectiveName(DKind);
break;		break;
DeclGroupPtrTy Ptr;
// Here we expect to see some function declaration.
if (AS == AS_none) {
assert(TagType == DeclSpec::TST_unspecified);
MaybeParseCXX11Attributes(Attrs);
ParsingDeclSpec PDS(*this);
Ptr = ParseExternalDeclaration(Attrs, &PDS);
} else {
Ptr =
ParseCXXClassMemberDeclarationWithPragmas(AS, Attrs, TagType, Tag);
}		}
if (Ptr) {		const Sema::DeclareTargetContextInfo &DTCI =
DeclGroupRef Ref = Ptr.get();		Actions.ActOnOpenMPEndDeclareTargetDirective();
Decls.append(Ref.begin(), Ref.end());		ParseOMPEndDeclareTargetDirective(DTCI.Kind, DKind, DTCI.Loc);
}		return nullptr;
}

ParseOMPEndDeclareTargetDirective(DKind, DTLoc);
Actions.ActOnFinishOpenMPDeclareTargetDirective();
return Actions.BuildDeclaratorGroup(Decls);
}		}
case OMPD_unknown:		case OMPD_unknown:
Diag(Tok, diag::err_omp_unknown_directive);		Diag(Tok, diag::err_omp_unknown_directive);
break;		break;
case OMPD_parallel:		case OMPD_parallel:
case OMPD_simd:		case OMPD_simd:
case OMPD_tile:		case OMPD_tile:
case OMPD_task:		case OMPD_task:
Show All 28 Lines	Parser::DeclGroupPtrTy Parser::ParseOpenMPDeclarativeDirectiveWithExtDecl(
case OMPD_target_parallel_for:		case OMPD_target_parallel_for:
case OMPD_taskloop:		case OMPD_taskloop:
case OMPD_taskloop_simd:		case OMPD_taskloop_simd:
case OMPD_master_taskloop:		case OMPD_master_taskloop:
case OMPD_master_taskloop_simd:		case OMPD_master_taskloop_simd:
case OMPD_parallel_master_taskloop:		case OMPD_parallel_master_taskloop:
case OMPD_parallel_master_taskloop_simd:		case OMPD_parallel_master_taskloop_simd:
case OMPD_distribute:		case OMPD_distribute:
case OMPD_end_declare_target:
case OMPD_target_update:		case OMPD_target_update:
case OMPD_distribute_parallel_for:		case OMPD_distribute_parallel_for:
case OMPD_distribute_parallel_for_simd:		case OMPD_distribute_parallel_for_simd:
case OMPD_distribute_simd:		case OMPD_distribute_simd:
case OMPD_target_parallel_for_simd:		case OMPD_target_parallel_for_simd:
case OMPD_target_simd:		case OMPD_target_simd:
case OMPD_teams_distribute:		case OMPD_teams_distribute:
case OMPD_teams_distribute_simd:		case OMPD_teams_distribute_simd:
▲ Show 20 Lines • Show All 362 Lines • ▼ Show 20 Lines	case OMPD_masked: {

// Exit scope.		// Exit scope.
Actions.EndOpenMPDSABlock(Directive.get());		Actions.EndOpenMPDSABlock(Directive.get());
OMPDirectiveScope.Exit();		OMPDirectiveScope.Exit();
break;		break;
}		}
case OMPD_declare_simd:		case OMPD_declare_simd:
case OMPD_declare_target:		case OMPD_declare_target:
		case OMPD_begin_declare_target:
case OMPD_end_declare_target:		case OMPD_end_declare_target:
case OMPD_requires:		case OMPD_requires:
case OMPD_begin_declare_variant:		case OMPD_begin_declare_variant:
case OMPD_end_declare_variant:		case OMPD_end_declare_variant:
case OMPD_declare_variant:		case OMPD_declare_variant:
Diag(Tok, diag::err_omp_unexpected_directive)		Diag(Tok, diag::err_omp_unexpected_directive)
<< 1 << getOpenMPDirectiveName(DKind);		<< 1 << getOpenMPDirectiveName(DKind);
SkipUntil(tok::annot_pragma_openmp_end);		SkipUntil(tok::annot_pragma_openmp_end);
▲ Show 20 Lines • Show All 1,494 Lines • Show Last 20 Lines

clang/lib/Sema/SemaDecl.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 18,451 Lines • ▼ Show 20 Lines	Sema::FunctionEmissionStatus Sema::getEmissionStatus(FunctionDecl *FD,

if (LangOpts.OpenMPIsDevice) {		if (LangOpts.OpenMPIsDevice) {
// In OpenMP device mode we will not emit host only functions, or functions		// In OpenMP device mode we will not emit host only functions, or functions
// we don't need due to their linkage.		// we don't need due to their linkage.
Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =		Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =
OMPDeclareTargetDeclAttr::getDeviceType(FD->getCanonicalDecl());		OMPDeclareTargetDeclAttr::getDeviceType(FD->getCanonicalDecl());
// DevTy may be changed later by		// DevTy may be changed later by
// #pragma omp declare target to() device_type().		// #pragma omp declare target to() device_type().
// Therefore DevTyhaving no value does not imply host. The emission status		// Therefore DevTy having no value does not imply host. The emission status
// will be checked again at the end of compilation unit with Final = true.		// will be checked again at the end of compilation unit with Final = true.
if (DevTy.hasValue())		if (DevTy.hasValue())
if (*DevTy == OMPDeclareTargetDeclAttr::DT_Host)		if (*DevTy == OMPDeclareTargetDeclAttr::DT_Host)
return FunctionEmissionStatus::OMPDiscarded;		return FunctionEmissionStatus::OMPDiscarded;
// If we have an explicit value for the device type, or we are in a target		// If we have an explicit value for the device type, or we are in a target
// declare context, we need to emit all extern and used symbols.		// declare context, we need to emit all extern and used symbols.
if (isInOpenMPDeclareTargetContext() \|\| DevTy.hasValue())		if (isInOpenMPDeclareTargetContext() \|\| DevTy.hasValue())
if (IsEmittedForExternalSymbol())		if (IsEmittedForExternalSymbol())
▲ Show 20 Lines • Show All 51 Lines • Show Last 20 Lines

clang/lib/Sema/SemaOpenMP.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 2,475 Lines • ▼ Show 20 Lines

void Sema::finalizeOpenMPDelayedAnalysis(const FunctionDecl *Caller,		void Sema::finalizeOpenMPDelayedAnalysis(const FunctionDecl *Caller,
const FunctionDecl *Callee,		const FunctionDecl *Callee,
SourceLocation Loc) {		SourceLocation Loc) {
assert(LangOpts.OpenMP && "Expected OpenMP compilation mode.");		assert(LangOpts.OpenMP && "Expected OpenMP compilation mode.");
Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =		Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =
OMPDeclareTargetDeclAttr::getDeviceType(Caller->getMostRecentDecl());		OMPDeclareTargetDeclAttr::getDeviceType(Caller->getMostRecentDecl());
// Ignore host functions during device analyzis.		// Ignore host functions during device analyzis.
if (LangOpts.OpenMPIsDevice && DevTy &&		if (LangOpts.OpenMPIsDevice &&
*DevTy == OMPDeclareTargetDeclAttr::DT_Host)		(!DevTy \|\| *DevTy == OMPDeclareTargetDeclAttr::DT_Host))
return;		return;
// Ignore nohost functions during host analyzis.		// Ignore nohost functions during host analyzis.
if (!LangOpts.OpenMPIsDevice && DevTy &&		if (!LangOpts.OpenMPIsDevice && DevTy &&
*DevTy == OMPDeclareTargetDeclAttr::DT_NoHost)		*DevTy == OMPDeclareTargetDeclAttr::DT_NoHost)
return;		return;
const FunctionDecl *FD = Callee->getMostRecentDecl();		const FunctionDecl *FD = Callee->getMostRecentDecl();
DevTy = OMPDeclareTargetDeclAttr::getDeviceType(FD);		DevTy = OMPDeclareTargetDeclAttr::getDeviceType(FD);
if (LangOpts.OpenMPIsDevice && DevTy &&		if (LangOpts.OpenMPIsDevice && DevTy &&
▲ Show 20 Lines • Show All 17,475 Lines • ▼ Show 20 Lines	OMPClause *Sema::ActOnOpenMPDefaultmapClause(
} else {		} else {
DSAStack->setDefaultDMAAttr(M, Kind, StartLoc);		DSAStack->setDefaultDMAAttr(M, Kind, StartLoc);
}		}

return new (Context)		return new (Context)
OMPDefaultmapClause(StartLoc, LParenLoc, MLoc, KindLoc, EndLoc, Kind, M);		OMPDefaultmapClause(StartLoc, LParenLoc, MLoc, KindLoc, EndLoc, Kind, M);
}		}

bool Sema::ActOnStartOpenMPDeclareTargetDirective(SourceLocation Loc) {		bool Sema::ActOnStartOpenMPDeclareTargetContext(
		DeclareTargetContextInfo &DTCI) {
DeclContext *CurLexicalContext = getCurLexicalContext();		DeclContext *CurLexicalContext = getCurLexicalContext();
if (!CurLexicalContext->isFileContext() &&		if (!CurLexicalContext->isFileContext() &&
!CurLexicalContext->isExternCContext() &&		!CurLexicalContext->isExternCContext() &&
!CurLexicalContext->isExternCXXContext() &&		!CurLexicalContext->isExternCXXContext() &&
!isa<CXXRecordDecl>(CurLexicalContext) &&		!isa<CXXRecordDecl>(CurLexicalContext) &&
!isa<ClassTemplateDecl>(CurLexicalContext) &&		!isa<ClassTemplateDecl>(CurLexicalContext) &&
!isa<ClassTemplatePartialSpecializationDecl>(CurLexicalContext) &&		!isa<ClassTemplatePartialSpecializationDecl>(CurLexicalContext) &&
!isa<ClassTemplateSpecializationDecl>(CurLexicalContext)) {		!isa<ClassTemplateSpecializationDecl>(CurLexicalContext)) {
Diag(Loc, diag::err_omp_region_not_file_context);		Diag(DTCI.Loc, diag::err_omp_region_not_file_context);
return false;		return false;
}		}
DeclareTargetNesting.push_back(Loc);		DeclareTargetNesting.push_back(DTCI);
return true;		return true;
}		}

void Sema::ActOnFinishOpenMPDeclareTargetDirective() {		const Sema::DeclareTargetContextInfo
		Sema::ActOnOpenMPEndDeclareTargetDirective() {
assert(!DeclareTargetNesting.empty() &&		assert(!DeclareTargetNesting.empty() &&
"Unexpected ActOnFinishOpenMPDeclareTargetDirective");		"check isInOpenMPDeclareTargetContext() first!");
DeclareTargetNesting.pop_back();		return DeclareTargetNesting.pop_back_val();
}		}

NamedDecl *		void Sema::ActOnFinishedOpenMPDeclareTargetContext(
Sema::lookupOpenMPDeclareTargetName(Scope *CurScope, CXXScopeSpec &ScopeSpec,		DeclareTargetContextInfo &DTCI) {
const DeclarationNameInfo &Id,		for (auto &It : DTCI.ExplicitlyMapped)
NamedDeclSetType &SameDirectiveDecls) {		ActOnOpenMPDeclareTargetName(It.first, It.second.Loc, It.second.MT,
		DTCI.DT);
		}

		NamedDecl Sema::lookupOpenMPDeclareTargetName(Scope CurScope,
		CXXScopeSpec &ScopeSpec,
		const DeclarationNameInfo &Id) {
LookupResult Lookup(*this, Id, LookupOrdinaryName);		LookupResult Lookup(*this, Id, LookupOrdinaryName);
LookupParsedName(Lookup, CurScope, &ScopeSpec, true);		LookupParsedName(Lookup, CurScope, &ScopeSpec, true);

if (Lookup.isAmbiguous())		if (Lookup.isAmbiguous())
return nullptr;		return nullptr;
Lookup.suppressDiagnostics();		Lookup.suppressDiagnostics();

if (!Lookup.isSingleResult()) {		if (!Lookup.isSingleResult()) {
Show All 12 Lines	NamedDecl Sema::lookupOpenMPDeclareTargetName(Scope CurScope,
}		}

NamedDecl *ND = Lookup.getAsSingle<NamedDecl>();		NamedDecl *ND = Lookup.getAsSingle<NamedDecl>();
if (!isa<VarDecl>(ND) && !isa<FunctionDecl>(ND) &&		if (!isa<VarDecl>(ND) && !isa<FunctionDecl>(ND) &&
!isa<FunctionTemplateDecl>(ND)) {		!isa<FunctionTemplateDecl>(ND)) {
Diag(Id.getLoc(), diag::err_omp_invalid_target_decl) << Id.getName();		Diag(Id.getLoc(), diag::err_omp_invalid_target_decl) << Id.getName();
return nullptr;		return nullptr;
}		}
if (!SameDirectiveDecls.insert(cast<NamedDecl>(ND->getCanonicalDecl())))
Diag(Id.getLoc(), diag::err_omp_declare_target_multiple) << Id.getName();
return ND;		return ND;
}		}

void Sema::ActOnOpenMPDeclareTargetName(		void Sema::ActOnOpenMPDeclareTargetName(
NamedDecl *ND, SourceLocation Loc, OMPDeclareTargetDeclAttr::MapTypeTy MT,		NamedDecl *ND, SourceLocation Loc, OMPDeclareTargetDeclAttr::MapTypeTy MT,
OMPDeclareTargetDeclAttr::DevTypeTy DT) {		OMPDeclareTargetDeclAttr::DevTypeTy DT) {
assert((isa<VarDecl>(ND) \|\| isa<FunctionDecl>(ND) \|\|		assert((isa<VarDecl>(ND) \|\| isa<FunctionDecl>(ND) \|\|
isa<FunctionTemplateDecl>(ND)) &&		isa<FunctionTemplateDecl>(ND)) &&
"Expected variable, function or function template.");		"Expected variable, function or function template.");

// Diagnose marking after use as it may lead to incorrect diagnosis and		// Diagnose marking after use as it may lead to incorrect diagnosis and
// codegen.		// codegen.
if (LangOpts.OpenMP >= 50 &&		if (LangOpts.OpenMP >= 50 &&
(ND->isUsed(/CheckUsedAttr=/false) \|\| ND->isReferenced()))		(ND->isUsed(/CheckUsedAttr=/false) \|\| ND->isReferenced()))
Diag(Loc, diag::warn_omp_declare_target_after_first_use);		Diag(Loc, diag::warn_omp_declare_target_after_first_use);

		// Explicit declare target lists have precedence.
		const unsigned Level = -1;

auto *VD = cast<ValueDecl>(ND);		auto *VD = cast<ValueDecl>(ND);
Optional<OMPDeclareTargetDeclAttr::DevTypeTy> DevTy =		llvm::Optional<OMPDeclareTargetDeclAttr *> ActiveAttr =
OMPDeclareTargetDeclAttr::getDeviceType(VD);		OMPDeclareTargetDeclAttr::getActiveAttr(VD);
Optional<SourceLocation> AttrLoc = OMPDeclareTargetDeclAttr::getLocation(VD);		if (ActiveAttr.hasValue() && ActiveAttr.getValue()->getDevType() != DT &&
if (DevTy.hasValue() && *DevTy != DT &&		ActiveAttr.getValue()->getLevel() == Level) {
(DeclareTargetNesting.empty() \|\|
*AttrLoc != DeclareTargetNesting.back())) {
Diag(Loc, diag::err_omp_device_type_mismatch)		Diag(Loc, diag::err_omp_device_type_mismatch)
<< OMPDeclareTargetDeclAttr::ConvertDevTypeTyToStr(DT)		<< OMPDeclareTargetDeclAttr::ConvertDevTypeTyToStr(DT)
<< OMPDeclareTargetDeclAttr::ConvertDevTypeTyToStr(*DevTy);		<< OMPDeclareTargetDeclAttr::ConvertDevTypeTyToStr(
		ActiveAttr.getValue()->getDevType());
return;		return;
}		}
Optional<OMPDeclareTargetDeclAttr::MapTypeTy> Res =		if (ActiveAttr.hasValue() && ActiveAttr.getValue()->getMapType() != MT &&
OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD);		ActiveAttr.getValue()->getLevel() == Level) {
if (!Res \|\| (!DeclareTargetNesting.empty() &&		Diag(Loc, diag::err_omp_declare_target_to_and_link) << ND;
*AttrLoc == DeclareTargetNesting.back())) {		return;
auto *A = OMPDeclareTargetDeclAttr::CreateImplicit(		}
Context, MT, DT, DeclareTargetNesting.size() + 1,
		if (ActiveAttr.hasValue() && ActiveAttr.getValue()->getLevel() == Level)
		return;

		auto *A = OMPDeclareTargetDeclAttr::CreateImplicit(Context, MT, DT, Level,
SourceRange(Loc, Loc));		SourceRange(Loc, Loc));
ND->addAttr(A);		ND->addAttr(A);
if (ASTMutationListener *ML = Context.getASTMutationListener())		if (ASTMutationListener *ML = Context.getASTMutationListener())
ML->DeclarationMarkedOpenMPDeclareTarget(ND, A);		ML->DeclarationMarkedOpenMPDeclareTarget(ND, A);
checkDeclIsAllowedInOpenMPTarget(nullptr, ND, Loc);		checkDeclIsAllowedInOpenMPTarget(nullptr, ND, Loc);
} else if (*Res != MT) {
Diag(Loc, diag::err_omp_declare_target_to_and_link) << ND;
}
}		}

static void checkDeclInTargetContext(SourceLocation SL, SourceRange SR,		static void checkDeclInTargetContext(SourceLocation SL, SourceRange SR,
Sema &SemaRef, Decl *D) {		Sema &SemaRef, Decl *D) {
if (!D \|\| !isa<VarDecl>(D))		if (!D \|\| !isa<VarDecl>(D))
return;		return;
auto *VD = cast<VarDecl>(D);		auto *VD = cast<VarDecl>(D);
Optional<OMPDeclareTargetDeclAttr::MapTypeTy> MapTy =		Optional<OMPDeclareTargetDeclAttr::MapTypeTy> MapTy =
OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD);		OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD);
if (SemaRef.LangOpts.OpenMP >= 50 &&		if (SemaRef.LangOpts.OpenMP >= 50 &&
(SemaRef.getCurLambda(/IgnoreNonLambdaCapturingScope=/true) \|\|		(SemaRef.getCurLambda(/IgnoreNonLambdaCapturingScope=/true) \|\|
SemaRef.getCurBlock() \|\| SemaRef.getCurCapturedRegion()) &&		SemaRef.getCurBlock() \|\| SemaRef.getCurCapturedRegion()) &&
VD->hasGlobalStorage()) {		VD->hasGlobalStorage()) {
llvm::Optional<OMPDeclareTargetDeclAttr::MapTypeTy> MapTy =
OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD);
if (!MapTy \|\| *MapTy != OMPDeclareTargetDeclAttr::MT_To) {		if (!MapTy \|\| *MapTy != OMPDeclareTargetDeclAttr::MT_To) {
// OpenMP 5.0, 2.12.7 declare target Directive, Restrictions		// OpenMP 5.0, 2.12.7 declare target Directive, Restrictions
// If a lambda declaration and definition appears between a		// If a lambda declaration and definition appears between a
// declare target directive and the matching end declare target		// declare target directive and the matching end declare target
// directive, all variables that are captured by the lambda		// directive, all variables that are captured by the lambda
// expression must also appear in a to clause.		// expression must also appear in a to clause.
SemaRef.Diag(VD->getLocation(),		SemaRef.Diag(VD->getLocation(),
diag::err_omp_lambda_capture_in_declare_target_not_to);		diag::err_omp_lambda_capture_in_declare_target_not_to);
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	if (auto *FD = dyn_cast<FunctionDecl>(D)) {
}		}
}		}
if (auto *VD = dyn_cast<ValueDecl>(D)) {		if (auto *VD = dyn_cast<ValueDecl>(D)) {
// Problem if any with var declared with incomplete type will be reported		// Problem if any with var declared with incomplete type will be reported
// as normal, so no need to check it here.		// as normal, so no need to check it here.
if ((E \|\| !VD->getType()->isIncompleteType()) &&		if ((E \|\| !VD->getType()->isIncompleteType()) &&
!checkValueDeclInTarget(SL, SR, *this, DSAStack, VD))		!checkValueDeclInTarget(SL, SR, *this, DSAStack, VD))
return;		return;
if (!E && !OMPDeclareTargetDeclAttr::isDeclareTargetDeclaration(VD)) {		if (!E && isInOpenMPDeclareTargetContext()) {
// Checking declaration inside declare target region.		// Checking declaration inside declare target region.
if (isa<VarDecl>(D) \|\| isa<FunctionDecl>(D) \|\|		if (isa<VarDecl>(D) \|\| isa<FunctionDecl>(D) \|\|
isa<FunctionTemplateDecl>(D)) {		isa<FunctionTemplateDecl>(D)) {
		llvm::Optional<OMPDeclareTargetDeclAttr *> ActiveAttr =
		OMPDeclareTargetDeclAttr::getActiveAttr(VD);
		unsigned Level = DeclareTargetNesting.size();
		if (ActiveAttr.hasValue() && ActiveAttr.getValue()->getLevel() >= Level)
		return;
		DeclareTargetContextInfo &DTCI = DeclareTargetNesting.back();
auto *A = OMPDeclareTargetDeclAttr::CreateImplicit(		auto *A = OMPDeclareTargetDeclAttr::CreateImplicit(
Context, OMPDeclareTargetDeclAttr::MT_To,		Context, OMPDeclareTargetDeclAttr::MT_To, DTCI.DT, Level,
OMPDeclareTargetDeclAttr::DT_Any, DeclareTargetNesting.size(),		SourceRange(DTCI.Loc, DTCI.Loc));
SourceRange(DeclareTargetNesting.back(),
DeclareTargetNesting.back()));
D->addAttr(A);		D->addAttr(A);
if (ASTMutationListener *ML = Context.getASTMutationListener())		if (ASTMutationListener *ML = Context.getASTMutationListener())
ML->DeclarationMarkedOpenMPDeclareTarget(D, A);		ML->DeclarationMarkedOpenMPDeclareTarget(D, A);
}		}
return;		return;
}		}
}		}
if (!E)		if (!E)
▲ Show 20 Lines • Show All 662 Lines • Show Last 20 Lines

clang/test/Headers/nvptx_device_math_complex.c

	// REQUIRES: nvptx-registered-target			// REQUIRES: nvptx-registered-target
	// RUN: %clang_cc1 -verify -internal-isystem %S/Inputs/include -fopenmp -x c -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc			// RUN: %clang_cc1 -verify -internal-isystem %S/Inputs/include -fopenmp -x c -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc
	// RUN: %clang_cc1 -verify -internal-isystem %S/../../lib/Headers/openmp_wrappers -include __clang_openmp_device_functions.h -internal-isystem %S/Inputs/include -fopenmp -x c -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -aux-triple powerpc64le-unknown-unknown -o - \| FileCheck %s			// RUN: %clang_cc1 -verify -internal-isystem %S/../../lib/Headers/openmp_wrappers -include __clang_openmp_device_functions.h -internal-isystem %S/Inputs/include -fopenmp -x c -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -aux-triple powerpc64le-unknown-unknown -o - \| FileCheck %s
	// RUN: %clang_cc1 -verify -internal-isystem %S/Inputs/include -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc			// RUN: %clang_cc1 -verify -internal-isystem %S/Inputs/include -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc
	// RUN: %clang_cc1 -verify -internal-isystem %S/../../lib/Headers/openmp_wrappers -include __clang_openmp_device_functions.h -internal-isystem %S/Inputs/include -fopenmp -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -aux-triple powerpc64le-unknown-unknown -o - \| FileCheck %s			// RUN: %clang_cc1 -verify -internal-isystem %S/../../lib/Headers/openmp_wrappers -include __clang_openmp_device_functions.h -internal-isystem %S/Inputs/include -fopenmp -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -aux-triple powerpc64le-unknown-unknown -o - \| FileCheck %s
	// expected-no-diagnostics			// expected-no-diagnostics

	#ifdef __cplusplus			#ifdef __cplusplus
	#include <complex>			#include <complex>
	#else			#else
	#include <complex.h>			#include <complex.h>
	#endif			#endif

	// CHECK: define weak {{.*}} @__muldc3			// CHECK: define weak {{.*}} @__divsc3
	// CHECK-DAG: call i32 @__nv_isnand(			// CHECK-DAG: call i32 @__nv_isnanf(
	// CHECK-DAG: call i32 @__nv_isinfd(			// CHECK-DAG: call i32 @__nv_isinff(
	// CHECK-DAG: call double @__nv_copysign(			// CHECK-DAG: call i32 @__nv_finitef(
				// CHECK-DAG: call float @__nv_copysignf(
				// CHECK-DAG: call float @__nv_scalbnf(
				// CHECK-DAG: call float @__nv_fabsf(
				// CHECK-DAG: call float @__nv_logbf(

	// CHECK: define weak {{.*}} @__mulsc3			// CHECK: define weak {{.*}} @__mulsc3
	// CHECK-DAG: call i32 @__nv_isnanf(			// CHECK-DAG: call i32 @__nv_isnanf(
	// CHECK-DAG: call i32 @__nv_isinff(			// CHECK-DAG: call i32 @__nv_isinff(
	// CHECK-DAG: call float @__nv_copysignf(			// CHECK-DAG: call float @__nv_copysignf(

	// CHECK: define weak {{.*}} @__divdc3			// CHECK: define weak {{.*}} @__divdc3
	// CHECK-DAG: call i32 @__nv_isnand(			// CHECK-DAG: call i32 @__nv_isnand(
	// CHECK-DAG: call i32 @__nv_isinfd(			// CHECK-DAG: call i32 @__nv_isinfd(
	// CHECK-DAG: call i32 @__nv_isfinited(			// CHECK-DAG: call i32 @__nv_isfinited(
	// CHECK-DAG: call double @__nv_copysign(			// CHECK-DAG: call double @__nv_copysign(
	// CHECK-DAG: call double @__nv_scalbn(			// CHECK-DAG: call double @__nv_scalbn(
	// CHECK-DAG: call double @__nv_fabs(			// CHECK-DAG: call double @__nv_fabs(
	// CHECK-DAG: call double @__nv_logb(			// CHECK-DAG: call double @__nv_logb(

	// CHECK: define weak {{.*}} @__divsc3			// CHECK: define weak {{.*}} @__muldc3
	// CHECK-DAG: call i32 @__nv_isnanf(			// CHECK-DAG: call i32 @__nv_isnand(
	// CHECK-DAG: call i32 @__nv_isinff(			// CHECK-DAG: call i32 @__nv_isinfd(
	// CHECK-DAG: call i32 @__nv_finitef(			// CHECK-DAG: call double @__nv_copysign(
	// CHECK-DAG: call float @__nv_copysignf(
	// CHECK-DAG: call float @__nv_scalbnf(
	// CHECK-DAG: call float @__nv_fabsf(
	// CHECK-DAG: call float @__nv_logbf(

	void test_scmplx(float _Complex a) {			void test_scmplx(float _Complex a) {
	#pragma omp target			#pragma omp target
	{			{
	(void)(a * (a / a));			(void)(a * (a / a));
	}			}
	}			}

	void test_dcmplx(double _Complex a) {			void test_dcmplx(double _Complex a) {
	#pragma omp target			#pragma omp target
	{			{
	(void)(a * (a / a));			(void)(a * (a / a));
	}			}
	}			}

clang/test/OpenMP/declare_target_codegen_globalization.cpp

	Show First 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: [[TMP1:%.]] = load i32, i32 [[TMP0]], align 4			// CHECK1-NEXT: [[TMP1:%.]] = load i32, i32 [[TMP0]], align 4
	// CHECK1-NEXT: ret i32 [[TMP1]]			// CHECK1-NEXT: ret i32 [[TMP1]]
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_Z3barv			// CHECK1-LABEL: define {{[^@]+}}@_Z3barv
	// CHECK1-SAME: () #[[ATTR2]] {			// CHECK1-SAME: () #[[ATTR2]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[A1:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[A2:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[TMP0:%.*]] = call i8 @__kmpc_is_spmd_exec_mode() #[[ATTR3:[0-9]+]]			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB2:[0-9]+]])
	// CHECK1-NEXT: [[TMP1:%.*]] = icmp ne i8 [[TMP0]], 0			// CHECK1-NEXT: [[TMP1:%.]] = call i16 @__kmpc_parallel_level(%struct.ident_t @[[GLOB2]], i32 [[TMP0]])
	// CHECK1-NEXT: br i1 [[TMP1]], label [[DOTSPMD:%.]], label [[DOTNON_SPMD:%.]]			// CHECK1-NEXT: [[TMP2:%.*]] = icmp eq i16 [[TMP1]], 0
				// CHECK1-NEXT: [[TMP3:%.*]] = call i8 @__kmpc_is_spmd_exec_mode() #[[ATTR3:[0-9]+]]
				// CHECK1-NEXT: [[TMP4:%.*]] = icmp ne i8 [[TMP3]], 0
				// CHECK1-NEXT: br i1 [[TMP4]], label [[DOTSPMD:%.]], label [[DOTNON_SPMD:%.]]
	// CHECK1: .spmd:			// CHECK1: .spmd:
	// CHECK1-NEXT: br label [[DOTEXIT:%.*]]			// CHECK1-NEXT: br label [[DOTEXIT:%.*]]
	// CHECK1: .non-spmd:			// CHECK1: .non-spmd:
	// CHECK1-NEXT: [[TMP2:%.]] = call i8 @__kmpc_data_sharing_coalesced_push_stack(i64 128, i16 0)			// CHECK1-NEXT: [[TMP5:%.*]] = select i1 [[TMP2]], i64 4, i64 128
	// CHECK1-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to %struct._globalized_locals_ty*			// CHECK1-NEXT: [[TMP6:%.]] = call i8 @__kmpc_data_sharing_coalesced_push_stack(i64 [[TMP5]], i16 0)
				// CHECK1-NEXT: [[TMP7:%.]] = bitcast i8 [[TMP6]] to %struct._globalized_locals_ty*
	// CHECK1-NEXT: br label [[DOTEXIT]]			// CHECK1-NEXT: br label [[DOTEXIT]]
	// CHECK1: .exit:			// CHECK1: .exit:
	// CHECK1-NEXT: [[_SELECT_STACK:%.]] = phi %struct._globalized_locals_ty [ null, [[DOTSPMD]] ], [ [[TMP3]], [[DOTNON_SPMD]] ]			// CHECK1-NEXT: [[_SELECT_STACK:%.]] = phi %struct._globalized_locals_ty [ null, [[DOTSPMD]] ], [ [[TMP7]], [[DOTNON_SPMD]] ]
				// CHECK1-NEXT: [[TMP8:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to %struct._globalized_locals_ty.0*
	// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT__GLOBALIZED_LOCALS_TY:%.]], %struct._globalized_locals_ty* [[_SELECT_STACK]], i32 0, i32 0			// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT__GLOBALIZED_LOCALS_TY:%.]], %struct._globalized_locals_ty* [[_SELECT_STACK]], i32 0, i32 0
	// CHECK1-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK1-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK1-NEXT: [[NVPTX_LANE_ID:%.*]] = and i32 [[NVPTX_TID]], 31			// CHECK1-NEXT: [[NVPTX_LANE_ID:%.*]] = and i32 [[NVPTX_TID]], 31
	// CHECK1-NEXT: [[TMP4:%.]] = getelementptr inbounds [32 x i32], [32 x i32] [[A]], i32 0, i32 [[NVPTX_LANE_ID]]			// CHECK1-NEXT: [[TMP9:%.]] = getelementptr inbounds [32 x i32], [32 x i32] [[A]], i32 0, i32 [[NVPTX_LANE_ID]]
	// CHECK1-NEXT: [[TMP5:%.]] = select i1 [[TMP1]], i32 [[A1]], i32* [[TMP4]]			// CHECK1-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT__GLOBALIZED_LOCALS_TY_0:%.]], %struct._globalized_locals_ty.0* [[TMP8]], i32 0, i32 0
	// CHECK1-NEXT: [[CALL:%.]] = call i32 @_Z3fooRi(i32 nonnull align 4 dereferenceable(4) [[TMP5]]) #[[ATTR4]]			// CHECK1-NEXT: [[TMP10:%.]] = select i1 [[TMP2]], i32 [[A1]], i32* [[TMP9]]
				// CHECK1-NEXT: [[TMP11:%.]] = select i1 [[TMP4]], i32 [[A2]], i32* [[TMP10]]
				// CHECK1-NEXT: [[CALL:%.]] = call i32 @_Z3fooRi(i32 nonnull align 4 dereferenceable(4) [[TMP11]]) #[[ATTR4]]
	// CHECK1-NEXT: store i32 [[CALL]], i32* [[RETVAL]], align 4			// CHECK1-NEXT: store i32 [[CALL]], i32* [[RETVAL]], align 4
	// CHECK1-NEXT: br i1 [[TMP1]], label [[DOTEXIT3:%.]], label [[DOTNON_SPMD2:%.]]			// CHECK1-NEXT: br i1 [[TMP4]], label [[DOTEXIT4:%.]], label [[DOTNON_SPMD3:%.]]
	// CHECK1: .non-spmd2:			// CHECK1: .non-spmd3:
	// CHECK1-NEXT: [[TMP6:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to i8*			// CHECK1-NEXT: [[TMP12:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to i8*
	// CHECK1-NEXT: call void @__kmpc_data_sharing_pop_stack(i8* [[TMP6]])			// CHECK1-NEXT: call void @__kmpc_data_sharing_pop_stack(i8* [[TMP12]])
	// CHECK1-NEXT: br label [[DOTEXIT3]]			// CHECK1-NEXT: br label [[DOTEXIT4]]
	// CHECK1: .exit3:			// CHECK1: .exit4:
	// CHECK1-NEXT: [[TMP7:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK1-NEXT: ret i32 [[TMP7]]			// CHECK1-NEXT: ret i32 [[TMP13]]
	//			//

clang/test/OpenMP/declare_target_device_only_compilation.cpp

This file was deleted.

	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm-bc %s -o %t-ppc-host.bc
	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o - \| FileCheck %s

	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple i386-pc-linux-gnu -fopenmp-targets=i386-pc-linux-gnu -emit-llvm-bc %s -o %t-i386-host.bc
	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple i386-pc-linux-gnu -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-i386-host.bc -o - \| FileCheck %s

	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple x86_64-unknown-linux-gnu -fopenmp-targets=x86_64-unknown-linux-gnu -emit-llvm-bc %s -o %t-x86_64-host.bc
	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple x86_64-unknown-linux-gnu -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-x86_64-host.bc -o - \| FileCheck %s

	// expected-no-diagnostics

	#pragma omp declare target
	#pragma omp begin declare variant match(device={kind(nohost)})
	int G1;
	#pragma omp end declare variant
	#pragma omp end declare target

	// CHECK: @[[G:.+]] = hidden {{.*}}global i32 0, align 4
	// CHECK: !omp_offload.info = !{!0}
	// CHECK: !0 = !{i32 1, !"[[G]]", i32 0, i32 0}

clang/test/OpenMP/declare_target_messages.cpp

Show All 11 Lines
__thread int t; // expected-note {{defined as threadprivate or thread local}}		__thread int t; // expected-note {{defined as threadprivate or thread local}}

#pragma omp declare target . // expected-error {{expected '(' after 'declare target'}}		#pragma omp declare target . // expected-error {{expected '(' after 'declare target'}}

#pragma omp declare target		#pragma omp declare target
void f();		void f();
#pragma omp end declare target shared(a) // expected-warning {{extra tokens at the end of '#pragma omp end declare target' are ignored}}		#pragma omp end declare target shared(a) // expected-warning {{extra tokens at the end of '#pragma omp end declare target' are ignored}}

#pragma omp declare target map(a) // omp45-error {{unexpected 'map' clause, only 'to' or 'link' clauses expected}} omp5-error {{unexpected 'map' clause, only 'to', 'link' or 'device_type' clauses expected}}		#pragma omp declare target map(a) // expected-error {{expected at least one 'to' or 'link' clause}} omp45-error {{unexpected 'map' clause, only 'to' or 'link' clauses expected}} omp5-error {{unexpected 'map' clause, only 'to', 'link' or 'device_type' clauses expected}}

#pragma omp declare target to(foo1) // expected-error {{use of undeclared identifier 'foo1'}}		#pragma omp declare target to(foo1) // expected-error {{use of undeclared identifier 'foo1'}}

#pragma omp declare target link(foo2) // expected-error {{use of undeclared identifier 'foo2'}}		#pragma omp declare target link(foo2) // expected-error {{use of undeclared identifier 'foo2'}}

#pragma omp declare target to(f) device_type(any) device_type(any) device_type(host) // omp45-error {{unexpected 'device_type' clause, only 'to' or 'link' clauses expected}} omp5-warning 2 {{more than one 'device_type' clause is specified}} omp5-error {{'device_type(host)' does not match previously specified 'device_type(any)' for the same declaration}}		#pragma omp declare target to(f) device_type(host) // omp45-error {{unexpected 'device_type' clause, only 'to' or 'link' clauses expected}} dev5-note {{marked as 'device_type(host)' here}}

		void q();
		#pragma omp declare target to(q) device_type(any) device_type(any) device_type(host) // omp45-error {{unexpected 'device_type' clause, only 'to' or 'link' clauses expected}} omp5-warning {{more than one 'device_type' clause is specified}}

void c();		void c();

void func() {} // expected-note {{'func' defined here}}		void func() {} // expected-note {{'func' defined here}}

#pragma omp declare target link(func) allocate(a) // expected-error {{function name is not allowed in 'link' clause}} omp45-error {{unexpected 'allocate' clause, only 'to' or 'link' clauses expected}} omp5-error {{unexpected 'allocate' clause, only 'to', 'link' or 'device_type' clauses expected}}		#pragma omp declare target link(func) allocate(a) // expected-error {{function name is not allowed in 'link' clause}} omp45-error {{unexpected 'allocate' clause, only 'to' or 'link' clauses expected}} omp5-error {{unexpected 'allocate' clause, only 'to', 'link' or 'device_type' clauses expected}}

void bar();		void bar();
▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines	void foo(int p) {
a = 0; // expected-error {{threadprivate variables cannot be used in target constructs}}		a = 0; // expected-error {{threadprivate variables cannot be used in target constructs}}
b = 0;		b = 0;
t = 1; // expected-error {{threadprivate variables cannot be used in target constructs}}		t = 1; // expected-error {{threadprivate variables cannot be used in target constructs}}
C object;		C object;
VC object1;		VC object1;
g = object.method();		g = object.method();
g += object.method1();		g += object.method1();
g += object1.method() + p;		g += object1.method() + p;
f();		f(); // dev5-error {{function with 'device_type(host)' is not available on device}}
		q();
c();		c();
}		}
#pragma omp declare target		#pragma omp declare target
void foo1() {		void foo1() {
[&](){ (void)(b+z);}(); // omp5-note {{variable 'z' is captured here}}		[&](){ (void)(b+z);}(); // omp5-note {{variable 'z' is captured here}}
}		}
#pragma omp end declare target		#pragma omp end declare target

Show All 15 Lines
#pragma omp declare target // expected-error {{unexpected OpenMP directive '#pragma omp declare target'}}		#pragma omp declare target // expected-error {{unexpected OpenMP directive '#pragma omp declare target'}}
int v;		int v;
#pragma omp end declare target // expected-error {{unexpected OpenMP directive '#pragma omp end declare target'}}		#pragma omp end declare target // expected-error {{unexpected OpenMP directive '#pragma omp end declare target'}}
foo(v);		foo(v);
return (0);		return (0);
}		}

namespace {		namespace {
#pragma omp declare target // expected-note {{to match this '#pragma omp declare target'}}		#pragma omp declare target
int x;		int x;
} // expected-error {{expected '#pragma omp end declare target'}}		}
#pragma omp end declare target // expected-error {{unexpected OpenMP directive '#pragma omp end declare target'}}		#pragma omp end declare target

#pragma omp declare target link(S) // expected-error {{'S' used in declare target directive is not a variable or a function name}}		#pragma omp declare target link(S) // expected-error {{'S' used in declare target directive is not a variable or a function name}}

#pragma omp declare target (x, x) // expected-error {{'x' appears multiple times in clauses on the same declare target directive}}		#pragma omp declare target (x, x) // expected-error {{'x' appears multiple times in clauses on the same declare target directive}}
#pragma omp declare target to(x) to(x) // expected-error {{'x' appears multiple times in clauses on the same declare target directive}}		#pragma omp declare target to(x) to(x) // expected-error {{'x' appears multiple times in clauses on the same declare target directive}}
#pragma omp declare target link(x) // expected-error {{'x' must not appear in both clauses 'to' and 'link'}}		#pragma omp declare target link(x) // expected-error {{'x' must not appear in both clauses 'to' and 'link'}}

void bazz() {}		void bazz() {}
Show All 17 Lines
void any4() {any2();}		void any4() {any2();}
#pragma omp end declare target		#pragma omp end declare target

void any5() {any();}		void any5() {any();}
void any6() {host1();}		void any6() {host1();}
void any7() {device();} // host5-error {{function with 'device_type(nohost)' is not available on host}}		void any7() {device();} // host5-error {{function with 'device_type(nohost)' is not available on host}}
void any8() {any2();}		void any8() {any2();}

#pragma omp declare target // expected-error {{expected '#pragma omp end declare target'}} expected-note {{to match this '#pragma omp declare target'}}		int MultiDevTy;
		#pragma omp declare target to(MultiDevTy) device_type(any) // omp45-error {{unexpected 'device_type' clause, only 'to' or 'link' clauses expected}}
		#pragma omp declare target to(MultiDevTy) device_type(host) // omp45-error {{unexpected 'device_type' clause, only 'to' or 'link' clauses expected}} omp5-error {{'device_type(host)' does not match previously specified 'device_type(any)' for the same declaration}}
		#pragma omp declare target to(MultiDevTy) device_type(nohost) // omp45-error {{unexpected 'device_type' clause, only 'to' or 'link' clauses expected}} omp5-error {{'device_type(nohost)' does not match previously specified 'device_type(any)' for the same declaration}}

		// TODO: Issue an error message error {{expected '#pragma omp end declare target'}} note {{to match this '#pragma omp declare target'}}
		#pragma omp declare target

clang/test/OpenMP/declare_target_only_one_side_compilation.cpp

This file was added.

				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - \| FileCheck %s --check-prefix HOST
				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm-bc %s -o %t-ppc-host.bc
				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o - \| FileCheck %s --check-prefix DEVICE

				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple i386-pc-linux-gnu -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - \| FileCheck %s --check-prefix HOST
				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple i386-pc-linux-gnu -fopenmp-targets=i386-pc-linux-gnu -emit-llvm-bc %s -o %t-i386-host.bc
				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple i386-pc-linux-gnu -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-i386-host.bc -o - \| FileCheck %s --check-prefix DEVICE

				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple x86_64-unknown-linux-gnu -fopenmp-targets=x86_64-unknown-linux-gnu -emit-llvm %s -o - \| FileCheck %s --check-prefix HOST
				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple x86_64-unknown-linux-gnu -fopenmp-targets=x86_64-unknown-linux-gnu -emit-llvm-bc %s -o %t-x86_64-host.bc
				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple x86_64-unknown-linux-gnu -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-x86_64-host.bc -o - \| FileCheck %s --check-prefix DEVICE

				// expected-no-diagnostics

				#pragma omp declare target
				#pragma omp begin declare variant match(device = {kind(nohost)})
				int G1;
				static int G2;
				#pragma omp end declare variant
				#pragma omp end declare target

				#pragma omp begin declare target device_type(nohost)
				int G3;
				static int G4;
				#pragma omp end declare target

				#pragma omp declare target
				int G5;
				static int G6;
				#pragma omp end declare target

				#pragma omp declare target to(G5, G6) device_type(nohost)

				#pragma omp begin declare target device_type(host)
				int G7;
				static int G8;
				#pragma omp end declare target

				#pragma omp declare target
				int G9;
				static int G10;
				#pragma omp end declare target

				int G11;
				static int G12;
				#pragma omp declare target to(G9, G10, G11, G12) device_type(host)

				// TODO: The code below should probably work but it is not 100% clear.
				#if 0
				#pragma omp declare target
				#pragma omp begin declare variant match(device = {kind(host)})
				int GX;
				static int GY;
				#pragma omp end declare variant
				#pragma omp end declare target
				#endif

				// TODO: It is odd, probably wrong, that we don't mangle all variables.

				// DEVICE-DAG: @G1 = hidden {{.*}}global i32 0, align 4
				// DEVICE-DAG: @_ZL2G2 = internal {{.*}}global i32 0, align 4
				// DEVICE-DAG: @G3 = hidden {{.*}}global i32 0, align 4
				// DEVICE-DAG: @_ZL2G4 = internal {{.*}}global i32 0, align 4
				// DEVICE-DAG: @G5 = hidden {{.*}}global i32 0, align 4
				// DEVICE-DAG: @_ZL2G6 = internal {{.*}}global i32 0, align 4
				// DEVICE-NOT: ref
				// DEVICE-NOT: llvm.used
				// DEVICE-NOT: omp_offload

				// HOST-DAG: @G7 = dso_local global i32 0, align 4
				// HOST-DAG: @_ZL2G8 = internal global i32 0, align 4
				// HOST-DAG: @G9 = dso_local global i32 0, align 4
				// HOST-DAG: @_ZL3G10 = internal global i32 0, align 4
				// HOST-DAG: @G11 = dso_local global i32 0, align 4
				// HOST-DAG: @_ZL3G12 = internal global i32 0, align 4

clang/test/OpenMP/for_firstprivate_codegen.cpp

	Show First 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK1-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK1-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK1-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK1-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK1-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK1: arraydestroy.done1:			// CHECK1: arraydestroy.done1:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK1-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK1-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK1-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK1-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 463 Lines • ▼ Show 20 Lines
	// CHECK1-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK1-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8
	// CHECK1-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK1-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK1-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK1-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK1-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_for_firstprivate_codegen.cpp			// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_for_firstprivate_codegen.cpp
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @__cxx_global_var_init()			// CHECK1-NEXT: call void @__cxx_global_var_init()
	// CHECK1-NEXT: call void @__cxx_global_var_init.1()			// CHECK1-NEXT: call void @__cxx_global_var_init.1()
	// CHECK1-NEXT: call void @__cxx_global_var_init.2()			// CHECK1-NEXT: call void @__cxx_global_var_init.2()
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK2-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK2-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK2-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK2-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK2-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK2: arraydestroy.done1:			// CHECK2: arraydestroy.done1:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK2-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK2-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK2-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK2-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 463 Lines • ▼ Show 20 Lines
	// CHECK2-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK2-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8
	// CHECK2-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK2-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK2-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK2-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK2-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_for_firstprivate_codegen.cpp			// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_for_firstprivate_codegen.cpp
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @__cxx_global_var_init()			// CHECK2-NEXT: call void @__cxx_global_var_init()
	// CHECK2-NEXT: call void @__cxx_global_var_init.1()			// CHECK2-NEXT: call void @__cxx_global_var_init.1()
	// CHECK2-NEXT: call void @__cxx_global_var_init.2()			// CHECK2-NEXT: call void @__cxx_global_var_init.2()
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK3-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK3-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK3-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK3-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK3-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK3: arraydestroy.done1:			// CHECK3: arraydestroy.done1:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK3-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK3-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK3-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK3-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	// CHECK3: omp.inner.for.end:			// CHECK3: omp.inner.for.end:
	// CHECK3-NEXT: br label [[OMP_LOOP_EXIT:%.*]]			// CHECK3-NEXT: br label [[OMP_LOOP_EXIT:%.*]]
	// CHECK3: omp.loop.exit:			// CHECK3: omp.loop.exit:
	// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]])			// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]])
	// CHECK3-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP6]])			// CHECK3-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP6]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK3-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK3-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK3-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK3-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_for_firstprivate_codegen.cpp			// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_for_firstprivate_codegen.cpp
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @__cxx_global_var_init()			// CHECK3-NEXT: call void @__cxx_global_var_init()
	// CHECK3-NEXT: call void @__cxx_global_var_init.1()			// CHECK3-NEXT: call void @__cxx_global_var_init.1()
	// CHECK3-NEXT: call void @__cxx_global_var_init.2()			// CHECK3-NEXT: call void @__cxx_global_var_init.2()
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK4-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK4-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK4-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK4-NEXT: ret void
				//
				//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: ret void
				//
				//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK4-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK4-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK4: arraydestroy.done1:			// CHECK4: arraydestroy.done1:
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK4-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK4-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK4-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK4-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK4-NEXT: ret void
				//
				//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 160 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR1:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32, i32 }> [[BLOCK]], i32 0, i32 5			// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR1:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32, i32 }> [[BLOCK]], i32 0, i32 5
	// CHECK4-NEXT: [[TMP0:%.]] = load i32, i32** [[BLOCK_CAPTURE_ADDR1]], align 8			// CHECK4-NEXT: [[TMP0:%.]] = load i32, i32** [[BLOCK_CAPTURE_ADDR1]], align 8
	// CHECK4-NEXT: store i32 2, i32* [[TMP0]], align 4			// CHECK4-NEXT: store i32 2, i32* [[TMP0]], align 4
	// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR2:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32, i32 }> [[BLOCK]], i32 0, i32 7			// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR2:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32, i32 }> [[BLOCK]], i32 0, i32 7
	// CHECK4-NEXT: store i32 4, i32* [[BLOCK_CAPTURE_ADDR2]], align 4			// CHECK4-NEXT: store i32 4, i32* [[BLOCK_CAPTURE_ADDR2]], align 4
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK4-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK4-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK4-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK4-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_for_firstprivate_codegen.cpp			// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_for_firstprivate_codegen.cpp
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @__cxx_global_var_init()			// CHECK4-NEXT: call void @__cxx_global_var_init()
	// CHECK4-NEXT: call void @__cxx_global_var_init.1()			// CHECK4-NEXT: call void @__cxx_global_var_init.1()
	// CHECK4-NEXT: call void @__cxx_global_var_init.2()			// CHECK4-NEXT: call void @__cxx_global_var_init.2()
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	▲ Show 20 Lines • Show All 958 Lines • Show Last 20 Lines

clang/test/OpenMP/irbuilder_for_iterator.cpp

Show All 22 Lines	#pragma omp for
for (MyIterator it = MyIterator(7); it != MyIterator(41); ++it) {		for (MyIterator it = MyIterator(7); it != MyIterator(41); ++it) {
unsigned i = *it;		unsigned i = *it;
a[i] = b[i] * c[i];		a[i] = b[i] * c[i];
}		}
}		}

#endif // HEADER		#endif // HEADER
// CHECK-LABEL: define {{[^@]+}}@workshareloop_iterator		// CHECK-LABEL: define {{[^@]+}}@workshareloop_iterator
// CHECK-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]]) [[ATTR0:#.]] {		// CHECK-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.*]]) #[[ATTR0:[0-9]+]] {
// CHECK-NEXT: entry:		// CHECK-NEXT: entry:
// CHECK-NEXT: [[A_ADDR:%.]] = alloca float, align 8		// CHECK-NEXT: [[A_ADDR:%.]] = alloca float, align 8
// CHECK-NEXT: [[B_ADDR:%.]] = alloca float, align 8		// CHECK-NEXT: [[B_ADDR:%.]] = alloca float, align 8
// CHECK-NEXT: [[C_ADDR:%.]] = alloca float, align 8		// CHECK-NEXT: [[C_ADDR:%.]] = alloca float, align 8
// CHECK-NEXT: [[IT:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1		// CHECK-NEXT: [[IT:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1
// CHECK-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8		// CHECK-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8
// CHECK-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1		// CHECK-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1
// CHECK-NEXT: [[DOTCOUNT_ADDR:%.*]] = alloca i64, align 8		// CHECK-NEXT: [[DOTCOUNT_ADDR:%.*]] = alloca i64, align 8
Show All 13 Lines
// CHECK-NEXT: call void @__captured_stmt(i64* [[DOTCOUNT_ADDR]], %struct.anon* [[AGG_CAPTURED]])		// CHECK-NEXT: call void @__captured_stmt(i64* [[DOTCOUNT_ADDR]], %struct.anon* [[AGG_CAPTURED]])
// CHECK-NEXT: [[DOTCOUNT:%.]] = load i64, i64 [[DOTCOUNT_ADDR]], align 8		// CHECK-NEXT: [[DOTCOUNT:%.]] = load i64, i64 [[DOTCOUNT_ADDR]], align 8
// CHECK-NEXT: br label [[OMP_LOOP_PREHEADER:%.*]]		// CHECK-NEXT: br label [[OMP_LOOP_PREHEADER:%.*]]
// CHECK: omp_loop.preheader:		// CHECK: omp_loop.preheader:
// CHECK-NEXT: store i64 0, i64* [[P_LOWERBOUND]], align 8		// CHECK-NEXT: store i64 0, i64* [[P_LOWERBOUND]], align 8
// CHECK-NEXT: [[TMP2:%.*]] = sub i64 [[DOTCOUNT]], 1		// CHECK-NEXT: [[TMP2:%.*]] = sub i64 [[DOTCOUNT]], 1
// CHECK-NEXT: store i64 [[TMP2]], i64* [[P_UPPERBOUND]], align 8		// CHECK-NEXT: store i64 [[TMP2]], i64* [[P_UPPERBOUND]], align 8
// CHECK-NEXT: store i64 1, i64* [[P_STRIDE]], align 8		// CHECK-NEXT: store i64 1, i64* [[P_STRIDE]], align 8
// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1:@.*]])		// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
// CHECK-NEXT: call void @__kmpc_for_static_init_8u(%struct.ident_t* [[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]], i32 34, i32* [[P_LASTITER]], i64* [[P_LOWERBOUND]], i64* [[P_UPPERBOUND]], i64* [[P_STRIDE]], i64 1, i64 1)		// CHECK-NEXT: call void @__kmpc_for_static_init_8u(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]], i32 34, i32* [[P_LASTITER]], i64* [[P_LOWERBOUND]], i64* [[P_UPPERBOUND]], i64* [[P_STRIDE]], i64 1, i64 1)
// CHECK-NEXT: [[TMP3:%.]] = load i64, i64 [[P_LOWERBOUND]], align 8		// CHECK-NEXT: [[TMP3:%.]] = load i64, i64 [[P_LOWERBOUND]], align 8
// CHECK-NEXT: [[TMP4:%.]] = load i64, i64 [[P_UPPERBOUND]], align 8		// CHECK-NEXT: [[TMP4:%.]] = load i64, i64 [[P_UPPERBOUND]], align 8
// CHECK-NEXT: [[TMP5:%.*]] = sub i64 [[TMP4]], [[TMP3]]		// CHECK-NEXT: [[TMP5:%.*]] = sub i64 [[TMP4]], [[TMP3]]
// CHECK-NEXT: [[TMP6:%.*]] = add i64 [[TMP5]], 1		// CHECK-NEXT: [[TMP6:%.*]] = add i64 [[TMP5]], 1
// CHECK-NEXT: br label [[OMP_LOOP_HEADER:%.*]]		// CHECK-NEXT: br label [[OMP_LOOP_HEADER:%.*]]
// CHECK: omp_loop.header:		// CHECK: omp_loop.header:
// CHECK-NEXT: [[OMP_LOOP_IV:%.]] = phi i64 [ 0, [[OMP_LOOP_PREHEADER]] ], [ [[OMP_LOOP_NEXT:%.]], [[OMP_LOOP_INC:%.*]] ]		// CHECK-NEXT: [[OMP_LOOP_IV:%.]] = phi i64 [ 0, [[OMP_LOOP_PREHEADER]] ], [ [[OMP_LOOP_NEXT:%.]], [[OMP_LOOP_INC:%.*]] ]
// CHECK-NEXT: br label [[OMP_LOOP_COND:%.*]]		// CHECK-NEXT: br label [[OMP_LOOP_COND:%.*]]
Show All 21 Lines
// CHECK-NEXT: [[IDXPROM4:%.*]] = zext i32 [[TMP15]] to i64		// CHECK-NEXT: [[IDXPROM4:%.*]] = zext i32 [[TMP15]] to i64
// CHECK-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds float, float [[TMP14]], i64 [[IDXPROM4]]		// CHECK-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds float, float [[TMP14]], i64 [[IDXPROM4]]
// CHECK-NEXT: store float [[MUL]], float* [[ARRAYIDX5]], align 4		// CHECK-NEXT: store float [[MUL]], float* [[ARRAYIDX5]], align 4
// CHECK-NEXT: br label [[OMP_LOOP_INC]]		// CHECK-NEXT: br label [[OMP_LOOP_INC]]
// CHECK: omp_loop.inc:		// CHECK: omp_loop.inc:
// CHECK-NEXT: [[OMP_LOOP_NEXT]] = add nuw i64 [[OMP_LOOP_IV]], 1		// CHECK-NEXT: [[OMP_LOOP_NEXT]] = add nuw i64 [[OMP_LOOP_IV]], 1
// CHECK-NEXT: br label [[OMP_LOOP_HEADER]]		// CHECK-NEXT: br label [[OMP_LOOP_HEADER]]
// CHECK: omp_loop.exit:		// CHECK: omp_loop.exit:
// CHECK-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* [[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]])		// CHECK-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]])
// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1]])		// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
// CHECK-NEXT: call void @__kmpc_barrier(%struct.ident_t* [[GLOB2:@.*]], i32 [[OMP_GLOBAL_THREAD_NUM6]])		// CHECK-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[OMP_GLOBAL_THREAD_NUM6]])
// CHECK-NEXT: br label [[OMP_LOOP_AFTER:%.*]]		// CHECK-NEXT: br label [[OMP_LOOP_AFTER:%.*]]
// CHECK: omp_loop.after:		// CHECK: omp_loop.after:
// CHECK-NEXT: ret void		// CHECK-NEXT: ret void
//		//
//		//
// CHECK-LABEL: define {{[^@]+}}@__captured_stmt		// CHECK-LABEL: define {{[^@]+}}@__captured_stmt
// CHECK-SAME: (i64* nonnull align 8 dereferenceable(8) [[DISTANCE:%.]], %struct.anon noalias [[__CONTEXT:%.]]) [[ATTR2:#.]] {		// CHECK-SAME: (i64* nonnull align 8 dereferenceable(8) [[DISTANCE:%.]], %struct.anon noalias [[__CONTEXT:%.*]]) #[[ATTR2:[0-9]+]] {
// CHECK-NEXT: entry:		// CHECK-NEXT: entry:
// CHECK-NEXT: [[DISTANCE_ADDR:%.]] = alloca i64, align 8		// CHECK-NEXT: [[DISTANCE_ADDR:%.]] = alloca i64, align 8
// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon, align 8		// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon, align 8
// CHECK-NEXT: [[DOTSTART:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1		// CHECK-NEXT: [[DOTSTART:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1
// CHECK-NEXT: [[DOTSTOP:%.*]] = alloca [[STRUCT_MYITERATOR]], align 1		// CHECK-NEXT: [[DOTSTOP:%.*]] = alloca [[STRUCT_MYITERATOR]], align 1
// CHECK-NEXT: [[DOTSTEP:%.*]] = alloca i64, align 8		// CHECK-NEXT: [[DOTSTEP:%.*]] = alloca i64, align 8
// CHECK-NEXT: store i64* [[DISTANCE]], i64** [[DISTANCE_ADDR]], align 8		// CHECK-NEXT: store i64* [[DISTANCE]], i64** [[DISTANCE_ADDR]], align 8
// CHECK-NEXT: store %struct.anon* [[__CONTEXT]], %struct.anon** [[__CONTEXT_ADDR]], align 8		// CHECK-NEXT: store %struct.anon* [[__CONTEXT]], %struct.anon** [[__CONTEXT_ADDR]], align 8
Show All 22 Lines
// CHECK: cond.end:		// CHECK: cond.end:
// CHECK-NEXT: [[COND:%.*]] = phi i64 [ [[DIV]], [[COND_TRUE]] ], [ [[DIV3]], [[COND_FALSE]] ]		// CHECK-NEXT: [[COND:%.*]] = phi i64 [ [[DIV]], [[COND_TRUE]] ], [ [[DIV3]], [[COND_FALSE]] ]
// CHECK-NEXT: [[TMP6:%.]] = load i64, i64** [[DISTANCE_ADDR]], align 8		// CHECK-NEXT: [[TMP6:%.]] = load i64, i64** [[DISTANCE_ADDR]], align 8
// CHECK-NEXT: store i64 [[COND]], i64* [[TMP6]], align 8		// CHECK-NEXT: store i64 [[COND]], i64* [[TMP6]], align 8
// CHECK-NEXT: ret void		// CHECK-NEXT: ret void
//		//
//		//
// CHECK-LABEL: define {{[^@]+}}@__captured_stmt.1		// CHECK-LABEL: define {{[^@]+}}@__captured_stmt.1
// CHECK-SAME: (%struct.MyIterator* nonnull align 1 dereferenceable(1) [[LOOPVAR:%.]], i64 [[LOGICAL:%.]], %struct.anon.0* noalias [[__CONTEXT:%.*]]) [[ATTR2]] {		// CHECK-SAME: (%struct.MyIterator* nonnull align 1 dereferenceable(1) [[LOOPVAR:%.]], i64 [[LOGICAL:%.]], %struct.anon.0* noalias [[__CONTEXT:%.*]]) #[[ATTR2]] {
// CHECK-NEXT: entry:		// CHECK-NEXT: entry:
// CHECK-NEXT: [[LOOPVAR_ADDR:%.]] = alloca %struct.MyIterator, align 8		// CHECK-NEXT: [[LOOPVAR_ADDR:%.]] = alloca %struct.MyIterator, align 8
// CHECK-NEXT: [[LOGICAL_ADDR:%.*]] = alloca i64, align 8		// CHECK-NEXT: [[LOGICAL_ADDR:%.*]] = alloca i64, align 8
// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon.0, align 8		// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon.0, align 8
// CHECK-NEXT: [[REF_TMP:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1		// CHECK-NEXT: [[REF_TMP:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1
// CHECK-NEXT: store %struct.MyIterator* [[LOOPVAR]], %struct.MyIterator** [[LOOPVAR_ADDR]], align 8		// CHECK-NEXT: store %struct.MyIterator* [[LOOPVAR]], %struct.MyIterator** [[LOOPVAR_ADDR]], align 8
// CHECK-NEXT: store i64 [[LOGICAL]], i64* [[LOGICAL_ADDR]], align 8		// CHECK-NEXT: store i64 [[LOGICAL]], i64* [[LOGICAL_ADDR]], align 8
// CHECK-NEXT: store %struct.anon.0* [[__CONTEXT]], %struct.anon.0** [[__CONTEXT_ADDR]], align 8		// CHECK-NEXT: store %struct.anon.0* [[__CONTEXT]], %struct.anon.0** [[__CONTEXT_ADDR]], align 8
// CHECK-NEXT: [[TMP0:%.]] = load %struct.anon.0, %struct.anon.0** [[__CONTEXT_ADDR]], align 8		// CHECK-NEXT: [[TMP0:%.]] = load %struct.anon.0, %struct.anon.0** [[__CONTEXT_ADDR]], align 8
// CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds [[STRUCT_ANON_0:%.]], %struct.anon.0* [[TMP0]], i32 0, i32 0		// CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds [[STRUCT_ANON_0:%.]], %struct.anon.0* [[TMP0]], i32 0, i32 0
// CHECK-NEXT: [[TMP2:%.]] = load i64, i64 [[LOGICAL_ADDR]], align 8		// CHECK-NEXT: [[TMP2:%.]] = load i64, i64 [[LOGICAL_ADDR]], align 8
// CHECK-NEXT: [[MUL:%.*]] = mul i64 1, [[TMP2]]		// CHECK-NEXT: [[MUL:%.*]] = mul i64 1, [[TMP2]]
// CHECK-NEXT: [[CONV:%.*]] = trunc i64 [[MUL]] to i32		// CHECK-NEXT: [[CONV:%.*]] = trunc i64 [[MUL]] to i32
// CHECK-NEXT: call void @_ZNK10MyIteratorplEj(%struct.MyIterator* sret(%struct.MyIterator) align 1 [[REF_TMP]], %struct.MyIterator* nonnull dereferenceable(1) [[TMP1]], i32 [[CONV]])		// CHECK-NEXT: call void @_ZNK10MyIteratorplEj(%struct.MyIterator* sret([[STRUCT_MYITERATOR]]) align 1 [[REF_TMP]], %struct.MyIterator* nonnull dereferenceable(1) [[TMP1]], i32 [[CONV]])
// CHECK-NEXT: [[TMP3:%.]] = load %struct.MyIterator, %struct.MyIterator** [[LOOPVAR_ADDR]], align 8		// CHECK-NEXT: [[TMP3:%.]] = load %struct.MyIterator, %struct.MyIterator** [[LOOPVAR_ADDR]], align 8
// CHECK-NEXT: [[CALL:%.]] = call nonnull align 1 dereferenceable(1) %struct.MyIterator @_ZN10MyIteratoraSERKS_(%struct.MyIterator* nonnull dereferenceable(1) [[TMP3]], %struct.MyIterator* nonnull align 1 dereferenceable(1) [[REF_TMP]])		// CHECK-NEXT: [[CALL:%.]] = call nonnull align 1 dereferenceable(1) %struct.MyIterator @_ZN10MyIteratoraSERKS_(%struct.MyIterator* nonnull dereferenceable(1) [[TMP3]], %struct.MyIterator* nonnull align 1 dereferenceable(1) [[REF_TMP]])
// CHECK-NEXT: ret void		// CHECK-NEXT: ret void
//		//

clang/test/OpenMP/irbuilder_for_rangefor.cpp

	Show All 28 Lines
	#pragma omp for			#pragma omp for
	for (unsigned i : MyRange(42)) {			for (unsigned i : MyRange(42)) {
	a[i] = b[i] * c[i];			a[i] = b[i] * c[i];
	}			}
	}			}

	#endif // HEADER			#endif // HEADER
	// CHECK-LABEL: define {{[^@]+}}@workshareloop_rangefor			// CHECK-LABEL: define {{[^@]+}}@workshareloop_rangefor
	// CHECK-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]]) [[ATTR0:#.]] {			// CHECK-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK-NEXT: [[__RANGE2:%.]] = alloca %struct.MyRange, align 8			// CHECK-NEXT: [[__RANGE2:%.]] = alloca %struct.MyRange, align 8
	// CHECK-NEXT: [[REF_TMP:%.]] = alloca [[STRUCT_MYRANGE:%.]], align 1			// CHECK-NEXT: [[REF_TMP:%.]] = alloca [[STRUCT_MYRANGE:%.]], align 1
	// CHECK-NEXT: [[__BEGIN2:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1			// CHECK-NEXT: [[__BEGIN2:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1
	// CHECK-NEXT: [[__END2:%.*]] = alloca [[STRUCT_MYITERATOR]], align 1			// CHECK-NEXT: [[__END2:%.*]] = alloca [[STRUCT_MYITERATOR]], align 1
	// CHECK-NEXT: [[I:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[I:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8			// CHECK-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8
	// CHECK-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1			// CHECK-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1
	// CHECK-NEXT: [[DOTCOUNT_ADDR:%.*]] = alloca i64, align 8			// CHECK-NEXT: [[DOTCOUNT_ADDR:%.*]] = alloca i64, align 8
	// CHECK-NEXT: [[P_LASTITER:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[P_LASTITER:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[P_LOWERBOUND:%.*]] = alloca i64, align 8			// CHECK-NEXT: [[P_LOWERBOUND:%.*]] = alloca i64, align 8
	// CHECK-NEXT: [[P_UPPERBOUND:%.*]] = alloca i64, align 8			// CHECK-NEXT: [[P_UPPERBOUND:%.*]] = alloca i64, align 8
	// CHECK-NEXT: [[P_STRIDE:%.*]] = alloca i64, align 8			// CHECK-NEXT: [[P_STRIDE:%.*]] = alloca i64, align 8
	// CHECK-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK-NEXT: store float* [[B]], float** [[B_ADDR]], align 8			// CHECK-NEXT: store float* [[B]], float** [[B_ADDR]], align 8
	// CHECK-NEXT: store float* [[C]], float** [[C_ADDR]], align 8			// CHECK-NEXT: store float* [[C]], float** [[C_ADDR]], align 8
	// CHECK-NEXT: call void @_ZN7MyRangeC1Ei(%struct.MyRange* nonnull dereferenceable(1) [[REF_TMP]], i32 42)			// CHECK-NEXT: call void @_ZN7MyRangeC1Ei(%struct.MyRange* nonnull dereferenceable(1) [[REF_TMP]], i32 42)
	// CHECK-NEXT: store %struct.MyRange* [[REF_TMP]], %struct.MyRange** [[__RANGE2]], align 8			// CHECK-NEXT: store %struct.MyRange* [[REF_TMP]], %struct.MyRange** [[__RANGE2]], align 8
	// CHECK-NEXT: [[TMP0:%.]] = load %struct.MyRange, %struct.MyRange** [[__RANGE2]], align 8			// CHECK-NEXT: [[TMP0:%.]] = load %struct.MyRange, %struct.MyRange** [[__RANGE2]], align 8
	// CHECK-NEXT: call void @_ZN7MyRange5beginEv(%struct.MyIterator* sret(%struct.MyIterator) align 1 [[__BEGIN2]], %struct.MyRange* nonnull dereferenceable(1) [[TMP0]])			// CHECK-NEXT: call void @_ZN7MyRange5beginEv(%struct.MyIterator* sret([[STRUCT_MYITERATOR]]) align 1 [[__BEGIN2]], %struct.MyRange* nonnull dereferenceable(1) [[TMP0]])
	// CHECK-NEXT: [[TMP1:%.]] = load %struct.MyRange, %struct.MyRange** [[__RANGE2]], align 8			// CHECK-NEXT: [[TMP1:%.]] = load %struct.MyRange, %struct.MyRange** [[__RANGE2]], align 8
	// CHECK-NEXT: call void @_ZN7MyRange3endEv(%struct.MyIterator* sret(%struct.MyIterator) align 1 [[__END2]], %struct.MyRange* nonnull dereferenceable(1) [[TMP1]])			// CHECK-NEXT: call void @_ZN7MyRange3endEv(%struct.MyIterator* sret([[STRUCT_MYITERATOR]]) align 1 [[__END2]], %struct.MyRange* nonnull dereferenceable(1) [[TMP1]])
	// CHECK-NEXT: [[CALL:%.]] = call i32 @_ZNK10MyIteratordeEv(%struct.MyIterator nonnull dereferenceable(1) [[__BEGIN2]])			// CHECK-NEXT: [[CALL:%.]] = call i32 @_ZNK10MyIteratordeEv(%struct.MyIterator nonnull dereferenceable(1) [[__BEGIN2]])
	// CHECK-NEXT: store i32 [[CALL]], i32* [[I]], align 4			// CHECK-NEXT: store i32 [[CALL]], i32* [[I]], align 4
	// CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds [[STRUCT_ANON]], %struct.anon [[AGG_CAPTURED]], i32 0, i32 0			// CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds [[STRUCT_ANON]], %struct.anon [[AGG_CAPTURED]], i32 0, i32 0
	// CHECK-NEXT: store %struct.MyIterator* [[__BEGIN2]], %struct.MyIterator** [[TMP2]], align 8			// CHECK-NEXT: store %struct.MyIterator* [[__BEGIN2]], %struct.MyIterator** [[TMP2]], align 8
	// CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT_ANON]], %struct.anon [[AGG_CAPTURED]], i32 0, i32 1			// CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT_ANON]], %struct.anon [[AGG_CAPTURED]], i32 0, i32 1
	// CHECK-NEXT: store %struct.MyIterator* [[__END2]], %struct.MyIterator** [[TMP3]], align 8			// CHECK-NEXT: store %struct.MyIterator* [[__END2]], %struct.MyIterator** [[TMP3]], align 8
	// CHECK-NEXT: [[TMP4:%.]] = getelementptr inbounds [[STRUCT_ANON_0]], %struct.anon.0 [[AGG_CAPTURED1]], i32 0, i32 0			// CHECK-NEXT: [[TMP4:%.]] = getelementptr inbounds [[STRUCT_ANON_0]], %struct.anon.0 [[AGG_CAPTURED1]], i32 0, i32 0
	// CHECK-NEXT: call void @_ZN10MyIteratorC1ERKS_(%struct.MyIterator* nonnull dereferenceable(1) [[TMP4]], %struct.MyIterator* nonnull align 1 dereferenceable(1) [[__BEGIN2]])			// CHECK-NEXT: call void @_ZN10MyIteratorC1ERKS_(%struct.MyIterator* nonnull dereferenceable(1) [[TMP4]], %struct.MyIterator* nonnull align 1 dereferenceable(1) [[__BEGIN2]])
	// CHECK-NEXT: call void @__captured_stmt(i64* [[DOTCOUNT_ADDR]], %struct.anon* [[AGG_CAPTURED]])			// CHECK-NEXT: call void @__captured_stmt(i64* [[DOTCOUNT_ADDR]], %struct.anon* [[AGG_CAPTURED]])
	// CHECK-NEXT: [[DOTCOUNT:%.]] = load i64, i64 [[DOTCOUNT_ADDR]], align 8			// CHECK-NEXT: [[DOTCOUNT:%.]] = load i64, i64 [[DOTCOUNT_ADDR]], align 8
	// CHECK-NEXT: br label [[OMP_LOOP_PREHEADER:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_PREHEADER:%.*]]
	// CHECK: omp_loop.preheader:			// CHECK: omp_loop.preheader:
	// CHECK-NEXT: store i64 0, i64* [[P_LOWERBOUND]], align 8			// CHECK-NEXT: store i64 0, i64* [[P_LOWERBOUND]], align 8
	// CHECK-NEXT: [[TMP5:%.*]] = sub i64 [[DOTCOUNT]], 1			// CHECK-NEXT: [[TMP5:%.*]] = sub i64 [[DOTCOUNT]], 1
	// CHECK-NEXT: store i64 [[TMP5]], i64* [[P_UPPERBOUND]], align 8			// CHECK-NEXT: store i64 [[TMP5]], i64* [[P_UPPERBOUND]], align 8
	// CHECK-NEXT: store i64 1, i64* [[P_STRIDE]], align 8			// CHECK-NEXT: store i64 1, i64* [[P_STRIDE]], align 8
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1:@.*]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK-NEXT: call void @__kmpc_for_static_init_8u(%struct.ident_t* [[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]], i32 34, i32* [[P_LASTITER]], i64* [[P_LOWERBOUND]], i64* [[P_UPPERBOUND]], i64* [[P_STRIDE]], i64 1, i64 1)			// CHECK-NEXT: call void @__kmpc_for_static_init_8u(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]], i32 34, i32* [[P_LASTITER]], i64* [[P_LOWERBOUND]], i64* [[P_UPPERBOUND]], i64* [[P_STRIDE]], i64 1, i64 1)
	// CHECK-NEXT: [[TMP6:%.]] = load i64, i64 [[P_LOWERBOUND]], align 8			// CHECK-NEXT: [[TMP6:%.]] = load i64, i64 [[P_LOWERBOUND]], align 8
	// CHECK-NEXT: [[TMP7:%.]] = load i64, i64 [[P_UPPERBOUND]], align 8			// CHECK-NEXT: [[TMP7:%.]] = load i64, i64 [[P_UPPERBOUND]], align 8
	// CHECK-NEXT: [[TMP8:%.*]] = sub i64 [[TMP7]], [[TMP6]]			// CHECK-NEXT: [[TMP8:%.*]] = sub i64 [[TMP7]], [[TMP6]]
	// CHECK-NEXT: [[TMP9:%.*]] = add i64 [[TMP8]], 1			// CHECK-NEXT: [[TMP9:%.*]] = add i64 [[TMP8]], 1
	// CHECK-NEXT: br label [[OMP_LOOP_HEADER:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_HEADER:%.*]]
	// CHECK: omp_loop.header:			// CHECK: omp_loop.header:
	// CHECK-NEXT: [[OMP_LOOP_IV:%.]] = phi i64 [ 0, [[OMP_LOOP_PREHEADER]] ], [ [[OMP_LOOP_NEXT:%.]], [[OMP_LOOP_INC:%.*]] ]			// CHECK-NEXT: [[OMP_LOOP_IV:%.]] = phi i64 [ 0, [[OMP_LOOP_PREHEADER]] ], [ [[OMP_LOOP_NEXT:%.]], [[OMP_LOOP_INC:%.*]] ]
	// CHECK-NEXT: br label [[OMP_LOOP_COND:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_COND:%.*]]
	Show All 19 Lines
	// CHECK-NEXT: [[IDXPROM4:%.*]] = zext i32 [[TMP18]] to i64			// CHECK-NEXT: [[IDXPROM4:%.*]] = zext i32 [[TMP18]] to i64
	// CHECK-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds float, float [[TMP17]], i64 [[IDXPROM4]]			// CHECK-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds float, float [[TMP17]], i64 [[IDXPROM4]]
	// CHECK-NEXT: store float [[MUL]], float* [[ARRAYIDX5]], align 4			// CHECK-NEXT: store float [[MUL]], float* [[ARRAYIDX5]], align 4
	// CHECK-NEXT: br label [[OMP_LOOP_INC]]			// CHECK-NEXT: br label [[OMP_LOOP_INC]]
	// CHECK: omp_loop.inc:			// CHECK: omp_loop.inc:
	// CHECK-NEXT: [[OMP_LOOP_NEXT]] = add nuw i64 [[OMP_LOOP_IV]], 1			// CHECK-NEXT: [[OMP_LOOP_NEXT]] = add nuw i64 [[OMP_LOOP_IV]], 1
	// CHECK-NEXT: br label [[OMP_LOOP_HEADER]]			// CHECK-NEXT: br label [[OMP_LOOP_HEADER]]
	// CHECK: omp_loop.exit:			// CHECK: omp_loop.exit:
	// CHECK-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* [[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]])			// CHECK-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]])
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK-NEXT: call void @__kmpc_barrier(%struct.ident_t* [[GLOB2:@.*]], i32 [[OMP_GLOBAL_THREAD_NUM6]])			// CHECK-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[OMP_GLOBAL_THREAD_NUM6]])
	// CHECK-NEXT: br label [[OMP_LOOP_AFTER:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_AFTER:%.*]]
	// CHECK: omp_loop.after:			// CHECK: omp_loop.after:
	// CHECK-NEXT: ret void			// CHECK-NEXT: ret void
	//			//
	//			//
	// CHECK-LABEL: define {{[^@]+}}@__captured_stmt			// CHECK-LABEL: define {{[^@]+}}@__captured_stmt
	// CHECK-SAME: (i64* nonnull align 8 dereferenceable(8) [[DISTANCE:%.]], %struct.anon noalias [[__CONTEXT:%.]]) [[ATTR2:#.]] {			// CHECK-SAME: (i64* nonnull align 8 dereferenceable(8) [[DISTANCE:%.]], %struct.anon noalias [[__CONTEXT:%.*]]) #[[ATTR2:[0-9]+]] {
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[DISTANCE_ADDR:%.]] = alloca i64, align 8			// CHECK-NEXT: [[DISTANCE_ADDR:%.]] = alloca i64, align 8
	// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon, align 8			// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon, align 8
	// CHECK-NEXT: [[DOTSTART:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1			// CHECK-NEXT: [[DOTSTART:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1
	// CHECK-NEXT: [[DOTSTOP:%.*]] = alloca [[STRUCT_MYITERATOR]], align 1			// CHECK-NEXT: [[DOTSTOP:%.*]] = alloca [[STRUCT_MYITERATOR]], align 1
	// CHECK-NEXT: [[DOTSTEP:%.*]] = alloca i64, align 8			// CHECK-NEXT: [[DOTSTEP:%.*]] = alloca i64, align 8
	// CHECK-NEXT: store i64* [[DISTANCE]], i64** [[DISTANCE_ADDR]], align 8			// CHECK-NEXT: store i64* [[DISTANCE]], i64** [[DISTANCE_ADDR]], align 8
	// CHECK-NEXT: store %struct.anon* [[__CONTEXT]], %struct.anon** [[__CONTEXT_ADDR]], align 8			// CHECK-NEXT: store %struct.anon* [[__CONTEXT]], %struct.anon** [[__CONTEXT_ADDR]], align 8
	Show All 24 Lines
	// CHECK: cond.end:			// CHECK: cond.end:
	// CHECK-NEXT: [[COND:%.*]] = phi i64 [ [[DIV]], [[COND_TRUE]] ], [ [[DIV3]], [[COND_FALSE]] ]			// CHECK-NEXT: [[COND:%.*]] = phi i64 [ [[DIV]], [[COND_TRUE]] ], [ [[DIV3]], [[COND_FALSE]] ]
	// CHECK-NEXT: [[TMP8:%.]] = load i64, i64** [[DISTANCE_ADDR]], align 8			// CHECK-NEXT: [[TMP8:%.]] = load i64, i64** [[DISTANCE_ADDR]], align 8
	// CHECK-NEXT: store i64 [[COND]], i64* [[TMP8]], align 8			// CHECK-NEXT: store i64 [[COND]], i64* [[TMP8]], align 8
	// CHECK-NEXT: ret void			// CHECK-NEXT: ret void
	//			//
	//			//
	// CHECK-LABEL: define {{[^@]+}}@__captured_stmt.1			// CHECK-LABEL: define {{[^@]+}}@__captured_stmt.1
	// CHECK-SAME: (i32* nonnull align 4 dereferenceable(4) [[LOOPVAR:%.]], i64 [[LOGICAL:%.]], %struct.anon.0* noalias [[__CONTEXT:%.*]]) [[ATTR2]] {			// CHECK-SAME: (i32* nonnull align 4 dereferenceable(4) [[LOOPVAR:%.]], i64 [[LOGICAL:%.]], %struct.anon.0* noalias [[__CONTEXT:%.*]]) #[[ATTR2]] {
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[LOOPVAR_ADDR:%.]] = alloca i32, align 8			// CHECK-NEXT: [[LOOPVAR_ADDR:%.]] = alloca i32, align 8
	// CHECK-NEXT: [[LOGICAL_ADDR:%.*]] = alloca i64, align 8			// CHECK-NEXT: [[LOGICAL_ADDR:%.*]] = alloca i64, align 8
	// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon.0, align 8			// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon.0, align 8
	// CHECK-NEXT: [[REF_TMP:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1			// CHECK-NEXT: [[REF_TMP:%.]] = alloca [[STRUCT_MYITERATOR:%.]], align 1
	// CHECK-NEXT: store i32* [[LOOPVAR]], i32** [[LOOPVAR_ADDR]], align 8			// CHECK-NEXT: store i32* [[LOOPVAR]], i32** [[LOOPVAR_ADDR]], align 8
	// CHECK-NEXT: store i64 [[LOGICAL]], i64* [[LOGICAL_ADDR]], align 8			// CHECK-NEXT: store i64 [[LOGICAL]], i64* [[LOGICAL_ADDR]], align 8
	// CHECK-NEXT: store %struct.anon.0* [[__CONTEXT]], %struct.anon.0** [[__CONTEXT_ADDR]], align 8			// CHECK-NEXT: store %struct.anon.0* [[__CONTEXT]], %struct.anon.0** [[__CONTEXT_ADDR]], align 8
	// CHECK-NEXT: [[TMP0:%.]] = load %struct.anon.0, %struct.anon.0** [[__CONTEXT_ADDR]], align 8			// CHECK-NEXT: [[TMP0:%.]] = load %struct.anon.0, %struct.anon.0** [[__CONTEXT_ADDR]], align 8
	// CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds [[STRUCT_ANON_0:%.]], %struct.anon.0* [[TMP0]], i32 0, i32 0			// CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds [[STRUCT_ANON_0:%.]], %struct.anon.0* [[TMP0]], i32 0, i32 0
	// CHECK-NEXT: [[TMP2:%.]] = load i64, i64 [[LOGICAL_ADDR]], align 8			// CHECK-NEXT: [[TMP2:%.]] = load i64, i64 [[LOGICAL_ADDR]], align 8
	// CHECK-NEXT: [[MUL:%.*]] = mul i64 1, [[TMP2]]			// CHECK-NEXT: [[MUL:%.*]] = mul i64 1, [[TMP2]]
	// CHECK-NEXT: [[CONV:%.*]] = trunc i64 [[MUL]] to i32			// CHECK-NEXT: [[CONV:%.*]] = trunc i64 [[MUL]] to i32
	// CHECK-NEXT: call void @_ZNK10MyIteratorplEj(%struct.MyIterator* sret(%struct.MyIterator) align 1 [[REF_TMP]], %struct.MyIterator* nonnull dereferenceable(1) [[TMP1]], i32 [[CONV]])			// CHECK-NEXT: call void @_ZNK10MyIteratorplEj(%struct.MyIterator* sret([[STRUCT_MYITERATOR]]) align 1 [[REF_TMP]], %struct.MyIterator* nonnull dereferenceable(1) [[TMP1]], i32 [[CONV]])
	// CHECK-NEXT: [[CALL:%.]] = call i32 @_ZNK10MyIteratordeEv(%struct.MyIterator nonnull dereferenceable(1) [[REF_TMP]])			// CHECK-NEXT: [[CALL:%.]] = call i32 @_ZNK10MyIteratordeEv(%struct.MyIterator nonnull dereferenceable(1) [[REF_TMP]])
	// CHECK-NEXT: [[TMP3:%.]] = load i32, i32** [[LOOPVAR_ADDR]], align 8			// CHECK-NEXT: [[TMP3:%.]] = load i32, i32** [[LOOPVAR_ADDR]], align 8
	// CHECK-NEXT: store i32 [[CALL]], i32* [[TMP3]], align 4			// CHECK-NEXT: store i32 [[CALL]], i32* [[TMP3]], align 4
	// CHECK-NEXT: ret void			// CHECK-NEXT: ret void
	//			//

clang/test/OpenMP/irbuilder_for_unsigned.c

	// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py UTC_ARGS: --function-signature --include-generated-funcs			// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py UTC_ARGS: --function-signature --include-generated-funcs
	// RUN: %clang_cc1 -fopenmp-enable-irbuilder -verify -fopenmp -fopenmp-version=45 -x c++ -triple x86_64-unknown-unknown -emit-llvm %s -o - \| FileCheck %s			// RUN: %clang_cc1 -fopenmp-enable-irbuilder -verify -fopenmp -fopenmp-version=45 -x c++ -triple x86_64-unknown-unknown -emit-llvm %s -o - \| FileCheck %s
	// expected-no-diagnostics			// expected-no-diagnostics

	#ifndef HEADER			#ifndef HEADER
	#define HEADER			#define HEADER

	extern "C" void workshareloop_unsigned(float a, float b, float c, float d) {			extern "C" void workshareloop_unsigned(float a, float b, float c, float d) {
	#pragma omp for			#pragma omp for
	for (unsigned i = 33; i < 32000000; i += 7) {			for (unsigned i = 33; i < 32000000; i += 7) {
	a[i] = b[i] * c[i] * d[i];			a[i] = b[i] * c[i] * d[i];
	}			}
	}			}

	#endif // HEADER			#endif // HEADER
	// CHECK-LABEL: define {{[^@]+}}@workshareloop_unsigned			// CHECK-LABEL: define {{[^@]+}}@workshareloop_unsigned
	// CHECK-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.]]) [[ATTR0:#.]] {			// CHECK-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK-NEXT: [[D_ADDR:%.]] = alloca float, align 8			// CHECK-NEXT: [[D_ADDR:%.]] = alloca float, align 8
	// CHECK-NEXT: [[I:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[I:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8			// CHECK-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8
	// CHECK-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 4			// CHECK-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 4
	Show All 15 Lines
	// CHECK-NEXT: call void @__captured_stmt(i32* [[DOTCOUNT_ADDR]], %struct.anon* [[AGG_CAPTURED]])			// CHECK-NEXT: call void @__captured_stmt(i32* [[DOTCOUNT_ADDR]], %struct.anon* [[AGG_CAPTURED]])
	// CHECK-NEXT: [[DOTCOUNT:%.]] = load i32, i32 [[DOTCOUNT_ADDR]], align 4			// CHECK-NEXT: [[DOTCOUNT:%.]] = load i32, i32 [[DOTCOUNT_ADDR]], align 4
	// CHECK-NEXT: br label [[OMP_LOOP_PREHEADER:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_PREHEADER:%.*]]
	// CHECK: omp_loop.preheader:			// CHECK: omp_loop.preheader:
	// CHECK-NEXT: store i32 0, i32* [[P_LOWERBOUND]], align 4			// CHECK-NEXT: store i32 0, i32* [[P_LOWERBOUND]], align 4
	// CHECK-NEXT: [[TMP3:%.*]] = sub i32 [[DOTCOUNT]], 1			// CHECK-NEXT: [[TMP3:%.*]] = sub i32 [[DOTCOUNT]], 1
	// CHECK-NEXT: store i32 [[TMP3]], i32* [[P_UPPERBOUND]], align 4			// CHECK-NEXT: store i32 [[TMP3]], i32* [[P_UPPERBOUND]], align 4
	// CHECK-NEXT: store i32 1, i32* [[P_STRIDE]], align 4			// CHECK-NEXT: store i32 1, i32* [[P_STRIDE]], align 4
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1:@.*]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK-NEXT: call void @__kmpc_for_static_init_4u(%struct.ident_t* [[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]], i32 34, i32* [[P_LASTITER]], i32* [[P_LOWERBOUND]], i32* [[P_UPPERBOUND]], i32* [[P_STRIDE]], i32 1, i32 1)			// CHECK-NEXT: call void @__kmpc_for_static_init_4u(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]], i32 34, i32* [[P_LASTITER]], i32* [[P_LOWERBOUND]], i32* [[P_UPPERBOUND]], i32* [[P_STRIDE]], i32 1, i32 1)
	// CHECK-NEXT: [[TMP4:%.]] = load i32, i32 [[P_LOWERBOUND]], align 4			// CHECK-NEXT: [[TMP4:%.]] = load i32, i32 [[P_LOWERBOUND]], align 4
	// CHECK-NEXT: [[TMP5:%.]] = load i32, i32 [[P_UPPERBOUND]], align 4			// CHECK-NEXT: [[TMP5:%.]] = load i32, i32 [[P_UPPERBOUND]], align 4
	// CHECK-NEXT: [[TMP6:%.*]] = sub i32 [[TMP5]], [[TMP4]]			// CHECK-NEXT: [[TMP6:%.*]] = sub i32 [[TMP5]], [[TMP4]]
	// CHECK-NEXT: [[TMP7:%.*]] = add i32 [[TMP6]], 1			// CHECK-NEXT: [[TMP7:%.*]] = add i32 [[TMP6]], 1
	// CHECK-NEXT: br label [[OMP_LOOP_HEADER:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_HEADER:%.*]]
	// CHECK: omp_loop.header:			// CHECK: omp_loop.header:
	// CHECK-NEXT: [[OMP_LOOP_IV:%.]] = phi i32 [ 0, [[OMP_LOOP_PREHEADER]] ], [ [[OMP_LOOP_NEXT:%.]], [[OMP_LOOP_INC:%.*]] ]			// CHECK-NEXT: [[OMP_LOOP_IV:%.]] = phi i32 [ 0, [[OMP_LOOP_PREHEADER]] ], [ [[OMP_LOOP_NEXT:%.]], [[OMP_LOOP_INC:%.*]] ]
	// CHECK-NEXT: br label [[OMP_LOOP_COND:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_COND:%.*]]
	Show All 25 Lines
	// CHECK-NEXT: [[IDXPROM7:%.*]] = zext i32 [[TMP19]] to i64			// CHECK-NEXT: [[IDXPROM7:%.*]] = zext i32 [[TMP19]] to i64
	// CHECK-NEXT: [[ARRAYIDX8:%.]] = getelementptr inbounds float, float [[TMP18]], i64 [[IDXPROM7]]			// CHECK-NEXT: [[ARRAYIDX8:%.]] = getelementptr inbounds float, float [[TMP18]], i64 [[IDXPROM7]]
	// CHECK-NEXT: store float [[MUL6]], float* [[ARRAYIDX8]], align 4			// CHECK-NEXT: store float [[MUL6]], float* [[ARRAYIDX8]], align 4
	// CHECK-NEXT: br label [[OMP_LOOP_INC]]			// CHECK-NEXT: br label [[OMP_LOOP_INC]]
	// CHECK: omp_loop.inc:			// CHECK: omp_loop.inc:
	// CHECK-NEXT: [[OMP_LOOP_NEXT]] = add nuw i32 [[OMP_LOOP_IV]], 1			// CHECK-NEXT: [[OMP_LOOP_NEXT]] = add nuw i32 [[OMP_LOOP_IV]], 1
	// CHECK-NEXT: br label [[OMP_LOOP_HEADER]]			// CHECK-NEXT: br label [[OMP_LOOP_HEADER]]
	// CHECK: omp_loop.exit:			// CHECK: omp_loop.exit:
	// CHECK-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* [[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]])			// CHECK-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM]])
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM9:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM9:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK-NEXT: call void @__kmpc_barrier(%struct.ident_t* [[GLOB2:@.*]], i32 [[OMP_GLOBAL_THREAD_NUM9]])			// CHECK-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[OMP_GLOBAL_THREAD_NUM9]])
	// CHECK-NEXT: br label [[OMP_LOOP_AFTER:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_AFTER:%.*]]
	// CHECK: omp_loop.after:			// CHECK: omp_loop.after:
	// CHECK-NEXT: ret void			// CHECK-NEXT: ret void
	//			//
	//			//
	// CHECK-LABEL: define {{[^@]+}}@__captured_stmt			// CHECK-LABEL: define {{[^@]+}}@__captured_stmt
	// CHECK-SAME: (i32* nonnull align 4 dereferenceable(4) [[DISTANCE:%.]], %struct.anon noalias [[__CONTEXT:%.]]) [[ATTR1:#.]] {			// CHECK-SAME: (i32* nonnull align 4 dereferenceable(4) [[DISTANCE:%.]], %struct.anon noalias [[__CONTEXT:%.*]]) #[[ATTR1:[0-9]+]] {
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[DISTANCE_ADDR:%.]] = alloca i32, align 8			// CHECK-NEXT: [[DISTANCE_ADDR:%.]] = alloca i32, align 8
	// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon, align 8			// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon, align 8
	// CHECK-NEXT: [[DOTSTART:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[DOTSTART:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[DOTSTOP:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[DOTSTOP:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[DOTSTEP:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[DOTSTEP:%.*]] = alloca i32, align 4
	// CHECK-NEXT: store i32* [[DISTANCE]], i32** [[DISTANCE_ADDR]], align 8			// CHECK-NEXT: store i32* [[DISTANCE]], i32** [[DISTANCE_ADDR]], align 8
	// CHECK-NEXT: store %struct.anon* [[__CONTEXT]], %struct.anon** [[__CONTEXT_ADDR]], align 8			// CHECK-NEXT: store %struct.anon* [[__CONTEXT]], %struct.anon** [[__CONTEXT_ADDR]], align 8
	Show All 20 Lines
	// CHECK: cond.end:			// CHECK: cond.end:
	// CHECK-NEXT: [[COND:%.*]] = phi i32 [ [[DIV]], [[COND_TRUE]] ], [ 0, [[COND_FALSE]] ]			// CHECK-NEXT: [[COND:%.*]] = phi i32 [ [[DIV]], [[COND_TRUE]] ], [ 0, [[COND_FALSE]] ]
	// CHECK-NEXT: [[TMP9:%.]] = load i32, i32** [[DISTANCE_ADDR]], align 8			// CHECK-NEXT: [[TMP9:%.]] = load i32, i32** [[DISTANCE_ADDR]], align 8
	// CHECK-NEXT: store i32 [[COND]], i32* [[TMP9]], align 4			// CHECK-NEXT: store i32 [[COND]], i32* [[TMP9]], align 4
	// CHECK-NEXT: ret void			// CHECK-NEXT: ret void
	//			//
	//			//
	// CHECK-LABEL: define {{[^@]+}}@__captured_stmt.1			// CHECK-LABEL: define {{[^@]+}}@__captured_stmt.1
	// CHECK-SAME: (i32* nonnull align 4 dereferenceable(4) [[LOOPVAR:%.]], i32 [[LOGICAL:%.]], %struct.anon.0* noalias [[__CONTEXT:%.*]]) [[ATTR1]] {			// CHECK-SAME: (i32* nonnull align 4 dereferenceable(4) [[LOOPVAR:%.]], i32 [[LOGICAL:%.]], %struct.anon.0* noalias [[__CONTEXT:%.*]]) #[[ATTR1]] {
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[LOOPVAR_ADDR:%.]] = alloca i32, align 8			// CHECK-NEXT: [[LOOPVAR_ADDR:%.]] = alloca i32, align 8
	// CHECK-NEXT: [[LOGICAL_ADDR:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[LOGICAL_ADDR:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon.0, align 8			// CHECK-NEXT: [[__CONTEXT_ADDR:%.]] = alloca %struct.anon.0, align 8
	// CHECK-NEXT: store i32* [[LOOPVAR]], i32** [[LOOPVAR_ADDR]], align 8			// CHECK-NEXT: store i32* [[LOOPVAR]], i32** [[LOOPVAR_ADDR]], align 8
	// CHECK-NEXT: store i32 [[LOGICAL]], i32* [[LOGICAL_ADDR]], align 4			// CHECK-NEXT: store i32 [[LOGICAL]], i32* [[LOGICAL_ADDR]], align 4
	// CHECK-NEXT: store %struct.anon.0* [[__CONTEXT]], %struct.anon.0** [[__CONTEXT_ADDR]], align 8			// CHECK-NEXT: store %struct.anon.0* [[__CONTEXT]], %struct.anon.0** [[__CONTEXT_ADDR]], align 8
	// CHECK-NEXT: [[TMP0:%.]] = load %struct.anon.0, %struct.anon.0** [[__CONTEXT_ADDR]], align 8			// CHECK-NEXT: [[TMP0:%.]] = load %struct.anon.0, %struct.anon.0** [[__CONTEXT_ADDR]], align 8
	Show All 9 Lines

clang/test/OpenMP/irbuilder_nested_openmp_parallel_empty.c

	// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py			// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py
	// RUN: %clang_cc1 -verify -fopenmp -fopenmp-enable-irbuilder -x c++ -emit-llvm %s -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=ALL,IRBUILDER			// RUN: %clang_cc1 -verify -fopenmp -fopenmp-enable-irbuilder -x c++ -emit-llvm %s -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=ALL,IRBUILDER
	// %clang_cc1 -fopenmp -fopenmp-enable-irbuilder -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o /tmp/t1 %s			// %clang_cc1 -fopenmp -fopenmp-enable-irbuilder -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o /tmp/t1 %s
	// %clang_cc1 -fopenmp -fopenmp-enable-irbuilder -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch /tmp/t1 -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=ALL-DEBUG,IRBUILDER-DEBUG %s			// %clang_cc1 -fopenmp -fopenmp-enable-irbuilder -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch /tmp/t1 -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=ALL-DEBUG,IRBUILDER-DEBUG %s

	// expected-no-diagnostics			// expected-no-diagnostics

	// TODO: Teach the update script to check new functions too.			// TODO: Teach the update script to check new functions too.

	#ifndef HEADER			#ifndef HEADER
	#define HEADER			#define HEADER

	// ALL-LABEL: @_Z17nested_parallel_0v(			// ALL-LABEL: @_Z17nested_parallel_0v(
	// ALL-NEXT: entry:			// ALL-NEXT: entry:
	// ALL-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @1)			// ALL-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// ALL-NEXT: br label [[OMP_PARALLEL:%.*]]			// ALL-NEXT: br label [[OMP_PARALLEL:%.*]]
	// ALL: omp_parallel:			// ALL: omp_parallel:
	// ALL-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @1, i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @_Z17nested_parallel_0v..omp_par.1 to void (i32, i32, ...)*))			// ALL-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @_Z17nested_parallel_0v..omp_par.1 to void (i32, i32, ...)*))
	// ALL-NEXT: br label [[OMP_PAR_OUTLINED_EXIT12:%.*]]			// ALL-NEXT: br label [[OMP_PAR_OUTLINED_EXIT12:%.*]]
	// ALL: omp.par.outlined.exit12:			// ALL: omp.par.outlined.exit12:
	// ALL-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// ALL-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// ALL: omp.par.exit.split:			// ALL: omp.par.exit.split:
	// ALL-NEXT: ret void			// ALL-NEXT: ret void
	//			//
	void nested_parallel_0(void) {			void nested_parallel_0(void) {
	#pragma omp parallel			#pragma omp parallel
	{			{
	#pragma omp parallel			#pragma omp parallel
	{			{
	}			}
	}			}
	}			}

	// ALL-LABEL: @_Z17nested_parallel_1Pfid(			// ALL-LABEL: @_Z17nested_parallel_1Pfid(
	// ALL-NEXT: entry:			// ALL-NEXT: entry:
	// ALL-NEXT: [[R_ADDR:%.]] = alloca float, align 8			// ALL-NEXT: [[R_ADDR:%.]] = alloca float, align 8
	// ALL-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4			// ALL-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
	// ALL-NEXT: [[B_ADDR:%.*]] = alloca double, align 8			// ALL-NEXT: [[B_ADDR:%.*]] = alloca double, align 8
	// ALL-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8			// ALL-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8
	// ALL-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4			// ALL-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
	// ALL-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8			// ALL-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8
	// ALL-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @1)			// ALL-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// ALL-NEXT: br label [[OMP_PARALLEL:%.*]]			// ALL-NEXT: br label [[OMP_PARALLEL:%.*]]
	// ALL: omp_parallel:			// ALL: omp_parallel:
	// ALL-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @1, i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z17nested_parallel_1Pfid..omp_par.2 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]])			// ALL-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z17nested_parallel_1Pfid..omp_par.2 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]])
	// ALL-NEXT: br label [[OMP_PAR_OUTLINED_EXIT13:%.*]]			// ALL-NEXT: br label [[OMP_PAR_OUTLINED_EXIT13:%.*]]
	// ALL: omp.par.outlined.exit13:			// ALL: omp.par.outlined.exit13:
	// ALL-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// ALL-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// ALL: omp.par.exit.split:			// ALL: omp.par.exit.split:
	// ALL-NEXT: ret void			// ALL-NEXT: ret void
	//			//
	void nested_parallel_1(float *r, int a, double b) {			void nested_parallel_1(float *r, int a, double b) {
	#pragma omp parallel			#pragma omp parallel
	{			{
	#pragma omp parallel			#pragma omp parallel
	{			{
	*r = a + b;			*r = a + b;
	}			}
	}			}
	}			}

	// ALL-LABEL: @_Z17nested_parallel_2Pfid(			// ALL-LABEL: @_Z17nested_parallel_2Pfid(
	// ALL-NEXT: entry:			// ALL-NEXT: entry:
	// ALL-NEXT: [[R_ADDR:%.]] = alloca float, align 8			// ALL-NEXT: [[R_ADDR:%.]] = alloca float, align 8
	// ALL-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4			// ALL-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
	// ALL-NEXT: [[B_ADDR:%.*]] = alloca double, align 8			// ALL-NEXT: [[B_ADDR:%.*]] = alloca double, align 8
	// ALL-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8			// ALL-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8
	// ALL-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4			// ALL-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
	// ALL-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8			// ALL-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8
	// ALL-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @1)			// ALL-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// ALL-NEXT: br label [[OMP_PARALLEL:%.*]]			// ALL-NEXT: br label [[OMP_PARALLEL:%.*]]
	// ALL: omp_parallel:			// ALL: omp_parallel:
	// ALL-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @1, i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z17nested_parallel_2Pfid..omp_par.5 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]])			// ALL-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z17nested_parallel_2Pfid..omp_par.5 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]])
	// ALL-NEXT: br label [[OMP_PAR_OUTLINED_EXIT55:%.*]]			// ALL-NEXT: br label [[OMP_PAR_OUTLINED_EXIT55:%.*]]
	// ALL: omp.par.outlined.exit55:			// ALL: omp.par.outlined.exit55:
	// ALL-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// ALL-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// ALL: omp.par.exit.split:			// ALL: omp.par.exit.split:
	// ALL-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4			// ALL-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
	// ALL-NEXT: [[CONV56:%.*]] = sitofp i32 [[TMP0]] to double			// ALL-NEXT: [[CONV56:%.*]] = sitofp i32 [[TMP0]] to double
	// ALL-NEXT: [[TMP1:%.]] = load double, double [[B_ADDR]], align 8			// ALL-NEXT: [[TMP1:%.]] = load double, double [[B_ADDR]], align 8
	// ALL-NEXT: [[ADD57:%.*]] = fadd double [[CONV56]], [[TMP1]]			// ALL-NEXT: [[ADD57:%.*]] = fadd double [[CONV56]], [[TMP1]]
	Show All 29 Lines

clang/test/OpenMP/irbuilder_nested_parallel_for.c

	// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py			// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py
	// RUN: %clang_cc1 -verify -fopenmp -fopenmp-enable-irbuilder -x c++ -emit-llvm %s -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -o - \| FileCheck --check-prefixes=CHECK %s			// RUN: %clang_cc1 -verify -fopenmp -fopenmp-enable-irbuilder -x c++ -emit-llvm %s -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -o - \| FileCheck --check-prefixes=CHECK %s
	// RUN: %clang_cc1 -fopenmp -fopenmp-enable-irbuilder -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=CHECK-DEBUG %s			// RUN: %clang_cc1 -fopenmp -fopenmp-enable-irbuilder -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=CHECK-DEBUG %s

	// expected-no-diagnostics			// expected-no-diagnostics

	// TODO: Teach the update script to check new functions too.			// TODO: Teach the update script to check new functions too.

	#ifndef HEADER			#ifndef HEADER
	#define HEADER			#define HEADER

	// CHECK-LABEL: @_Z14parallel_for_0v(			// CHECK-LABEL: @_Z14parallel_for_0v(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1:@.*]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK-NEXT: br label [[OMP_PARALLEL:%.*]]			// CHECK-NEXT: br label [[OMP_PARALLEL:%.*]]
	// CHECK: omp_parallel:			// CHECK: omp_parallel:
	// CHECK-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* [[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @_Z14parallel_for_0v..omp_par to void (i32, i32, ...)*))			// CHECK-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @_Z14parallel_for_0v..omp_par to void (i32, i32, ...)*))
	// CHECK-NEXT: br label [[OMP_PAR_OUTLINED_EXIT:%.*]]			// CHECK-NEXT: br label [[OMP_PAR_OUTLINED_EXIT:%.*]]
	// CHECK: omp.par.outlined.exit:			// CHECK: omp.par.outlined.exit:
	// CHECK-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// CHECK-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// CHECK: omp.par.exit.split:			// CHECK: omp.par.exit.split:
	// CHECK-NEXT: ret void			// CHECK-NEXT: ret void
	//			//
	// CHECK-DEBUG-LABEL: @_Z14parallel_for_0v(			// CHECK-DEBUG-LABEL: @_Z14parallel_for_0v(
	// CHECK-DEBUG-NEXT: entry:			// CHECK-DEBUG-NEXT: entry:
	// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1:@.]]), [[DBG12:!dbg !.]]			// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]]), !dbg [[DBG12:![0-9]+]]
	// CHECK-DEBUG-NEXT: br label [[OMP_PARALLEL:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PARALLEL:%.*]]
	// CHECK-DEBUG: omp_parallel:			// CHECK-DEBUG: omp_parallel:
	// CHECK-DEBUG-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* [[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @_Z14parallel_for_0v..omp_par to void (i32, i32, ...))), [[DBG13:!dbg !.]]			// CHECK-DEBUG-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @_Z14parallel_for_0v..omp_par to void (i32, i32, ...)*)), !dbg [[DBG13:![0-9]+]]
	// CHECK-DEBUG-NEXT: br label [[OMP_PAR_OUTLINED_EXIT:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PAR_OUTLINED_EXIT:%.*]]
	// CHECK-DEBUG: omp.par.outlined.exit:			// CHECK-DEBUG: omp.par.outlined.exit:
	// CHECK-DEBUG-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// CHECK-DEBUG: omp.par.exit.split:			// CHECK-DEBUG: omp.par.exit.split:
	// CHECK-DEBUG-NEXT: ret void, [[DBG17:!dbg !.*]]			// CHECK-DEBUG-NEXT: ret void, !dbg [[DBG17:![0-9]+]]
	//			//
	void parallel_for_0(void) {			void parallel_for_0(void) {
	#pragma omp parallel			#pragma omp parallel
	{			{
	#pragma omp for			#pragma omp for
	for (int i = 0; i < 100; ++i) {			for (int i = 0; i < 100; ++i) {
	}			}
	}			}
	}			}

	// CHECK-LABEL: @_Z14parallel_for_1Pfid(			// CHECK-LABEL: @_Z14parallel_for_1Pfid(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[R_ADDR:%.]] = alloca float, align 8			// CHECK-NEXT: [[R_ADDR:%.]] = alloca float, align 8
	// CHECK-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[B_ADDR:%.*]] = alloca double, align 8			// CHECK-NEXT: [[B_ADDR:%.*]] = alloca double, align 8
	// CHECK-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8			// CHECK-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8
	// CHECK-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4			// CHECK-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
	// CHECK-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8			// CHECK-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK-NEXT: br label [[OMP_PARALLEL:%.*]]			// CHECK-NEXT: br label [[OMP_PARALLEL:%.*]]
	// CHECK: omp_parallel:			// CHECK: omp_parallel:
	// CHECK-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* [[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z14parallel_for_1Pfid..omp_par.4 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]])			// CHECK-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z14parallel_for_1Pfid..omp_par.4 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]])
	// CHECK-NEXT: br label [[OMP_PAR_OUTLINED_EXIT16:%.*]]			// CHECK-NEXT: br label [[OMP_PAR_OUTLINED_EXIT16:%.*]]
	// CHECK: omp.par.outlined.exit16:			// CHECK: omp.par.outlined.exit16:
	// CHECK-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// CHECK-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// CHECK: omp.par.exit.split:			// CHECK: omp.par.exit.split:
	// CHECK-NEXT: ret void			// CHECK-NEXT: ret void
	//			//
	// CHECK-DEBUG-LABEL: @_Z14parallel_for_1Pfid(			// CHECK-DEBUG-LABEL: @_Z14parallel_for_1Pfid(
	// CHECK-DEBUG-NEXT: entry:			// CHECK-DEBUG-NEXT: entry:
	// CHECK-DEBUG-NEXT: [[R_ADDR:%.]] = alloca float, align 8			// CHECK-DEBUG-NEXT: [[R_ADDR:%.]] = alloca float, align 8
	// CHECK-DEBUG-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4			// CHECK-DEBUG-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
	// CHECK-DEBUG-NEXT: [[B_ADDR:%.*]] = alloca double, align 8			// CHECK-DEBUG-NEXT: [[B_ADDR:%.*]] = alloca double, align 8
	// CHECK-DEBUG-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8			// CHECK-DEBUG-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8
	// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata float** [[R_ADDR]], [[META72:metadata !.]], metadata !DIExpression()), [[DBG73:!dbg !.]]			// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata float** [[R_ADDR]], metadata [[META71:![0-9]+]], metadata !DIExpression()), !dbg [[DBG72:![0-9]+]]
	// CHECK-DEBUG-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4			// CHECK-DEBUG-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
	// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], [[META74:metadata !.]], metadata !DIExpression()), [[DBG75:!dbg !.]]			// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META73:![0-9]+]], metadata !DIExpression()), !dbg [[DBG74:![0-9]+]]
	// CHECK-DEBUG-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8			// CHECK-DEBUG-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8
	// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata double* [[B_ADDR]], [[META76:metadata !.]], metadata !DIExpression()), [[DBG77:!dbg !.]]			// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata double* [[B_ADDR]], metadata [[META75:![0-9]+]], metadata !DIExpression()), !dbg [[DBG76:![0-9]+]]
	// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB6:@.]]), [[DBG78:!dbg !.]]			// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB6:[0-9]+]]), !dbg [[DBG77:![0-9]+]]
	// CHECK-DEBUG-NEXT: br label [[OMP_PARALLEL:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PARALLEL:%.*]]
	// CHECK-DEBUG: omp_parallel:			// CHECK-DEBUG: omp_parallel:
	// CHECK-DEBUG-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* [[GLOB6]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z14parallel_for_1Pfid..omp_par.4 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]]), [[DBG79:!dbg !.*]]			// CHECK-DEBUG-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB6]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z14parallel_for_1Pfid..omp_par.4 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]]), !dbg [[DBG78:![0-9]+]]
	// CHECK-DEBUG-NEXT: br label [[OMP_PAR_OUTLINED_EXIT16:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PAR_OUTLINED_EXIT16:%.*]]
	// CHECK-DEBUG: omp.par.outlined.exit16:			// CHECK-DEBUG: omp.par.outlined.exit16:
	// CHECK-DEBUG-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// CHECK-DEBUG: omp.par.exit.split:			// CHECK-DEBUG: omp.par.exit.split:
	// CHECK-DEBUG-NEXT: ret void, [[DBG81:!dbg !.*]]			// CHECK-DEBUG-NEXT: ret void, !dbg [[DBG80:![0-9]+]]
	//			//
	void parallel_for_1(float *r, int a, double b) {			void parallel_for_1(float *r, int a, double b) {
	#pragma omp parallel			#pragma omp parallel
	{			{
	#pragma omp parallel			#pragma omp parallel
	{			{
	#pragma omp for			#pragma omp for
	for (int i = 0; i < 100; ++i) {			for (int i = 0; i < 100; ++i) {
	Show All 14 Lines
	// CHECK-NEXT: [[DOTCOUNT_ADDR188:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[DOTCOUNT_ADDR188:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[P_LASTITER203:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[P_LASTITER203:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[P_LOWERBOUND204:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[P_LOWERBOUND204:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[P_UPPERBOUND205:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[P_UPPERBOUND205:%.*]] = alloca i32, align 4
	// CHECK-NEXT: [[P_STRIDE206:%.*]] = alloca i32, align 4			// CHECK-NEXT: [[P_STRIDE206:%.*]] = alloca i32, align 4
	// CHECK-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8			// CHECK-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8
	// CHECK-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4			// CHECK-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
	// CHECK-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8			// CHECK-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK-NEXT: br label [[OMP_PARALLEL:%.*]]			// CHECK-NEXT: br label [[OMP_PARALLEL:%.*]]
	// CHECK: omp_parallel:			// CHECK: omp_parallel:
	// CHECK-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* [[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z14parallel_for_2Pfid..omp_par.23 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]])			// CHECK-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z14parallel_for_2Pfid..omp_par.23 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]])
	// CHECK-NEXT: br label [[OMP_PAR_OUTLINED_EXIT184:%.*]]			// CHECK-NEXT: br label [[OMP_PAR_OUTLINED_EXIT184:%.*]]
	// CHECK: omp.par.outlined.exit184:			// CHECK: omp.par.outlined.exit184:
	// CHECK-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// CHECK-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// CHECK: omp.par.exit.split:			// CHECK: omp.par.exit.split:
	// CHECK-NEXT: store i32 0, i32* [[I185]], align 4			// CHECK-NEXT: store i32 0, i32* [[I185]], align 4
	// CHECK-NEXT: [[TMP0:%.]] = getelementptr inbounds [[STRUCT_ANON_17]], %struct.anon.17 [[AGG_CAPTURED186]], i32 0, i32 0			// CHECK-NEXT: [[TMP0:%.]] = getelementptr inbounds [[STRUCT_ANON_17]], %struct.anon.17 [[AGG_CAPTURED186]], i32 0, i32 0
	// CHECK-NEXT: store i32* [[I185]], i32** [[TMP0]], align 8			// CHECK-NEXT: store i32* [[I185]], i32** [[TMP0]], align 8
	// CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds [[STRUCT_ANON_18]], %struct.anon.18 [[AGG_CAPTURED187]], i32 0, i32 0			// CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds [[STRUCT_ANON_18]], %struct.anon.18 [[AGG_CAPTURED187]], i32 0, i32 0
	// CHECK-NEXT: [[TMP2:%.]] = load i32, i32 [[I185]], align 4			// CHECK-NEXT: [[TMP2:%.]] = load i32, i32 [[I185]], align 4
	// CHECK-NEXT: store i32 [[TMP2]], i32* [[TMP1]], align 4			// CHECK-NEXT: store i32 [[TMP2]], i32* [[TMP1]], align 4
	// CHECK-NEXT: call void @__captured_stmt.19(i32* [[DOTCOUNT_ADDR188]], %struct.anon.17* [[AGG_CAPTURED186]])			// CHECK-NEXT: call void @__captured_stmt.19(i32* [[DOTCOUNT_ADDR188]], %struct.anon.17* [[AGG_CAPTURED186]])
	// CHECK-NEXT: [[DOTCOUNT189:%.]] = load i32, i32 [[DOTCOUNT_ADDR188]], align 4			// CHECK-NEXT: [[DOTCOUNT189:%.]] = load i32, i32 [[DOTCOUNT_ADDR188]], align 4
	// CHECK-NEXT: br label [[OMP_LOOP_PREHEADER190:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_PREHEADER190:%.*]]
	// CHECK: omp_loop.preheader190:			// CHECK: omp_loop.preheader190:
	// CHECK-NEXT: store i32 0, i32* [[P_LOWERBOUND204]], align 4			// CHECK-NEXT: store i32 0, i32* [[P_LOWERBOUND204]], align 4
	// CHECK-NEXT: [[TMP3:%.*]] = sub i32 [[DOTCOUNT189]], 1			// CHECK-NEXT: [[TMP3:%.*]] = sub i32 [[DOTCOUNT189]], 1
	// CHECK-NEXT: store i32 [[TMP3]], i32* [[P_UPPERBOUND205]], align 4			// CHECK-NEXT: store i32 [[TMP3]], i32* [[P_UPPERBOUND205]], align 4
	// CHECK-NEXT: store i32 1, i32* [[P_STRIDE206]], align 4			// CHECK-NEXT: store i32 1, i32* [[P_STRIDE206]], align 4
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM207:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM207:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK-NEXT: call void @__kmpc_for_static_init_4u(%struct.ident_t* [[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM207]], i32 34, i32* [[P_LASTITER203]], i32* [[P_LOWERBOUND204]], i32* [[P_UPPERBOUND205]], i32* [[P_STRIDE206]], i32 1, i32 1)			// CHECK-NEXT: call void @__kmpc_for_static_init_4u(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM207]], i32 34, i32* [[P_LASTITER203]], i32* [[P_LOWERBOUND204]], i32* [[P_UPPERBOUND205]], i32* [[P_STRIDE206]], i32 1, i32 1)
	// CHECK-NEXT: [[TMP4:%.]] = load i32, i32 [[P_LOWERBOUND204]], align 4			// CHECK-NEXT: [[TMP4:%.]] = load i32, i32 [[P_LOWERBOUND204]], align 4
	// CHECK-NEXT: [[TMP5:%.]] = load i32, i32 [[P_UPPERBOUND205]], align 4			// CHECK-NEXT: [[TMP5:%.]] = load i32, i32 [[P_UPPERBOUND205]], align 4
	// CHECK-NEXT: [[TMP6:%.*]] = sub i32 [[TMP5]], [[TMP4]]			// CHECK-NEXT: [[TMP6:%.*]] = sub i32 [[TMP5]], [[TMP4]]
	// CHECK-NEXT: [[TMP7:%.*]] = add i32 [[TMP6]], 1			// CHECK-NEXT: [[TMP7:%.*]] = add i32 [[TMP6]], 1
	// CHECK-NEXT: br label [[OMP_LOOP_HEADER191:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_HEADER191:%.*]]
	// CHECK: omp_loop.header191:			// CHECK: omp_loop.header191:
	// CHECK-NEXT: [[OMP_LOOP_IV197:%.]] = phi i32 [ 0, [[OMP_LOOP_PREHEADER190]] ], [ [[OMP_LOOP_NEXT199:%.]], [[OMP_LOOP_INC194:%.*]] ]			// CHECK-NEXT: [[OMP_LOOP_IV197:%.]] = phi i32 [ 0, [[OMP_LOOP_PREHEADER190]] ], [ [[OMP_LOOP_NEXT199:%.]], [[OMP_LOOP_INC194:%.*]] ]
	// CHECK-NEXT: br label [[OMP_LOOP_COND192:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_COND192:%.*]]
	Show All 10 Lines
	// CHECK-NEXT: [[CONV202:%.*]] = fptrunc double [[ADD201]] to float			// CHECK-NEXT: [[CONV202:%.*]] = fptrunc double [[ADD201]] to float
	// CHECK-NEXT: [[TMP11:%.]] = load float, float** [[R_ADDR]], align 8			// CHECK-NEXT: [[TMP11:%.]] = load float, float** [[R_ADDR]], align 8
	// CHECK-NEXT: store float [[CONV202]], float* [[TMP11]], align 4			// CHECK-NEXT: store float [[CONV202]], float* [[TMP11]], align 4
	// CHECK-NEXT: br label [[OMP_LOOP_INC194]]			// CHECK-NEXT: br label [[OMP_LOOP_INC194]]
	// CHECK: omp_loop.inc194:			// CHECK: omp_loop.inc194:
	// CHECK-NEXT: [[OMP_LOOP_NEXT199]] = add nuw i32 [[OMP_LOOP_IV197]], 1			// CHECK-NEXT: [[OMP_LOOP_NEXT199]] = add nuw i32 [[OMP_LOOP_IV197]], 1
	// CHECK-NEXT: br label [[OMP_LOOP_HEADER191]]			// CHECK-NEXT: br label [[OMP_LOOP_HEADER191]]
	// CHECK: omp_loop.exit195:			// CHECK: omp_loop.exit195:
	// CHECK-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* [[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM207]])			// CHECK-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM207]])
	// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM208:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB1]])			// CHECK-NEXT: [[OMP_GLOBAL_THREAD_NUM208:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK-NEXT: call void @__kmpc_barrier(%struct.ident_t* [[GLOB2:@.*]], i32 [[OMP_GLOBAL_THREAD_NUM208]])			// CHECK-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[OMP_GLOBAL_THREAD_NUM208]])
	// CHECK-NEXT: br label [[OMP_LOOP_AFTER196:%.*]]			// CHECK-NEXT: br label [[OMP_LOOP_AFTER196:%.*]]
	// CHECK: omp_loop.after196:			// CHECK: omp_loop.after196:
	// CHECK-NEXT: ret void			// CHECK-NEXT: ret void
	//			//
	// CHECK-DEBUG-LABEL: @_Z14parallel_for_2Pfid(			// CHECK-DEBUG-LABEL: @_Z14parallel_for_2Pfid(
	// CHECK-DEBUG-NEXT: entry:			// CHECK-DEBUG-NEXT: entry:
	// CHECK-DEBUG-NEXT: [[R_ADDR:%.]] = alloca float, align 8			// CHECK-DEBUG-NEXT: [[R_ADDR:%.]] = alloca float, align 8
	// CHECK-DEBUG-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4			// CHECK-DEBUG-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
	// CHECK-DEBUG-NEXT: [[B_ADDR:%.*]] = alloca double, align 8			// CHECK-DEBUG-NEXT: [[B_ADDR:%.*]] = alloca double, align 8
	// CHECK-DEBUG-NEXT: [[I185:%.*]] = alloca i32, align 4			// CHECK-DEBUG-NEXT: [[I185:%.*]] = alloca i32, align 4
	// CHECK-DEBUG-NEXT: [[AGG_CAPTURED186:%.]] = alloca [[STRUCT_ANON_17:%.]], align 8			// CHECK-DEBUG-NEXT: [[AGG_CAPTURED186:%.]] = alloca [[STRUCT_ANON_17:%.]], align 8
	// CHECK-DEBUG-NEXT: [[AGG_CAPTURED187:%.]] = alloca [[STRUCT_ANON_18:%.]], align 4			// CHECK-DEBUG-NEXT: [[AGG_CAPTURED187:%.]] = alloca [[STRUCT_ANON_18:%.]], align 4
	// CHECK-DEBUG-NEXT: [[DOTCOUNT_ADDR188:%.*]] = alloca i32, align 4			// CHECK-DEBUG-NEXT: [[DOTCOUNT_ADDR188:%.*]] = alloca i32, align 4
	// CHECK-DEBUG-NEXT: [[P_LASTITER203:%.*]] = alloca i32, align 4			// CHECK-DEBUG-NEXT: [[P_LASTITER203:%.*]] = alloca i32, align 4
	// CHECK-DEBUG-NEXT: [[P_LOWERBOUND204:%.*]] = alloca i32, align 4			// CHECK-DEBUG-NEXT: [[P_LOWERBOUND204:%.*]] = alloca i32, align 4
	// CHECK-DEBUG-NEXT: [[P_UPPERBOUND205:%.*]] = alloca i32, align 4			// CHECK-DEBUG-NEXT: [[P_UPPERBOUND205:%.*]] = alloca i32, align 4
	// CHECK-DEBUG-NEXT: [[P_STRIDE206:%.*]] = alloca i32, align 4			// CHECK-DEBUG-NEXT: [[P_STRIDE206:%.*]] = alloca i32, align 4
	// CHECK-DEBUG-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8			// CHECK-DEBUG-NEXT: store float* [[R:%.]], float* [[R_ADDR]], align 8
	// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata float** [[R_ADDR]], [[META133:metadata !.]], metadata !DIExpression()), [[DBG134:!dbg !.]]			// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata float** [[R_ADDR]], metadata [[META132:![0-9]+]], metadata !DIExpression()), !dbg [[DBG133:![0-9]+]]
	// CHECK-DEBUG-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4			// CHECK-DEBUG-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
	// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], [[META135:metadata !.]], metadata !DIExpression()), [[DBG136:!dbg !.]]			// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META134:![0-9]+]], metadata !DIExpression()), !dbg [[DBG135:![0-9]+]]
	// CHECK-DEBUG-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8			// CHECK-DEBUG-NEXT: store double [[B:%.]], double [[B_ADDR]], align 8
	// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata double* [[B_ADDR]], [[META137:metadata !.]], metadata !DIExpression()), [[DBG138:!dbg !.]]			// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata double* [[B_ADDR]], metadata [[META136:![0-9]+]], metadata !DIExpression()), !dbg [[DBG137:![0-9]+]]
	// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB13:@.]]), [[DBG139:!dbg !.]]			// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB13:[0-9]+]]), !dbg [[DBG138:![0-9]+]]
	// CHECK-DEBUG-NEXT: br label [[OMP_PARALLEL:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PARALLEL:%.*]]
	// CHECK-DEBUG: omp_parallel:			// CHECK-DEBUG: omp_parallel:
	// CHECK-DEBUG-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* [[GLOB13]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z14parallel_for_2Pfid..omp_par.23 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]]), [[DBG140:!dbg !.*]]			// CHECK-DEBUG-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB13]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, i32, double, float*) @_Z14parallel_for_2Pfid..omp_par.23 to void (i32, i32, ...)), i32 [[A_ADDR]], double* [[B_ADDR]], float** [[R_ADDR]]), !dbg [[DBG139:![0-9]+]]
	// CHECK-DEBUG-NEXT: br label [[OMP_PAR_OUTLINED_EXIT184:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PAR_OUTLINED_EXIT184:%.*]]
	// CHECK-DEBUG: omp.par.outlined.exit184:			// CHECK-DEBUG: omp.par.outlined.exit184:
	// CHECK-DEBUG-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]			// CHECK-DEBUG-NEXT: br label [[OMP_PAR_EXIT_SPLIT:%.*]]
	// CHECK-DEBUG: omp.par.exit.split:			// CHECK-DEBUG: omp.par.exit.split:
	// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata i32* [[I185]], [[META144:metadata !.]], metadata !DIExpression()), [[DBG147:!dbg !.]]			// CHECK-DEBUG-NEXT: call void @llvm.dbg.declare(metadata i32* [[I185]], metadata [[META143:![0-9]+]], metadata !DIExpression()), !dbg [[DBG146:![0-9]+]]
	// CHECK-DEBUG-NEXT: store i32 0, i32* [[I185]], align 4, [[DBG147]]			// CHECK-DEBUG-NEXT: store i32 0, i32* [[I185]], align 4, !dbg [[DBG146]]
	// CHECK-DEBUG-NEXT: [[TMP0:%.]] = getelementptr inbounds [[STRUCT_ANON_17]], %struct.anon.17 [[AGG_CAPTURED186]], i32 0, i32 0, [[DBG148:!dbg !.*]]			// CHECK-DEBUG-NEXT: [[TMP0:%.]] = getelementptr inbounds [[STRUCT_ANON_17]], %struct.anon.17 [[AGG_CAPTURED186]], i32 0, i32 0, !dbg [[DBG147:![0-9]+]]
	// CHECK-DEBUG-NEXT: store i32* [[I185]], i32** [[TMP0]], align 8, [[DBG148]]			// CHECK-DEBUG-NEXT: store i32* [[I185]], i32** [[TMP0]], align 8, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[TMP1:%.]] = getelementptr inbounds [[STRUCT_ANON_18]], %struct.anon.18 [[AGG_CAPTURED187]], i32 0, i32 0, [[DBG148]]			// CHECK-DEBUG-NEXT: [[TMP1:%.]] = getelementptr inbounds [[STRUCT_ANON_18]], %struct.anon.18 [[AGG_CAPTURED187]], i32 0, i32 0, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[TMP2:%.]] = load i32, i32 [[I185]], align 4, [[DBG149:!dbg !.*]]			// CHECK-DEBUG-NEXT: [[TMP2:%.]] = load i32, i32 [[I185]], align 4, !dbg [[DBG148:![0-9]+]]
	// CHECK-DEBUG-NEXT: store i32 [[TMP2]], i32* [[TMP1]], align 4, [[DBG148]]			// CHECK-DEBUG-NEXT: store i32 [[TMP2]], i32* [[TMP1]], align 4, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: call void @__captured_stmt.19(i32* [[DOTCOUNT_ADDR188]], %struct.anon.17* [[AGG_CAPTURED186]]), [[DBG148]]			// CHECK-DEBUG-NEXT: call void @__captured_stmt.19(i32* [[DOTCOUNT_ADDR188]], %struct.anon.17* [[AGG_CAPTURED186]]), !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[DOTCOUNT189:%.]] = load i32, i32 [[DOTCOUNT_ADDR188]], align 4, [[DBG148]]			// CHECK-DEBUG-NEXT: [[DOTCOUNT189:%.]] = load i32, i32 [[DOTCOUNT_ADDR188]], align 4, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_PREHEADER190:%.*]], [[DBG148]]			// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_PREHEADER190:%.*]], !dbg [[DBG147]]
	// CHECK-DEBUG: omp_loop.preheader190:			// CHECK-DEBUG: omp_loop.preheader190:
	// CHECK-DEBUG-NEXT: store i32 0, i32* [[P_LOWERBOUND204]], align 4, [[DBG148]]			// CHECK-DEBUG-NEXT: store i32 0, i32* [[P_LOWERBOUND204]], align 4, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[TMP3:%.*]] = sub i32 [[DOTCOUNT189]], 1, [[DBG148]]			// CHECK-DEBUG-NEXT: [[TMP3:%.*]] = sub i32 [[DOTCOUNT189]], 1, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: store i32 [[TMP3]], i32* [[P_UPPERBOUND205]], align 4, [[DBG148]]			// CHECK-DEBUG-NEXT: store i32 [[TMP3]], i32* [[P_UPPERBOUND205]], align 4, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: store i32 1, i32* [[P_STRIDE206]], align 4, [[DBG148]]			// CHECK-DEBUG-NEXT: store i32 1, i32* [[P_STRIDE206]], align 4, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM207:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB42:@.*]]), [[DBG148]]			// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM207:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB42:[0-9]+]]), !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: call void @__kmpc_for_static_init_4u(%struct.ident_t* [[GLOB42]], i32 [[OMP_GLOBAL_THREAD_NUM207]], i32 34, i32* [[P_LASTITER203]], i32* [[P_LOWERBOUND204]], i32* [[P_UPPERBOUND205]], i32* [[P_STRIDE206]], i32 1, i32 1), [[DBG148]]			// CHECK-DEBUG-NEXT: call void @__kmpc_for_static_init_4u(%struct.ident_t* @[[GLOB42]], i32 [[OMP_GLOBAL_THREAD_NUM207]], i32 34, i32* [[P_LASTITER203]], i32* [[P_LOWERBOUND204]], i32* [[P_UPPERBOUND205]], i32* [[P_STRIDE206]], i32 1, i32 1), !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[TMP4:%.]] = load i32, i32 [[P_LOWERBOUND204]], align 4, [[DBG148]]			// CHECK-DEBUG-NEXT: [[TMP4:%.]] = load i32, i32 [[P_LOWERBOUND204]], align 4, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[TMP5:%.]] = load i32, i32 [[P_UPPERBOUND205]], align 4, [[DBG148]]			// CHECK-DEBUG-NEXT: [[TMP5:%.]] = load i32, i32 [[P_UPPERBOUND205]], align 4, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[TMP6:%.*]] = sub i32 [[TMP5]], [[TMP4]], [[DBG148]]			// CHECK-DEBUG-NEXT: [[TMP6:%.*]] = sub i32 [[TMP5]], [[TMP4]], !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[TMP7:%.*]] = add i32 [[TMP6]], 1, [[DBG148]]			// CHECK-DEBUG-NEXT: [[TMP7:%.*]] = add i32 [[TMP6]], 1, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_HEADER191:%.*]], [[DBG148]]			// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_HEADER191:%.*]], !dbg [[DBG147]]
	// CHECK-DEBUG: omp_loop.header191:			// CHECK-DEBUG: omp_loop.header191:
	// CHECK-DEBUG-NEXT: [[OMP_LOOP_IV197:%.]] = phi i32 [ 0, [[OMP_LOOP_PREHEADER190]] ], [ [[OMP_LOOP_NEXT199:%.]], [[OMP_LOOP_INC194:%.*]] ], [[DBG148]]			// CHECK-DEBUG-NEXT: [[OMP_LOOP_IV197:%.]] = phi i32 [ 0, [[OMP_LOOP_PREHEADER190]] ], [ [[OMP_LOOP_NEXT199:%.]], [[OMP_LOOP_INC194:%.*]] ], !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_COND192:%.*]], [[DBG148]]			// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_COND192:%.*]], !dbg [[DBG147]]
	// CHECK-DEBUG: omp_loop.cond192:			// CHECK-DEBUG: omp_loop.cond192:
	// CHECK-DEBUG-NEXT: [[OMP_LOOP_CMP198:%.*]] = icmp ult i32 [[OMP_LOOP_IV197]], [[TMP7]], [[DBG148]]			// CHECK-DEBUG-NEXT: [[OMP_LOOP_CMP198:%.*]] = icmp ult i32 [[OMP_LOOP_IV197]], [[TMP7]], !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: br i1 [[OMP_LOOP_CMP198]], label [[OMP_LOOP_BODY193:%.]], label [[OMP_LOOP_EXIT195:%.]], [[DBG148]]			// CHECK-DEBUG-NEXT: br i1 [[OMP_LOOP_CMP198]], label [[OMP_LOOP_BODY193:%.]], label [[OMP_LOOP_EXIT195:%.]], !dbg [[DBG147]]
	// CHECK-DEBUG: omp_loop.body193:			// CHECK-DEBUG: omp_loop.body193:
	// CHECK-DEBUG-NEXT: [[TMP8:%.*]] = add i32 [[OMP_LOOP_IV197]], [[TMP4]], [[DBG148]]			// CHECK-DEBUG-NEXT: [[TMP8:%.*]] = add i32 [[OMP_LOOP_IV197]], [[TMP4]], !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: call void @__captured_stmt.20(i32* [[I185]], i32 [[TMP8]], %struct.anon.18* [[AGG_CAPTURED187]]), [[DBG148]]			// CHECK-DEBUG-NEXT: call void @__captured_stmt.20(i32* [[I185]], i32 [[TMP8]], %struct.anon.18* [[AGG_CAPTURED187]]), !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[TMP9:%.]] = load i32, i32 [[A_ADDR]], align 4, [[DBG150:!dbg !.*]]			// CHECK-DEBUG-NEXT: [[TMP9:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG149:![0-9]+]]
	// CHECK-DEBUG-NEXT: [[CONV200:%.*]] = sitofp i32 [[TMP9]] to double, [[DBG150]]			// CHECK-DEBUG-NEXT: [[CONV200:%.*]] = sitofp i32 [[TMP9]] to double, !dbg [[DBG149]]
	// CHECK-DEBUG-NEXT: [[TMP10:%.]] = load double, double [[B_ADDR]], align 8, [[DBG151:!dbg !.*]]			// CHECK-DEBUG-NEXT: [[TMP10:%.]] = load double, double [[B_ADDR]], align 8, !dbg [[DBG150:![0-9]+]]
	// CHECK-DEBUG-NEXT: [[ADD201:%.]] = fadd double [[CONV200]], [[TMP10]], [[DBG152:!dbg !.]]			// CHECK-DEBUG-NEXT: [[ADD201:%.*]] = fadd double [[CONV200]], [[TMP10]], !dbg [[DBG151:![0-9]+]]
	// CHECK-DEBUG-NEXT: [[CONV202:%.*]] = fptrunc double [[ADD201]] to float, [[DBG150]]			// CHECK-DEBUG-NEXT: [[CONV202:%.*]] = fptrunc double [[ADD201]] to float, !dbg [[DBG149]]
	// CHECK-DEBUG-NEXT: [[TMP11:%.]] = load float, float** [[R_ADDR]], align 8, [[DBG153:!dbg !.*]]			// CHECK-DEBUG-NEXT: [[TMP11:%.]] = load float, float** [[R_ADDR]], align 8, !dbg [[DBG152:![0-9]+]]
	// CHECK-DEBUG-NEXT: store float [[CONV202]], float* [[TMP11]], align 4, [[DBG154:!dbg !.*]]			// CHECK-DEBUG-NEXT: store float [[CONV202]], float* [[TMP11]], align 4, !dbg [[DBG153:![0-9]+]]
	// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_INC194]], [[DBG148]]			// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_INC194]], !dbg [[DBG147]]
	// CHECK-DEBUG: omp_loop.inc194:			// CHECK-DEBUG: omp_loop.inc194:
	// CHECK-DEBUG-NEXT: [[OMP_LOOP_NEXT199]] = add nuw i32 [[OMP_LOOP_IV197]], 1, [[DBG148]]			// CHECK-DEBUG-NEXT: [[OMP_LOOP_NEXT199]] = add nuw i32 [[OMP_LOOP_IV197]], 1, !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_HEADER191]], [[DBG148]]			// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_HEADER191]], !dbg [[DBG147]]
	// CHECK-DEBUG: omp_loop.exit195:			// CHECK-DEBUG: omp_loop.exit195:
	// CHECK-DEBUG-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* [[GLOB42]], i32 [[OMP_GLOBAL_THREAD_NUM207]]), [[DBG148]]			// CHECK-DEBUG-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB42]], i32 [[OMP_GLOBAL_THREAD_NUM207]]), !dbg [[DBG147]]
	// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM208:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t [[GLOB42]]), [[DBG151]]			// CHECK-DEBUG-NEXT: [[OMP_GLOBAL_THREAD_NUM208:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB42]]), !dbg [[DBG150]]
	// CHECK-DEBUG-NEXT: call void @__kmpc_barrier(%struct.ident_t* [[GLOB43:@.*]], i32 [[OMP_GLOBAL_THREAD_NUM208]]), [[DBG151]]			// CHECK-DEBUG-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB43:[0-9]+]], i32 [[OMP_GLOBAL_THREAD_NUM208]]), !dbg [[DBG150]]
	// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_AFTER196:%.*]], [[DBG148]]			// CHECK-DEBUG-NEXT: br label [[OMP_LOOP_AFTER196:%.*]], !dbg [[DBG147]]
	// CHECK-DEBUG: omp_loop.after196:			// CHECK-DEBUG: omp_loop.after196:
	// CHECK-DEBUG-NEXT: ret void, [[DBG155:!dbg !.*]]			// CHECK-DEBUG-NEXT: ret void, !dbg [[DBG154:![0-9]+]]
	//			//
	void parallel_for_2(float *r, int a, double b) {			void parallel_for_2(float *r, int a, double b) {
	#pragma omp parallel			#pragma omp parallel
	{			{
	#pragma omp for			#pragma omp for
	for (int i = 0; i < 100; ++i)			for (int i = 0; i < 100; ++i)
	*r = a + b;			*r = a + b;
	#pragma omp parallel			#pragma omp parallel
	Show All 33 Lines

clang/test/OpenMP/nvptx_declare_target_var_ctor_dtor_codegen.cpp

Show First 20 Lines • Show All 85 Lines • ▼ Show 20 Lines	int maini1() {
int a;		int a;
#pragma omp target map(tofrom : a)		#pragma omp target map(tofrom : a)
{		{
a = c;		a = c;
}		}
return 0;		return 0;
}		}

// DEVICE: define weak{{.}} void @__omp_offloading_{{.}}_{{.}}maini1{{.}}_l[[@LINE-7]](i32* nonnull align {{[0-9]+}} dereferenceable{{[^,]*}}		// DEVICE-DAG: define weak{{.}} void @__omp_offloading_{{.}}_{{.}}maini1{{.}}_l[[@LINE-7]](i32* nonnull align {{[0-9]+}} dereferenceable{{[^,]*}}
// DEVICE: [[C:%.+]] = load i32, i32* [[C_ADDR]],		// DEVICE-DAG: [[C:%.+]] = load i32, i32* [[C_ADDR]],
// DEVICE: store i32 [[C]], i32* %		// DEVICE-DAG: store i32 [[C]], i32* %

// HOST: define internal void @__omp_offloading_{{.}}_{{.}}maini1{{.}}_l[[@LINE-11]](i32 nonnull align {{[0-9]+}} dereferenceable{{.*}})		// HOST: define internal void @__omp_offloading_{{.}}_{{.}}maini1{{.}}_l[[@LINE-11]](i32 nonnull align {{[0-9]+}} dereferenceable{{.*}})
// HOST: [[C:%.]] = load i32, i32 @[[C_ADDR]],		// HOST: [[C:%.]] = load i32, i32 @[[C_ADDR]],
// HOST: store i32 [[C]], i32* %		// HOST: store i32 [[C]], i32* %

// HOST-DAG: !{i32 1, !"[[CD_ADDR]]", i32 0, i32 {{[0-9]+}}}		// HOST-DAG: !{i32 1, !"[[CD_ADDR]]", i32 0, i32 {{[0-9]+}}}
// HOST-DAG: !{i32 1, !"[[C_ADDR]]", i32 0, i32 {{[0-9]+}}}		// HOST-DAG: !{i32 1, !"[[C_ADDR]]", i32 0, i32 {{[0-9]+}}}

// DEVICE: !nvvm.annotations		// DEVICE: !nvvm.annotations
// DEVICE-DAG: !{void ()* [[C_CTOR]], !"kernel", i32 1}		// DEVICE-DAG: !{void ()* [[C_CTOR]], !"kernel", i32 1}
// DEVICE-DAG: !{void ()* [[CD_CTOR]], !"kernel", i32 1}		// DEVICE-DAG: !{void ()* [[CD_CTOR]], !"kernel", i32 1}
// DEVICE-DAG: !{void ()* [[CD_DTOR]], !"kernel", i32 1}		// DEVICE-DAG: !{void ()* [[CD_DTOR]], !"kernel", i32 1}

#endif // HEADER		#endif // HEADER

clang/test/OpenMP/nvptx_declare_variant_name_mangling.cpp

	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc			// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc
	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple nvptx64-unknown-unknown -aux-triple powerpc64le-unknown-unknown -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o - \| FileCheck %s --implicit-check-not='call i32 {@_Z3bazv\|@_Z3barv}'			// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple nvptx64-unknown-unknown -aux-triple powerpc64le-unknown-unknown -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o - \| FileCheck %s --implicit-check-not='call i32 {@_Z3bazv\|@_Z3barv}'
	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple nvptx64-unknown-unknown -aux-triple powerpc64le-unknown-unknown -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -emit-pch -o %t			// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple nvptx64-unknown-unknown -aux-triple powerpc64le-unknown-unknown -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -emit-pch -o %t
	// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple nvptx64-unknown-unknown -aux-triple powerpc64le-unknown-unknown -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -include-pch %t -o - \| FileCheck %s --implicit-check-not='call i32 {@_Z3bazv\|@_Z3barv}'			// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple nvptx64-unknown-unknown -aux-triple powerpc64le-unknown-unknown -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -include-pch %t -o - \| FileCheck %s --implicit-check-not='call i32 {@_Z3bazv\|@_Z3barv}'
	// expected-no-diagnostics			// expected-no-diagnostics

	// CHECK-DAG: @_Z3barv			// CHECK-DAG: @_Z3barv
	// CHECK-DAG: @_Z3bazv			// CHECK-DAG: @_Z3bazv
	// CHECK-DAG: @"_Z53bar$ompvariant$S2$s7$Pnvptx$Pnvptx64$S3$s9$Pmatch_anyv"			// CHECK-DAG: define{{.*}} @"_Z53bar$ompvariant$S2$s7$Pnvptx$Pnvptx64$S3$s9$Pmatch_anyv"
	// CHECK-DAG: @"_Z53baz$ompvariant$S2$s7$Pnvptx$Pnvptx64$S3$s9$Pmatch_anyv"			// CHECK-DAG: define{{.*}} @"_Z53baz$ompvariant$S2$s7$Pnvptx$Pnvptx64$S3$s9$Pmatch_anyv"
	// CHECK-DAG: call i32 @"_Z53bar$ompvariant$S2$s7$Pnvptx$Pnvptx64$S3$s9$Pmatch_anyv"()			// CHECK-DAG: call i32 @"_Z53bar$ompvariant$S2$s7$Pnvptx$Pnvptx64$S3$s9$Pmatch_anyv"()
	// CHECK-DAG: call i32 @"_Z53baz$ompvariant$S2$s7$Pnvptx$Pnvptx64$S3$s9$Pmatch_anyv"()			// CHECK-DAG: call i32 @"_Z53baz$ompvariant$S2$s7$Pnvptx$Pnvptx64$S3$s9$Pmatch_anyv"()

	#ifndef HEADER			#ifndef HEADER
	#define HEADER			#define HEADER

	#pragma omp declare target			#pragma omp declare target

	Show All 23 Lines

clang/test/OpenMP/nvptx_multi_target_parallel_codegen.cpp

	Show First 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: call void @_Z3usev() #[[ATTR7:[0-9]+]]			// CHECK1-NEXT: call void @_Z3usev() #[[ATTR7:[0-9]+]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_Z3usev			// CHECK1-LABEL: define {{[^@]+}}@_Z3usev
	// CHECK1-SAME: () #[[ATTR2:[0-9]+]] {			// CHECK1-SAME: () #[[ATTR2:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 8			// CHECK1-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 8
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB3:[0-9]+]])
	// CHECK1-NEXT: [[TMP1:%.]] = bitcast [0 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK1-NEXT: [[TMP1:%.]] = bitcast [0 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK1-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32)* @__omp_outlined__1 to i8), i8 null, i8** [[TMP1]], i64 0)			// CHECK1-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32)* @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP1]], i64 0)
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR0]] {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	// CHECK1-NEXT: call void @_Z4workv() #[[ATTR7]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker			// CHECK1-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker
	// CHECK1-SAME: () #[[ATTR5:[0-9]+]] {			// CHECK1-SAME: () #[[ATTR4:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[WORK_FN:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[WORK_FN:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1			// CHECK1-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1
	// CHECK1-NEXT: store i8* null, i8** [[WORK_FN]], align 8			// CHECK1-NEXT: store i8* null, i8** [[WORK_FN]], align 8
	// CHECK1-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1			// CHECK1-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1
	// CHECK1-NEXT: br label [[DOTAWAIT_WORK:%.*]]			// CHECK1-NEXT: br label [[DOTAWAIT_WORK:%.*]]
	// CHECK1: .await.work:			// CHECK1: .await.work:
	// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	Show All 27 Lines
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK1-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK1-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK1-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK1-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK1-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK1-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]			// CHECK1-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]
	// CHECK1-NEXT: [[TMP0:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]			// CHECK1-NEXT: [[TMP0:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]
	// CHECK1-NEXT: br i1 [[TMP0]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]			// CHECK1-NEXT: br i1 [[TMP0]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]
	// CHECK1: .worker:			// CHECK1: .worker:
	// CHECK1-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker() #[[ATTR4:[0-9]+]]			// CHECK1-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker() #[[ATTR3:[0-9]+]]
	// CHECK1-NEXT: br label [[DOTEXIT:%.*]]			// CHECK1-NEXT: br label [[DOTEXIT:%.*]]
	// CHECK1: .mastercheck:			// CHECK1: .mastercheck:
	// CHECK1-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK1-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK1-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK1-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK1-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK1-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK1-NEXT: [[TMP1:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1			// CHECK1-NEXT: [[TMP1:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1
	// CHECK1-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1			// CHECK1-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1
	// CHECK1-NEXT: [[TMP3:%.*]] = xor i32 [[TMP1]], -1			// CHECK1-NEXT: [[TMP3:%.*]] = xor i32 [[TMP1]], -1
	Show All 11 Lines
	// CHECK1: .termination.notifier:			// CHECK1: .termination.notifier:
	// CHECK1-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK1-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK1-NEXT: br label [[DOTEXIT]]			// CHECK1-NEXT: br label [[DOTEXIT]]
	// CHECK1: .exit:			// CHECK1: .exit:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1
				// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR0]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
				// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
				// CHECK1-NEXT: call void @_Z4workv() #[[ATTR7]]
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
				// CHECK1-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR4]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK1-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 8
				// CHECK1-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK1-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK1-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK1-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]]) #[[ATTR3]]
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l21			// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l21
	// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 4			// CHECK2-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 4
	// CHECK2-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK2-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK2-NEXT: call void @__kmpc_spmd_kernel_init(i32 [[NVPTX_NUM_THREADS]], i16 1)			// CHECK2-NEXT: call void @__kmpc_spmd_kernel_init(i32 [[NVPTX_NUM_THREADS]], i16 1)
	// CHECK2-NEXT: call void @__kmpc_data_sharing_init_stack_spmd()			// CHECK2-NEXT: call void @__kmpc_data_sharing_init_stack_spmd()
	// CHECK2-NEXT: br label [[DOTEXECUTE:%.*]]			// CHECK2-NEXT: br label [[DOTEXECUTE:%.*]]
	Show All 19 Lines
	// CHECK2-NEXT: call void @_Z3usev() #[[ATTR7:[0-9]+]]			// CHECK2-NEXT: call void @_Z3usev() #[[ATTR7:[0-9]+]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_Z3usev			// CHECK2-LABEL: define {{[^@]+}}@_Z3usev
	// CHECK2-SAME: () #[[ATTR2:[0-9]+]] {			// CHECK2-SAME: () #[[ATTR2:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 4			// CHECK2-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 4
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB3:[0-9]+]])
	// CHECK2-NEXT: [[TMP1:%.]] = bitcast [0 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK2-NEXT: [[TMP1:%.]] = bitcast [0 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK2-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32)* @__omp_outlined__1 to i8), i8 null, i8** [[TMP1]], i32 0)			// CHECK2-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32)* @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP1]], i32 0)
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR0]] {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
	// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
	// CHECK2-NEXT: call void @_Z4workv() #[[ATTR7]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker			// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker
	// CHECK2-SAME: () #[[ATTR5:[0-9]+]] {			// CHECK2-SAME: () #[[ATTR4:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[WORK_FN:%.]] = alloca i8, align 4			// CHECK2-NEXT: [[WORK_FN:%.]] = alloca i8, align 4
	// CHECK2-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1			// CHECK2-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1
	// CHECK2-NEXT: store i8* null, i8** [[WORK_FN]], align 4			// CHECK2-NEXT: store i8* null, i8** [[WORK_FN]], align 4
	// CHECK2-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1			// CHECK2-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1
	// CHECK2-NEXT: br label [[DOTAWAIT_WORK:%.*]]			// CHECK2-NEXT: br label [[DOTAWAIT_WORK:%.*]]
	// CHECK2: .await.work:			// CHECK2: .await.work:
	// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	Show All 27 Lines
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK2-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK2-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK2-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK2-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK2-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK2-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]			// CHECK2-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]
	// CHECK2-NEXT: [[TMP0:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]			// CHECK2-NEXT: [[TMP0:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]
	// CHECK2-NEXT: br i1 [[TMP0]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]			// CHECK2-NEXT: br i1 [[TMP0]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]
	// CHECK2: .worker:			// CHECK2: .worker:
	// CHECK2-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker() #[[ATTR4:[0-9]+]]			// CHECK2-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker() #[[ATTR3:[0-9]+]]
	// CHECK2-NEXT: br label [[DOTEXIT:%.*]]			// CHECK2-NEXT: br label [[DOTEXIT:%.*]]
	// CHECK2: .mastercheck:			// CHECK2: .mastercheck:
	// CHECK2-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK2-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK2-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK2-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK2-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK2-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK2-NEXT: [[TMP1:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1			// CHECK2-NEXT: [[TMP1:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1
	// CHECK2-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1			// CHECK2-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1
	// CHECK2-NEXT: [[TMP3:%.*]] = xor i32 [[TMP1]], -1			// CHECK2-NEXT: [[TMP3:%.*]] = xor i32 [[TMP1]], -1
	Show All 11 Lines
	// CHECK2: .termination.notifier:			// CHECK2: .termination.notifier:
	// CHECK2-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK2-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK2-NEXT: br label [[DOTEXIT]]			// CHECK2-NEXT: br label [[DOTEXIT]]
	// CHECK2: .exit:			// CHECK2: .exit:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1
				// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR0]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
				// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
				// CHECK2-NEXT: call void @_Z4workv() #[[ATTR7]]
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
				// CHECK2-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR4]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK2-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
				// CHECK2-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK2-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK2-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK2-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]]) #[[ATTR3]]
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l21			// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l21
	// CHECK3-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK3-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 4			// CHECK3-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 4
	// CHECK3-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK3-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK3-NEXT: call void @__kmpc_spmd_kernel_init(i32 [[NVPTX_NUM_THREADS]], i16 1)			// CHECK3-NEXT: call void @__kmpc_spmd_kernel_init(i32 [[NVPTX_NUM_THREADS]], i16 1)
	// CHECK3-NEXT: call void @__kmpc_data_sharing_init_stack_spmd()			// CHECK3-NEXT: call void @__kmpc_data_sharing_init_stack_spmd()
	// CHECK3-NEXT: br label [[DOTEXECUTE:%.*]]			// CHECK3-NEXT: br label [[DOTEXECUTE:%.*]]
	Show All 19 Lines
	// CHECK3-NEXT: call void @_Z3usev() #[[ATTR7:[0-9]+]]			// CHECK3-NEXT: call void @_Z3usev() #[[ATTR7:[0-9]+]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z3usev			// CHECK3-LABEL: define {{[^@]+}}@_Z3usev
	// CHECK3-SAME: () #[[ATTR2:[0-9]+]] {			// CHECK3-SAME: () #[[ATTR2:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 4			// CHECK3-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [0 x i8], align 4
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB3:[0-9]+]])
	// CHECK3-NEXT: [[TMP1:%.]] = bitcast [0 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK3-NEXT: [[TMP1:%.]] = bitcast [0 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK3-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32)* @__omp_outlined__1 to i8), i8 null, i8** [[TMP1]], i32 0)			// CHECK3-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32)* @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP1]], i32 0)
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
	// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
	// CHECK3-NEXT: call void @_Z4workv() #[[ATTR7]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker			// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker
	// CHECK3-SAME: () #[[ATTR5:[0-9]+]] {			// CHECK3-SAME: () #[[ATTR4:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[WORK_FN:%.]] = alloca i8, align 4			// CHECK3-NEXT: [[WORK_FN:%.]] = alloca i8, align 4
	// CHECK3-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1			// CHECK3-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1
	// CHECK3-NEXT: store i8* null, i8** [[WORK_FN]], align 4			// CHECK3-NEXT: store i8* null, i8** [[WORK_FN]], align 4
	// CHECK3-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1			// CHECK3-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1
	// CHECK3-NEXT: br label [[DOTAWAIT_WORK:%.*]]			// CHECK3-NEXT: br label [[DOTAWAIT_WORK:%.*]]
	// CHECK3: .await.work:			// CHECK3: .await.work:
	// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	Show All 27 Lines
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK3-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK3-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK3-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK3-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK3-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK3-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]			// CHECK3-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]
	// CHECK3-NEXT: [[TMP0:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]			// CHECK3-NEXT: [[TMP0:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]
	// CHECK3-NEXT: br i1 [[TMP0]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]			// CHECK3-NEXT: br i1 [[TMP0]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]
	// CHECK3: .worker:			// CHECK3: .worker:
	// CHECK3-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker() #[[ATTR4:[0-9]+]]			// CHECK3-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l23_worker() #[[ATTR3:[0-9]+]]
	// CHECK3-NEXT: br label [[DOTEXIT:%.*]]			// CHECK3-NEXT: br label [[DOTEXIT:%.*]]
	// CHECK3: .mastercheck:			// CHECK3: .mastercheck:
	// CHECK3-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK3-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK3-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK3-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK3-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK3-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK3-NEXT: [[TMP1:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1			// CHECK3-NEXT: [[TMP1:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1
	// CHECK3-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1			// CHECK3-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1
	// CHECK3-NEXT: [[TMP3:%.*]] = xor i32 [[TMP1]], -1			// CHECK3-NEXT: [[TMP3:%.*]] = xor i32 [[TMP1]], -1
	Show All 10 Lines
	// CHECK3-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]			// CHECK3-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]
	// CHECK3: .termination.notifier:			// CHECK3: .termination.notifier:
	// CHECK3-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK3-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK3-NEXT: br label [[DOTEXIT]]			// CHECK3-NEXT: br label [[DOTEXIT]]
	// CHECK3: .exit:			// CHECK3: .exit:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
				//
				// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1
				// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR0]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
				// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
				// CHECK3-NEXT: call void @_Z4workv() #[[ATTR7]]
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
				// CHECK3-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR4]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK3-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK3-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK3-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
				// CHECK3-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK3-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK3-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK3-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]]) #[[ATTR3]]
				// CHECK3-NEXT: ret void
				//

clang/test/OpenMP/nvptx_nested_parallel_codegen.cpp

	Show First 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: [[IS_ACTIVE:%.*]] = icmp ne i8 [[TMP3]], 0			// CHECK1-NEXT: [[IS_ACTIVE:%.*]] = icmp ne i8 [[TMP3]], 0
	// CHECK1-NEXT: br i1 [[IS_ACTIVE]], label [[DOTEXECUTE_PARALLEL:%.]], label [[DOTBARRIER_PARALLEL:%.]]			// CHECK1-NEXT: br i1 [[IS_ACTIVE]], label [[DOTEXECUTE_PARALLEL:%.]], label [[DOTBARRIER_PARALLEL:%.]]
	// CHECK1: .execute.parallel:			// CHECK1: .execute.parallel:
	// CHECK1-NEXT: [[TMP4:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])			// CHECK1-NEXT: [[TMP4:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK1-NEXT: [[TMP5:%.]] = load i8, i8** [[WORK_FN]], align 8			// CHECK1-NEXT: [[TMP5:%.]] = load i8, i8** [[WORK_FN]], align 8
	// CHECK1-NEXT: [[WORK_MATCH:%.]] = icmp eq i8 [[TMP5]], bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8*)			// CHECK1-NEXT: [[WORK_MATCH:%.]] = icmp eq i8 [[TMP5]], bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8*)
	// CHECK1-NEXT: br i1 [[WORK_MATCH]], label [[DOTEXECUTE_FN:%.]], label [[DOTCHECK_NEXT:%.]]			// CHECK1-NEXT: br i1 [[WORK_MATCH]], label [[DOTEXECUTE_FN:%.]], label [[DOTCHECK_NEXT:%.]]
	// CHECK1: .execute.fn:			// CHECK1: .execute.fn:
	// CHECK1-NEXT: call void @__omp_outlined___wrapper(i16 0, i32 [[TMP4]]) #[[ATTR5:[0-9]+]]			// CHECK1-NEXT: call void @__omp_outlined___wrapper(i16 0, i32 [[TMP4]]) #[[ATTR4:[0-9]+]]
	// CHECK1-NEXT: br label [[DOTTERMINATE_PARALLEL:%.*]]			// CHECK1-NEXT: br label [[DOTTERMINATE_PARALLEL:%.*]]
	// CHECK1: .check.next:			// CHECK1: .check.next:
	// CHECK1-NEXT: [[TMP6:%.]] = load i8, i8** [[WORK_FN]], align 8			// CHECK1-NEXT: [[TMP6:%.]] = bitcast i8 [[TMP2]] to void (i16, i32)*
	// CHECK1-NEXT: [[WORK_MATCH1:%.]] = icmp eq i8 [[TMP6]], bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8*)			// CHECK1-NEXT: call void [[TMP6]](i16 0, i32 [[TMP4]])
	// CHECK1-NEXT: br i1 [[WORK_MATCH1]], label [[DOTEXECUTE_FN2:%.]], label [[DOTCHECK_NEXT3:%.]]
	// CHECK1: .execute.fn2:
	// CHECK1-NEXT: call void @__omp_outlined__1_wrapper(i16 0, i32 [[TMP4]]) #[[ATTR5]]
	// CHECK1-NEXT: br label [[DOTTERMINATE_PARALLEL]]
	// CHECK1: .check.next3:
	// CHECK1-NEXT: [[TMP7:%.]] = bitcast i8 [[TMP2]] to void (i16, i32)*
	// CHECK1-NEXT: call void [[TMP7]](i16 0, i32 [[TMP4]])
	// CHECK1-NEXT: br label [[DOTTERMINATE_PARALLEL]]			// CHECK1-NEXT: br label [[DOTTERMINATE_PARALLEL]]
	// CHECK1: .terminate.parallel:			// CHECK1: .terminate.parallel:
	// CHECK1-NEXT: call void @__kmpc_kernel_end_parallel()			// CHECK1-NEXT: call void @__kmpc_kernel_end_parallel()
	// CHECK1-NEXT: br label [[DOTBARRIER_PARALLEL]]			// CHECK1-NEXT: br label [[DOTBARRIER_PARALLEL]]
	// CHECK1: .barrier.parallel:			// CHECK1: .barrier.parallel:
	// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK1-NEXT: br label [[DOTAWAIT_WORK]]			// CHECK1-NEXT: br label [[DOTAWAIT_WORK]]
	// CHECK1: .exit:			// CHECK1: .exit:
	Show All 9 Lines
	// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 8			// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 8
	// CHECK1-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK1-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK1-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK1-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK1-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK1-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK1-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]			// CHECK1-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]
	// CHECK1-NEXT: [[TMP1:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]			// CHECK1-NEXT: [[TMP1:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]
	// CHECK1-NEXT: br i1 [[TMP1]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]			// CHECK1-NEXT: br i1 [[TMP1]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]
	// CHECK1: .worker:			// CHECK1: .worker:
	// CHECK1-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker() #[[ATTR5]]			// CHECK1-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker() #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTEXIT:%.*]]			// CHECK1-NEXT: br label [[DOTEXIT:%.*]]
	// CHECK1: .mastercheck:			// CHECK1: .mastercheck:
	// CHECK1-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK1-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK1-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK1-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK1-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK1-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK1-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1			// CHECK1-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1
	// CHECK1-NEXT: [[TMP3:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1			// CHECK1-NEXT: [[TMP3:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1
	// CHECK1-NEXT: [[TMP4:%.*]] = xor i32 [[TMP2]], -1			// CHECK1-NEXT: [[TMP4:%.*]] = xor i32 [[TMP2]], -1
	// CHECK1-NEXT: [[MASTER_TID:%.*]] = and i32 [[TMP3]], [[TMP4]]			// CHECK1-NEXT: [[MASTER_TID:%.*]] = and i32 [[TMP3]], [[TMP4]]
	// CHECK1-NEXT: [[TMP5:%.*]] = icmp eq i32 [[NVPTX_TID1]], [[MASTER_TID]]			// CHECK1-NEXT: [[TMP5:%.*]] = icmp eq i32 [[NVPTX_TID1]], [[MASTER_TID]]
	// CHECK1-NEXT: br i1 [[TMP5]], label [[DOTMASTER:%.*]], label [[DOTEXIT]]			// CHECK1-NEXT: br i1 [[TMP5]], label [[DOTMASTER:%.*]], label [[DOTEXIT]]
	// CHECK1: .master:			// CHECK1: .master:
	// CHECK1-NEXT: [[NVPTX_NUM_THREADS4:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK1-NEXT: [[NVPTX_NUM_THREADS4:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK1-NEXT: [[NVPTX_WARP_SIZE5:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK1-NEXT: [[NVPTX_WARP_SIZE5:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK1-NEXT: [[THREAD_LIMIT6:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS4]], [[NVPTX_WARP_SIZE5]]			// CHECK1-NEXT: [[THREAD_LIMIT6:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS4]], [[NVPTX_WARP_SIZE5]]
	// CHECK1-NEXT: call void @__kmpc_kernel_init(i32 [[THREAD_LIMIT6]], i16 1)			// CHECK1-NEXT: call void @__kmpc_kernel_init(i32 [[THREAD_LIMIT6]], i16 1)
	// CHECK1-NEXT: call void @__kmpc_data_sharing_init_stack()			// CHECK1-NEXT: call void @__kmpc_data_sharing_init_stack()
	// CHECK1-NEXT: [[TMP6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK1-NEXT: [[TMP6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK1-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7:[0-9]+]]			// CHECK1-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7:[0-9]+]]
	// CHECK1-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 2)			// CHECK1-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 2)
	// CHECK1-NEXT: [[TMP7:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i64 0, i64 0			// CHECK1-NEXT: [[TMP7:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i64 0, i64 0
	// CHECK1-NEXT: [[TMP8:%.]] = bitcast i32 [[TMP0]] to i8*			// CHECK1-NEXT: [[TMP8:%.]] = bitcast i32 [[TMP0]] to i8*
	// CHECK1-NEXT: store i8* [[TMP8]], i8** [[TMP7]], align 8			// CHECK1-NEXT: store i8* [[TMP8]], i8** [[TMP7]], align 8
	// CHECK1-NEXT: [[TMP9:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK1-NEXT: [[TMP9:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK1-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32) @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP9]], i64 1)			// CHECK1-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32) @__omp_outlined__ to i8), i8 bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8), i8* [[TMP9]], i64 1)
	// CHECK1-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]			// CHECK1-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]
	// CHECK1: .termination.notifier:			// CHECK1: .termination.notifier:
	// CHECK1-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK1-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK1-NEXT: br label [[DOTEXIT]]			// CHECK1-NEXT: br label [[DOTEXIT]]
	// CHECK1: .exit:			// CHECK1: .exit:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_Z3usePi			// CHECK1-LABEL: define {{[^@]+}}@_Z3usePi
	// CHECK1-SAME: (i32* [[C:%.*]]) #[[ATTR3:[0-9]+]] {			// CHECK1-SAME: (i32* [[C:%.*]]) #[[ATTR3:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[C_ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[C_ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [1 x i8], align 8			// CHECK1-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [1 x i8], align 8
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB2:[0-9]+]])
	// CHECK1-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 8			// CHECK1-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 8
	// CHECK1-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 2)			// CHECK1-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB2]], i32 [[TMP0]], i32 2)
	// CHECK1-NEXT: [[TMP1:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i64 0, i64 0			// CHECK1-NEXT: [[TMP1:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i64 0, i64 0
	// CHECK1-NEXT: [[TMP2:%.]] = bitcast i32* [[C_ADDR]] to i8*			// CHECK1-NEXT: [[TMP2:%.]] = bitcast i32* [[C_ADDR]] to i8*
	// CHECK1-NEXT: store i8* [[TMP2]], i8** [[TMP1]], align 8			// CHECK1-NEXT: store i8* [[TMP2]], i8** [[TMP1]], align 8
	// CHECK1-NEXT: [[TMP3:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK1-NEXT: [[TMP3:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK1-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32*) @__omp_outlined__ to i8), i8 bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8), i8* [[TMP3]], i64 1)			// CHECK1-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB2]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32*) @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP3]], i64 1)
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__			// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__
				// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: [[C_ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
				// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
				// CHECK1-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 8
				// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 8
				// CHECK1-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7]]
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined___wrapper
				// CHECK1-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK1-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 8
				// CHECK1-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK1-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK1-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK1-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 8
				// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i64 0
				// CHECK1-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
				// CHECK1-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 8
				// CHECK1-NEXT: call void @__omp_outlined__(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]]) #[[ATTR4]]
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32* nonnull align 8 dereferenceable(8) [[C:%.*]]) #[[ATTR1]] {			// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32* nonnull align 8 dereferenceable(8) [[C:%.*]]) #[[ATTR1]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[C_ADDR:%.]] = alloca i32*, align 8			// CHECK1-NEXT: [[C_ADDR:%.]] = alloca i32*, align 8
	// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 8			// CHECK1-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 8
	Show All 23 Lines
	// CHECK1-NEXT: [[TMP5:%.]] = bitcast i32 [[ATOMIC_TEMP]] to i8*			// CHECK1-NEXT: [[TMP5:%.]] = bitcast i32 [[ATOMIC_TEMP]] to i8*
	// CHECK1-NEXT: [[TMP6:%.]] = bitcast i32 [[ATOMIC_TEMP1]] to i8*			// CHECK1-NEXT: [[TMP6:%.]] = bitcast i32 [[ATOMIC_TEMP1]] to i8*
	// CHECK1-NEXT: [[CALL:%.]] = call zeroext i1 @__atomic_compare_exchange(i64 4, i8 [[TMP4]], i8* [[TMP5]], i8* [[TMP6]], i32 0, i32 0) #[[ATTR7]]			// CHECK1-NEXT: [[CALL:%.]] = call zeroext i1 @__atomic_compare_exchange(i64 4, i8 [[TMP4]], i8* [[TMP5]], i8* [[TMP6]], i32 0, i32 0) #[[ATTR7]]
	// CHECK1-NEXT: br i1 [[CALL]], label [[ATOMIC_EXIT:%.*]], label [[ATOMIC_CONT]]			// CHECK1-NEXT: br i1 [[CALL]], label [[ATOMIC_EXIT:%.*]], label [[ATOMIC_CONT]]
	// CHECK1: atomic_exit:			// CHECK1: atomic_exit:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined___wrapper			// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK1-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {			// CHECK1-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2			// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK1-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 8			// CHECK1-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 8
	// CHECK1-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4			// CHECK1-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK1-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2			// CHECK1-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4			// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK1-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])			// CHECK1-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK1-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 8			// CHECK1-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 8
	// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i64 0			// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i64 0
	// CHECK1-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32***			// CHECK1-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32***
	// CHECK1-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 8			// CHECK1-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 8
	// CHECK1-NEXT: call void @__omp_outlined__(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32** [[TMP5]]) #[[ATTR5]]			// CHECK1-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32** [[TMP5]]) #[[ATTR4]]
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[C_ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 8
	// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 8
	// CHECK1-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7]]
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK1-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK1-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 8
	// CHECK1-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK1-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK1-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK1-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 8
	// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i64 0
	// CHECK1-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
	// CHECK1-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 8
	// CHECK1-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]]) #[[ATTR5]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker			// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker
	// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[WORK_FN:%.]] = alloca i8, align 4			// CHECK2-NEXT: [[WORK_FN:%.]] = alloca i8, align 4
	// CHECK2-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1			// CHECK2-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1
	Show All 13 Lines
	// CHECK2-NEXT: [[IS_ACTIVE:%.*]] = icmp ne i8 [[TMP3]], 0			// CHECK2-NEXT: [[IS_ACTIVE:%.*]] = icmp ne i8 [[TMP3]], 0
	// CHECK2-NEXT: br i1 [[IS_ACTIVE]], label [[DOTEXECUTE_PARALLEL:%.]], label [[DOTBARRIER_PARALLEL:%.]]			// CHECK2-NEXT: br i1 [[IS_ACTIVE]], label [[DOTEXECUTE_PARALLEL:%.]], label [[DOTBARRIER_PARALLEL:%.]]
	// CHECK2: .execute.parallel:			// CHECK2: .execute.parallel:
	// CHECK2-NEXT: [[TMP4:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])			// CHECK2-NEXT: [[TMP4:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK2-NEXT: [[TMP5:%.]] = load i8, i8** [[WORK_FN]], align 4			// CHECK2-NEXT: [[TMP5:%.]] = load i8, i8** [[WORK_FN]], align 4
	// CHECK2-NEXT: [[WORK_MATCH:%.]] = icmp eq i8 [[TMP5]], bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8*)			// CHECK2-NEXT: [[WORK_MATCH:%.]] = icmp eq i8 [[TMP5]], bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8*)
	// CHECK2-NEXT: br i1 [[WORK_MATCH]], label [[DOTEXECUTE_FN:%.]], label [[DOTCHECK_NEXT:%.]]			// CHECK2-NEXT: br i1 [[WORK_MATCH]], label [[DOTEXECUTE_FN:%.]], label [[DOTCHECK_NEXT:%.]]
	// CHECK2: .execute.fn:			// CHECK2: .execute.fn:
	// CHECK2-NEXT: call void @__omp_outlined___wrapper(i16 0, i32 [[TMP4]]) #[[ATTR5:[0-9]+]]			// CHECK2-NEXT: call void @__omp_outlined___wrapper(i16 0, i32 [[TMP4]]) #[[ATTR4:[0-9]+]]
	// CHECK2-NEXT: br label [[DOTTERMINATE_PARALLEL:%.*]]			// CHECK2-NEXT: br label [[DOTTERMINATE_PARALLEL:%.*]]
	// CHECK2: .check.next:			// CHECK2: .check.next:
	// CHECK2-NEXT: [[TMP6:%.]] = load i8, i8** [[WORK_FN]], align 4			// CHECK2-NEXT: [[TMP6:%.]] = bitcast i8 [[TMP2]] to void (i16, i32)*
	// CHECK2-NEXT: [[WORK_MATCH1:%.]] = icmp eq i8 [[TMP6]], bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8*)			// CHECK2-NEXT: call void [[TMP6]](i16 0, i32 [[TMP4]])
	// CHECK2-NEXT: br i1 [[WORK_MATCH1]], label [[DOTEXECUTE_FN2:%.]], label [[DOTCHECK_NEXT3:%.]]
	// CHECK2: .execute.fn2:
	// CHECK2-NEXT: call void @__omp_outlined__1_wrapper(i16 0, i32 [[TMP4]]) #[[ATTR5]]
	// CHECK2-NEXT: br label [[DOTTERMINATE_PARALLEL]]
	// CHECK2: .check.next3:
	// CHECK2-NEXT: [[TMP7:%.]] = bitcast i8 [[TMP2]] to void (i16, i32)*
	// CHECK2-NEXT: call void [[TMP7]](i16 0, i32 [[TMP4]])
	// CHECK2-NEXT: br label [[DOTTERMINATE_PARALLEL]]			// CHECK2-NEXT: br label [[DOTTERMINATE_PARALLEL]]
	// CHECK2: .terminate.parallel:			// CHECK2: .terminate.parallel:
	// CHECK2-NEXT: call void @__kmpc_kernel_end_parallel()			// CHECK2-NEXT: call void @__kmpc_kernel_end_parallel()
	// CHECK2-NEXT: br label [[DOTBARRIER_PARALLEL]]			// CHECK2-NEXT: br label [[DOTBARRIER_PARALLEL]]
	// CHECK2: .barrier.parallel:			// CHECK2: .barrier.parallel:
	// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK2-NEXT: br label [[DOTAWAIT_WORK]]			// CHECK2-NEXT: br label [[DOTAWAIT_WORK]]
	// CHECK2: .exit:			// CHECK2: .exit:
	Show All 9 Lines
	// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 4			// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 4
	// CHECK2-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK2-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK2-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK2-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK2-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK2-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK2-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]			// CHECK2-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]
	// CHECK2-NEXT: [[TMP1:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]			// CHECK2-NEXT: [[TMP1:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]
	// CHECK2-NEXT: br i1 [[TMP1]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]			// CHECK2-NEXT: br i1 [[TMP1]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]
	// CHECK2: .worker:			// CHECK2: .worker:
	// CHECK2-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker() #[[ATTR5]]			// CHECK2-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker() #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTEXIT:%.*]]			// CHECK2-NEXT: br label [[DOTEXIT:%.*]]
	// CHECK2: .mastercheck:			// CHECK2: .mastercheck:
	// CHECK2-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK2-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK2-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK2-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK2-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK2-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK2-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1			// CHECK2-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1
	// CHECK2-NEXT: [[TMP3:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1			// CHECK2-NEXT: [[TMP3:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1
	// CHECK2-NEXT: [[TMP4:%.*]] = xor i32 [[TMP2]], -1			// CHECK2-NEXT: [[TMP4:%.*]] = xor i32 [[TMP2]], -1
	// CHECK2-NEXT: [[MASTER_TID:%.*]] = and i32 [[TMP3]], [[TMP4]]			// CHECK2-NEXT: [[MASTER_TID:%.*]] = and i32 [[TMP3]], [[TMP4]]
	// CHECK2-NEXT: [[TMP5:%.*]] = icmp eq i32 [[NVPTX_TID1]], [[MASTER_TID]]			// CHECK2-NEXT: [[TMP5:%.*]] = icmp eq i32 [[NVPTX_TID1]], [[MASTER_TID]]
	// CHECK2-NEXT: br i1 [[TMP5]], label [[DOTMASTER:%.*]], label [[DOTEXIT]]			// CHECK2-NEXT: br i1 [[TMP5]], label [[DOTMASTER:%.*]], label [[DOTEXIT]]
	// CHECK2: .master:			// CHECK2: .master:
	// CHECK2-NEXT: [[NVPTX_NUM_THREADS4:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK2-NEXT: [[NVPTX_NUM_THREADS4:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK2-NEXT: [[NVPTX_WARP_SIZE5:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK2-NEXT: [[NVPTX_WARP_SIZE5:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK2-NEXT: [[THREAD_LIMIT6:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS4]], [[NVPTX_WARP_SIZE5]]			// CHECK2-NEXT: [[THREAD_LIMIT6:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS4]], [[NVPTX_WARP_SIZE5]]
	// CHECK2-NEXT: call void @__kmpc_kernel_init(i32 [[THREAD_LIMIT6]], i16 1)			// CHECK2-NEXT: call void @__kmpc_kernel_init(i32 [[THREAD_LIMIT6]], i16 1)
	// CHECK2-NEXT: call void @__kmpc_data_sharing_init_stack()			// CHECK2-NEXT: call void @__kmpc_data_sharing_init_stack()
	// CHECK2-NEXT: [[TMP6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK2-NEXT: [[TMP6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK2-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7:[0-9]+]]			// CHECK2-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7:[0-9]+]]
	// CHECK2-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 2)			// CHECK2-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 2)
	// CHECK2-NEXT: [[TMP7:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i32 0, i32 0			// CHECK2-NEXT: [[TMP7:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP8:%.]] = bitcast i32 [[TMP0]] to i8*			// CHECK2-NEXT: [[TMP8:%.]] = bitcast i32 [[TMP0]] to i8*
	// CHECK2-NEXT: store i8* [[TMP8]], i8** [[TMP7]], align 4			// CHECK2-NEXT: store i8* [[TMP8]], i8** [[TMP7]], align 4
	// CHECK2-NEXT: [[TMP9:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK2-NEXT: [[TMP9:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK2-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32) @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP9]], i32 1)			// CHECK2-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32) @__omp_outlined__ to i8), i8 bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8), i8* [[TMP9]], i32 1)
	// CHECK2-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]			// CHECK2-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]
	// CHECK2: .termination.notifier:			// CHECK2: .termination.notifier:
	// CHECK2-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK2-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK2-NEXT: br label [[DOTEXIT]]			// CHECK2-NEXT: br label [[DOTEXIT]]
	// CHECK2: .exit:			// CHECK2: .exit:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_Z3usePi			// CHECK2-LABEL: define {{[^@]+}}@_Z3usePi
	// CHECK2-SAME: (i32* [[C:%.*]]) #[[ATTR3:[0-9]+]] {			// CHECK2-SAME: (i32* [[C:%.*]]) #[[ATTR3:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[C_ADDR:%.]] = alloca i32, align 4			// CHECK2-NEXT: [[C_ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [1 x i8], align 4			// CHECK2-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [1 x i8], align 4
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB2:[0-9]+]])
	// CHECK2-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 4			// CHECK2-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 4
	// CHECK2-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 2)			// CHECK2-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB2]], i32 [[TMP0]], i32 2)
	// CHECK2-NEXT: [[TMP1:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i32 0, i32 0			// CHECK2-NEXT: [[TMP1:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP2:%.]] = bitcast i32* [[C_ADDR]] to i8*			// CHECK2-NEXT: [[TMP2:%.]] = bitcast i32* [[C_ADDR]] to i8*
	// CHECK2-NEXT: store i8* [[TMP2]], i8** [[TMP1]], align 4			// CHECK2-NEXT: store i8* [[TMP2]], i8** [[TMP1]], align 4
	// CHECK2-NEXT: [[TMP3:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK2-NEXT: [[TMP3:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK2-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32*) @__omp_outlined__ to i8), i8 bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8), i8* [[TMP3]], i32 1)			// CHECK2-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB2]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32*) @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP3]], i32 1)
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__			// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__
				// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK2-NEXT: [[C_ADDR:%.]] = alloca i32, align 4
				// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
				// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
				// CHECK2-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 4
				// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 4
				// CHECK2-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7]]
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined___wrapper
				// CHECK2-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK2-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
				// CHECK2-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK2-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK2-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK2-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
				// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
				// CHECK2-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
				// CHECK2-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
				// CHECK2-NEXT: call void @__omp_outlined__(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]]) #[[ATTR4]]
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32* nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {			// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32* nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[C_ADDR:%.]] = alloca i32*, align 4			// CHECK2-NEXT: [[C_ADDR:%.]] = alloca i32*, align 4
	// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4			// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
	// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4			// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
	// CHECK2-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4			// CHECK2-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	Show All 23 Lines
	// CHECK2-NEXT: [[TMP5:%.]] = bitcast i32 [[ATOMIC_TEMP]] to i8*			// CHECK2-NEXT: [[TMP5:%.]] = bitcast i32 [[ATOMIC_TEMP]] to i8*
	// CHECK2-NEXT: [[TMP6:%.]] = bitcast i32 [[ATOMIC_TEMP1]] to i8*			// CHECK2-NEXT: [[TMP6:%.]] = bitcast i32 [[ATOMIC_TEMP1]] to i8*
	// CHECK2-NEXT: [[CALL:%.]] = call zeroext i1 @__atomic_compare_exchange(i32 4, i8 [[TMP4]], i8* [[TMP5]], i8* [[TMP6]], i32 0, i32 0) #[[ATTR7]]			// CHECK2-NEXT: [[CALL:%.]] = call zeroext i1 @__atomic_compare_exchange(i32 4, i8 [[TMP4]], i8* [[TMP5]], i8* [[TMP6]], i32 0, i32 0) #[[ATTR7]]
	// CHECK2-NEXT: br i1 [[CALL]], label [[ATOMIC_EXIT:%.*]], label [[ATOMIC_CONT]]			// CHECK2-NEXT: br i1 [[CALL]], label [[ATOMIC_EXIT:%.*]], label [[ATOMIC_CONT]]
	// CHECK2: atomic_exit:			// CHECK2: atomic_exit:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined___wrapper			// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK2-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {			// CHECK2-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2			// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK2-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4			// CHECK2-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
	// CHECK2-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4			// CHECK2-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK2-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2			// CHECK2-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4			// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK2-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])			// CHECK2-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK2-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4			// CHECK2-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
	// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0			// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
	// CHECK2-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32***			// CHECK2-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32***
	// CHECK2-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4			// CHECK2-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
	// CHECK2-NEXT: call void @__omp_outlined__(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32** [[TMP5]]) #[[ATTR5]]			// CHECK2-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32** [[TMP5]]) #[[ATTR4]]
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[C_ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
	// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
	// CHECK2-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 4
	// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 4
	// CHECK2-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7]]
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK2-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK2-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
	// CHECK2-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK2-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK2-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK2-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
	// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
	// CHECK2-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
	// CHECK2-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
	// CHECK2-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]]) #[[ATTR5]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker			// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker
	// CHECK3-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK3-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[WORK_FN:%.]] = alloca i8, align 4			// CHECK3-NEXT: [[WORK_FN:%.]] = alloca i8, align 4
	// CHECK3-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1			// CHECK3-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1
	Show All 13 Lines
	// CHECK3-NEXT: [[IS_ACTIVE:%.*]] = icmp ne i8 [[TMP3]], 0			// CHECK3-NEXT: [[IS_ACTIVE:%.*]] = icmp ne i8 [[TMP3]], 0
	// CHECK3-NEXT: br i1 [[IS_ACTIVE]], label [[DOTEXECUTE_PARALLEL:%.]], label [[DOTBARRIER_PARALLEL:%.]]			// CHECK3-NEXT: br i1 [[IS_ACTIVE]], label [[DOTEXECUTE_PARALLEL:%.]], label [[DOTBARRIER_PARALLEL:%.]]
	// CHECK3: .execute.parallel:			// CHECK3: .execute.parallel:
	// CHECK3-NEXT: [[TMP4:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])			// CHECK3-NEXT: [[TMP4:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK3-NEXT: [[TMP5:%.]] = load i8, i8** [[WORK_FN]], align 4			// CHECK3-NEXT: [[TMP5:%.]] = load i8, i8** [[WORK_FN]], align 4
	// CHECK3-NEXT: [[WORK_MATCH:%.]] = icmp eq i8 [[TMP5]], bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8*)			// CHECK3-NEXT: [[WORK_MATCH:%.]] = icmp eq i8 [[TMP5]], bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8*)
	// CHECK3-NEXT: br i1 [[WORK_MATCH]], label [[DOTEXECUTE_FN:%.]], label [[DOTCHECK_NEXT:%.]]			// CHECK3-NEXT: br i1 [[WORK_MATCH]], label [[DOTEXECUTE_FN:%.]], label [[DOTCHECK_NEXT:%.]]
	// CHECK3: .execute.fn:			// CHECK3: .execute.fn:
	// CHECK3-NEXT: call void @__omp_outlined___wrapper(i16 0, i32 [[TMP4]]) #[[ATTR5:[0-9]+]]			// CHECK3-NEXT: call void @__omp_outlined___wrapper(i16 0, i32 [[TMP4]]) #[[ATTR4:[0-9]+]]
	// CHECK3-NEXT: br label [[DOTTERMINATE_PARALLEL:%.*]]			// CHECK3-NEXT: br label [[DOTTERMINATE_PARALLEL:%.*]]
	// CHECK3: .check.next:			// CHECK3: .check.next:
	// CHECK3-NEXT: [[TMP6:%.]] = load i8, i8** [[WORK_FN]], align 4			// CHECK3-NEXT: [[TMP6:%.]] = bitcast i8 [[TMP2]] to void (i16, i32)*
	// CHECK3-NEXT: [[WORK_MATCH1:%.]] = icmp eq i8 [[TMP6]], bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8*)			// CHECK3-NEXT: call void [[TMP6]](i16 0, i32 [[TMP4]])
	// CHECK3-NEXT: br i1 [[WORK_MATCH1]], label [[DOTEXECUTE_FN2:%.]], label [[DOTCHECK_NEXT3:%.]]
	// CHECK3: .execute.fn2:
	// CHECK3-NEXT: call void @__omp_outlined__1_wrapper(i16 0, i32 [[TMP4]]) #[[ATTR5]]
	// CHECK3-NEXT: br label [[DOTTERMINATE_PARALLEL]]
	// CHECK3: .check.next3:
	// CHECK3-NEXT: [[TMP7:%.]] = bitcast i8 [[TMP2]] to void (i16, i32)*
	// CHECK3-NEXT: call void [[TMP7]](i16 0, i32 [[TMP4]])
	// CHECK3-NEXT: br label [[DOTTERMINATE_PARALLEL]]			// CHECK3-NEXT: br label [[DOTTERMINATE_PARALLEL]]
	// CHECK3: .terminate.parallel:			// CHECK3: .terminate.parallel:
	// CHECK3-NEXT: call void @__kmpc_kernel_end_parallel()			// CHECK3-NEXT: call void @__kmpc_kernel_end_parallel()
	// CHECK3-NEXT: br label [[DOTBARRIER_PARALLEL]]			// CHECK3-NEXT: br label [[DOTBARRIER_PARALLEL]]
	// CHECK3: .barrier.parallel:			// CHECK3: .barrier.parallel:
	// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK3-NEXT: br label [[DOTAWAIT_WORK]]			// CHECK3-NEXT: br label [[DOTAWAIT_WORK]]
	// CHECK3: .exit:			// CHECK3: .exit:
	Show All 9 Lines
	// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 4			// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 4
	// CHECK3-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK3-NEXT: [[NVPTX_TID:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK3-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK3-NEXT: [[NVPTX_NUM_THREADS:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK3-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK3-NEXT: [[NVPTX_WARP_SIZE:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK3-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]			// CHECK3-NEXT: [[THREAD_LIMIT:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS]], [[NVPTX_WARP_SIZE]]
	// CHECK3-NEXT: [[TMP1:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]			// CHECK3-NEXT: [[TMP1:%.*]] = icmp ult i32 [[NVPTX_TID]], [[THREAD_LIMIT]]
	// CHECK3-NEXT: br i1 [[TMP1]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]			// CHECK3-NEXT: br i1 [[TMP1]], label [[DOTWORKER:%.]], label [[DOTMASTERCHECK:%.]]
	// CHECK3: .worker:			// CHECK3: .worker:
	// CHECK3-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker() #[[ATTR5]]			// CHECK3-NEXT: call void @{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}_main_l25_worker() #[[ATTR4]]
	// CHECK3-NEXT: br label [[DOTEXIT:%.*]]			// CHECK3-NEXT: br label [[DOTEXIT:%.*]]
	// CHECK3: .mastercheck:			// CHECK3: .mastercheck:
	// CHECK3-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()			// CHECK3-NEXT: [[NVPTX_TID1:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.tid.x()
	// CHECK3-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK3-NEXT: [[NVPTX_NUM_THREADS2:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK3-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK3-NEXT: [[NVPTX_WARP_SIZE3:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK3-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1			// CHECK3-NEXT: [[TMP2:%.*]] = sub nuw i32 [[NVPTX_WARP_SIZE3]], 1
	// CHECK3-NEXT: [[TMP3:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1			// CHECK3-NEXT: [[TMP3:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS2]], 1
	// CHECK3-NEXT: [[TMP4:%.*]] = xor i32 [[TMP2]], -1			// CHECK3-NEXT: [[TMP4:%.*]] = xor i32 [[TMP2]], -1
	// CHECK3-NEXT: [[MASTER_TID:%.*]] = and i32 [[TMP3]], [[TMP4]]			// CHECK3-NEXT: [[MASTER_TID:%.*]] = and i32 [[TMP3]], [[TMP4]]
	// CHECK3-NEXT: [[TMP5:%.*]] = icmp eq i32 [[NVPTX_TID1]], [[MASTER_TID]]			// CHECK3-NEXT: [[TMP5:%.*]] = icmp eq i32 [[NVPTX_TID1]], [[MASTER_TID]]
	// CHECK3-NEXT: br i1 [[TMP5]], label [[DOTMASTER:%.*]], label [[DOTEXIT]]			// CHECK3-NEXT: br i1 [[TMP5]], label [[DOTMASTER:%.*]], label [[DOTEXIT]]
	// CHECK3: .master:			// CHECK3: .master:
	// CHECK3-NEXT: [[NVPTX_NUM_THREADS4:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()			// CHECK3-NEXT: [[NVPTX_NUM_THREADS4:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
	// CHECK3-NEXT: [[NVPTX_WARP_SIZE5:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()			// CHECK3-NEXT: [[NVPTX_WARP_SIZE5:%.*]] = call i32 @llvm.nvvm.read.ptx.sreg.warpsize()
	// CHECK3-NEXT: [[THREAD_LIMIT6:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS4]], [[NVPTX_WARP_SIZE5]]			// CHECK3-NEXT: [[THREAD_LIMIT6:%.*]] = sub nuw i32 [[NVPTX_NUM_THREADS4]], [[NVPTX_WARP_SIZE5]]
	// CHECK3-NEXT: call void @__kmpc_kernel_init(i32 [[THREAD_LIMIT6]], i16 1)			// CHECK3-NEXT: call void @__kmpc_kernel_init(i32 [[THREAD_LIMIT6]], i16 1)
	// CHECK3-NEXT: call void @__kmpc_data_sharing_init_stack()			// CHECK3-NEXT: call void @__kmpc_data_sharing_init_stack()
	// CHECK3-NEXT: [[TMP6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK3-NEXT: [[TMP6:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK3-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7:[0-9]+]]			// CHECK3-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7:[0-9]+]]
	// CHECK3-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 2)			// CHECK3-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 2)
	// CHECK3-NEXT: [[TMP7:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i32 0, i32 0			// CHECK3-NEXT: [[TMP7:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP8:%.]] = bitcast i32 [[TMP0]] to i8*			// CHECK3-NEXT: [[TMP8:%.]] = bitcast i32 [[TMP0]] to i8*
	// CHECK3-NEXT: store i8* [[TMP8]], i8** [[TMP7]], align 4			// CHECK3-NEXT: store i8* [[TMP8]], i8** [[TMP7]], align 4
	// CHECK3-NEXT: [[TMP9:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK3-NEXT: [[TMP9:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK3-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32) @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP9]], i32 1)			// CHECK3-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP6]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32) @__omp_outlined__ to i8), i8 bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8), i8* [[TMP9]], i32 1)
	// CHECK3-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]			// CHECK3-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]
	// CHECK3: .termination.notifier:			// CHECK3: .termination.notifier:
	// CHECK3-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK3-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK3-NEXT: br label [[DOTEXIT]]			// CHECK3-NEXT: br label [[DOTEXIT]]
	// CHECK3: .exit:			// CHECK3: .exit:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z3usePi			// CHECK3-LABEL: define {{[^@]+}}@_Z3usePi
	// CHECK3-SAME: (i32* [[C:%.*]]) #[[ATTR3:[0-9]+]] {			// CHECK3-SAME: (i32* [[C:%.*]]) #[[ATTR3:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca i32, align 4			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [1 x i8], align 4			// CHECK3-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [1 x i8], align 4
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB2:[0-9]+]])
	// CHECK3-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 4			// CHECK3-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 4
	// CHECK3-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 2)			// CHECK3-NEXT: call void @__kmpc_push_num_threads(%struct.ident_t* @[[GLOB2]], i32 [[TMP0]], i32 2)
	// CHECK3-NEXT: [[TMP1:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i32 0, i32 0			// CHECK3-NEXT: [[TMP1:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[CAPTURED_VARS_ADDRS]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP2:%.]] = bitcast i32* [[C_ADDR]] to i8*			// CHECK3-NEXT: [[TMP2:%.]] = bitcast i32* [[C_ADDR]] to i8*
	// CHECK3-NEXT: store i8* [[TMP2]], i8** [[TMP1]], align 4			// CHECK3-NEXT: store i8* [[TMP2]], i8** [[TMP1]], align 4
	// CHECK3-NEXT: [[TMP3:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**			// CHECK3-NEXT: [[TMP3:%.]] = bitcast [1 x i8]* [[CAPTURED_VARS_ADDRS]] to i8**
	// CHECK3-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32*) @__omp_outlined__ to i8), i8 bitcast (void (i16, i32)* @__omp_outlined___wrapper to i8), i8* [[TMP3]], i32 1)			// CHECK3-NEXT: call void @__kmpc_parallel_51(%struct.ident_t* @[[GLOB2]], i32 [[TMP0]], i32 1, i32 -1, i32 -1, i8* bitcast (void (i32, i32, i32*) @__omp_outlined__1 to i8), i8 bitcast (void (i16, i32)* @__omp_outlined__1_wrapper to i8), i8* [[TMP3]], i32 1)
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__			// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__
				// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK3-NEXT: [[C_ADDR:%.]] = alloca i32, align 4
				// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
				// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
				// CHECK3-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 4
				// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 4
				// CHECK3-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7]]
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined___wrapper
				// CHECK3-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK3-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK3-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK3-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
				// CHECK3-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK3-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK3-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
				// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
				// CHECK3-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
				// CHECK3-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
				// CHECK3-NEXT: call void @__omp_outlined__(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]]) #[[ATTR4]]
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32* nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32* nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca i32*, align 4			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca i32*, align 4
	// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4			// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
	// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4			// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
	// CHECK3-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4			// CHECK3-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	Show All 23 Lines
	// CHECK3-NEXT: [[TMP5:%.]] = bitcast i32 [[ATOMIC_TEMP]] to i8*			// CHECK3-NEXT: [[TMP5:%.]] = bitcast i32 [[ATOMIC_TEMP]] to i8*
	// CHECK3-NEXT: [[TMP6:%.]] = bitcast i32 [[ATOMIC_TEMP1]] to i8*			// CHECK3-NEXT: [[TMP6:%.]] = bitcast i32 [[ATOMIC_TEMP1]] to i8*
	// CHECK3-NEXT: [[CALL:%.]] = call zeroext i1 @__atomic_compare_exchange(i32 4, i8 [[TMP4]], i8* [[TMP5]], i8* [[TMP6]], i32 0, i32 0) #[[ATTR7]]			// CHECK3-NEXT: [[CALL:%.]] = call zeroext i1 @__atomic_compare_exchange(i32 4, i8 [[TMP4]], i8* [[TMP5]], i8* [[TMP6]], i32 0, i32 0) #[[ATTR7]]
	// CHECK3-NEXT: br i1 [[CALL]], label [[ATOMIC_EXIT:%.*]], label [[ATOMIC_CONT]]			// CHECK3-NEXT: br i1 [[CALL]], label [[ATOMIC_EXIT:%.*]], label [[ATOMIC_CONT]]
	// CHECK3: atomic_exit:			// CHECK3: atomic_exit:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined___wrapper			// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK3-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {			// CHECK3-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2			// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK3-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4			// CHECK3-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
	// CHECK3-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4			// CHECK3-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK3-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2			// CHECK3-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4			// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK3-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])			// CHECK3-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4			// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
	// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0			// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
	// CHECK3-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32***			// CHECK3-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32***
	// CHECK3-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4			// CHECK3-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
	// CHECK3-NEXT: call void @__omp_outlined__(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32** [[TMP5]]) #[[ATTR5]]			// CHECK3-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32** [[TMP5]]) #[[ATTR4]]
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
	// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
	// CHECK3-NEXT: store i32* [[C]], i32** [[C_ADDR]], align 4
	// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32** [[C_ADDR]], align 4
	// CHECK3-NEXT: call void @_Z3usePi(i32* [[TMP0]]) #[[ATTR7]]
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK3-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK3-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
	// CHECK3-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK3-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK3-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
	// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
	// CHECK3-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
	// CHECK3-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
	// CHECK3-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]]) #[[ATTR5]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//

clang/test/OpenMP/nvptx_target_codegen.cpp

	Show First 20 Lines • Show All 757 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: [[TMP19:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to i8*			// CHECK1-NEXT: [[TMP19:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to i8*
	// CHECK1-NEXT: call void @__kmpc_data_sharing_pop_stack(i8* [[TMP19]])			// CHECK1-NEXT: call void @__kmpc_data_sharing_pop_stack(i8* [[TMP19]])
	// CHECK1-NEXT: br label [[DOTEXIT5]]			// CHECK1-NEXT: br label [[DOTEXIT5]]
	// CHECK1: .exit5:			// CHECK1: .exit5:
	// CHECK1-NEXT: [[TMP20:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK1-NEXT: [[TMP20:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK1-NEXT: ret i32 [[TMP20]]			// CHECK1-NEXT: ret i32 [[TMP20]]
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[F:%.]], double nonnull align 8 dereferenceable(8) [[A:%.*]]) #[[ATTR0]] {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[F_ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[A_ADDR:%.]] = alloca double, align 8
	// CHECK1-NEXT: [[TMP:%.]] = alloca double, align 8
	// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[F]], i32** [[F_ADDR]], align 8
	// CHECK1-NEXT: store double* [[A]], double** [[A_ADDR]], align 8
	// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[F_ADDR]], align 8
	// CHECK1-NEXT: [[TMP1:%.]] = load double, double** [[A_ADDR]], align 8
	// CHECK1-NEXT: store double* [[TMP1]], double** [[TMP]], align 8
	// CHECK1-NEXT: [[TMP2:%.]] = load double, double** [[TMP]], align 8
	// CHECK1-NEXT: [[TMP3:%.]] = load double, double [[TMP2]], align 8
	// CHECK1-NEXT: [[ADD:%.*]] = fadd double 2.000000e+00, [[TMP3]]
	// CHECK1-NEXT: [[CONV:%.*]] = fptosi double [[ADD]] to i32
	// CHECK1-NEXT: store i32 [[CONV]], i32* [[TMP0]], align 4
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK1-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK1-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 8
	// CHECK1-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK1-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK1-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK1-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 8
	// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i64 0
	// CHECK1-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
	// CHECK1-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 8
	// CHECK1-NEXT: [[TMP6:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i64 1
	// CHECK1-NEXT: [[TMP7:%.]] = bitcast i8* [[TMP6]] to double**
	// CHECK1-NEXT: [[TMP8:%.]] = load double, double** [[TMP7]], align 8
	// CHECK1-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]], double* [[TMP8]]) #[[ATTR2]]
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z16unreachable_callv_l142_worker			// CHECK1-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z16unreachable_callv_l142_worker
	// CHECK1-SAME: () #[[ATTR3]] {			// CHECK1-SAME: () #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[WORK_FN:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[WORK_FN:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1			// CHECK1-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1
	// CHECK1-NEXT: store i8* null, i8** [[WORK_FN]], align 8			// CHECK1-NEXT: store i8* null, i8** [[WORK_FN]], align 8
	// CHECK1-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1			// CHECK1-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1
	// CHECK1-NEXT: br label [[DOTAWAIT_WORK:%.*]]			// CHECK1-NEXT: br label [[DOTAWAIT_WORK:%.*]]
	▲ Show 20 Lines • Show All 152 Lines • ▼ Show 20 Lines
	// CHECK1: .termination.notifier:			// CHECK1: .termination.notifier:
	// CHECK1-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK1-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK1-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK1-NEXT: br label [[DOTEXIT]]			// CHECK1-NEXT: br label [[DOTEXIT]]
	// CHECK1: .exit:			// CHECK1: .exit:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1
				// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[F:%.]], double nonnull align 8 dereferenceable(8) [[A:%.*]]) #[[ATTR0]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: [[F_ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: [[A_ADDR:%.]] = alloca double, align 8
				// CHECK1-NEXT: [[TMP:%.]] = alloca double, align 8
				// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
				// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
				// CHECK1-NEXT: store i32* [[F]], i32** [[F_ADDR]], align 8
				// CHECK1-NEXT: store double* [[A]], double** [[A_ADDR]], align 8
				// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[F_ADDR]], align 8
				// CHECK1-NEXT: [[TMP1:%.]] = load double, double** [[A_ADDR]], align 8
				// CHECK1-NEXT: store double* [[TMP1]], double** [[TMP]], align 8
				// CHECK1-NEXT: [[TMP2:%.]] = load double, double** [[TMP]], align 8
				// CHECK1-NEXT: [[TMP3:%.]] = load double, double [[TMP2]], align 8
				// CHECK1-NEXT: [[ADD:%.*]] = fadd double 2.000000e+00, [[TMP3]]
				// CHECK1-NEXT: [[CONV:%.*]] = fptosi double [[ADD]] to i32
				// CHECK1-NEXT: store i32 [[CONV]], i32* [[TMP0]], align 4
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
				// CHECK1-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR3]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK1-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 8
				// CHECK1-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK1-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK1-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK1-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 8
				// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i64 0
				// CHECK1-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
				// CHECK1-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 8
				// CHECK1-NEXT: [[TMP6:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i64 1
				// CHECK1-NEXT: [[TMP7:%.]] = bitcast i8* [[TMP6]] to double**
				// CHECK1-NEXT: [[TMP8:%.]] = load double, double** [[TMP7]], align 8
				// CHECK1-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]], double* [[TMP8]]) #[[ATTR2]]
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z9targetBarPiS__l25			// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z9targetBarPiS__l25
	// CHECK2-SAME: (i32* [[PTR1:%.]], i32* nonnull align 4 dereferenceable(4) [[PTR2:%.*]]) #[[ATTR0:[0-9]+]] {			// CHECK2-SAME: (i32* [[PTR1:%.]], i32* nonnull align 4 dereferenceable(4) [[PTR2:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[PTR1_ADDR:%.]] = alloca i32, align 4			// CHECK2-NEXT: [[PTR1_ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[PTR2_ADDR:%.]] = alloca i32*, align 4			// CHECK2-NEXT: [[PTR2_ADDR:%.]] = alloca i32*, align 4
	// CHECK2-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [2 x i8], align 4			// CHECK2-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [2 x i8], align 4
	// CHECK2-NEXT: store i32* [[PTR1]], i32** [[PTR1_ADDR]], align 4			// CHECK2-NEXT: store i32* [[PTR1]], i32** [[PTR1_ADDR]], align 4
	// CHECK2-NEXT: store i32 [[PTR2]], i32* [[PTR2_ADDR]], align 4			// CHECK2-NEXT: store i32 [[PTR2]], i32* [[PTR2_ADDR]], align 4
	▲ Show 20 Lines • Show All 600 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[TMP19:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to i8*			// CHECK2-NEXT: [[TMP19:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to i8*
	// CHECK2-NEXT: call void @__kmpc_data_sharing_pop_stack(i8* [[TMP19]])			// CHECK2-NEXT: call void @__kmpc_data_sharing_pop_stack(i8* [[TMP19]])
	// CHECK2-NEXT: br label [[DOTEXIT5]]			// CHECK2-NEXT: br label [[DOTEXIT5]]
	// CHECK2: .exit5:			// CHECK2: .exit5:
	// CHECK2-NEXT: [[TMP20:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK2-NEXT: [[TMP20:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK2-NEXT: ret i32 [[TMP20]]			// CHECK2-NEXT: ret i32 [[TMP20]]
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[F:%.]], double nonnull align 8 dereferenceable(8) [[A:%.*]]) #[[ATTR0]] {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[F_ADDR:%.]] = alloca i32, align 4
	// CHECK2-NEXT: [[A_ADDR:%.]] = alloca double, align 4
	// CHECK2-NEXT: [[TMP:%.]] = alloca double, align 4
	// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
	// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
	// CHECK2-NEXT: store i32* [[F]], i32** [[F_ADDR]], align 4
	// CHECK2-NEXT: store double* [[A]], double** [[A_ADDR]], align 4
	// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[F_ADDR]], align 4
	// CHECK2-NEXT: [[TMP1:%.]] = load double, double** [[A_ADDR]], align 4
	// CHECK2-NEXT: store double* [[TMP1]], double** [[TMP]], align 4
	// CHECK2-NEXT: [[TMP2:%.]] = load double, double** [[TMP]], align 4
	// CHECK2-NEXT: [[TMP3:%.]] = load double, double [[TMP2]], align 8
	// CHECK2-NEXT: [[ADD:%.*]] = fadd double 2.000000e+00, [[TMP3]]
	// CHECK2-NEXT: [[CONV:%.*]] = fptosi double [[ADD]] to i32
	// CHECK2-NEXT: store i32 [[CONV]], i32* [[TMP0]], align 4
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK2-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK2-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
	// CHECK2-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK2-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK2-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK2-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
	// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
	// CHECK2-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
	// CHECK2-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
	// CHECK2-NEXT: [[TMP6:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 1
	// CHECK2-NEXT: [[TMP7:%.]] = bitcast i8* [[TMP6]] to double**
	// CHECK2-NEXT: [[TMP8:%.]] = load double, double** [[TMP7]], align 4
	// CHECK2-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]], double* [[TMP8]]) #[[ATTR2]]
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z16unreachable_callv_l142_worker			// CHECK2-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z16unreachable_callv_l142_worker
	// CHECK2-SAME: () #[[ATTR3]] {			// CHECK2-SAME: () #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[WORK_FN:%.]] = alloca i8, align 4			// CHECK2-NEXT: [[WORK_FN:%.]] = alloca i8, align 4
	// CHECK2-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1			// CHECK2-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1
	// CHECK2-NEXT: store i8* null, i8** [[WORK_FN]], align 4			// CHECK2-NEXT: store i8* null, i8** [[WORK_FN]], align 4
	// CHECK2-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1			// CHECK2-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1
	// CHECK2-NEXT: br label [[DOTAWAIT_WORK:%.*]]			// CHECK2-NEXT: br label [[DOTAWAIT_WORK:%.*]]
	▲ Show 20 Lines • Show All 151 Lines • ▼ Show 20 Lines
	// CHECK2: .termination.notifier:			// CHECK2: .termination.notifier:
	// CHECK2-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK2-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK2-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK2-NEXT: br label [[DOTEXIT]]			// CHECK2-NEXT: br label [[DOTEXIT]]
	// CHECK2: .exit:			// CHECK2: .exit:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1
				// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[F:%.]], double nonnull align 8 dereferenceable(8) [[A:%.*]]) #[[ATTR0]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK2-NEXT: [[F_ADDR:%.]] = alloca i32, align 4
				// CHECK2-NEXT: [[A_ADDR:%.]] = alloca double, align 4
				// CHECK2-NEXT: [[TMP:%.]] = alloca double, align 4
				// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
				// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
				// CHECK2-NEXT: store i32* [[F]], i32** [[F_ADDR]], align 4
				// CHECK2-NEXT: store double* [[A]], double** [[A_ADDR]], align 4
				// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[F_ADDR]], align 4
				// CHECK2-NEXT: [[TMP1:%.]] = load double, double** [[A_ADDR]], align 4
				// CHECK2-NEXT: store double* [[TMP1]], double** [[TMP]], align 4
				// CHECK2-NEXT: [[TMP2:%.]] = load double, double** [[TMP]], align 4
				// CHECK2-NEXT: [[TMP3:%.]] = load double, double [[TMP2]], align 8
				// CHECK2-NEXT: [[ADD:%.*]] = fadd double 2.000000e+00, [[TMP3]]
				// CHECK2-NEXT: [[CONV:%.*]] = fptosi double [[ADD]] to i32
				// CHECK2-NEXT: store i32 [[CONV]], i32* [[TMP0]], align 4
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
				// CHECK2-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR3]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK2-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
				// CHECK2-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK2-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK2-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK2-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
				// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
				// CHECK2-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
				// CHECK2-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
				// CHECK2-NEXT: [[TMP6:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 1
				// CHECK2-NEXT: [[TMP7:%.]] = bitcast i8* [[TMP6]] to double**
				// CHECK2-NEXT: [[TMP8:%.]] = load double, double** [[TMP7]], align 4
				// CHECK2-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]], double* [[TMP8]]) #[[ATTR2]]
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z9targetBarPiS__l25			// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z9targetBarPiS__l25
	// CHECK3-SAME: (i32* [[PTR1:%.]], i32* nonnull align 4 dereferenceable(4) [[PTR2:%.*]]) #[[ATTR0:[0-9]+]] {			// CHECK3-SAME: (i32* [[PTR1:%.]], i32* nonnull align 4 dereferenceable(4) [[PTR2:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[PTR1_ADDR:%.]] = alloca i32, align 4			// CHECK3-NEXT: [[PTR1_ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[PTR2_ADDR:%.]] = alloca i32*, align 4			// CHECK3-NEXT: [[PTR2_ADDR:%.]] = alloca i32*, align 4
	// CHECK3-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [2 x i8], align 4			// CHECK3-NEXT: [[CAPTURED_VARS_ADDRS:%.]] = alloca [2 x i8], align 4
	// CHECK3-NEXT: store i32* [[PTR1]], i32** [[PTR1_ADDR]], align 4			// CHECK3-NEXT: store i32* [[PTR1]], i32** [[PTR1_ADDR]], align 4
	// CHECK3-NEXT: store i32 [[PTR2]], i32* [[PTR2_ADDR]], align 4			// CHECK3-NEXT: store i32 [[PTR2]], i32* [[PTR2_ADDR]], align 4
	▲ Show 20 Lines • Show All 600 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[TMP19:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to i8*			// CHECK3-NEXT: [[TMP19:%.]] = bitcast %struct._globalized_locals_ty [[_SELECT_STACK]] to i8*
	// CHECK3-NEXT: call void @__kmpc_data_sharing_pop_stack(i8* [[TMP19]])			// CHECK3-NEXT: call void @__kmpc_data_sharing_pop_stack(i8* [[TMP19]])
	// CHECK3-NEXT: br label [[DOTEXIT5]]			// CHECK3-NEXT: br label [[DOTEXIT5]]
	// CHECK3: .exit5:			// CHECK3: .exit5:
	// CHECK3-NEXT: [[TMP20:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK3-NEXT: [[TMP20:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK3-NEXT: ret i32 [[TMP20]]			// CHECK3-NEXT: ret i32 [[TMP20]]
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[F:%.]], double nonnull align 8 dereferenceable(8) [[A:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[F_ADDR:%.]] = alloca i32, align 4
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca double, align 4
	// CHECK3-NEXT: [[TMP:%.]] = alloca double, align 4
	// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
	// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
	// CHECK3-NEXT: store i32* [[F]], i32** [[F_ADDR]], align 4
	// CHECK3-NEXT: store double* [[A]], double** [[A_ADDR]], align 4
	// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32** [[F_ADDR]], align 4
	// CHECK3-NEXT: [[TMP1:%.]] = load double, double** [[A_ADDR]], align 4
	// CHECK3-NEXT: store double* [[TMP1]], double** [[TMP]], align 4
	// CHECK3-NEXT: [[TMP2:%.]] = load double, double** [[TMP]], align 4
	// CHECK3-NEXT: [[TMP3:%.]] = load double, double [[TMP2]], align 8
	// CHECK3-NEXT: [[ADD:%.*]] = fadd double 2.000000e+00, [[TMP3]]
	// CHECK3-NEXT: [[CONV:%.*]] = fptosi double [[ADD]] to i32
	// CHECK3-NEXT: store i32 [[CONV]], i32* [[TMP0]], align 4
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
	// CHECK3-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
	// CHECK3-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
	// CHECK3-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
	// CHECK3-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
	// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
	// CHECK3-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
	// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
	// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
	// CHECK3-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
	// CHECK3-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
	// CHECK3-NEXT: [[TMP6:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 1
	// CHECK3-NEXT: [[TMP7:%.]] = bitcast i8* [[TMP6]] to double**
	// CHECK3-NEXT: [[TMP8:%.]] = load double, double** [[TMP7]], align 4
	// CHECK3-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]], double* [[TMP8]]) #[[ATTR2]]
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z16unreachable_callv_l142_worker			// CHECK3-LABEL: define {{[^@]+}}@{{__omp_offloading_[0-9a-z]+_[0-9a-z]+}}__Z16unreachable_callv_l142_worker
	// CHECK3-SAME: () #[[ATTR3]] {			// CHECK3-SAME: () #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[WORK_FN:%.]] = alloca i8, align 4			// CHECK3-NEXT: [[WORK_FN:%.]] = alloca i8, align 4
	// CHECK3-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1			// CHECK3-NEXT: [[EXEC_STATUS:%.*]] = alloca i8, align 1
	// CHECK3-NEXT: store i8* null, i8** [[WORK_FN]], align 4			// CHECK3-NEXT: store i8* null, i8** [[WORK_FN]], align 4
	// CHECK3-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1			// CHECK3-NEXT: store i8 0, i8* [[EXEC_STATUS]], align 1
	// CHECK3-NEXT: br label [[DOTAWAIT_WORK:%.*]]			// CHECK3-NEXT: br label [[DOTAWAIT_WORK:%.*]]
	▲ Show 20 Lines • Show All 150 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]			// CHECK3-NEXT: br label [[DOTTERMINATION_NOTIFIER:%.*]]
	// CHECK3: .termination.notifier:			// CHECK3: .termination.notifier:
	// CHECK3-NEXT: call void @__kmpc_kernel_deinit(i16 1)			// CHECK3-NEXT: call void @__kmpc_kernel_deinit(i16 1)
	// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)			// CHECK3-NEXT: call void @__kmpc_barrier_simple_spmd(%struct.ident_t* null, i32 0)
	// CHECK3-NEXT: br label [[DOTEXIT]]			// CHECK3-NEXT: br label [[DOTEXIT]]
	// CHECK3: .exit:			// CHECK3: .exit:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
				//
				// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1
				// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[F:%.]], double nonnull align 8 dereferenceable(8) [[A:%.*]]) #[[ATTR0]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 4
				// CHECK3-NEXT: [[F_ADDR:%.]] = alloca i32, align 4
				// CHECK3-NEXT: [[A_ADDR:%.]] = alloca double, align 4
				// CHECK3-NEXT: [[TMP:%.]] = alloca double, align 4
				// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 4
				// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 4
				// CHECK3-NEXT: store i32* [[F]], i32** [[F_ADDR]], align 4
				// CHECK3-NEXT: store double* [[A]], double** [[A_ADDR]], align 4
				// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32** [[F_ADDR]], align 4
				// CHECK3-NEXT: [[TMP1:%.]] = load double, double** [[A_ADDR]], align 4
				// CHECK3-NEXT: store double* [[TMP1]], double** [[TMP]], align 4
				// CHECK3-NEXT: [[TMP2:%.]] = load double, double** [[TMP]], align 4
				// CHECK3-NEXT: [[TMP3:%.]] = load double, double [[TMP2]], align 8
				// CHECK3-NEXT: [[ADD:%.*]] = fadd double 2.000000e+00, [[TMP3]]
				// CHECK3-NEXT: [[CONV:%.*]] = fptosi double [[ADD]] to i32
				// CHECK3-NEXT: store i32 [[CONV]], i32* [[TMP0]], align 4
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@__omp_outlined__1_wrapper
				// CHECK3-SAME: (i16 zeroext [[TMP0:%.]], i32 [[TMP1:%.]]) #[[ATTR3]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i16, align 2
				// CHECK3-NEXT: [[DOTADDR1:%.*]] = alloca i32, align 4
				// CHECK3-NEXT: [[DOTZERO_ADDR:%.*]] = alloca i32, align 4
				// CHECK3-NEXT: [[GLOBAL_ARGS:%.]] = alloca i8*, align 4
				// CHECK3-NEXT: store i32 0, i32* [[DOTZERO_ADDR]], align 4
				// CHECK3-NEXT: store i16 [[TMP0]], i16* [[DOTADDR]], align 2
				// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 4
				// CHECK3-NEXT: call void @__kmpc_get_shared_variables(i8*** [[GLOBAL_ARGS]])
				// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[GLOBAL_ARGS]], align 4
				// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 0
				// CHECK3-NEXT: [[TMP4:%.]] = bitcast i8* [[TMP3]] to i32**
				// CHECK3-NEXT: [[TMP5:%.]] = load i32, i32** [[TMP4]], align 4
				// CHECK3-NEXT: [[TMP6:%.]] = getelementptr inbounds i8, i8** [[TMP2]], i32 1
				// CHECK3-NEXT: [[TMP7:%.]] = bitcast i8* [[TMP6]] to double**
				// CHECK3-NEXT: [[TMP8:%.]] = load double, double** [[TMP7]], align 4
				// CHECK3-NEXT: call void @__omp_outlined__1(i32* [[DOTADDR1]], i32* [[DOTZERO_ADDR]], i32* [[TMP5]], double* [[TMP8]]) #[[ATTR2]]
				// CHECK3-NEXT: ret void
				//

clang/test/OpenMP/parallel_for_codegen.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 2,462 Lines • ▼ Show 20 Lines
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@__clang_call_terminate			// CHECK2-LABEL: define {{[^@]+}}@__clang_call_terminate
	// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR6:[0-9]+]] comdat {			// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR6:[0-9]+]] comdat {
	// CHECK2-NEXT: [[TMP2:%.]] = call i8 @__cxa_begin_catch(i8* [[TMP0]]) #[[ATTR2:[0-9]+]]			// CHECK2-NEXT: [[TMP2:%.]] = call i8 @__cxa_begin_catch(i8* [[TMP0]]) #[[ATTR2:[0-9]+]]
	// CHECK2-NEXT: call void @_ZSt9terminatev() #[[ATTR7]]			// CHECK2-NEXT: call void @_ZSt9terminatev() #[[ATTR7]]
	// CHECK2-NEXT: unreachable			// CHECK2-NEXT: unreachable
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z3foov
	// CHECK3-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_Z8mayThrowv()
	// CHECK3-NEXT: ret i32 0
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_Z17with_var_schedulev			// CHECK3-LABEL: define {{[^@]+}}@_Z17with_var_schedulev
	// CHECK3-SAME: () #[[ATTR2:[0-9]+]] {			// CHECK3-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A:%.*]] = alloca double, align 8			// CHECK3-NEXT: [[A:%.*]] = alloca double, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1			// CHECK3-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: store double 5.000000e+00, double* [[A]], align 8			// CHECK3-NEXT: store double 5.000000e+00, double* [[A]], align 8
	// CHECK3-NEXT: [[TMP0:%.]] = load double, double [[A]], align 8			// CHECK3-NEXT: [[TMP0:%.]] = load double, double [[A]], align 8
	// CHECK3-NEXT: [[CONV:%.*]] = fptosi double [[TMP0]] to i8			// CHECK3-NEXT: [[CONV:%.*]] = fptosi double [[TMP0]] to i8
	// CHECK3-NEXT: store i8 [[CONV]], i8* [[DOTCAPTURE_EXPR_]], align 1			// CHECK3-NEXT: store i8 [[CONV]], i8* [[DOTCAPTURE_EXPR_]], align 1
	// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1			// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1
	// CHECK3-NEXT: [[CONV1:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*			// CHECK3-NEXT: [[CONV1:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*
	// CHECK3-NEXT: store i8 [[TMP1]], i8* [[CONV1]], align 1			// CHECK3-NEXT: store i8 [[TMP1]], i8* [[CONV1]], align 1
	// CHECK3-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8			// CHECK3-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 1, void (i32, i32, ...)* bitcast (void (i32, i32, i64)* @.omp_outlined. to void (i32, i32, ...)*), i64 [[TMP2]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 1, void (i32, i32, ...)* bitcast (void (i32, i32, i64)* @.omp_outlined. to void (i32, i32, ...)*), i64 [[TMP2]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined.			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined.
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3:[0-9]+]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[TMP:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[TMP:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca double, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca double, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR_2:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR_2:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[TMP23:%.]] = load i32, i32 [[TMP22]], align 4			// CHECK3-NEXT: [[TMP23:%.]] = load i32, i32 [[TMP22]], align 4
	// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP23]])			// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP23]])
	// CHECK3-NEXT: br label [[OMP_PRECOND_END]]			// CHECK3-NEXT: br label [[OMP_PRECOND_END]]
	// CHECK3: omp.precond.end:			// CHECK3: omp.precond.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z23without_schedule_clausePfS_S_S_			// CHECK3-LABEL: define {{[^@]+}}@_Z23without_schedule_clausePfS_S_S_
	// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR2]] {			// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8			// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8
	// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8			// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8
	// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8			// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..1 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..1 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..1			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..1
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	// CHECK3: omp.inner.for.end:			// CHECK3: omp.inner.for.end:
	// CHECK3-NEXT: br label [[OMP_LOOP_EXIT:%.*]]			// CHECK3-NEXT: br label [[OMP_LOOP_EXIT:%.*]]
	// CHECK3: omp.loop.exit:			// CHECK3: omp.loop.exit:
	// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP5]])			// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP5]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z18static_not_chunkedPfS_S_S_			// CHECK3-LABEL: define {{[^@]+}}@_Z18static_not_chunkedPfS_S_S_
	// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR2]] {			// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8			// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8
	// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8			// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8
	// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8			// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..2 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..2 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..2			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..2
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	// CHECK3: omp.inner.for.end:			// CHECK3: omp.inner.for.end:
	// CHECK3-NEXT: br label [[OMP_LOOP_EXIT:%.*]]			// CHECK3-NEXT: br label [[OMP_LOOP_EXIT:%.*]]
	// CHECK3: omp.loop.exit:			// CHECK3: omp.loop.exit:
	// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP5]])			// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP5]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z14static_chunkedPfS_S_S_			// CHECK3-LABEL: define {{[^@]+}}@_Z14static_chunkedPfS_S_S_
	// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR2]] {			// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8			// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8
	// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8			// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8
	// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8			// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..3 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..3 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..3			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..3
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: store i32 [[ADD13]], i32* [[DOTOMP_UB]], align 4			// CHECK3-NEXT: store i32 [[ADD13]], i32* [[DOTOMP_UB]], align 4
	// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]			// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]
	// CHECK3: omp.dispatch.end:			// CHECK3: omp.dispatch.end:
	// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP5]])			// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP5]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z8dynamic1PfS_S_S_			// CHECK3-LABEL: define {{[^@]+}}@_Z8dynamic1PfS_S_S_
	// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR2]] {			// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8			// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8
	// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8			// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8
	// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8			// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..4 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..4 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..4			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..4
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: br label [[OMP_DISPATCH_INC:%.*]]			// CHECK3-NEXT: br label [[OMP_DISPATCH_INC:%.*]]
	// CHECK3: omp.dispatch.inc:			// CHECK3: omp.dispatch.inc:
	// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]			// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]
	// CHECK3: omp.dispatch.end:			// CHECK3: omp.dispatch.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z7guided7PfS_S_S_			// CHECK3-LABEL: define {{[^@]+}}@_Z7guided7PfS_S_S_
	// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR2]] {			// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8			// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8
	// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8			// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8
	// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8			// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..5 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..5 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..5			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..5
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: br label [[OMP_DISPATCH_INC:%.*]]			// CHECK3-NEXT: br label [[OMP_DISPATCH_INC:%.*]]
	// CHECK3: omp.dispatch.inc:			// CHECK3: omp.dispatch.inc:
	// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]			// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]
	// CHECK3: omp.dispatch.end:			// CHECK3: omp.dispatch.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z9test_autoPfS_S_S_			// CHECK3-LABEL: define {{[^@]+}}@_Z9test_autoPfS_S_S_
	// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR2]] {			// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[X:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[X:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[Y:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[Y:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8			// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8
	// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8			// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8
	// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8			// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8
	// CHECK3-NEXT: store i32 0, i32* [[X]], align 4			// CHECK3-NEXT: store i32 0, i32* [[X]], align 4
	// CHECK3-NEXT: store i32 0, i32* [[Y]], align 4			// CHECK3-NEXT: store i32 0, i32* [[Y]], align 4
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 5, void (i32, i32, ...)* bitcast (void (i32, i32, i32, float, float, float, float) @.omp_outlined..6 to void (i32, i32, ...)), i32 [[Y]], float [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float [[D_ADDR]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 5, void (i32, i32, ...)* bitcast (void (i32, i32, i32, float, float, float, float) @.omp_outlined..6 to void (i32, i32, ...)), i32 [[Y]], float [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float [[D_ADDR]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..6			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..6
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[Y:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[Y:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[Y_ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[Y_ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8
	▲ Show 20 Lines • Show All 121 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]			// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]
	// CHECK3: omp.dispatch.end:			// CHECK3: omp.dispatch.end:
	// CHECK3-NEXT: br label [[OMP_PRECOND_END]]			// CHECK3-NEXT: br label [[OMP_PRECOND_END]]
	// CHECK3: omp.precond.end:			// CHECK3: omp.precond.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z7runtimePfS_S_S_			// CHECK3-LABEL: define {{[^@]+}}@_Z7runtimePfS_S_S_
	// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR2]] {			// CHECK3-SAME: (float* [[A:%.]], float [[B:%.]], float [[C:%.]], float [[D:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[X:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[X:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8			// CHECK3-NEXT: store float* [[B]], float** [[B_ADDR]], align 8
	// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8			// CHECK3-NEXT: store float* [[C]], float** [[C_ADDR]], align 8
	// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8			// CHECK3-NEXT: store float* [[D]], float** [[D_ADDR]], align 8
	// CHECK3-NEXT: store i32 0, i32* [[X]], align 4			// CHECK3-NEXT: store i32 0, i32* [[X]], align 4
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..7 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, float, float, float, float)* @.omp_outlined..7 to void (i32, i32, ...)), float* [[A_ADDR]], float [[B_ADDR]], float [[C_ADDR]], float** [[D_ADDR]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..7			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..7
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], float* nonnull align 8 dereferenceable(8) [[B:%.]], float* nonnull align 8 dereferenceable(8) [[C:%.]], float* nonnull align 8 dereferenceable(8) [[D:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[B_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[D_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	// CHECK3: omp.inner.for.end:			// CHECK3: omp.inner.for.end:
	// CHECK3-NEXT: br label [[OMP_DISPATCH_INC:%.*]]			// CHECK3-NEXT: br label [[OMP_DISPATCH_INC:%.*]]
	// CHECK3: omp.dispatch.inc:			// CHECK3: omp.dispatch.inc:
	// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]			// CHECK3-NEXT: br label [[OMP_DISPATCH_COND]]
	// CHECK3: omp.dispatch.end:			// CHECK3: omp.dispatch.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@_Z3foov
				// CHECK3-SAME: () #[[ATTR3:[0-9]+]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: call void @_Z8mayThrowv()
				// CHECK3-NEXT: ret i32 0
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@_Z12parallel_forPfi			// CHECK3-LABEL: define {{[^@]+}}@_Z12parallel_forPfi
	// CHECK3-SAME: (float* [[A:%.]], i32 [[N:%.]]) #[[ATTR2]] {			// CHECK3-SAME: (float* [[A:%.]], i32 [[N:%.]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float, align 8
	// CHECK3-NEXT: [[N_ADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[N_ADDR:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[N_CASTED:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[N_CASTED:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8			// CHECK3-NEXT: store float* [[A]], float** [[A_ADDR]], align 8
	// CHECK3-NEXT: store i32 [[N]], i32* [[N_ADDR]], align 4			// CHECK3-NEXT: store i32 [[N]], i32* [[N_ADDR]], align 4
	Show All 9 Lines
	// CHECK3-NEXT: [[TMP4:%.]] = load i64, i64 [[N_CASTED]], align 8			// CHECK3-NEXT: [[TMP4:%.]] = load i64, i64 [[N_CASTED]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, float*, i64, i64) @.omp_outlined..8 to void (i32, i32, ...)), float* [[A_ADDR]], i64 [[TMP1]], i64 [[TMP4]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, float*, i64, i64) @.omp_outlined..8 to void (i32, i32, ...)), float* [[A_ADDR]], i64 [[TMP1]], i64 [[TMP4]])
	// CHECK3-NEXT: [[TMP5:%.]] = load i8, i8** [[SAVED_STACK]], align 8			// CHECK3-NEXT: [[TMP5:%.]] = load i8, i8** [[SAVED_STACK]], align 8
	// CHECK3-NEXT: call void @llvm.stackrestore(i8* [[TMP5]])			// CHECK3-NEXT: call void @llvm.stackrestore(i8* [[TMP5]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..8			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..8
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], i64 [[VLA:%.]], i64 [[N:%.]]) #[[ATTR3]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], float* nonnull align 8 dereferenceable(8) [[A:%.]], i64 [[VLA:%.]], i64 [[N:%.]]) #[[ATTR1]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8			// CHECK3-NEXT: [[A_ADDR:%.]] = alloca float*, align 8
	// CHECK3-NEXT: [[VLA_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[VLA_ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[N_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[N_ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[TMP:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: catch i8* null			// CHECK3-NEXT: catch i8* null
	// CHECK3-NEXT: [[TMP26:%.]] = extractvalue { i8, i32 } [[TMP25]], 0			// CHECK3-NEXT: [[TMP26:%.]] = extractvalue { i8, i32 } [[TMP25]], 0
	// CHECK3-NEXT: call void @__clang_call_terminate(i8* [[TMP26]]) #[[ATTR7:[0-9]+]]			// CHECK3-NEXT: call void @__clang_call_terminate(i8* [[TMP26]]) #[[ATTR7:[0-9]+]]
	// CHECK3-NEXT: unreachable			// CHECK3-NEXT: unreachable
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@__clang_call_terminate			// CHECK3-LABEL: define {{[^@]+}}@__clang_call_terminate
	// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR6:[0-9]+]] comdat {			// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR6:[0-9]+]] comdat {
	// CHECK3-NEXT: [[TMP2:%.]] = call i8 @__cxa_begin_catch(i8* [[TMP0]]) #[[ATTR4:[0-9]+]]			// CHECK3-NEXT: [[TMP2:%.]] = call i8 @__cxa_begin_catch(i8* [[TMP0]]) #[[ATTR2:[0-9]+]]
	// CHECK3-NEXT: call void @_ZSt9terminatev() #[[ATTR7]]			// CHECK3-NEXT: call void @_ZSt9terminatev() #[[ATTR7]]
	// CHECK3-NEXT: unreachable			// CHECK3-NEXT: unreachable
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@_Z17with_var_schedulev			// CHECK4-LABEL: define {{[^@]+}}@_Z17with_var_schedulev
	// CHECK4-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK4-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[A:%.*]] = alloca double, align 8			// CHECK4-NEXT: [[A:%.*]] = alloca double, align 8
	▲ Show 20 Lines • Show All 5,811 Lines • Show Last 20 Lines

clang/test/OpenMP/parallel_master_taskloop_codegen.cpp

	Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	#pragma omp parallel master taskloop shared(c) num_tasks(4) final(c)			#pragma omp parallel master taskloop shared(c) num_tasks(4) final(c)
	for (a = 0; a < c; ++a)			for (a = 0; a < c; ++a)
	;			;
	}			}
	} s(1);			} s(1);


	#endif			#endif
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK1-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN1SC1Ei(%struct.S* nonnull dereferenceable(4) @s, i32 1)
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SC1Ei
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
	// CHECK1-NEXT: call void @_ZN1SC2Ei(%struct.S* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@main			// CHECK1-LABEL: define {{[^@]+}}@main
	// CHECK1-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR2:[0-9]+]] {			// CHECK1-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[ARGC_ADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[ARGC_ADDR:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[ARGV_ADDR:%.]] = alloca i8*, align 8			// CHECK1-NEXT: [[ARGV_ADDR:%.]] = alloca i8*, align 8
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR__CASTED2:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTCAPTURE_EXPR__CASTED2:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: [[TOBOOL12:%.*]] = trunc i8 [[TMP13]] to i1			// CHECK1-NEXT: [[TOBOOL12:%.*]] = trunc i8 [[TMP13]] to i1
	// CHECK1-NEXT: br i1 [[TOBOOL12]], label [[OMP_IF_THEN:%.]], label [[OMP_IF_ELSE:%.]]			// CHECK1-NEXT: br i1 [[TOBOOL12]], label [[OMP_IF_THEN:%.]], label [[OMP_IF_ELSE:%.]]
	// CHECK1: omp_if.then:			// CHECK1: omp_if.then:
	// CHECK1-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, i32, i8*, i64, i64) @.omp_outlined..5 to void (i32, i32, ...)), i32 [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]])			// CHECK1-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, i32, i8*, i64, i64) @.omp_outlined..5 to void (i32, i32, ...)), i32 [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]])
	// CHECK1-NEXT: br label [[OMP_IF_END:%.*]]			// CHECK1-NEXT: br label [[OMP_IF_END:%.*]]
	// CHECK1: omp_if.else:			// CHECK1: omp_if.else:
	// CHECK1-NEXT: call void @__kmpc_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK1-NEXT: call void @__kmpc_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK1-NEXT: store i32 [[TMP0]], i32* [[DOTTHREADID_TEMP_]], align 4			// CHECK1-NEXT: store i32 [[TMP0]], i32* [[DOTTHREADID_TEMP_]], align 4
	// CHECK1-NEXT: call void @.omp_outlined..5(i32* [[DOTTHREADID_TEMP_]], i32* [[DOTBOUND_ZERO_ADDR]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]]) #[[ATTR4:[0-9]+]]			// CHECK1-NEXT: call void @.omp_outlined..5(i32* [[DOTTHREADID_TEMP_]], i32* [[DOTBOUND_ZERO_ADDR]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]]) #[[ATTR2:[0-9]+]]
	// CHECK1-NEXT: call void @__kmpc_end_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK1-NEXT: call void @__kmpc_end_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK1-NEXT: br label [[OMP_IF_END]]			// CHECK1-NEXT: br label [[OMP_IF_END]]
	// CHECK1: omp_if.end:			// CHECK1: omp_if.end:
	// CHECK1-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..8 to void (i32, i32, ...)*))			// CHECK1-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..8 to void (i32, i32, ...)*))
	// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK1-NEXT: ret i32 [[TMP14]]			// CHECK1-NEXT: ret i32 [[TMP14]]
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined.			// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined.
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3:[0-9]+]] {			// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 1			// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 1
	// CHECK1-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 27 Lines
	// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK1-NEXT: br label [[OMP_IF_END]]			// CHECK1-NEXT: br label [[OMP_IF_END]]
	// CHECK1: omp_if.end:			// CHECK1: omp_if.end:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry.			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry.
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR6:[0-9]+]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR4:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1			// CHECK1-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1
	// CHECK1-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !13			// CHECK1-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !13
	// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK1: .omp_outlined..1.exit:			// CHECK1: .omp_outlined..1.exit:
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined..2			// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined..2
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3]] {			// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1			// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1
	// CHECK1-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 23 Lines
	// CHECK1-NEXT: call void @__kmpc_taskloop(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* [[TMP5]], i32 1, i64* [[TMP8]], i64* [[TMP9]], i64 [[TMP13]], i32 1, i32 1, i64 [[TMP14]], i8* null)			// CHECK1-NEXT: call void @__kmpc_taskloop(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* [[TMP5]], i32 1, i64* [[TMP8]], i64* [[TMP9]], i64 [[TMP13]], i32 1, i32 1, i64 [[TMP14]], i8* null)
	// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK1-NEXT: br label [[OMP_IF_END]]			// CHECK1-NEXT: br label [[OMP_IF_END]]
	// CHECK1: omp_if.end:			// CHECK1: omp_if.end:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..4			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..4
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1			// CHECK1-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1
	// CHECK1-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !27			// CHECK1-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !27
	// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK1: .omp_outlined..3.exit:			// CHECK1: .omp_outlined..3.exit:
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined..5			// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined..5
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[ARGC:%.]], i8** nonnull align 8 dereferenceable(8) [[ARGV:%.]], i64 [[DOTCAPTURE_EXPR_:%.]], i64 [[DOTCAPTURE_EXPR_1:%.*]]) #[[ATTR3]] {			// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[ARGC:%.]], i8** nonnull align 8 dereferenceable(8) [[ARGV:%.]], i64 [[DOTCAPTURE_EXPR_:%.]], i64 [[DOTCAPTURE_EXPR_1:%.*]]) #[[ATTR1]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[ARGC_ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[ARGC_ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[ARGV_ADDR:%.]] = alloca i8**, align 8			// CHECK1-NEXT: [[ARGV_ADDR:%.]] = alloca i8**, align 8
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR2:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR2:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_2:%.]], align 8			// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_2:%.]], align 8
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK1-NEXT: br label [[OMP_IF_END]]			// CHECK1-NEXT: br label [[OMP_IF_END]]
	// CHECK1: omp_if.end:			// CHECK1: omp_if.end:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..7			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..7
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 144 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK1: omp.inner.for.end.i:			// CHECK1: omp.inner.for.end.i:
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__6_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__6_EXIT]]
	// CHECK1: .omp_outlined..6.exit:			// CHECK1: .omp_outlined..6.exit:
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined..8			// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined..8
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR3]] {			// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR1]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_4:%.]], align 1			// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_4:%.]], align 1
	// CHECK1-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[DOTGLOBAL_TID__ADDR]], align 8
	Show All 20 Lines
	// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK1-NEXT: br label [[OMP_IF_END]]			// CHECK1-NEXT: br label [[OMP_IF_END]]
	// CHECK1: omp_if.end:			// CHECK1: omp_if.end:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..10			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..10
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: [[CONV1_I:%.*]] = sext i32 [[TMP22]] to i64			// CHECK1-NEXT: [[CONV1_I:%.*]] = sext i32 [[TMP22]] to i64
	// CHECK1-NEXT: [[TMP23:%.]] = load i64, i64 [[DOTUB__ADDR_I]], align 8, !noalias !51			// CHECK1-NEXT: [[TMP23:%.]] = load i64, i64 [[DOTUB__ADDR_I]], align 8, !noalias !51
	// CHECK1-NEXT: [[CMP_I:%.*]] = icmp ule i64 [[CONV1_I]], [[TMP23]]			// CHECK1-NEXT: [[CMP_I:%.*]] = icmp ule i64 [[CONV1_I]], [[TMP23]]
	// CHECK1-NEXT: br i1 [[CMP_I]], label [[OMP_INNER_FOR_BODY_I:%.]], label [[OMP_INNER_FOR_END_I:%.]]			// CHECK1-NEXT: br i1 [[CMP_I]], label [[OMP_INNER_FOR_BODY_I:%.]], label [[OMP_INNER_FOR_END_I:%.]]
	// CHECK1: omp.inner.for.body.i:			// CHECK1: omp.inner.for.body.i:
	// CHECK1-NEXT: [[TMP24:%.]] = load i32, i32 [[DOTOMP_IV_I]], align 4, !noalias !51			// CHECK1-NEXT: [[TMP24:%.]] = load i32, i32 [[DOTOMP_IV_I]], align 4, !noalias !51
	// CHECK1-NEXT: store i32 [[TMP24]], i32* [[I_I]], align 4, !noalias !51			// CHECK1-NEXT: store i32 [[TMP24]], i32* [[I_I]], align 4, !noalias !51
	// CHECK1-NEXT: [[TMP25:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51			// CHECK1-NEXT: [[TMP25:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51
	// CHECK1-NEXT: [[TMP26:%.]] = call i32 @__kmpc_cancel(%struct.ident_t @[[GLOB1]], i32 [[TMP25]], i32 4) #[[ATTR4]]			// CHECK1-NEXT: [[TMP26:%.]] = call i32 @__kmpc_cancel(%struct.ident_t @[[GLOB1]], i32 [[TMP25]], i32 4) #[[ATTR2]]
	// CHECK1-NEXT: [[TMP27:%.*]] = icmp ne i32 [[TMP26]], 0			// CHECK1-NEXT: [[TMP27:%.*]] = icmp ne i32 [[TMP26]], 0
	// CHECK1-NEXT: br i1 [[TMP27]], label [[DOTCANCEL_EXIT_I:%.]], label [[DOTCANCEL_CONTINUE_I:%.]]			// CHECK1-NEXT: br i1 [[TMP27]], label [[DOTCANCEL_EXIT_I:%.]], label [[DOTCANCEL_CONTINUE_I:%.]]
	// CHECK1: .cancel.exit.i:			// CHECK1: .cancel.exit.i:
	// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT:%.*]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT:%.*]]
	// CHECK1: .cancel.continue.i:			// CHECK1: .cancel.continue.i:
	// CHECK1-NEXT: [[TMP28:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51			// CHECK1-NEXT: [[TMP28:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51
	// CHECK1-NEXT: [[TMP29:%.]] = call i32 @__kmpc_cancellationpoint(%struct.ident_t @[[GLOB1]], i32 [[TMP28]], i32 4) #[[ATTR4]]			// CHECK1-NEXT: [[TMP29:%.]] = call i32 @__kmpc_cancellationpoint(%struct.ident_t @[[GLOB1]], i32 [[TMP28]], i32 4) #[[ATTR2]]
	// CHECK1-NEXT: [[TMP30:%.*]] = icmp ne i32 [[TMP29]], 0			// CHECK1-NEXT: [[TMP30:%.*]] = icmp ne i32 [[TMP29]], 0
	// CHECK1-NEXT: br i1 [[TMP30]], label [[DOTCANCEL_EXIT2_I:%.]], label [[DOTCANCEL_CONTINUE3_I:%.]]			// CHECK1-NEXT: br i1 [[TMP30]], label [[DOTCANCEL_EXIT2_I:%.]], label [[DOTCANCEL_CONTINUE3_I:%.]]
	// CHECK1: .cancel.exit2.i:			// CHECK1: .cancel.exit2.i:
	// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]
	// CHECK1: .cancel.continue3.i:			// CHECK1: .cancel.continue3.i:
	// CHECK1-NEXT: [[TMP31:%.]] = load i32, i32 [[DOTOMP_IV_I]], align 4, !noalias !51			// CHECK1-NEXT: [[TMP31:%.]] = load i32, i32 [[DOTOMP_IV_I]], align 4, !noalias !51
	// CHECK1-NEXT: [[ADD4_I:%.*]] = add nsw i32 [[TMP31]], 1			// CHECK1-NEXT: [[ADD4_I:%.*]] = add nsw i32 [[TMP31]], 1
	// CHECK1-NEXT: store i32 [[ADD4_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !51			// CHECK1-NEXT: store i32 [[ADD4_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !51
	// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK1: omp.inner.for.end.i:			// CHECK1: omp.inner.for.end.i:
	// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]
	// CHECK1: .omp_outlined..9.exit:			// CHECK1: .omp_outlined..9.exit:
	// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK1-SAME: () #[[ATTR7:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: call void @_ZN1SC1Ei(%struct.S* nonnull dereferenceable(4) @s, i32 1)
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SC1Ei
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR8:[0-9]+]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
				// CHECK1-NEXT: call void @_ZN1SC2Ei(%struct.S* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SC2Ei			// CHECK1-LABEL: define {{[^@]+}}@_ZN1SC2Ei
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR8]] align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1			// CHECK1-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4			// CHECK1-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4			// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
	// CHECK1-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0			// CHECK1-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0
	// CHECK1-NEXT: [[FROMBOOL:%.*]] = zext i1 [[TOBOOL]] to i8			// CHECK1-NEXT: [[FROMBOOL:%.*]] = zext i1 [[TOBOOL]] to i8
	// CHECK1-NEXT: store i8 [[FROMBOOL]], i8* [[DOTCAPTURE_EXPR_]], align 1			// CHECK1-NEXT: store i8 [[FROMBOOL]], i8* [[DOTCAPTURE_EXPR_]], align 1
	// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1			// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1
	// CHECK1-NEXT: [[TOBOOL2:%.*]] = trunc i8 [[TMP1]] to i1			// CHECK1-NEXT: [[TOBOOL2:%.*]] = trunc i8 [[TMP1]] to i1
	// CHECK1-NEXT: [[CONV:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*			// CHECK1-NEXT: [[CONV:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*
	// CHECK1-NEXT: [[FROMBOOL3:%.*]] = zext i1 [[TOBOOL2]] to i8			// CHECK1-NEXT: [[FROMBOOL3:%.*]] = zext i1 [[TOBOOL2]] to i8
	// CHECK1-NEXT: store i8 [[FROMBOOL3]], i8* [[CONV]], align 1			// CHECK1-NEXT: store i8 [[FROMBOOL3]], i8* [[CONV]], align 1
	// CHECK1-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8			// CHECK1-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8
	// CHECK1-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.S, i32, i64)* @.omp_outlined..11 to void (i32, i32, ...)), %struct.S [[THIS1]], i32* [[C_ADDR]], i64 [[TMP2]])			// CHECK1-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.S, i32, i64)* @.omp_outlined..11 to void (i32, i32, ...)), %struct.S [[THIS1]], i32* [[C_ADDR]], i64 [[TMP2]])
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined..11			// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined..11
	// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.S [[THIS:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3]] {			// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.S [[THIS:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: [[C_ADDR:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[C_ADDR:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_6:%.]], align 8			// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_6:%.]], align 8
	// CHECK1-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[TMP:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK1-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK1-NEXT: br label [[OMP_IF_END]]			// CHECK1-NEXT: br label [[OMP_IF_END]]
	// CHECK1: omp_if.end:			// CHECK1: omp_if.end:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..13			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..13
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK1-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK1: omp.inner.for.end.i:			// CHECK1: omp.inner.for.end.i:
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__12_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__12_EXIT]]
	// CHECK1: .omp_outlined..12.exit:			// CHECK1: .omp_outlined..12.exit:
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_codegen.cpp			// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_codegen.cpp
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @__cxx_global_var_init()			// CHECK1-NEXT: call void @__cxx_global_var_init()
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK2-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN1SC1Ei(%struct.S* nonnull dereferenceable(4) @s, i32 1)
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC1Ei
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
	// CHECK2-NEXT: call void @_ZN1SC2Ei(%struct.S* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@main			// CHECK2-LABEL: define {{[^@]+}}@main
	// CHECK2-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR2:[0-9]+]] {			// CHECK2-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[ARGC_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[ARGC_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[ARGV_ADDR:%.]] = alloca i8*, align 8			// CHECK2-NEXT: [[ARGV_ADDR:%.]] = alloca i8*, align 8
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR__CASTED2:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR__CASTED2:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[TOBOOL12:%.*]] = trunc i8 [[TMP13]] to i1			// CHECK2-NEXT: [[TOBOOL12:%.*]] = trunc i8 [[TMP13]] to i1
	// CHECK2-NEXT: br i1 [[TOBOOL12]], label [[OMP_IF_THEN:%.]], label [[OMP_IF_ELSE:%.]]			// CHECK2-NEXT: br i1 [[TOBOOL12]], label [[OMP_IF_THEN:%.]], label [[OMP_IF_ELSE:%.]]
	// CHECK2: omp_if.then:			// CHECK2: omp_if.then:
	// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, i32, i8*, i64, i64) @.omp_outlined..5 to void (i32, i32, ...)), i32 [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]])			// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, i32, i8*, i64, i64) @.omp_outlined..5 to void (i32, i32, ...)), i32 [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]])
	// CHECK2-NEXT: br label [[OMP_IF_END:%.*]]			// CHECK2-NEXT: br label [[OMP_IF_END:%.*]]
	// CHECK2: omp_if.else:			// CHECK2: omp_if.else:
	// CHECK2-NEXT: call void @__kmpc_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK2-NEXT: call void @__kmpc_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK2-NEXT: store i32 [[TMP0]], i32* [[DOTTHREADID_TEMP_]], align 4			// CHECK2-NEXT: store i32 [[TMP0]], i32* [[DOTTHREADID_TEMP_]], align 4
	// CHECK2-NEXT: call void @.omp_outlined..5(i32* [[DOTTHREADID_TEMP_]], i32* [[DOTBOUND_ZERO_ADDR]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]]) #[[ATTR4:[0-9]+]]			// CHECK2-NEXT: call void @.omp_outlined..5(i32* [[DOTTHREADID_TEMP_]], i32* [[DOTBOUND_ZERO_ADDR]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]]) #[[ATTR2:[0-9]+]]
	// CHECK2-NEXT: call void @__kmpc_end_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK2-NEXT: call void @__kmpc_end_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK2-NEXT: br label [[OMP_IF_END]]			// CHECK2-NEXT: br label [[OMP_IF_END]]
	// CHECK2: omp_if.end:			// CHECK2: omp_if.end:
	// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..8 to void (i32, i32, ...)*))			// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..8 to void (i32, i32, ...)*))
	// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK2-NEXT: ret i32 [[TMP14]]			// CHECK2-NEXT: ret i32 [[TMP14]]
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined.			// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined.
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3:[0-9]+]] {			// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 1			// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 1
	// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 27 Lines
	// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK2-NEXT: br label [[OMP_IF_END]]			// CHECK2-NEXT: br label [[OMP_IF_END]]
	// CHECK2: omp_if.end:			// CHECK2: omp_if.end:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry.			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry.
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR6:[0-9]+]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR4:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1			// CHECK2-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1
	// CHECK2-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !13			// CHECK2-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !13
	// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK2: .omp_outlined..1.exit:			// CHECK2: .omp_outlined..1.exit:
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined..2			// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined..2
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3]] {			// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1			// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1
	// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 23 Lines
	// CHECK2-NEXT: call void @__kmpc_taskloop(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* [[TMP5]], i32 1, i64* [[TMP8]], i64* [[TMP9]], i64 [[TMP13]], i32 1, i32 1, i64 [[TMP14]], i8* null)			// CHECK2-NEXT: call void @__kmpc_taskloop(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* [[TMP5]], i32 1, i64* [[TMP8]], i64* [[TMP9]], i64 [[TMP13]], i32 1, i32 1, i64 [[TMP14]], i8* null)
	// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK2-NEXT: br label [[OMP_IF_END]]			// CHECK2-NEXT: br label [[OMP_IF_END]]
	// CHECK2: omp_if.end:			// CHECK2: omp_if.end:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..4			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..4
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1			// CHECK2-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1
	// CHECK2-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !27			// CHECK2-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !27
	// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK2: .omp_outlined..3.exit:			// CHECK2: .omp_outlined..3.exit:
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined..5			// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined..5
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[ARGC:%.]], i8** nonnull align 8 dereferenceable(8) [[ARGV:%.]], i64 [[DOTCAPTURE_EXPR_:%.]], i64 [[DOTCAPTURE_EXPR_1:%.*]]) #[[ATTR3]] {			// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[ARGC:%.]], i8** nonnull align 8 dereferenceable(8) [[ARGV:%.]], i64 [[DOTCAPTURE_EXPR_:%.]], i64 [[DOTCAPTURE_EXPR_1:%.*]]) #[[ATTR1]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[ARGC_ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[ARGC_ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[ARGV_ADDR:%.]] = alloca i8**, align 8			// CHECK2-NEXT: [[ARGV_ADDR:%.]] = alloca i8**, align 8
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR2:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR2:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_2:%.]], align 8			// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_2:%.]], align 8
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK2-NEXT: br label [[OMP_IF_END]]			// CHECK2-NEXT: br label [[OMP_IF_END]]
	// CHECK2: omp_if.end:			// CHECK2: omp_if.end:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..7			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..7
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 144 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK2: omp.inner.for.end.i:			// CHECK2: omp.inner.for.end.i:
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__6_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__6_EXIT]]
	// CHECK2: .omp_outlined..6.exit:			// CHECK2: .omp_outlined..6.exit:
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined..8			// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined..8
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR3]] {			// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR1]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_4:%.]], align 1			// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_4:%.]], align 1
	// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[DOTGLOBAL_TID__ADDR]], align 8
	Show All 20 Lines
	// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK2-NEXT: br label [[OMP_IF_END]]			// CHECK2-NEXT: br label [[OMP_IF_END]]
	// CHECK2: omp_if.end:			// CHECK2: omp_if.end:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..10			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..10
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[CONV1_I:%.*]] = sext i32 [[TMP22]] to i64			// CHECK2-NEXT: [[CONV1_I:%.*]] = sext i32 [[TMP22]] to i64
	// CHECK2-NEXT: [[TMP23:%.]] = load i64, i64 [[DOTUB__ADDR_I]], align 8, !noalias !51			// CHECK2-NEXT: [[TMP23:%.]] = load i64, i64 [[DOTUB__ADDR_I]], align 8, !noalias !51
	// CHECK2-NEXT: [[CMP_I:%.*]] = icmp ule i64 [[CONV1_I]], [[TMP23]]			// CHECK2-NEXT: [[CMP_I:%.*]] = icmp ule i64 [[CONV1_I]], [[TMP23]]
	// CHECK2-NEXT: br i1 [[CMP_I]], label [[OMP_INNER_FOR_BODY_I:%.]], label [[OMP_INNER_FOR_END_I:%.]]			// CHECK2-NEXT: br i1 [[CMP_I]], label [[OMP_INNER_FOR_BODY_I:%.]], label [[OMP_INNER_FOR_END_I:%.]]
	// CHECK2: omp.inner.for.body.i:			// CHECK2: omp.inner.for.body.i:
	// CHECK2-NEXT: [[TMP24:%.]] = load i32, i32 [[DOTOMP_IV_I]], align 4, !noalias !51			// CHECK2-NEXT: [[TMP24:%.]] = load i32, i32 [[DOTOMP_IV_I]], align 4, !noalias !51
	// CHECK2-NEXT: store i32 [[TMP24]], i32* [[I_I]], align 4, !noalias !51			// CHECK2-NEXT: store i32 [[TMP24]], i32* [[I_I]], align 4, !noalias !51
	// CHECK2-NEXT: [[TMP25:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51			// CHECK2-NEXT: [[TMP25:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51
	// CHECK2-NEXT: [[TMP26:%.]] = call i32 @__kmpc_cancel(%struct.ident_t @[[GLOB1]], i32 [[TMP25]], i32 4) #[[ATTR4]]			// CHECK2-NEXT: [[TMP26:%.]] = call i32 @__kmpc_cancel(%struct.ident_t @[[GLOB1]], i32 [[TMP25]], i32 4) #[[ATTR2]]
	// CHECK2-NEXT: [[TMP27:%.*]] = icmp ne i32 [[TMP26]], 0			// CHECK2-NEXT: [[TMP27:%.*]] = icmp ne i32 [[TMP26]], 0
	// CHECK2-NEXT: br i1 [[TMP27]], label [[DOTCANCEL_EXIT_I:%.]], label [[DOTCANCEL_CONTINUE_I:%.]]			// CHECK2-NEXT: br i1 [[TMP27]], label [[DOTCANCEL_EXIT_I:%.]], label [[DOTCANCEL_CONTINUE_I:%.]]
	// CHECK2: .cancel.exit.i:			// CHECK2: .cancel.exit.i:
	// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT:%.*]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT:%.*]]
	// CHECK2: .cancel.continue.i:			// CHECK2: .cancel.continue.i:
	// CHECK2-NEXT: [[TMP28:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51			// CHECK2-NEXT: [[TMP28:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51
	// CHECK2-NEXT: [[TMP29:%.]] = call i32 @__kmpc_cancellationpoint(%struct.ident_t @[[GLOB1]], i32 [[TMP28]], i32 4) #[[ATTR4]]			// CHECK2-NEXT: [[TMP29:%.]] = call i32 @__kmpc_cancellationpoint(%struct.ident_t @[[GLOB1]], i32 [[TMP28]], i32 4) #[[ATTR2]]
	// CHECK2-NEXT: [[TMP30:%.*]] = icmp ne i32 [[TMP29]], 0			// CHECK2-NEXT: [[TMP30:%.*]] = icmp ne i32 [[TMP29]], 0
	// CHECK2-NEXT: br i1 [[TMP30]], label [[DOTCANCEL_EXIT2_I:%.]], label [[DOTCANCEL_CONTINUE3_I:%.]]			// CHECK2-NEXT: br i1 [[TMP30]], label [[DOTCANCEL_EXIT2_I:%.]], label [[DOTCANCEL_CONTINUE3_I:%.]]
	// CHECK2: .cancel.exit2.i:			// CHECK2: .cancel.exit2.i:
	// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]
	// CHECK2: .cancel.continue3.i:			// CHECK2: .cancel.continue3.i:
	// CHECK2-NEXT: [[TMP31:%.]] = load i32, i32 [[DOTOMP_IV_I]], align 4, !noalias !51			// CHECK2-NEXT: [[TMP31:%.]] = load i32, i32 [[DOTOMP_IV_I]], align 4, !noalias !51
	// CHECK2-NEXT: [[ADD4_I:%.*]] = add nsw i32 [[TMP31]], 1			// CHECK2-NEXT: [[ADD4_I:%.*]] = add nsw i32 [[TMP31]], 1
	// CHECK2-NEXT: store i32 [[ADD4_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !51			// CHECK2-NEXT: store i32 [[ADD4_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !51
	// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK2: omp.inner.for.end.i:			// CHECK2: omp.inner.for.end.i:
	// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]
	// CHECK2: .omp_outlined..9.exit:			// CHECK2: .omp_outlined..9.exit:
	// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK2-SAME: () #[[ATTR7:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: call void @_ZN1SC1Ei(%struct.S* nonnull dereferenceable(4) @s, i32 1)
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC1Ei
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR8:[0-9]+]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
				// CHECK2-NEXT: call void @_ZN1SC2Ei(%struct.S* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC2Ei			// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC2Ei
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR8]] align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4			// CHECK2-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4			// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
	// CHECK2-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0			// CHECK2-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0
	// CHECK2-NEXT: [[FROMBOOL:%.*]] = zext i1 [[TOBOOL]] to i8			// CHECK2-NEXT: [[FROMBOOL:%.*]] = zext i1 [[TOBOOL]] to i8
	// CHECK2-NEXT: store i8 [[FROMBOOL]], i8* [[DOTCAPTURE_EXPR_]], align 1			// CHECK2-NEXT: store i8 [[FROMBOOL]], i8* [[DOTCAPTURE_EXPR_]], align 1
	// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1			// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1
	// CHECK2-NEXT: [[TOBOOL2:%.*]] = trunc i8 [[TMP1]] to i1			// CHECK2-NEXT: [[TOBOOL2:%.*]] = trunc i8 [[TMP1]] to i1
	// CHECK2-NEXT: [[CONV:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*			// CHECK2-NEXT: [[CONV:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*
	// CHECK2-NEXT: [[FROMBOOL3:%.*]] = zext i1 [[TOBOOL2]] to i8			// CHECK2-NEXT: [[FROMBOOL3:%.*]] = zext i1 [[TOBOOL2]] to i8
	// CHECK2-NEXT: store i8 [[FROMBOOL3]], i8* [[CONV]], align 1			// CHECK2-NEXT: store i8 [[FROMBOOL3]], i8* [[CONV]], align 1
	// CHECK2-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8			// CHECK2-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8
	// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.S, i32, i64)* @.omp_outlined..11 to void (i32, i32, ...)), %struct.S [[THIS1]], i32* [[C_ADDR]], i64 [[TMP2]])			// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.S, i32, i64)* @.omp_outlined..11 to void (i32, i32, ...)), %struct.S [[THIS1]], i32* [[C_ADDR]], i64 [[TMP2]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined..11			// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined..11
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.S [[THIS:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3]] {			// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.S [[THIS:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: [[C_ADDR:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[C_ADDR:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_6:%.]], align 8			// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_6:%.]], align 8
	// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK2-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK2-NEXT: br label [[OMP_IF_END]]			// CHECK2-NEXT: br label [[OMP_IF_END]]
	// CHECK2: omp_if.end:			// CHECK2: omp_if.end:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..13			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..13
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]			// CHECK2-NEXT: br label [[OMP_INNER_FOR_COND_I]]
	// CHECK2: omp.inner.for.end.i:			// CHECK2: omp.inner.for.end.i:
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__12_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__12_EXIT]]
	// CHECK2: .omp_outlined..12.exit:			// CHECK2: .omp_outlined..12.exit:
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_codegen.cpp			// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_codegen.cpp
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @__cxx_global_var_init()			// CHECK2-NEXT: call void @__cxx_global_var_init()
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@main			// CHECK3-LABEL: define {{[^@]+}}@main
	// CHECK3-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR0:[0-9]+]] {			// CHECK3-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	▲ Show 20 Lines • Show All 352 Lines • Show Last 20 Lines

clang/test/OpenMP/parallel_master_taskloop_simd_codegen.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 1,737 Lines • ▼ Show 20 Lines
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_simd_codegen.cpp			// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_simd_codegen.cpp
	// CHECK2-SAME: () #[[ATTR6]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR6]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @__cxx_global_var_init()			// CHECK2-NEXT: call void @__cxx_global_var_init()
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK3-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_ZN1SC1Ei(%struct.S* nonnull dereferenceable(4) @s, i32 1)
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SC1Ei
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
	// CHECK3-NEXT: call void @_ZN1SC2Ei(%struct.S* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@main			// CHECK3-LABEL: define {{[^@]+}}@main
	// CHECK3-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR2:[0-9]+]] {			// CHECK3-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[ARGC_ADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[ARGC_ADDR:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[ARGV_ADDR:%.]] = alloca i8*, align 8			// CHECK3-NEXT: [[ARGV_ADDR:%.]] = alloca i8*, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__CASTED2:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__CASTED2:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[TOBOOL12:%.*]] = trunc i8 [[TMP13]] to i1			// CHECK3-NEXT: [[TOBOOL12:%.*]] = trunc i8 [[TMP13]] to i1
	// CHECK3-NEXT: br i1 [[TOBOOL12]], label [[OMP_IF_THEN:%.]], label [[OMP_IF_ELSE:%.]]			// CHECK3-NEXT: br i1 [[TOBOOL12]], label [[OMP_IF_THEN:%.]], label [[OMP_IF_ELSE:%.]]
	// CHECK3: omp_if.then:			// CHECK3: omp_if.then:
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 5, void (i32, i32, ...)* bitcast (void (i32, i32, i32, i32, i8**, i64, i64) @.omp_outlined..5 to void (i32, i32, ...)), i32 [[I]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 5, void (i32, i32, ...)* bitcast (void (i32, i32, i32, i32, i8**, i64, i64) @.omp_outlined..5 to void (i32, i32, ...)), i32 [[I]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]])
	// CHECK3-NEXT: br label [[OMP_IF_END:%.*]]			// CHECK3-NEXT: br label [[OMP_IF_END:%.*]]
	// CHECK3: omp_if.else:			// CHECK3: omp_if.else:
	// CHECK3-NEXT: call void @__kmpc_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK3-NEXT: call void @__kmpc_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK3-NEXT: store i32 [[TMP0]], i32* [[DOTTHREADID_TEMP_]], align 4			// CHECK3-NEXT: store i32 [[TMP0]], i32* [[DOTTHREADID_TEMP_]], align 4
	// CHECK3-NEXT: call void @.omp_outlined..5(i32* [[DOTTHREADID_TEMP_]], i32* [[DOTBOUND_ZERO_ADDR]], i32* [[I]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]]) #[[ATTR4:[0-9]+]]			// CHECK3-NEXT: call void @.omp_outlined..5(i32* [[DOTTHREADID_TEMP_]], i32* [[DOTBOUND_ZERO_ADDR]], i32* [[I]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]]) #[[ATTR2:[0-9]+]]
	// CHECK3-NEXT: call void @__kmpc_end_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK3-NEXT: call void @__kmpc_end_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK3-NEXT: br label [[OMP_IF_END]]			// CHECK3-NEXT: br label [[OMP_IF_END]]
	// CHECK3: omp_if.end:			// CHECK3: omp_if.end:
	// CHECK3-NEXT: [[TMP14:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK3-NEXT: [[TMP14:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK3-NEXT: ret i32 [[TMP14]]			// CHECK3-NEXT: ret i32 [[TMP14]]
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined.			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined.
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3:[0-9]+]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 1			// CHECK3-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 1
	// CHECK3-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 27 Lines
	// CHECK3-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK3-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK3-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK3-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK3-NEXT: br label [[OMP_IF_END]]			// CHECK3-NEXT: br label [[OMP_IF_END]]
	// CHECK3: omp_if.end:			// CHECK3: omp_if.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry.			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry.
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR6:[0-9]+]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR4:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1			// CHECK3-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1
	// CHECK3-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !13			// CHECK3-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !13
	// CHECK3-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP14:![0-9]+]]			// CHECK3-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP14:![0-9]+]]
	// CHECK3: .omp_outlined..1.exit:			// CHECK3: .omp_outlined..1.exit:
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..2			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..2
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1			// CHECK3-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1
	// CHECK3-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 23 Lines
	// CHECK3-NEXT: call void @__kmpc_taskloop(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* [[TMP5]], i32 1, i64* [[TMP8]], i64* [[TMP9]], i64 [[TMP13]], i32 1, i32 1, i64 [[TMP14]], i8* null)			// CHECK3-NEXT: call void @__kmpc_taskloop(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* [[TMP5]], i32 1, i64* [[TMP8]], i64* [[TMP9]], i64 [[TMP13]], i32 1, i32 1, i64 [[TMP14]], i8* null)
	// CHECK3-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK3-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK3-NEXT: br label [[OMP_IF_END]]			// CHECK3-NEXT: br label [[OMP_IF_END]]
	// CHECK3: omp_if.end:			// CHECK3: omp_if.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..4			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..4
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1			// CHECK3-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1
	// CHECK3-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !30, !llvm.access.group !31			// CHECK3-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !30, !llvm.access.group !31
	// CHECK3-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP32:![0-9]+]]			// CHECK3-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP32:![0-9]+]]
	// CHECK3: .omp_outlined..3.exit:			// CHECK3: .omp_outlined..3.exit:
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..5			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..5
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[I:%.]], i32 nonnull align 4 dereferenceable(4) [[ARGC:%.]], i8** nonnull align 8 dereferenceable(8) [[ARGV:%.]], i64 [[DOTCAPTURE_EXPR_:%.]], i64 [[DOTCAPTURE_EXPR_1:%.*]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[I:%.]], i32 nonnull align 4 dereferenceable(4) [[ARGC:%.]], i8** nonnull align 8 dereferenceable(8) [[ARGV:%.]], i64 [[DOTCAPTURE_EXPR_:%.]], i64 [[DOTCAPTURE_EXPR_1:%.*]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[I_ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[I_ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[ARGC_ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[ARGC_ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[ARGV_ADDR:%.]] = alloca i8**, align 8			// CHECK3-NEXT: [[ARGV_ADDR:%.]] = alloca i8**, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR2:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR2:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])			// CHECK3-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])
	// CHECK3-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])			// CHECK3-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])
	// CHECK3-NEXT: br label [[OMP_IF_END]]			// CHECK3-NEXT: br label [[OMP_IF_END]]
	// CHECK3: omp_if.end:			// CHECK3: omp_if.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_privates_map.			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_privates_map.
	// CHECK3-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR0]] {			// CHECK3-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR6:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8
	// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK3-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK3-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0			// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK3-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK3-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8			// CHECK3-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..7			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..7
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: store i64 [[TMP17]], i64* [[DOTST__ADDR_I]], align 8, !noalias !46			// CHECK3-NEXT: store i64 [[TMP17]], i64* [[DOTST__ADDR_I]], align 8, !noalias !46
	// CHECK3-NEXT: store i32 [[TMP19]], i32* [[DOTLITER__ADDR_I]], align 4, !noalias !46			// CHECK3-NEXT: store i32 [[TMP19]], i32* [[DOTLITER__ADDR_I]], align 4, !noalias !46
	// CHECK3-NEXT: store i8* [[TMP21]], i8** [[DOTREDUCTIONS__ADDR_I]], align 8, !noalias !46			// CHECK3-NEXT: store i8* [[TMP21]], i8** [[DOTREDUCTIONS__ADDR_I]], align 8, !noalias !46
	// CHECK3-NEXT: store %struct.anon.2* [[TMP8]], %struct.anon.2** [[__CONTEXT_ADDR_I]], align 8, !noalias !46			// CHECK3-NEXT: store %struct.anon.2* [[TMP8]], %struct.anon.2** [[__CONTEXT_ADDR_I]], align 8, !noalias !46
	// CHECK3-NEXT: [[TMP22:%.]] = load %struct.anon.2, %struct.anon.2** [[__CONTEXT_ADDR_I]], align 8, !noalias !46			// CHECK3-NEXT: [[TMP22:%.]] = load %struct.anon.2, %struct.anon.2** [[__CONTEXT_ADDR_I]], align 8, !noalias !46
	// CHECK3-NEXT: [[TMP23:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !46			// CHECK3-NEXT: [[TMP23:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !46
	// CHECK3-NEXT: [[TMP24:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !46			// CHECK3-NEXT: [[TMP24:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !46
	// CHECK3-NEXT: [[TMP25:%.]] = bitcast void (i8, ...)* [[TMP23]] to void (i8, i32)			// CHECK3-NEXT: [[TMP25:%.]] = bitcast void (i8, ...)* [[TMP23]] to void (i8, i32)
	// CHECK3-NEXT: call void [[TMP25]](i8* [[TMP24]], i32** [[DOTLASTPRIV_PTR_ADDR_I]]) #[[ATTR4]]			// CHECK3-NEXT: call void [[TMP25]](i8* [[TMP24]], i32** [[DOTLASTPRIV_PTR_ADDR_I]]) #[[ATTR2]]
	// CHECK3-NEXT: [[TMP26:%.]] = getelementptr inbounds [[STRUCT_ANON_2:%.]], %struct.anon.2* [[TMP22]], i32 0, i32 0			// CHECK3-NEXT: [[TMP26:%.]] = getelementptr inbounds [[STRUCT_ANON_2:%.]], %struct.anon.2* [[TMP22]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP27:%.]] = load i32, i32** [[TMP26]], align 8			// CHECK3-NEXT: [[TMP27:%.]] = load i32, i32** [[TMP26]], align 8
	// CHECK3-NEXT: [[TMP28:%.]] = load i32, i32** [[DOTLASTPRIV_PTR_ADDR_I]], align 8, !noalias !46			// CHECK3-NEXT: [[TMP28:%.]] = load i32, i32** [[DOTLASTPRIV_PTR_ADDR_I]], align 8, !noalias !46
	// CHECK3-NEXT: [[TMP29:%.]] = getelementptr inbounds [[STRUCT_ANON_2]], %struct.anon.2 [[TMP22]], i32 0, i32 1			// CHECK3-NEXT: [[TMP29:%.]] = getelementptr inbounds [[STRUCT_ANON_2]], %struct.anon.2 [[TMP22]], i32 0, i32 1
	// CHECK3-NEXT: [[TMP30:%.]] = load i32, i32** [[TMP29]], align 8			// CHECK3-NEXT: [[TMP30:%.]] = load i32, i32** [[TMP29]], align 8
	// CHECK3-NEXT: [[TMP31:%.]] = load i32, i32 [[TMP30]], align 4			// CHECK3-NEXT: [[TMP31:%.]] = load i32, i32 [[TMP30]], align 4
	// CHECK3-NEXT: store i32 [[TMP31]], i32* [[DOTCAPTURE_EXPR__I]], align 4, !noalias !46			// CHECK3-NEXT: store i32 [[TMP31]], i32* [[DOTCAPTURE_EXPR__I]], align 4, !noalias !46
	// CHECK3-NEXT: [[TMP32:%.]] = getelementptr inbounds [[STRUCT_ANON_2]], %struct.anon.2 [[TMP22]], i32 0, i32 1			// CHECK3-NEXT: [[TMP32:%.]] = getelementptr inbounds [[STRUCT_ANON_2]], %struct.anon.2 [[TMP22]], i32 0, i32 1
	▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: br i1 [[TMP87]], label [[DOTOMP_LASTPRIVATE_THEN_I:%.]], label [[DOTOMP_OUTLINED__6_EXIT:%.]]			// CHECK3-NEXT: br i1 [[TMP87]], label [[DOTOMP_LASTPRIVATE_THEN_I:%.]], label [[DOTOMP_OUTLINED__6_EXIT:%.]]
	// CHECK3: .omp.lastprivate.then.i:			// CHECK3: .omp.lastprivate.then.i:
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__6_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__6_EXIT]]
	// CHECK3: .omp_outlined..6.exit:			// CHECK3: .omp_outlined..6.exit:
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_dup.			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_dup.
	// CHECK3-SAME: (%struct.kmp_task_t_with_privates.3* [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 [[TMP1:%.]], i32 [[TMP2:%.]]) #[[ATTR6]] {			// CHECK3-SAME: (%struct.kmp_task_t_with_privates.3* [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 [[TMP1:%.]], i32 [[TMP2:%.]]) #[[ATTR4]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca %struct.kmp_task_t_with_privates.3, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca %struct.kmp_task_t_with_privates.3, align 8
	// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca %struct.kmp_task_t_with_privates.3, align 8			// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca %struct.kmp_task_t_with_privates.3, align 8
	// CHECK3-NEXT: [[DOTADDR2:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR2:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: store %struct.kmp_task_t_with_privates.3* [[TMP0]], %struct.kmp_task_t_with_privates.3** [[DOTADDR]], align 8			// CHECK3-NEXT: store %struct.kmp_task_t_with_privates.3* [[TMP0]], %struct.kmp_task_t_with_privates.3** [[DOTADDR]], align 8
	// CHECK3-NEXT: store %struct.kmp_task_t_with_privates.3* [[TMP1]], %struct.kmp_task_t_with_privates.3** [[DOTADDR1]], align 8			// CHECK3-NEXT: store %struct.kmp_task_t_with_privates.3* [[TMP1]], %struct.kmp_task_t_with_privates.3** [[DOTADDR1]], align 8
	// CHECK3-NEXT: store i32 [[TMP2]], i32* [[DOTADDR2]], align 4			// CHECK3-NEXT: store i32 [[TMP2]], i32* [[DOTADDR2]], align 4
	// CHECK3-NEXT: [[TMP3:%.]] = load %struct.kmp_task_t_with_privates.3, %struct.kmp_task_t_with_privates.3** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP3:%.]] = load %struct.kmp_task_t_with_privates.3, %struct.kmp_task_t_with_privates.3** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP4:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_3:%.]], %struct.kmp_task_t_with_privates.3* [[TMP3]], i32 0, i32 0			// CHECK3-NEXT: [[TMP4:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_3:%.]], %struct.kmp_task_t_with_privates.3* [[TMP3]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T:%.]], %struct.kmp_task_t* [[TMP4]], i32 0, i32 8			// CHECK3-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T:%.]], %struct.kmp_task_t* [[TMP4]], i32 0, i32 8
	// CHECK3-NEXT: [[TMP6:%.]] = load i32, i32 [[DOTADDR2]], align 4			// CHECK3-NEXT: [[TMP6:%.]] = load i32, i32 [[DOTADDR2]], align 4
	// CHECK3-NEXT: store i32 [[TMP6]], i32* [[TMP5]], align 8			// CHECK3-NEXT: store i32 [[TMP6]], i32* [[TMP5]], align 8
	// CHECK3-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_3]], %struct.kmp_task_t_with_privates.3 [[TMP3]], i32 0, i32 1			// CHECK3-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_3]], %struct.kmp_task_t_with_privates.3 [[TMP3]], i32 0, i32 1
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK3-SAME: () #[[ATTR6]] section "__TEXT,__StaticInit,regular,pure_instructions" {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: call void @_ZN1SC1Ei(%struct.S* nonnull dereferenceable(4) @s, i32 1)
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SC1Ei
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR8:[0-9]+]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
				// CHECK3-NEXT: call void @_ZN1SC2Ei(%struct.S* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SC2Ei			// CHECK3-LABEL: define {{[^@]+}}@_ZN1SC2Ei
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR8]] align 2 {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1			// CHECK3-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4			// CHECK3-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4			// CHECK3-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
	// CHECK3-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0			// CHECK3-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0
	// CHECK3-NEXT: [[FROMBOOL:%.*]] = zext i1 [[TOBOOL]] to i8			// CHECK3-NEXT: [[FROMBOOL:%.*]] = zext i1 [[TOBOOL]] to i8
	// CHECK3-NEXT: store i8 [[FROMBOOL]], i8* [[DOTCAPTURE_EXPR_]], align 1			// CHECK3-NEXT: store i8 [[FROMBOOL]], i8* [[DOTCAPTURE_EXPR_]], align 1
	// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1			// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1
	// CHECK3-NEXT: [[TOBOOL2:%.*]] = trunc i8 [[TMP1]] to i1			// CHECK3-NEXT: [[TOBOOL2:%.*]] = trunc i8 [[TMP1]] to i1
	// CHECK3-NEXT: [[CONV:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*			// CHECK3-NEXT: [[CONV:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*
	// CHECK3-NEXT: [[FROMBOOL3:%.*]] = zext i1 [[TOBOOL2]] to i8			// CHECK3-NEXT: [[FROMBOOL3:%.*]] = zext i1 [[TOBOOL2]] to i8
	// CHECK3-NEXT: store i8 [[FROMBOOL3]], i8* [[CONV]], align 1			// CHECK3-NEXT: store i8 [[FROMBOOL3]], i8* [[CONV]], align 1
	// CHECK3-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8			// CHECK3-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.S, i32, i64)* @.omp_outlined..8 to void (i32, i32, ...)), %struct.S [[THIS1]], i32* [[C_ADDR]], i64 [[TMP2]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.S, i32, i64)* @.omp_outlined..8 to void (i32, i32, ...)), %struct.S [[THIS1]], i32* [[C_ADDR]], i64 [[TMP2]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..8			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..8
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.S [[THIS:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.S [[THIS:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: [[C_ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[C_ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_4:%.]], align 8			// CHECK3-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_4:%.]], align 8
	// CHECK3-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[TMP:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK3-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK3-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK3-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK3-NEXT: br label [[OMP_IF_END]]			// CHECK3-NEXT: br label [[OMP_IF_END]]
	// CHECK3: omp_if.end:			// CHECK3: omp_if.end:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..10			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..10
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP65:![0-9]+]]			// CHECK3-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP65:![0-9]+]]
	// CHECK3: omp.inner.for.end.i:			// CHECK3: omp.inner.for.end.i:
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]
	// CHECK3: .omp_outlined..9.exit:			// CHECK3: .omp_outlined..9.exit:
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_simd_codegen.cpp			// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_simd_codegen.cpp
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR6]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @__cxx_global_var_init()			// CHECK3-NEXT: call void @__cxx_global_var_init()
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK4-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @_ZN1SC1Ei(%struct.S* nonnull dereferenceable(4) @s, i32 1)
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SC1Ei
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
	// CHECK4-NEXT: call void @_ZN1SC2Ei(%struct.S* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@main			// CHECK4-LABEL: define {{[^@]+}}@main
	// CHECK4-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR2:[0-9]+]] {			// CHECK4-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[ARGC_ADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[ARGC_ADDR:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[ARGV_ADDR:%.]] = alloca i8*, align 8			// CHECK4-NEXT: [[ARGV_ADDR:%.]] = alloca i8*, align 8
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR__CASTED2:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTCAPTURE_EXPR__CASTED2:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: [[TOBOOL12:%.*]] = trunc i8 [[TMP13]] to i1			// CHECK4-NEXT: [[TOBOOL12:%.*]] = trunc i8 [[TMP13]] to i1
	// CHECK4-NEXT: br i1 [[TOBOOL12]], label [[OMP_IF_THEN:%.]], label [[OMP_IF_ELSE:%.]]			// CHECK4-NEXT: br i1 [[TOBOOL12]], label [[OMP_IF_THEN:%.]], label [[OMP_IF_ELSE:%.]]
	// CHECK4: omp_if.then:			// CHECK4: omp_if.then:
	// CHECK4-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 5, void (i32, i32, ...)* bitcast (void (i32, i32, i32, i32, i8**, i64, i64) @.omp_outlined..5 to void (i32, i32, ...)), i32 [[I]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]])			// CHECK4-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 5, void (i32, i32, ...)* bitcast (void (i32, i32, i32, i32, i8**, i64, i64) @.omp_outlined..5 to void (i32, i32, ...)), i32 [[I]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]])
	// CHECK4-NEXT: br label [[OMP_IF_END:%.*]]			// CHECK4-NEXT: br label [[OMP_IF_END:%.*]]
	// CHECK4: omp_if.else:			// CHECK4: omp_if.else:
	// CHECK4-NEXT: call void @__kmpc_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK4-NEXT: call void @__kmpc_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK4-NEXT: store i32 [[TMP0]], i32* [[DOTTHREADID_TEMP_]], align 4			// CHECK4-NEXT: store i32 [[TMP0]], i32* [[DOTTHREADID_TEMP_]], align 4
	// CHECK4-NEXT: call void @.omp_outlined..5(i32* [[DOTTHREADID_TEMP_]], i32* [[DOTBOUND_ZERO_ADDR]], i32* [[I]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]]) #[[ATTR4:[0-9]+]]			// CHECK4-NEXT: call void @.omp_outlined..5(i32* [[DOTTHREADID_TEMP_]], i32* [[DOTBOUND_ZERO_ADDR]], i32* [[I]], i32* [[ARGC_ADDR]], i8*** [[ARGV_ADDR]], i64 [[TMP10]], i64 [[TMP12]]) #[[ATTR2:[0-9]+]]
	// CHECK4-NEXT: call void @__kmpc_end_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK4-NEXT: call void @__kmpc_end_serialized_parallel(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK4-NEXT: br label [[OMP_IF_END]]			// CHECK4-NEXT: br label [[OMP_IF_END]]
	// CHECK4: omp_if.end:			// CHECK4: omp_if.end:
	// CHECK4-NEXT: [[TMP14:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK4-NEXT: [[TMP14:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK4-NEXT: ret i32 [[TMP14]]			// CHECK4-NEXT: ret i32 [[TMP14]]
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_outlined.			// CHECK4-LABEL: define {{[^@]+}}@.omp_outlined.
	// CHECK4-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3:[0-9]+]] {			// CHECK4-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 1			// CHECK4-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 1
	// CHECK4-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK4-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK4-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK4-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 27 Lines
	// CHECK4-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK4-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK4-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK4-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK4-NEXT: br label [[OMP_IF_END]]			// CHECK4-NEXT: br label [[OMP_IF_END]]
	// CHECK4: omp_if.end:			// CHECK4: omp_if.end:
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry.			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry.
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR6:[0-9]+]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR4:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1			// CHECK4-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1
	// CHECK4-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !13			// CHECK4-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !13
	// CHECK4-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP14:![0-9]+]]			// CHECK4-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP14:![0-9]+]]
	// CHECK4: .omp_outlined..1.exit:			// CHECK4: .omp_outlined..1.exit:
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_outlined..2			// CHECK4-LABEL: define {{[^@]+}}@.omp_outlined..2
	// CHECK4-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3]] {			// CHECK4-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1			// CHECK4-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_0:%.]], align 1
	// CHECK4-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK4-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK4-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK4-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 23 Lines
	// CHECK4-NEXT: call void @__kmpc_taskloop(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* [[TMP5]], i32 1, i64* [[TMP8]], i64* [[TMP9]], i64 [[TMP13]], i32 1, i32 1, i64 [[TMP14]], i8* null)			// CHECK4-NEXT: call void @__kmpc_taskloop(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* [[TMP5]], i32 1, i64* [[TMP8]], i64* [[TMP9]], i64 [[TMP13]], i32 1, i32 1, i64 [[TMP14]], i8* null)
	// CHECK4-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK4-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK4-NEXT: br label [[OMP_IF_END]]			// CHECK4-NEXT: br label [[OMP_IF_END]]
	// CHECK4: omp_if.end:			// CHECK4: omp_if.end:
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..4			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..4
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1			// CHECK4-NEXT: [[ADD2_I:%.*]] = add nsw i32 [[TMP25]], 1
	// CHECK4-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !30, !llvm.access.group !31			// CHECK4-NEXT: store i32 [[ADD2_I]], i32* [[DOTOMP_IV_I]], align 4, !noalias !30, !llvm.access.group !31
	// CHECK4-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP32:![0-9]+]]			// CHECK4-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP32:![0-9]+]]
	// CHECK4: .omp_outlined..3.exit:			// CHECK4: .omp_outlined..3.exit:
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_outlined..5			// CHECK4-LABEL: define {{[^@]+}}@.omp_outlined..5
	// CHECK4-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[I:%.]], i32 nonnull align 4 dereferenceable(4) [[ARGC:%.]], i8** nonnull align 8 dereferenceable(8) [[ARGV:%.]], i64 [[DOTCAPTURE_EXPR_:%.]], i64 [[DOTCAPTURE_EXPR_1:%.*]]) #[[ATTR3]] {			// CHECK4-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], i32 nonnull align 4 dereferenceable(4) [[I:%.]], i32 nonnull align 4 dereferenceable(4) [[ARGC:%.]], i8** nonnull align 8 dereferenceable(8) [[ARGV:%.]], i64 [[DOTCAPTURE_EXPR_:%.]], i64 [[DOTCAPTURE_EXPR_1:%.*]]) #[[ATTR1]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[I_ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[I_ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[ARGC_ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[ARGC_ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[ARGV_ADDR:%.]] = alloca i8**, align 8			// CHECK4-NEXT: [[ARGV_ADDR:%.]] = alloca i8**, align 8
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR2:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR2:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])			// CHECK4-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])
	// CHECK4-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])			// CHECK4-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])
	// CHECK4-NEXT: br label [[OMP_IF_END]]			// CHECK4-NEXT: br label [[OMP_IF_END]]
	// CHECK4: omp_if.end:			// CHECK4: omp_if.end:
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_privates_map.			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_privates_map.
	// CHECK4-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR0]] {			// CHECK4-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR6:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8			// CHECK4-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8
	// CHECK4-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK4-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK4-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK4-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK4-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK4-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK4-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK4-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK4-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0			// CHECK4-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK4-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK4-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8			// CHECK4-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..7			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..7
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: store i64 [[TMP17]], i64* [[DOTST__ADDR_I]], align 8, !noalias !46			// CHECK4-NEXT: store i64 [[TMP17]], i64* [[DOTST__ADDR_I]], align 8, !noalias !46
	// CHECK4-NEXT: store i32 [[TMP19]], i32* [[DOTLITER__ADDR_I]], align 4, !noalias !46			// CHECK4-NEXT: store i32 [[TMP19]], i32* [[DOTLITER__ADDR_I]], align 4, !noalias !46
	// CHECK4-NEXT: store i8* [[TMP21]], i8** [[DOTREDUCTIONS__ADDR_I]], align 8, !noalias !46			// CHECK4-NEXT: store i8* [[TMP21]], i8** [[DOTREDUCTIONS__ADDR_I]], align 8, !noalias !46
	// CHECK4-NEXT: store %struct.anon.2* [[TMP8]], %struct.anon.2** [[__CONTEXT_ADDR_I]], align 8, !noalias !46			// CHECK4-NEXT: store %struct.anon.2* [[TMP8]], %struct.anon.2** [[__CONTEXT_ADDR_I]], align 8, !noalias !46
	// CHECK4-NEXT: [[TMP22:%.]] = load %struct.anon.2, %struct.anon.2** [[__CONTEXT_ADDR_I]], align 8, !noalias !46			// CHECK4-NEXT: [[TMP22:%.]] = load %struct.anon.2, %struct.anon.2** [[__CONTEXT_ADDR_I]], align 8, !noalias !46
	// CHECK4-NEXT: [[TMP23:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !46			// CHECK4-NEXT: [[TMP23:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !46
	// CHECK4-NEXT: [[TMP24:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !46			// CHECK4-NEXT: [[TMP24:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !46
	// CHECK4-NEXT: [[TMP25:%.]] = bitcast void (i8, ...)* [[TMP23]] to void (i8, i32)			// CHECK4-NEXT: [[TMP25:%.]] = bitcast void (i8, ...)* [[TMP23]] to void (i8, i32)
	// CHECK4-NEXT: call void [[TMP25]](i8* [[TMP24]], i32** [[DOTLASTPRIV_PTR_ADDR_I]]) #[[ATTR4]]			// CHECK4-NEXT: call void [[TMP25]](i8* [[TMP24]], i32** [[DOTLASTPRIV_PTR_ADDR_I]]) #[[ATTR2]]
	// CHECK4-NEXT: [[TMP26:%.]] = getelementptr inbounds [[STRUCT_ANON_2:%.]], %struct.anon.2* [[TMP22]], i32 0, i32 0			// CHECK4-NEXT: [[TMP26:%.]] = getelementptr inbounds [[STRUCT_ANON_2:%.]], %struct.anon.2* [[TMP22]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP27:%.]] = load i32, i32** [[TMP26]], align 8			// CHECK4-NEXT: [[TMP27:%.]] = load i32, i32** [[TMP26]], align 8
	// CHECK4-NEXT: [[TMP28:%.]] = load i32, i32** [[DOTLASTPRIV_PTR_ADDR_I]], align 8, !noalias !46			// CHECK4-NEXT: [[TMP28:%.]] = load i32, i32** [[DOTLASTPRIV_PTR_ADDR_I]], align 8, !noalias !46
	// CHECK4-NEXT: [[TMP29:%.]] = getelementptr inbounds [[STRUCT_ANON_2]], %struct.anon.2 [[TMP22]], i32 0, i32 1			// CHECK4-NEXT: [[TMP29:%.]] = getelementptr inbounds [[STRUCT_ANON_2]], %struct.anon.2 [[TMP22]], i32 0, i32 1
	// CHECK4-NEXT: [[TMP30:%.]] = load i32, i32** [[TMP29]], align 8			// CHECK4-NEXT: [[TMP30:%.]] = load i32, i32** [[TMP29]], align 8
	// CHECK4-NEXT: [[TMP31:%.]] = load i32, i32 [[TMP30]], align 4			// CHECK4-NEXT: [[TMP31:%.]] = load i32, i32 [[TMP30]], align 4
	// CHECK4-NEXT: store i32 [[TMP31]], i32* [[DOTCAPTURE_EXPR__I]], align 4, !noalias !46			// CHECK4-NEXT: store i32 [[TMP31]], i32* [[DOTCAPTURE_EXPR__I]], align 4, !noalias !46
	// CHECK4-NEXT: [[TMP32:%.]] = getelementptr inbounds [[STRUCT_ANON_2]], %struct.anon.2 [[TMP22]], i32 0, i32 1			// CHECK4-NEXT: [[TMP32:%.]] = getelementptr inbounds [[STRUCT_ANON_2]], %struct.anon.2 [[TMP22]], i32 0, i32 1
	▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: br i1 [[TMP87]], label [[DOTOMP_LASTPRIVATE_THEN_I:%.]], label [[DOTOMP_OUTLINED__6_EXIT:%.]]			// CHECK4-NEXT: br i1 [[TMP87]], label [[DOTOMP_LASTPRIVATE_THEN_I:%.]], label [[DOTOMP_OUTLINED__6_EXIT:%.]]
	// CHECK4: .omp.lastprivate.then.i:			// CHECK4: .omp.lastprivate.then.i:
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__6_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__6_EXIT]]
	// CHECK4: .omp_outlined..6.exit:			// CHECK4: .omp_outlined..6.exit:
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_dup.			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_dup.
	// CHECK4-SAME: (%struct.kmp_task_t_with_privates.3* [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 [[TMP1:%.]], i32 [[TMP2:%.]]) #[[ATTR6]] {			// CHECK4-SAME: (%struct.kmp_task_t_with_privates.3* [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 [[TMP1:%.]], i32 [[TMP2:%.]]) #[[ATTR4]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTADDR:%.]] = alloca %struct.kmp_task_t_with_privates.3, align 8			// CHECK4-NEXT: [[DOTADDR:%.]] = alloca %struct.kmp_task_t_with_privates.3, align 8
	// CHECK4-NEXT: [[DOTADDR1:%.]] = alloca %struct.kmp_task_t_with_privates.3, align 8			// CHECK4-NEXT: [[DOTADDR1:%.]] = alloca %struct.kmp_task_t_with_privates.3, align 8
	// CHECK4-NEXT: [[DOTADDR2:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTADDR2:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: store %struct.kmp_task_t_with_privates.3* [[TMP0]], %struct.kmp_task_t_with_privates.3** [[DOTADDR]], align 8			// CHECK4-NEXT: store %struct.kmp_task_t_with_privates.3* [[TMP0]], %struct.kmp_task_t_with_privates.3** [[DOTADDR]], align 8
	// CHECK4-NEXT: store %struct.kmp_task_t_with_privates.3* [[TMP1]], %struct.kmp_task_t_with_privates.3** [[DOTADDR1]], align 8			// CHECK4-NEXT: store %struct.kmp_task_t_with_privates.3* [[TMP1]], %struct.kmp_task_t_with_privates.3** [[DOTADDR1]], align 8
	// CHECK4-NEXT: store i32 [[TMP2]], i32* [[DOTADDR2]], align 4			// CHECK4-NEXT: store i32 [[TMP2]], i32* [[DOTADDR2]], align 4
	// CHECK4-NEXT: [[TMP3:%.]] = load %struct.kmp_task_t_with_privates.3, %struct.kmp_task_t_with_privates.3** [[DOTADDR]], align 8			// CHECK4-NEXT: [[TMP3:%.]] = load %struct.kmp_task_t_with_privates.3, %struct.kmp_task_t_with_privates.3** [[DOTADDR]], align 8
	// CHECK4-NEXT: [[TMP4:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_3:%.]], %struct.kmp_task_t_with_privates.3* [[TMP3]], i32 0, i32 0			// CHECK4-NEXT: [[TMP4:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_3:%.]], %struct.kmp_task_t_with_privates.3* [[TMP3]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T:%.]], %struct.kmp_task_t* [[TMP4]], i32 0, i32 8			// CHECK4-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T:%.]], %struct.kmp_task_t* [[TMP4]], i32 0, i32 8
	// CHECK4-NEXT: [[TMP6:%.]] = load i32, i32 [[DOTADDR2]], align 4			// CHECK4-NEXT: [[TMP6:%.]] = load i32, i32 [[DOTADDR2]], align 4
	// CHECK4-NEXT: store i32 [[TMP6]], i32* [[TMP5]], align 8			// CHECK4-NEXT: store i32 [[TMP6]], i32* [[TMP5]], align 8
	// CHECK4-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_3]], %struct.kmp_task_t_with_privates.3 [[TMP3]], i32 0, i32 1			// CHECK4-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_3]], %struct.kmp_task_t_with_privates.3 [[TMP3]], i32 0, i32 1
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
				// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK4-SAME: () #[[ATTR6]] section "__TEXT,__StaticInit,regular,pure_instructions" {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: call void @_ZN1SC1Ei(%struct.S* nonnull dereferenceable(4) @s, i32 1)
				// CHECK4-NEXT: ret void
				//
				//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SC1Ei
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR8:[0-9]+]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
				// CHECK4-NEXT: call void @_ZN1SC2Ei(%struct.S* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
				// CHECK4-NEXT: ret void
				//
				//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SC2Ei			// CHECK4-LABEL: define {{[^@]+}}@_ZN1SC2Ei
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], i32 [[C:%.]]) unnamed_addr #[[ATTR8]] align 2 {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[C_ADDR:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1			// CHECK4-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i8, align 1
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTCAPTURE_EXPR__CASTED:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4			// CHECK4-NEXT: store i32 [[C]], i32* [[C_ADDR]], align 4
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4			// CHECK4-NEXT: [[TMP0:%.]] = load i32, i32 [[C_ADDR]], align 4
	// CHECK4-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0			// CHECK4-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0
	// CHECK4-NEXT: [[FROMBOOL:%.*]] = zext i1 [[TOBOOL]] to i8			// CHECK4-NEXT: [[FROMBOOL:%.*]] = zext i1 [[TOBOOL]] to i8
	// CHECK4-NEXT: store i8 [[FROMBOOL]], i8* [[DOTCAPTURE_EXPR_]], align 1			// CHECK4-NEXT: store i8 [[FROMBOOL]], i8* [[DOTCAPTURE_EXPR_]], align 1
	// CHECK4-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1			// CHECK4-NEXT: [[TMP1:%.]] = load i8, i8 [[DOTCAPTURE_EXPR_]], align 1
	// CHECK4-NEXT: [[TOBOOL2:%.*]] = trunc i8 [[TMP1]] to i1			// CHECK4-NEXT: [[TOBOOL2:%.*]] = trunc i8 [[TMP1]] to i1
	// CHECK4-NEXT: [[CONV:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*			// CHECK4-NEXT: [[CONV:%.]] = bitcast i64 [[DOTCAPTURE_EXPR__CASTED]] to i8*
	// CHECK4-NEXT: [[FROMBOOL3:%.*]] = zext i1 [[TOBOOL2]] to i8			// CHECK4-NEXT: [[FROMBOOL3:%.*]] = zext i1 [[TOBOOL2]] to i8
	// CHECK4-NEXT: store i8 [[FROMBOOL3]], i8* [[CONV]], align 1			// CHECK4-NEXT: store i8 [[FROMBOOL3]], i8* [[CONV]], align 1
	// CHECK4-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8			// CHECK4-NEXT: [[TMP2:%.]] = load i64, i64 [[DOTCAPTURE_EXPR__CASTED]], align 8
	// CHECK4-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.S, i32, i64)* @.omp_outlined..8 to void (i32, i32, ...)), %struct.S [[THIS1]], i32* [[C_ADDR]], i64 [[TMP2]])			// CHECK4-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 3, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.S, i32, i64)* @.omp_outlined..8 to void (i32, i32, ...)), %struct.S [[THIS1]], i32* [[C_ADDR]], i64 [[TMP2]])
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_outlined..8			// CHECK4-LABEL: define {{[^@]+}}@.omp_outlined..8
	// CHECK4-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.S [[THIS:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR3]] {			// CHECK4-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.S [[THIS:%.]], i32 nonnull align 4 dereferenceable(4) [[C:%.]], i64 [[DOTCAPTURE_EXPR_:%.]]) #[[ATTR1]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: [[C_ADDR:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[C_ADDR:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTCAPTURE_EXPR__ADDR:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_4:%.]], align 8			// CHECK4-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON_4:%.]], align 8
	// CHECK4-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[TMP:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK4-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK4-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])			// CHECK4-NEXT: call void @__kmpc_end_master(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]])
	// CHECK4-NEXT: br label [[OMP_IF_END]]			// CHECK4-NEXT: br label [[OMP_IF_END]]
	// CHECK4: omp_if.end:			// CHECK4: omp_if.end:
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..10			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..10
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR6]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR4]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTLB__ADDR_I:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[DOTUB__ADDR_I:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP65:![0-9]+]]			// CHECK4-NEXT: br label [[OMP_INNER_FOR_COND_I]], !llvm.loop [[LOOP65:![0-9]+]]
	// CHECK4: omp.inner.for.end.i:			// CHECK4: omp.inner.for.end.i:
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__9_EXIT]]
	// CHECK4: .omp_outlined..9.exit:			// CHECK4: .omp_outlined..9.exit:
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_simd_codegen.cpp			// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_parallel_master_taskloop_simd_codegen.cpp
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR6]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @__cxx_global_var_init()			// CHECK4-NEXT: call void @__cxx_global_var_init()
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@main			// CHECK5-LABEL: define {{[^@]+}}@main
	// CHECK5-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR0:[0-9]+]] {			// CHECK5-SAME: (i32 [[ARGC:%.]], i8* [[ARGV:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	▲ Show 20 Lines • Show All 1,482 Lines • Show Last 20 Lines

clang/test/OpenMP/remarks_parallel_in_multiple_target_state_machines.c

	// RUN: %clang_cc1 -verify=host -Rpass=openmp -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc			// RUN: %clang_cc1 -verify=host -Rpass=openmp -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc
	// RUN: %clang_cc1 -verify=all,safe -Rpass=openmp -fopenmp -O2 -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o %t.out			// RUN: %clang_cc1 -verify=all,safe -Rpass=openmp -fopenmp -O2 -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o %t.out
	// RUN: %clang_cc1 -fexperimental-new-pass-manager -verify=all,safe -Rpass=openmp -fopenmp -O2 -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o %t.out			// RUN: %clang_cc1 -fexperimental-new-pass-manager -verify=all,safe -Rpass=openmp -fopenmp -O2 -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o %t.out

	// host-no-diagnostics			// host-no-diagnostics

	void bar1(void) { // all-remark {{[OMP100] Potentially unknown OpenMP target region caller}}			void bar1(void) {
	#pragma omp parallel // #0			#pragma omp parallel // #0
	// all-remark@#0 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}			// all-remark@#0 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}
	// safe-remark@#0 {{Parallel region is not known to be called from a unique single target region, maybe the surrounding function has external linkage?; will not attempt to rewrite the state machine use.}}			// safe-remark@#0 {{Parallel region is used in unexpected ways; will not attempt to rewrite the state machine.}}
	// force-remark@#0 {{[UNSAFE] Parallel region is not known to be called from a unique single target region, maybe the surrounding function has external linkage?; will rewrite the state machine use due to command line flag, this can lead to undefined behavior if the parallel region is called from a target region outside this translation unit.}}
	// force-remark@#0 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__2_wrapper, kernel ID: <NONE>}}			// force-remark@#0 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__2_wrapper, kernel ID: <NONE>}}
	{			{
	}			}
	}			}
	void bar2(void) { // all-remark {{[OMP100] Potentially unknown OpenMP target region caller}}			void bar2(void) {
	#pragma omp parallel // #1			#pragma omp parallel // #1
	// all-remark@#1 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}			// all-remark@#1 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}
	// safe-remark@#1 {{Parallel region is not known to be called from a unique single target region, maybe the surrounding function has external linkage?; will not attempt to rewrite the state machine use.}}			// safe-remark@#1 {{Parallel region is used in unexpected ways; will not attempt to rewrite the state machine.}}
	// force-remark@#1 {{[UNSAFE] Parallel region is not known to be called from a unique single target region, maybe the surrounding function has external linkage?; will rewrite the state machine use due to command line flag, this can lead to undefined behavior if the parallel region is called from a target region outside this translation unit.}}
	// force-remark@#1 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__6_wrapper, kernel ID: <NONE>}}			// force-remark@#1 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__6_wrapper, kernel ID: <NONE>}}
	{			{
	}			}
	}			}

	void foo1(void) {			void foo1(void) {
	#pragma omp target teams // #2			#pragma omp target teams // #2
	// all-remark@#2 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__1_wrapper, kernel ID: __omp_offloading}}			// all-remark@#2 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__1_wrapper, kernel ID: __omp_offloading}}
	// all-remark@#2 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__3_wrapper, kernel ID: __omp_offloading}}			// all-remark@#2 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__2_wrapper, kernel ID: __omp_offloading}}
	{			{
	#pragma omp parallel // #3			#pragma omp parallel // #3
	// all-remark@#3 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}			// all-remark@#3 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}
	// all-remark@#3 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__1_wrapper, kernel ID: __omp_offloading}}			// all-remark@#3 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__1_wrapper, kernel ID: __omp_offloading}}
	{			{
	}			}
	bar1();			bar1();
	#pragma omp parallel // #4			#pragma omp parallel // #4
	// all-remark@#4 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}			// all-remark@#4 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}
	// all-remark@#4 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__3_wrapper, kernel ID: __omp_offloading}}			// all-remark@#4 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__2_wrapper, kernel ID: __omp_offloading}}
	{			{
	}			}
	}			}
	}			}

	void foo2(void) {			void foo2(void) {
	#pragma omp target teams // #5			#pragma omp target teams // #5
	// all-remark@#5 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__5_wrapper, kernel ID: __omp_offloading}}			// all-remark@#5 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__5_wrapper, kernel ID: __omp_offloading}}
	// all-remark@#5 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__7_wrapper, kernel ID: __omp_offloading}}			// all-remark@#5 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__4_wrapper, kernel ID: __omp_offloading}}
	{			{
	#pragma omp parallel // #6			#pragma omp parallel // #6
	// all-remark@#6 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}			// all-remark@#6 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}
	// all-remark@#6 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__5_wrapper, kernel ID: __omp_offloading}}			// all-remark@#6 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__4_wrapper, kernel ID: __omp_offloading}}
	{			{
	}			}
	bar1();			bar1();
	bar2();			bar2();
	#pragma omp parallel // #7			#pragma omp parallel // #7
	// all-remark@#7 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}			// all-remark@#7 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}
	// all-remark@#7 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__7_wrapper, kernel ID: __omp_offloading}}			// all-remark@#7 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__5_wrapper, kernel ID: __omp_offloading}}
	{			{
	}			}
	bar1();			bar1();
	bar2();			bar2();
	}			}
	}			}

	void foo3(void) {			void foo3(void) {
	#pragma omp target teams // #8			#pragma omp target teams // #8
	// all-remark@#8 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__9_wrapper, kernel ID: __omp_offloading}}			// all-remark@#8 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__7_wrapper, kernel ID: __omp_offloading}}
	// all-remark@#8 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__10_wrapper, kernel ID: __omp_offloading}}			// all-remark@#8 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__8_wrapper, kernel ID: __omp_offloading}}
	{			{
	#pragma omp parallel // #9			#pragma omp parallel // #9
	// all-remark@#9 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}			// all-remark@#9 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}
	// all-remark@#9 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__9_wrapper, kernel ID: __omp_offloading}}			// all-remark@#9 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__7_wrapper, kernel ID: __omp_offloading}}
	{			{
	}			}
	bar1();			bar1();
	bar2();			bar2();
	#pragma omp parallel // #10			#pragma omp parallel // #10
	// all-remark@#10 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}			// all-remark@#10 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}}
	// all-remark@#10 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__10_wrapper, kernel ID: __omp_offloading}}			// all-remark@#10 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__8_wrapper, kernel ID: __omp_offloading}}
	{			{
	}			}
	bar1();			bar1();
	bar2();			bar2();
	}			}
	}			}

	void spmd(void) {			void spmd(void) {
	Show All 13 Lines

clang/test/OpenMP/remarks_parallel_in_target_state_machine.c

	// RUN: %clang_cc1 -verify=host -Rpass=openmp -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc			// RUN: %clang_cc1 -verify=host -Rpass=openmp -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm-bc %s -o %t-ppc-host.bc
	// RUN: %clang_cc1 -verify -Rpass=openmp -fopenmp -O2 -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o %t.out			// RUN: %clang_cc1 -verify -Rpass=openmp -fopenmp -O2 -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o %t.out
	// RUN: %clang_cc1 -fexperimental-new-pass-manager -verify -Rpass=openmp -fopenmp -O2 -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o %t.out			// RUN: %clang_cc1 -fexperimental-new-pass-manager -verify -Rpass=openmp -fopenmp -O2 -x c++ -triple nvptx64-unknown-unknown -fopenmp-targets=nvptx64-nvidia-cuda -emit-llvm %s -fopenmp-is-device -fopenmp-host-ir-file-path %t-ppc-host.bc -o %t.out

	// host-no-diagnostics			// host-no-diagnostics

	void bar(void) { // expected-remark {{[OMP100] Potentially unknown OpenMP target region caller}}			void bar(void) {
	#pragma omp parallel // #1 \			#pragma omp parallel // #1 \
	// expected-remark@#1 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}} \			// expected-remark@#1 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}} \
	// expected-remark@#1 {{Parallel region is not known to be called from a unique single target region, maybe the surrounding function has external linkage?; will not attempt to rewrite the state machine use.}}			// expected-remark@#1 {{Parallel region is used in unexpected ways; will not attempt to rewrite the state machine.}}
	{			{
	}			}
	}			}

	void foo(void) {			void foo(void) {
	#pragma omp target teams // #2 \			#pragma omp target teams // #2 \
	// expected-remark@#2 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__1_wrapper, kernel ID: __omp_offloading}} \			// expected-remark@#2 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__1_wrapper, kernel ID: __omp_offloading}} \
	// expected-remark@#2 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__3_wrapper, kernel ID: __omp_offloading}}			// expected-remark@#2 {{Target region containing the parallel region that is specialized. (parallel region ID: __omp_outlined__2_wrapper, kernel ID: __omp_offloading}}
	{			{
	#pragma omp parallel // #3 \			#pragma omp parallel // #3 \
	// expected-remark@#3 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}} \			// expected-remark@#3 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}} \
	// expected-remark@#3 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__1_wrapper, kernel ID: __omp_offloading}}			// expected-remark@#3 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__1_wrapper, kernel ID: __omp_offloading}}
	{			{
	}			}
	bar();			bar();
	#pragma omp parallel // #4 \			#pragma omp parallel // #4 \
	// expected-remark@#4 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}} \			// expected-remark@#4 {{Found a parallel region that is called in a target region but not part of a combined target construct nor nested inside a target construct without intermediate code. This can lead to excessive register usage for unrelated target regions in the same translation unit due to spurious call edges assumed by ptxas.}} \
	// expected-remark@#4 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__3_wrapper, kernel ID: __omp_offloading}}			// expected-remark@#4 {{Specialize parallel region that is only reached from a single target region to avoid spurious call edges and excessive register usage in other target regions. (parallel region ID: __omp_outlined__2_wrapper, kernel ID: __omp_offloading}}
	{			{
	}			}
	}			}
	}			}

	void spmd(void) {			void spmd(void) {
	// Verify we do not emit the remarks above for "SPMD" regions.			// Verify we do not emit the remarks above for "SPMD" regions.
	#pragma omp target teams			#pragma omp target teams
	Show All 11 Lines

clang/test/OpenMP/sections_firstprivate_codegen.cpp

	Show First 20 Lines • Show All 169 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK1-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK1-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK1-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK1-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK1-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK1: arraydestroy.done1:			// CHECK1: arraydestroy.done1:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK1-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK1-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK1-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK1-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 421 Lines • ▼ Show 20 Lines
	// CHECK1-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK1-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8
	// CHECK1-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK1-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK1-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK1-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK1-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_sections_firstprivate_codegen.cpp			// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_sections_firstprivate_codegen.cpp
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @__cxx_global_var_init()			// CHECK1-NEXT: call void @__cxx_global_var_init()
	// CHECK1-NEXT: call void @__cxx_global_var_init.1()			// CHECK1-NEXT: call void @__cxx_global_var_init.1()
	// CHECK1-NEXT: call void @__cxx_global_var_init.2()			// CHECK1-NEXT: call void @__cxx_global_var_init.2()
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK2-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK2-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK2-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK2-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK2-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK2: arraydestroy.done1:			// CHECK2: arraydestroy.done1:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK2-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK2-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK2-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK2-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 421 Lines • ▼ Show 20 Lines
	// CHECK2-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK2-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8
	// CHECK2-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK2-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK2-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK2-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK2-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_sections_firstprivate_codegen.cpp			// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_sections_firstprivate_codegen.cpp
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @__cxx_global_var_init()			// CHECK2-NEXT: call void @__cxx_global_var_init()
	// CHECK2-NEXT: call void @__cxx_global_var_init.1()			// CHECK2-NEXT: call void @__cxx_global_var_init.1()
	// CHECK2-NEXT: call void @__cxx_global_var_init.2()			// CHECK2-NEXT: call void @__cxx_global_var_init.2()
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK3-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK3-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK3-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK3-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK3-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK3: arraydestroy.done1:			// CHECK3: arraydestroy.done1:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK3-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK3-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK3-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK3-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: store i32 [[INC]], i32* [[DOTOMP_SECTIONS_IV_]], align 4			// CHECK3-NEXT: store i32 [[INC]], i32* [[DOTOMP_SECTIONS_IV_]], align 4
	// CHECK3-NEXT: br label [[OMP_INNER_FOR_COND]]			// CHECK3-NEXT: br label [[OMP_INNER_FOR_COND]]
	// CHECK3: omp.inner.for.end:			// CHECK3: omp.inner.for.end:
	// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])			// CHECK3-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]])
	// CHECK3-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP4]])			// CHECK3-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP4]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK3-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK3-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK3-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK3-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_sections_firstprivate_codegen.cpp			// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_sections_firstprivate_codegen.cpp
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @__cxx_global_var_init()			// CHECK3-NEXT: call void @__cxx_global_var_init()
	// CHECK3-NEXT: call void @__cxx_global_var_init.1()			// CHECK3-NEXT: call void @__cxx_global_var_init.1()
	// CHECK3-NEXT: call void @__cxx_global_var_init.2()			// CHECK3-NEXT: call void @__cxx_global_var_init.2()
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK4-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK4-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK4-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK4-NEXT: ret void
				//
				//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: ret void
				//
				//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK4-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK4-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK4: arraydestroy.done1:			// CHECK4: arraydestroy.done1:
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK4-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK4-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK4-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK4-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK4-NEXT: ret void
				//
				//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: store <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>* [[BLOCK_ADDR]], align 8			// CHECK4-NEXT: store <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>* [[BLOCK_ADDR]], align 8
	// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], i32 0, i32 5			// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], i32 0, i32 5
	// CHECK4-NEXT: store i32 2, i32* [[BLOCK_CAPTURE_ADDR]], align 8			// CHECK4-NEXT: store i32 2, i32* [[BLOCK_CAPTURE_ADDR]], align 8
	// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR1:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], i32 0, i32 6			// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR1:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], i32 0, i32 6
	// CHECK4-NEXT: store i32 20, i32* [[BLOCK_CAPTURE_ADDR1]], align 4			// CHECK4-NEXT: store i32 20, i32* [[BLOCK_CAPTURE_ADDR1]], align 4
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK4-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK4-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK4-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK4-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_sections_firstprivate_codegen.cpp			// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_sections_firstprivate_codegen.cpp
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @__cxx_global_var_init()			// CHECK4-NEXT: call void @__cxx_global_var_init()
	// CHECK4-NEXT: call void @__cxx_global_var_init.1()			// CHECK4-NEXT: call void @__cxx_global_var_init.1()
	// CHECK4-NEXT: call void @__cxx_global_var_init.2()			// CHECK4-NEXT: call void @__cxx_global_var_init.2()
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	▲ Show 20 Lines • Show All 832 Lines • Show Last 20 Lines

clang/test/OpenMP/single_codegen.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 137 Lines • ▼ Show 20 Lines








	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init			// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.
	// CHECK1-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) @tc)			// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%class.TestClass) @_ZN9TestClassD1Ev to void (i8)), i8* bitcast (%class.TestClass* @tc to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]]			// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
				// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
				// CHECK1-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]])
				// CHECK1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
				// CHECK1-NEXT: ret i8* [[TMP3]]
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN9TestClassC1Ev			// CHECK1-LABEL: define {{[^@]+}}@_ZN9TestClassC1Ev
	// CHECK1-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 {			// CHECK1-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK1-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN9TestClassC2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]])			// CHECK1-NEXT: call void @_ZN9TestClassC2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]])
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.
				// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
				// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
				// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
				// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
				// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR3:[0-9]+]]
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN9TestClassD1Ev			// CHECK1-LABEL: define {{[^@]+}}@_ZN9TestClassD1Ev
	// CHECK1-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {			// CHECK1-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK1-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN9TestClassD2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]			// CHECK1-NEXT: call void @_ZN9TestClassD2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK1-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_.
	// CHECK1-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			// CHECK1-SAME: () #[[ATTR0]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
				// CHECK1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%class.TestClass* @tc to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.)
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..1
				// CHECK1-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
				// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
				// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x %class.TestClass]*
				// CHECK1-NEXT: [[ARRAY_BEGIN:%.]] = getelementptr inbounds [2 x %class.TestClass], [2 x %class.TestClass] [[TMP2]], i32 0, i32 0
				// CHECK1-NEXT: [[ARRAYCTOR_END:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2
	// CHECK1-NEXT: br label [[ARRAYCTOR_LOOP:%.*]]			// CHECK1-NEXT: br label [[ARRAYCTOR_LOOP:%.*]]
	// CHECK1: arrayctor.loop:			// CHECK1: arrayctor.loop:
	// CHECK1-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ]			// CHECK1-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ [[ARRAY_BEGIN]], [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ]
	// CHECK1-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])			// CHECK1-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])
	// CHECK1-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]]			// CHECK1-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]]
	// CHECK1: invoke.cont:			// CHECK1: invoke.cont:
	// CHECK1-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass [[ARRAYCTOR_CUR]], i64 1			// CHECK1-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYCTOR_CUR]], i64 1
	// CHECK1-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], getelementptr inbounds ([[CLASS_TESTCLASS]], %class.TestClass* getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2)			// CHECK1-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], [[ARRAYCTOR_END]]
	// CHECK1-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]]			// CHECK1-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]]
	// CHECK1: arrayctor.cont:			// CHECK1: arrayctor.cont:
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]			// CHECK1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret i8* [[TMP3]]
	// CHECK1: lpad:			// CHECK1: lpad:
	// CHECK1-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }			// CHECK1-NEXT: [[TMP4:%.]] = landingpad { i8, i32 }
	// CHECK1-NEXT: cleanup			// CHECK1-NEXT: cleanup
	// CHECK1-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0			// CHECK1-NEXT: [[TMP5:%.]] = extractvalue { i8, i32 } [[TMP4]], 0
	// CHECK1-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8			// CHECK1-NEXT: store i8* [[TMP5]], i8** [[EXN_SLOT]], align 8
	// CHECK1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1			// CHECK1-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP4]], 1
	// CHECK1-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4			// CHECK1-NEXT: store i32 [[TMP6]], i32* [[EHSELECTOR_SLOT]], align 4
	// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ARRAYCTOR_CUR]]			// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass [[ARRAY_BEGIN]], [[ARRAYCTOR_CUR]]
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]]
	// CHECK1: arraydestroy.body:			// CHECK1: arraydestroy.body:
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]			// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
	// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0)			// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]]
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]]
	// CHECK1: arraydestroy.done1:			// CHECK1: arraydestroy.done1:
	// CHECK1-NEXT: br label [[EH_RESUME:%.*]]			// CHECK1-NEXT: br label [[EH_RESUME:%.*]]
	// CHECK1: eh.resume:			// CHECK1: eh.resume:
	// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8			// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
	// CHECK1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4			// CHECK1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
	// CHECK1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0			// CHECK1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
	// CHECK1-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1			// CHECK1-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
	// CHECK1-NEXT: resume { i8*, i32 } [[LPAD_VAL2]]			// CHECK1-NEXT: resume { i8*, i32 } [[LPAD_VAL2]]
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_array_dtor			// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..2
	// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {			// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
				// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
				// CHECK1-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
				// CHECK1-NEXT: [[TMP2:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2
	// CHECK1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]			// CHECK1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
	// CHECK1: arraydestroy.body:			// CHECK1: arraydestroy.body:
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ getelementptr inbounds ([[CLASS_TESTCLASS:%.]], %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]			// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
	// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0)			// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]]
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK1: arraydestroy.done1:			// CHECK1: arraydestroy.done1:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.			// CHECK1-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_..3
	// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {			// CHECK1-SAME: () #[[ATTR0]] {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
	// CHECK1-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]])
	// CHECK1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: ret i8* [[TMP3]]
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.
	// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast ([2 x %class.TestClass]* @tc2 to i8), i8 (i8) @.__kmpc_global_ctor_..1, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..2)
	// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
	// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR3]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_.			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK1-SAME: () #[[ATTR0]] {			// CHECK1-SAME: () #[[ATTR0]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])			// CHECK1-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) @tc)
	// CHECK1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%class.TestClass* @tc to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.)			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%class.TestClass) @_ZN9TestClassD1Ev to void (i8)), i8* bitcast (%class.TestClass* @tc to i8), i8 @__dso_handle) #[[ATTR3]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..2			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.4
	// CHECK1-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			// CHECK1-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x %class.TestClass]*
	// CHECK1-NEXT: [[ARRAY_BEGIN:%.]] = getelementptr inbounds [2 x %class.TestClass], [2 x %class.TestClass] [[TMP2]], i32 0, i32 0
	// CHECK1-NEXT: [[ARRAYCTOR_END:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2
	// CHECK1-NEXT: br label [[ARRAYCTOR_LOOP:%.*]]			// CHECK1-NEXT: br label [[ARRAYCTOR_LOOP:%.*]]
	// CHECK1: arrayctor.loop:			// CHECK1: arrayctor.loop:
	// CHECK1-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ [[ARRAY_BEGIN]], [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ]			// CHECK1-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ]
	// CHECK1-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])			// CHECK1-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])
	// CHECK1-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]]			// CHECK1-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]]
	// CHECK1: invoke.cont:			// CHECK1: invoke.cont:
	// CHECK1-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYCTOR_CUR]], i64 1			// CHECK1-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass [[ARRAYCTOR_CUR]], i64 1
	// CHECK1-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], [[ARRAYCTOR_END]]			// CHECK1-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], getelementptr inbounds ([[CLASS_TESTCLASS]], %class.TestClass* getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2)
	// CHECK1-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]]			// CHECK1-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]]
	// CHECK1: arrayctor.cont:			// CHECK1: arrayctor.cont:
	// CHECK1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]
	// CHECK1-NEXT: ret i8* [[TMP3]]			// CHECK1-NEXT: ret void
	// CHECK1: lpad:			// CHECK1: lpad:
	// CHECK1-NEXT: [[TMP4:%.]] = landingpad { i8, i32 }			// CHECK1-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
	// CHECK1-NEXT: cleanup			// CHECK1-NEXT: cleanup
	// CHECK1-NEXT: [[TMP5:%.]] = extractvalue { i8, i32 } [[TMP4]], 0			// CHECK1-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0
	// CHECK1-NEXT: store i8* [[TMP5]], i8** [[EXN_SLOT]], align 8			// CHECK1-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8
	// CHECK1-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP4]], 1			// CHECK1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1
	// CHECK1-NEXT: store i32 [[TMP6]], i32* [[EHSELECTOR_SLOT]], align 4			// CHECK1-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4
	// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass [[ARRAY_BEGIN]], [[ARRAYCTOR_CUR]]			// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ARRAYCTOR_CUR]]
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]]
	// CHECK1: arraydestroy.body:			// CHECK1: arraydestroy.body:
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]			// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
	// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]]			// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0)
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]]
	// CHECK1: arraydestroy.done1:			// CHECK1: arraydestroy.done1:
	// CHECK1-NEXT: br label [[EH_RESUME:%.*]]			// CHECK1-NEXT: br label [[EH_RESUME:%.*]]
	// CHECK1: eh.resume:			// CHECK1: eh.resume:
	// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8			// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
	// CHECK1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4			// CHECK1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
	// CHECK1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0			// CHECK1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
	// CHECK1-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1			// CHECK1-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
	// CHECK1-NEXT: resume { i8*, i32 } [[LPAD_VAL2]]			// CHECK1-NEXT: resume { i8*, i32 } [[LPAD_VAL2]]
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..3			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
	// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {			// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
	// CHECK1-NEXT: [[TMP2:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2
	// CHECK1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]			// CHECK1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
	// CHECK1: arraydestroy.body:			// CHECK1: arraydestroy.body:
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ getelementptr inbounds ([[CLASS_TESTCLASS:%.]], %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]			// CHECK1-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
	// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]]			// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0)
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK1: arraydestroy.done1:			// CHECK1: arraydestroy.done1:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_..4
	// CHECK1-SAME: () #[[ATTR0]] {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast ([2 x %class.TestClass]* @tc2 to i8), i8 (i8) @.__kmpc_global_ctor_..2, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..3)
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN9TestClassC2Ev			// CHECK1-LABEL: define {{[^@]+}}@_ZN9TestClassC2Ev
	// CHECK1-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {			// CHECK1-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK1-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[THIS1]], i32 0, i32 0			// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[THIS1]], i32 0, i32 0
	// CHECK1-NEXT: store i32 0, i32* [[A]], align 4			// CHECK1-NEXT: store i32 0, i32* [[A]], align 4
	▲ Show 20 Lines • Show All 795 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]]			// CHECK1-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]]
	// CHECK1-NEXT: unreachable			// CHECK1-NEXT: unreachable
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_codegen.cpp			// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_codegen.cpp
	// CHECK1-SAME: () #[[ATTR0]] {			// CHECK1-SAME: () #[[ATTR0]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @__cxx_global_var_init()			// CHECK1-NEXT: call void @__cxx_global_var_init()
	// CHECK1-NEXT: call void @__cxx_global_var_init.1()			// CHECK1-NEXT: call void @__cxx_global_var_init.4()
	// CHECK1-NEXT: call void @.__omp_threadprivate_init_.()			// CHECK1-NEXT: call void @.__omp_threadprivate_init_.()
	// CHECK1-NEXT: call void @.__omp_threadprivate_init_..4()			// CHECK1-NEXT: call void @.__omp_threadprivate_init_..3()
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init			// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) @tc)			// CHECK2-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) @tc)
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%class.TestClass) @_ZN9TestClassD1Ev to void (i8)), i8* bitcast (%class.TestClass* @tc to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]]			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%class.TestClass) @_ZN9TestClassD1Ev to void (i8)), i8* bitcast (%class.TestClass* @tc to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]]
	▲ Show 20 Lines • Show All 996 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @__cxx_global_var_init()			// CHECK2-NEXT: call void @__cxx_global_var_init()
	// CHECK2-NEXT: call void @__cxx_global_var_init.1()			// CHECK2-NEXT: call void @__cxx_global_var_init.1()
	// CHECK2-NEXT: call void @.__omp_threadprivate_init_.()			// CHECK2-NEXT: call void @.__omp_threadprivate_init_.()
	// CHECK2-NEXT: call void @.__omp_threadprivate_init_..4()			// CHECK2-NEXT: call void @.__omp_threadprivate_init_..4()
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK3-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK3-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%class.TestClass* @tc to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.)
	// CHECK3-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) @tc)
	// CHECK3-NEXT: [[TMP1:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%class.TestClass) @_ZN9TestClassD1Ev to void (i8)), i8* bitcast (%class.TestClass* @tc to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]]
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.			// CHECK3-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.
	// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {			// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*			// CHECK3-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
	// CHECK3-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]])			// CHECK3-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]])
	// CHECK3-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: ret i8* [[TMP3]]			// CHECK3-NEXT: ret i8* [[TMP3]]
	Show All 11 Lines
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.			// CHECK3-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.
	// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {			// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*			// CHECK3-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
	// CHECK3-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR3]]			// CHECK3-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR3:[0-9]+]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN9TestClassD1Ev			// CHECK3-LABEL: define {{[^@]+}}@_ZN9TestClassD1Ev
	// CHECK3-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {			// CHECK3-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK3-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: call void @_ZN9TestClassD2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]			// CHECK3-NEXT: call void @_ZN9TestClassD2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK3-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_.
	// CHECK3-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			// CHECK3-SAME: () #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4			// CHECK3-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%class.TestClass* @tc to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.)
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
	// CHECK3-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast ([2 x %class.TestClass]* @tc2 to i8), i8 (i8) @.__kmpc_global_ctor_..2, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..3)
	// CHECK3-NEXT: br label [[ARRAYCTOR_LOOP:%.*]]
	// CHECK3: arrayctor.loop:
	// CHECK3-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ]
	// CHECK3-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])
	// CHECK3-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]]
	// CHECK3: invoke.cont:
	// CHECK3-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass [[ARRAYCTOR_CUR]], i64 1
	// CHECK3-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], getelementptr inbounds ([[CLASS_TESTCLASS]], %class.TestClass* getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2)
	// CHECK3-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]]
	// CHECK3: arrayctor.cont:
	// CHECK3-NEXT: [[TMP1:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	// CHECK3: lpad:
	// CHECK3-NEXT: [[TMP2:%.]] = landingpad { i8, i32 }
	// CHECK3-NEXT: cleanup
	// CHECK3-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP2]], 0
	// CHECK3-NEXT: store i8* [[TMP3]], i8** [[EXN_SLOT]], align 8
	// CHECK3-NEXT: [[TMP4:%.]] = extractvalue { i8, i32 } [[TMP2]], 1
	// CHECK3-NEXT: store i32 [[TMP4]], i32* [[EHSELECTOR_SLOT]], align 4
	// CHECK3-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ARRAYCTOR_CUR]]
	// CHECK3-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]]
	// CHECK3: arraydestroy.body:
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK3-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
	// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0)
	// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]]
	// CHECK3: arraydestroy.done1:
	// CHECK3-NEXT: br label [[EH_RESUME:%.*]]
	// CHECK3: eh.resume:
	// CHECK3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
	// CHECK3-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
	// CHECK3-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
	// CHECK3-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
	// CHECK3-NEXT: resume { i8*, i32 } [[LPAD_VAL2]]
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..2			// CHECK3-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..1
	// CHECK3-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			// CHECK3-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x %class.TestClass]*			// CHECK3-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x %class.TestClass]*
	Show All 31 Lines
	// CHECK3: eh.resume:			// CHECK3: eh.resume:
	// CHECK3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8			// CHECK3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
	// CHECK3-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4			// CHECK3-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
	// CHECK3-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0			// CHECK3-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
	// CHECK3-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1			// CHECK3-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
	// CHECK3-NEXT: resume { i8*, i32 } [[LPAD_VAL2]]			// CHECK3-NEXT: resume { i8*, i32 } [[LPAD_VAL2]]
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..3			// CHECK3-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..2
	// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {			// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*			// CHECK3-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*
	// CHECK3-NEXT: [[TMP2:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2			// CHECK3-NEXT: [[TMP2:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2
	// CHECK3-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]			// CHECK3-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
	// CHECK3: arraydestroy.body:			// CHECK3: arraydestroy.body:
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK3-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]			// CHECK3-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
	// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]]			// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]]
	// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK3: arraydestroy.done1:			// CHECK3: arraydestroy.done1:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_..3
				// CHECK3-SAME: () #[[ATTR0]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
				// CHECK3-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast ([2 x %class.TestClass]* @tc2 to i8), i8 (i8) @.__kmpc_global_ctor_..1, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..2)
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK3-SAME: () #[[ATTR0]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) @tc)
				// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%class.TestClass) @_ZN9TestClassD1Ev to void (i8)), i8* bitcast (%class.TestClass* @tc to i8), i8 @__dso_handle) #[[ATTR3]]
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.4
				// CHECK3-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
				// CHECK3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
				// CHECK3-NEXT: br label [[ARRAYCTOR_LOOP:%.*]]
				// CHECK3: arrayctor.loop:
				// CHECK3-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ]
				// CHECK3-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])
				// CHECK3-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]]
				// CHECK3: invoke.cont:
				// CHECK3-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass [[ARRAYCTOR_CUR]], i64 1
				// CHECK3-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], getelementptr inbounds ([[CLASS_TESTCLASS]], %class.TestClass* getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2)
				// CHECK3-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]]
				// CHECK3: arrayctor.cont:
				// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]
				// CHECK3-NEXT: ret void
				// CHECK3: lpad:
				// CHECK3-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
				// CHECK3-NEXT: cleanup
				// CHECK3-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0
				// CHECK3-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8
				// CHECK3-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1
				// CHECK3-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4
				// CHECK3-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ARRAYCTOR_CUR]]
				// CHECK3-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]]
				// CHECK3: arraydestroy.body:
				// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
				// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
				// CHECK3-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
				// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0)
				// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]]
				// CHECK3: arraydestroy.done1:
				// CHECK3-NEXT: br label [[EH_RESUME:%.*]]
				// CHECK3: eh.resume:
				// CHECK3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
				// CHECK3-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
				// CHECK3-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
				// CHECK3-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
				// CHECK3-NEXT: resume { i8*, i32 } [[LPAD_VAL2]]
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_array_dtor			// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
	// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {			// CHECK3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]			// CHECK3-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
	// CHECK3: arraydestroy.body:			// CHECK3: arraydestroy.body:
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ getelementptr inbounds ([[CLASS_TESTCLASS:%.]], %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ getelementptr inbounds ([[CLASS_TESTCLASS:%.]], %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK3-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]			// CHECK3-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
	// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0)			// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0)
	// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK3: arraydestroy.done1:			// CHECK3: arraydestroy.done1:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z3foov
	// CHECK3-SAME: () #[[ATTR4:[0-9]+]] {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_Z8mayThrowv()
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN9TestClassC2Ev			// CHECK3-LABEL: define {{[^@]+}}@_ZN9TestClassC2Ev
	// CHECK3-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {			// CHECK3-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK3-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[A:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[THIS1]], i32 0, i32 0			// CHECK3-NEXT: [[A:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[THIS1]], i32 0, i32 0
	// CHECK3-NEXT: store i32 0, i32* [[A]], align 4			// CHECK3-NEXT: store i32 0, i32* [[A]], align 4
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN9TestClassD2Ev			// CHECK3-LABEL: define {{[^@]+}}@_ZN9TestClassD2Ev
	// CHECK3-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {			// CHECK3-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK3-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@_Z3foov
				// CHECK3-SAME: () #[[ATTR4:[0-9]+]] {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: call void @_Z8mayThrowv()
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@main			// CHECK3-LABEL: define {{[^@]+}}@main
	// CHECK3-SAME: () #[[ATTR6:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			// CHECK3-SAME: () #[[ATTR6:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[A:%.*]] = alloca i8, align 1			// CHECK3-NEXT: [[A:%.*]] = alloca i8, align 1
	// CHECK3-NEXT: [[A2:%.*]] = alloca [2 x i8], align 1			// CHECK3-NEXT: [[A2:%.*]] = alloca [2 x i8], align 1
	// CHECK3-NEXT: [[C:%.]] = alloca %class.TestClass, align 8			// CHECK3-NEXT: [[C:%.]] = alloca %class.TestClass, align 8
	// CHECK3-NEXT: [[SST:%.]] = alloca [[STRUCT_SST:%.]], align 8			// CHECK3-NEXT: [[SST:%.]] = alloca [[STRUCT_SST:%.]], align 8
	▲ Show 20 Lines • Show All 245 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: br label [[TERMINATE_HANDLER:%.*]]			// CHECK3-NEXT: br label [[TERMINATE_HANDLER:%.*]]
	// CHECK3: omp_if.end:			// CHECK3: omp_if.end:
	// CHECK3-NEXT: [[TMP12:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[DOTOMP_COPYPRIVATE_CPR_LIST]], i64 0, i64 0			// CHECK3-NEXT: [[TMP12:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[DOTOMP_COPYPRIVATE_CPR_LIST]], i64 0, i64 0
	// CHECK3-NEXT: [[TMP13:%.]] = load double, double** [[_TMP1]], align 8			// CHECK3-NEXT: [[TMP13:%.]] = load double, double** [[_TMP1]], align 8
	// CHECK3-NEXT: [[TMP14:%.]] = bitcast double [[TMP13]] to i8*			// CHECK3-NEXT: [[TMP14:%.]] = bitcast double [[TMP13]] to i8*
	// CHECK3-NEXT: store i8* [[TMP14]], i8** [[TMP12]], align 8			// CHECK3-NEXT: store i8* [[TMP14]], i8** [[TMP12]], align 8
	// CHECK3-NEXT: [[TMP15:%.]] = bitcast [1 x i8]* [[DOTOMP_COPYPRIVATE_CPR_LIST]] to i8*			// CHECK3-NEXT: [[TMP15:%.]] = bitcast [1 x i8]* [[DOTOMP_COPYPRIVATE_CPR_LIST]] to i8*
	// CHECK3-NEXT: [[TMP16:%.]] = load i32, i32 [[DOTOMP_COPYPRIVATE_DID_IT]], align 4			// CHECK3-NEXT: [[TMP16:%.]] = load i32, i32 [[DOTOMP_COPYPRIVATE_DID_IT]], align 4
	// CHECK3-NEXT: call void @__kmpc_copyprivate(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]], i64 8, i8* [[TMP15]], void (i8, i8)* @.omp.copyprivate.copy_func.4, i32 [[TMP16]])			// CHECK3-NEXT: call void @__kmpc_copyprivate(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]], i64 8, i8* [[TMP15]], void (i8, i8)* @.omp.copyprivate.copy_func.5, i32 [[TMP16]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	// CHECK3: terminate.handler:			// CHECK3: terminate.handler:
	// CHECK3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8			// CHECK3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
	// CHECK3-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]]			// CHECK3-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]]
	// CHECK3-NEXT: unreachable			// CHECK3-NEXT: unreachable
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZZN3SSTIdEC1EvENKUlvE_clEv			// CHECK3-LABEL: define {{[^@]+}}@_ZZN3SSTIdEC1EvENKUlvE_clEv
	Show All 10 Lines
	// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds [[CLASS_ANON_0]], %class.anon.0 [[REF_TMP]], i32 0, i32 1			// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds [[CLASS_ANON_0]], %class.anon.0 [[REF_TMP]], i32 0, i32 1
	// CHECK3-NEXT: [[TMP4:%.]] = getelementptr inbounds [[CLASS_ANON]], %class.anon [[THIS1]], i32 0, i32 1			// CHECK3-NEXT: [[TMP4:%.]] = getelementptr inbounds [[CLASS_ANON]], %class.anon [[THIS1]], i32 0, i32 1
	// CHECK3-NEXT: [[TMP5:%.]] = load double, double** [[TMP4]], align 8			// CHECK3-NEXT: [[TMP5:%.]] = load double, double** [[TMP4]], align 8
	// CHECK3-NEXT: store double* [[TMP5]], double** [[TMP3]], align 8			// CHECK3-NEXT: store double* [[TMP5]], double** [[TMP3]], align 8
	// CHECK3-NEXT: call void @_ZZZN3SSTIdEC1EvENKUlvE_clEvENKUlvE_clEv(%class.anon.0* nonnull dereferenceable(16) [[REF_TMP]])			// CHECK3-NEXT: call void @_ZZZN3SSTIdEC1EvENKUlvE_clEvENKUlvE_clEv(%class.anon.0* nonnull dereferenceable(16) [[REF_TMP]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp.copyprivate.copy_func.4			// CHECK3-LABEL: define {{[^@]+}}@.omp.copyprivate.copy_func.5
	// CHECK3-SAME: (i8* [[TMP0:%.]], i8 [[TMP1:%.*]]) #[[ATTR9]] {			// CHECK3-SAME: (i8* [[TMP0:%.]], i8 [[TMP1:%.*]]) #[[ATTR9]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i8, align 8
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: store i8* [[TMP1]], i8** [[DOTADDR1]], align 8			// CHECK3-NEXT: store i8* [[TMP1]], i8** [[DOTADDR1]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to [1 x i8]			// CHECK3-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to [1 x i8]
	Show All 25 Lines
	// CHECK3-NEXT: [[INC:%.*]] = fadd double [[TMP4]], 1.000000e+00			// CHECK3-NEXT: [[INC:%.*]] = fadd double [[TMP4]], 1.000000e+00
	// CHECK3-NEXT: store double [[INC]], double* [[TMP3]], align 8			// CHECK3-NEXT: store double [[INC]], double* [[TMP3]], align 8
	// CHECK3-NEXT: [[TMP5:%.]] = getelementptr inbounds [[CLASS_ANON_0]], %class.anon.0 [[THIS1]], i32 0, i32 1			// CHECK3-NEXT: [[TMP5:%.]] = getelementptr inbounds [[CLASS_ANON_0]], %class.anon.0 [[THIS1]], i32 0, i32 1
	// CHECK3-NEXT: [[TMP6:%.]] = load double, double** [[TMP5]], align 8			// CHECK3-NEXT: [[TMP6:%.]] = load double, double** [[TMP5]], align 8
	// CHECK3-NEXT: [[TMP7:%.]] = load double, double [[TMP6]], align 8			// CHECK3-NEXT: [[TMP7:%.]] = load double, double [[TMP6]], align 8
	// CHECK3-NEXT: [[CONV:%.]] = bitcast i64 [[A_CASTED]] to double*			// CHECK3-NEXT: [[CONV:%.]] = bitcast i64 [[A_CASTED]] to double*
	// CHECK3-NEXT: store double [[TMP7]], double* [[CONV]], align 8			// CHECK3-NEXT: store double [[TMP7]], double* [[CONV]], align 8
	// CHECK3-NEXT: [[TMP8:%.]] = load i64, i64 [[A_CASTED]], align 8			// CHECK3-NEXT: [[TMP8:%.]] = load i64, i64 [[A_CASTED]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 2, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.SST, i64) @.omp_outlined..5 to void (i32, i32, ...)), %struct.SST [[TMP1]], i64 [[TMP8]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 2, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.SST, i64) @.omp_outlined..6 to void (i32, i32, ...)), %struct.SST [[TMP1]], i64 [[TMP8]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..5			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..6
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.SST [[THIS:%.]], i64 [[A:%.]]) #[[ATTR12]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.SST [[THIS:%.]], i64 [[A:%.]]) #[[ATTR12]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.SST, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.SST, align 8
	// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[TMP:%.]] = alloca double, align 8			// CHECK3-NEXT: [[TMP:%.]] = alloca double, align 8
	// CHECK3-NEXT: [[_TMP1:%.]] = alloca double, align 8			// CHECK3-NEXT: [[_TMP1:%.]] = alloca double, align 8
	Show All 24 Lines
	// CHECK3-NEXT: br label [[OMP_IF_END]]			// CHECK3-NEXT: br label [[OMP_IF_END]]
	// CHECK3: omp_if.end:			// CHECK3: omp_if.end:
	// CHECK3-NEXT: [[TMP8:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[DOTOMP_COPYPRIVATE_CPR_LIST]], i64 0, i64 0			// CHECK3-NEXT: [[TMP8:%.]] = getelementptr inbounds [1 x i8], [1 x i8] [[DOTOMP_COPYPRIVATE_CPR_LIST]], i64 0, i64 0
	// CHECK3-NEXT: [[TMP9:%.]] = load double, double** [[_TMP1]], align 8			// CHECK3-NEXT: [[TMP9:%.]] = load double, double** [[_TMP1]], align 8
	// CHECK3-NEXT: [[TMP10:%.]] = bitcast double [[TMP9]] to i8*			// CHECK3-NEXT: [[TMP10:%.]] = bitcast double [[TMP9]] to i8*
	// CHECK3-NEXT: store i8* [[TMP10]], i8** [[TMP8]], align 8			// CHECK3-NEXT: store i8* [[TMP10]], i8** [[TMP8]], align 8
	// CHECK3-NEXT: [[TMP11:%.]] = bitcast [1 x i8]* [[DOTOMP_COPYPRIVATE_CPR_LIST]] to i8*			// CHECK3-NEXT: [[TMP11:%.]] = bitcast [1 x i8]* [[DOTOMP_COPYPRIVATE_CPR_LIST]] to i8*
	// CHECK3-NEXT: [[TMP12:%.]] = load i32, i32 [[DOTOMP_COPYPRIVATE_DID_IT]], align 4			// CHECK3-NEXT: [[TMP12:%.]] = load i32, i32 [[DOTOMP_COPYPRIVATE_DID_IT]], align 4
	// CHECK3-NEXT: call void @__kmpc_copyprivate(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]], i64 8, i8* [[TMP11]], void (i8, i8)* @.omp.copyprivate.copy_func.6, i32 [[TMP12]])			// CHECK3-NEXT: call void @__kmpc_copyprivate(%struct.ident_t* @[[GLOB1]], i32 [[TMP3]], i64 8, i8* [[TMP11]], void (i8, i8)* @.omp.copyprivate.copy_func.7, i32 [[TMP12]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp.copyprivate.copy_func.6			// CHECK3-LABEL: define {{[^@]+}}@.omp.copyprivate.copy_func.7
	// CHECK3-SAME: (i8* [[TMP0:%.]], i8 [[TMP1:%.*]]) #[[ATTR9]] {			// CHECK3-SAME: (i8* [[TMP0:%.]], i8 [[TMP1:%.*]]) #[[ATTR9]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i8, align 8
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: store i8* [[TMP1]], i8** [[DOTADDR1]], align 8			// CHECK3-NEXT: store i8* [[TMP1]], i8** [[DOTADDR1]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to [1 x i8]			// CHECK3-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to [1 x i8]
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[CONV9:%.]] = bitcast i64 [[B_CASTED]] to i32*			// CHECK3-NEXT: [[CONV9:%.]] = bitcast i64 [[B_CASTED]] to i32*
	// CHECK3-NEXT: store i32 [[TMP5]], i32* [[CONV9]], align 4			// CHECK3-NEXT: store i32 [[TMP5]], i32* [[CONV9]], align 4
	// CHECK3-NEXT: [[TMP6:%.]] = load i64, i64 [[B_CASTED]], align 8			// CHECK3-NEXT: [[TMP6:%.]] = load i64, i64 [[B_CASTED]], align 8
	// CHECK3-NEXT: [[TMP7:%.]] = load i32, i32** [[C7]], align 8			// CHECK3-NEXT: [[TMP7:%.]] = load i32, i32** [[C7]], align 8
	// CHECK3-NEXT: [[TMP8:%.]] = load i32, i32 [[TMP7]], align 4			// CHECK3-NEXT: [[TMP8:%.]] = load i32, i32 [[TMP7]], align 4
	// CHECK3-NEXT: [[CONV10:%.]] = bitcast i64 [[C_CASTED]] to i32*			// CHECK3-NEXT: [[CONV10:%.]] = bitcast i64 [[C_CASTED]] to i32*
	// CHECK3-NEXT: store i32 [[TMP8]], i32* [[CONV10]], align 4			// CHECK3-NEXT: store i32 [[TMP8]], i32* [[CONV10]], align 4
	// CHECK3-NEXT: [[TMP9:%.]] = load i64, i64 [[C_CASTED]], align 8			// CHECK3-NEXT: [[TMP9:%.]] = load i64, i64 [[C_CASTED]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.SS, i64, i64, i64) @.omp_outlined..7 to void (i32, i32, ...)), %struct.SS [[THIS1]], i64 [[TMP4]], i64 [[TMP6]], i64 [[TMP9]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.SS, i64, i64, i64) @.omp_outlined..8 to void (i32, i32, ...)), %struct.SS [[THIS1]], i64 [[TMP4]], i64 [[TMP6]], i64 [[TMP9]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..7			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..8
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.SS [[THIS:%.]], i64 [[A:%.]], i64 [[B:%.]], i64 [[C:%.]]) #[[ATTR12]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.SS [[THIS:%.]], i64 [[A:%.]], i64 [[B:%.]], i64 [[C:%.]]) #[[ATTR12]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.SS, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.SS, align 8
	// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[B_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[B_ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[C_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[C_ADDR:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[TMP20:%.]] = bitcast i32 [[CONV1]] to i8*			// CHECK3-NEXT: [[TMP20:%.]] = bitcast i32 [[CONV1]] to i8*
	// CHECK3-NEXT: store i8* [[TMP20]], i8** [[TMP19]], align 8			// CHECK3-NEXT: store i8* [[TMP20]], i8** [[TMP19]], align 8
	// CHECK3-NEXT: [[TMP21:%.]] = getelementptr inbounds [3 x i8], [3 x i8] [[DOTOMP_COPYPRIVATE_CPR_LIST]], i64 0, i64 2			// CHECK3-NEXT: [[TMP21:%.]] = getelementptr inbounds [3 x i8], [3 x i8] [[DOTOMP_COPYPRIVATE_CPR_LIST]], i64 0, i64 2
	// CHECK3-NEXT: [[TMP22:%.]] = load i32, i32** [[_TMP5]], align 8			// CHECK3-NEXT: [[TMP22:%.]] = load i32, i32** [[_TMP5]], align 8
	// CHECK3-NEXT: [[TMP23:%.]] = bitcast i32 [[TMP22]] to i8*			// CHECK3-NEXT: [[TMP23:%.]] = bitcast i32 [[TMP22]] to i8*
	// CHECK3-NEXT: store i8* [[TMP23]], i8** [[TMP21]], align 8			// CHECK3-NEXT: store i8* [[TMP23]], i8** [[TMP21]], align 8
	// CHECK3-NEXT: [[TMP24:%.]] = bitcast [3 x i8]* [[DOTOMP_COPYPRIVATE_CPR_LIST]] to i8*			// CHECK3-NEXT: [[TMP24:%.]] = bitcast [3 x i8]* [[DOTOMP_COPYPRIVATE_CPR_LIST]] to i8*
	// CHECK3-NEXT: [[TMP25:%.]] = load i32, i32 [[DOTOMP_COPYPRIVATE_DID_IT]], align 4			// CHECK3-NEXT: [[TMP25:%.]] = load i32, i32 [[DOTOMP_COPYPRIVATE_DID_IT]], align 4
	// CHECK3-NEXT: call void @__kmpc_copyprivate(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]], i64 24, i8* [[TMP24]], void (i8, i8)* @.omp.copyprivate.copy_func.8, i32 [[TMP25]])			// CHECK3-NEXT: call void @__kmpc_copyprivate(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]], i64 24, i8* [[TMP24]], void (i8, i8)* @.omp.copyprivate.copy_func.9, i32 [[TMP25]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	// CHECK3: terminate.handler:			// CHECK3: terminate.handler:
	// CHECK3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8			// CHECK3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
	// CHECK3-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]]			// CHECK3-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]]
	// CHECK3-NEXT: unreachable			// CHECK3-NEXT: unreachable
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZZN2SSC1ERiENKUlvE_clEv			// CHECK3-LABEL: define {{[^@]+}}@_ZZN2SSC1ERiENKUlvE_clEv
	Show All 35 Lines
	// CHECK3-NEXT: store i32 [[TMP17]], i32* [[CONV2]], align 4			// CHECK3-NEXT: store i32 [[TMP17]], i32* [[CONV2]], align 4
	// CHECK3-NEXT: [[TMP18:%.]] = load i64, i64 [[B_CASTED]], align 8			// CHECK3-NEXT: [[TMP18:%.]] = load i64, i64 [[B_CASTED]], align 8
	// CHECK3-NEXT: [[TMP19:%.]] = getelementptr inbounds [[CLASS_ANON_1]], %class.anon.1 [[THIS1]], i32 0, i32 3			// CHECK3-NEXT: [[TMP19:%.]] = getelementptr inbounds [[CLASS_ANON_1]], %class.anon.1 [[THIS1]], i32 0, i32 3
	// CHECK3-NEXT: [[TMP20:%.]] = load i32, i32** [[TMP19]], align 8			// CHECK3-NEXT: [[TMP20:%.]] = load i32, i32** [[TMP19]], align 8
	// CHECK3-NEXT: [[TMP21:%.]] = load i32, i32 [[TMP20]], align 4			// CHECK3-NEXT: [[TMP21:%.]] = load i32, i32 [[TMP20]], align 4
	// CHECK3-NEXT: [[CONV3:%.]] = bitcast i64 [[C_CASTED]] to i32*			// CHECK3-NEXT: [[CONV3:%.]] = bitcast i64 [[C_CASTED]] to i32*
	// CHECK3-NEXT: store i32 [[TMP21]], i32* [[CONV3]], align 4			// CHECK3-NEXT: store i32 [[TMP21]], i32* [[CONV3]], align 4
	// CHECK3-NEXT: [[TMP22:%.]] = load i64, i64 [[C_CASTED]], align 8			// CHECK3-NEXT: [[TMP22:%.]] = load i64, i64 [[C_CASTED]], align 8
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.SS, i64, i64, i64) @.omp_outlined..9 to void (i32, i32, ...)), %struct.SS [[TMP1]], i64 [[TMP14]], i64 [[TMP18]], i64 [[TMP22]])			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 4, void (i32, i32, ...)* bitcast (void (i32, i32, %struct.SS, i64, i64, i64) @.omp_outlined..10 to void (i32, i32, ...)), %struct.SS [[TMP1]], i64 [[TMP14]], i64 [[TMP18]], i64 [[TMP22]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp.copyprivate.copy_func.8			// CHECK3-LABEL: define {{[^@]+}}@.omp.copyprivate.copy_func.9
	// CHECK3-SAME: (i8* [[TMP0:%.]], i8 [[TMP1:%.*]]) #[[ATTR9]] {			// CHECK3-SAME: (i8* [[TMP0:%.]], i8 [[TMP1:%.*]]) #[[ATTR9]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i8, align 8
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: store i8* [[TMP1]], i8** [[DOTADDR1]], align 8			// CHECK3-NEXT: store i8* [[TMP1]], i8** [[DOTADDR1]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to [3 x i8]			// CHECK3-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to [3 x i8]
	Show All 21 Lines
	// CHECK3-NEXT: [[TMP23:%.]] = getelementptr inbounds [3 x i8], [3 x i8] [[TMP5]], i64 0, i64 2			// CHECK3-NEXT: [[TMP23:%.]] = getelementptr inbounds [3 x i8], [3 x i8] [[TMP5]], i64 0, i64 2
	// CHECK3-NEXT: [[TMP24:%.]] = load i8, i8** [[TMP23]], align 8			// CHECK3-NEXT: [[TMP24:%.]] = load i8, i8** [[TMP23]], align 8
	// CHECK3-NEXT: [[TMP25:%.]] = bitcast i8 [[TMP24]] to i32*			// CHECK3-NEXT: [[TMP25:%.]] = bitcast i8 [[TMP24]] to i32*
	// CHECK3-NEXT: [[TMP26:%.]] = load i32, i32 [[TMP25]], align 4			// CHECK3-NEXT: [[TMP26:%.]] = load i32, i32 [[TMP25]], align 4
	// CHECK3-NEXT: store i32 [[TMP26]], i32* [[TMP22]], align 4			// CHECK3-NEXT: store i32 [[TMP26]], i32* [[TMP22]], align 4
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..9			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..10
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.SS [[THIS:%.]], i64 [[A:%.]], i64 [[B:%.]], i64 [[C:%.]]) #[[ATTR12]] {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]], %struct.SS [[THIS:%.]], i64 [[A:%.]], i64 [[B:%.]], i64 [[C:%.]]) #[[ATTR12]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.SS, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.SS, align 8
	// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[B_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[B_ADDR:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[C_ADDR:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[C_ADDR:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[TMP16:%.]] = bitcast i32 [[CONV1]] to i8*			// CHECK3-NEXT: [[TMP16:%.]] = bitcast i32 [[CONV1]] to i8*
	// CHECK3-NEXT: store i8* [[TMP16]], i8** [[TMP15]], align 8			// CHECK3-NEXT: store i8* [[TMP16]], i8** [[TMP15]], align 8
	// CHECK3-NEXT: [[TMP17:%.]] = getelementptr inbounds [3 x i8], [3 x i8] [[DOTOMP_COPYPRIVATE_CPR_LIST]], i64 0, i64 2			// CHECK3-NEXT: [[TMP17:%.]] = getelementptr inbounds [3 x i8], [3 x i8] [[DOTOMP_COPYPRIVATE_CPR_LIST]], i64 0, i64 2
	// CHECK3-NEXT: [[TMP18:%.]] = load i32, i32** [[_TMP5]], align 8			// CHECK3-NEXT: [[TMP18:%.]] = load i32, i32** [[_TMP5]], align 8
	// CHECK3-NEXT: [[TMP19:%.]] = bitcast i32 [[TMP18]] to i8*			// CHECK3-NEXT: [[TMP19:%.]] = bitcast i32 [[TMP18]] to i8*
	// CHECK3-NEXT: store i8* [[TMP19]], i8** [[TMP17]], align 8			// CHECK3-NEXT: store i8* [[TMP19]], i8** [[TMP17]], align 8
	// CHECK3-NEXT: [[TMP20:%.]] = bitcast [3 x i8]* [[DOTOMP_COPYPRIVATE_CPR_LIST]] to i8*			// CHECK3-NEXT: [[TMP20:%.]] = bitcast [3 x i8]* [[DOTOMP_COPYPRIVATE_CPR_LIST]] to i8*
	// CHECK3-NEXT: [[TMP21:%.]] = load i32, i32 [[DOTOMP_COPYPRIVATE_DID_IT]], align 4			// CHECK3-NEXT: [[TMP21:%.]] = load i32, i32 [[DOTOMP_COPYPRIVATE_DID_IT]], align 4
	// CHECK3-NEXT: call void @__kmpc_copyprivate(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]], i64 24, i8* [[TMP20]], void (i8, i8)* @.omp.copyprivate.copy_func.10, i32 [[TMP21]])			// CHECK3-NEXT: call void @__kmpc_copyprivate(%struct.ident_t* @[[GLOB1]], i32 [[TMP4]], i64 24, i8* [[TMP20]], void (i8, i8)* @.omp.copyprivate.copy_func.11, i32 [[TMP21]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp.copyprivate.copy_func.10			// CHECK3-LABEL: define {{[^@]+}}@.omp.copyprivate.copy_func.11
	// CHECK3-SAME: (i8* [[TMP0:%.]], i8 [[TMP1:%.*]]) #[[ATTR9]] {			// CHECK3-SAME: (i8* [[TMP0:%.]], i8 [[TMP1:%.*]]) #[[ATTR9]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i8, align 8
	// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: store i8* [[TMP1]], i8** [[DOTADDR1]], align 8			// CHECK3-NEXT: store i8* [[TMP1]], i8** [[DOTADDR1]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to [3 x i8]			// CHECK3-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to [3 x i8]
	Show All 24 Lines
	// CHECK3-NEXT: [[TMP26:%.]] = load i32, i32 [[TMP25]], align 4			// CHECK3-NEXT: [[TMP26:%.]] = load i32, i32 [[TMP25]], align 4
	// CHECK3-NEXT: store i32 [[TMP26]], i32* [[TMP22]], align 4			// CHECK3-NEXT: store i32 [[TMP26]], i32* [[TMP22]], align 4
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_Z15parallel_singlev			// CHECK3-LABEL: define {{[^@]+}}@_Z15parallel_singlev
	// CHECK3-SAME: () #[[ATTR10]] {			// CHECK3-SAME: () #[[ATTR10]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..11 to void (i32, i32, ...)*))			// CHECK3-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..12 to void (i32, i32, ...)*))
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..11			// CHECK3-LABEL: define {{[^@]+}}@.omp_outlined..12
	// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]]) #[[ATTR12]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			// CHECK3-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]]) #[[ATTR12]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8			// CHECK3-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
	// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8			// CHECK3-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
	Show All 25 Lines
	// CHECK3-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]]			// CHECK3-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]]
	// CHECK3-NEXT: unreachable			// CHECK3-NEXT: unreachable
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_codegen.cpp			// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_codegen.cpp
	// CHECK3-SAME: () #[[ATTR0]] {			// CHECK3-SAME: () #[[ATTR0]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @__cxx_global_var_init()			// CHECK3-NEXT: call void @__cxx_global_var_init()
	// CHECK3-NEXT: call void @__cxx_global_var_init.1()			// CHECK3-NEXT: call void @__cxx_global_var_init.4()
				// CHECK3-NEXT: call void @.__omp_threadprivate_init_.()
				// CHECK3-NEXT: call void @.__omp_threadprivate_init_..3()
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init			// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK4-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK4-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])			// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
	// CHECK4-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%class.TestClass* @tc to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.)			// CHECK4-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%class.TestClass* @tc to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.)
	▲ Show 20 Lines • Show All 982 Lines • ▼ Show 20 Lines
	// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_codegen.cpp			// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_codegen.cpp
	// CHECK4-SAME: () #[[ATTR0]] {			// CHECK4-SAME: () #[[ATTR0]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @__cxx_global_var_init()			// CHECK4-NEXT: call void @__cxx_global_var_init()
	// CHECK4-NEXT: call void @__cxx_global_var_init.1()			// CHECK4-NEXT: call void @__cxx_global_var_init.1()
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@__cxx_global_var_init			// CHECK5-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.
	// CHECK5-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG6:![0-9]+]] {			// CHECK5-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG6:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) @tc), !dbg [[DBG8:![0-9]+]]			// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK5-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%class.TestClass) @_ZN9TestClassD1Ev to void (i8)), i8* bitcast (%class.TestClass* @tc to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]], !dbg [[DBG11:![0-9]+]]			// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK5-NEXT: ret void, !dbg [[DBG8]]			// CHECK5-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG9:![0-9]+]]
				// CHECK5-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*, !dbg [[DBG9]]
				// CHECK5-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]]), !dbg [[DBG10:![0-9]+]]
				// CHECK5-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG9]]
				// CHECK5-NEXT: ret i8* [[TMP3]], !dbg [[DBG9]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@_ZN9TestClassC1Ev			// CHECK5-LABEL: define {{[^@]+}}@_ZN9TestClassC1Ev
	// CHECK5-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 !dbg [[DBG12:![0-9]+]] {			// CHECK5-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 !dbg [[DBG11:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK5-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK5-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK5-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK5-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8			// CHECK5-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK5-NEXT: call void @_ZN9TestClassC2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]]), !dbg [[DBG13:![0-9]+]]			// CHECK5-NEXT: call void @_ZN9TestClassC2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]]), !dbg [[DBG12:![0-9]+]]
	// CHECK5-NEXT: ret void, !dbg [[DBG14:![0-9]+]]			// CHECK5-NEXT: ret void, !dbg [[DBG13:![0-9]+]]
				//
				//
				// CHECK5-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.
				// CHECK5-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG14:![0-9]+]] {
				// CHECK5-NEXT: entry:
				// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
				// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
				// CHECK5-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG15:![0-9]+]]
				// CHECK5-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*, !dbg [[DBG15]]
				// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR3:[0-9]+]], !dbg [[DBG15]]
				// CHECK5-NEXT: ret void, !dbg [[DBG16:![0-9]+]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@_ZN9TestClassD1Ev			// CHECK5-LABEL: define {{[^@]+}}@_ZN9TestClassD1Ev
	// CHECK5-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] align 2 !dbg [[DBG15:![0-9]+]] {			// CHECK5-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] align 2 !dbg [[DBG17:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK5-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK5-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK5-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK5-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8			// CHECK5-NEXT: [[THIS1:%.]] = load %class.TestClass, %class.TestClass** [[THIS_ADDR]], align 8
	// CHECK5-NEXT: call void @_ZN9TestClassD2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]], !dbg [[DBG16:![0-9]+]]			// CHECK5-NEXT: call void @_ZN9TestClassD2Ev(%class.TestClass* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]], !dbg [[DBG18:![0-9]+]]
	// CHECK5-NEXT: ret void, !dbg [[DBG17:![0-9]+]]			// CHECK5-NEXT: ret void, !dbg [[DBG19:![0-9]+]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK5-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_.
	// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG18:![0-9]+]] {			// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG20:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
				// CHECK5-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]]), !dbg [[DBG21:![0-9]+]]
				// CHECK5-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%class.TestClass* @tc to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.), !dbg [[DBG21]]
				// CHECK5-NEXT: ret void, !dbg [[DBG21]]
				//
				//
				// CHECK5-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..1
				// CHECK5-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG22:![0-9]+]] {
				// CHECK5-NEXT: entry:
				// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK5-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8			// CHECK5-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
	// CHECK5-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4			// CHECK5-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
	// CHECK5-NEXT: br label [[ARRAYCTOR_LOOP:%.*]], !dbg [[DBG19:![0-9]+]]			// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
				// CHECK5-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG23:![0-9]+]]
				// CHECK5-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x %class.TestClass]*, !dbg [[DBG23]]
				// CHECK5-NEXT: [[ARRAY_BEGIN:%.]] = getelementptr inbounds [2 x %class.TestClass], [2 x %class.TestClass] [[TMP2]], i32 0, i32 0, !dbg [[DBG24:![0-9]+]]
				// CHECK5-NEXT: [[ARRAYCTOR_END:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2, !dbg [[DBG24]]
				// CHECK5-NEXT: br label [[ARRAYCTOR_LOOP:%.*]], !dbg [[DBG24]]
	// CHECK5: arrayctor.loop:			// CHECK5: arrayctor.loop:
	// CHECK5-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ], !dbg [[DBG19]]			// CHECK5-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ [[ARRAY_BEGIN]], [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ], !dbg [[DBG24]]
	// CHECK5-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])			// CHECK5-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])
	// CHECK5-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]], !dbg [[DBG19]]			// CHECK5-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]], !dbg [[DBG24]]
	// CHECK5: invoke.cont:			// CHECK5: invoke.cont:
	// CHECK5-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass [[ARRAYCTOR_CUR]], i64 1, !dbg [[DBG19]]			// CHECK5-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYCTOR_CUR]], i64 1, !dbg [[DBG24]]
	// CHECK5-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], getelementptr inbounds ([[CLASS_TESTCLASS]], %class.TestClass* getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2), !dbg [[DBG19]]			// CHECK5-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], [[ARRAYCTOR_END]], !dbg [[DBG24]]
	// CHECK5-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]], !dbg [[DBG19]]			// CHECK5-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]], !dbg [[DBG24]]
	// CHECK5: arrayctor.cont:			// CHECK5: arrayctor.cont:
	// CHECK5-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]], !dbg [[DBG21:![0-9]+]]			// CHECK5-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG23]]
	// CHECK5-NEXT: ret void, !dbg [[DBG21]]			// CHECK5-NEXT: ret i8* [[TMP3]], !dbg [[DBG23]]
	// CHECK5: lpad:			// CHECK5: lpad:
	// CHECK5-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }			// CHECK5-NEXT: [[TMP4:%.]] = landingpad { i8, i32 }
	// CHECK5-NEXT: cleanup, !dbg [[DBG22:![0-9]+]]			// CHECK5-NEXT: cleanup, !dbg [[DBG25:![0-9]+]]
	// CHECK5-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0, !dbg [[DBG22]]			// CHECK5-NEXT: [[TMP5:%.]] = extractvalue { i8, i32 } [[TMP4]], 0, !dbg [[DBG25]]
	// CHECK5-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG22]]			// CHECK5-NEXT: store i8* [[TMP5]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG25]]
	// CHECK5-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1, !dbg [[DBG22]]			// CHECK5-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP4]], 1, !dbg [[DBG25]]
	// CHECK5-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG22]]			// CHECK5-NEXT: store i32 [[TMP6]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG25]]
	// CHECK5-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ARRAYCTOR_CUR]], !dbg [[DBG19]]			// CHECK5-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass [[ARRAY_BEGIN]], [[ARRAYCTOR_CUR]], !dbg [[DBG24]]
	// CHECK5-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG19]]			// CHECK5-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG24]]
	// CHECK5: arraydestroy.body:			// CHECK5: arraydestroy.body:
	// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG19]]			// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG24]]
	// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG19]]			// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG24]]
	// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG19]]			// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG24]]
	// CHECK5-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), !dbg [[DBG19]]			// CHECK5-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]], !dbg [[DBG24]]
	// CHECK5-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG19]]			// CHECK5-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG24]]
	// CHECK5: arraydestroy.done1:			// CHECK5: arraydestroy.done1:
	// CHECK5-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG19]]			// CHECK5-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG24]]
	// CHECK5: eh.resume:			// CHECK5: eh.resume:
	// CHECK5-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG19]]			// CHECK5-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG24]]
	// CHECK5-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG19]]			// CHECK5-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG24]]
	// CHECK5-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG19]]			// CHECK5-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG24]]
	// CHECK5-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG19]]			// CHECK5-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG24]]
	// CHECK5-NEXT: resume { i8*, i32 } [[LPAD_VAL2]], !dbg [[DBG19]]			// CHECK5-NEXT: resume { i8*, i32 } [[LPAD_VAL2]], !dbg [[DBG24]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@__cxx_global_array_dtor			// CHECK5-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..2
	// CHECK5-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG23:![0-9]+]] {			// CHECK5-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG26:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK5-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG24:![0-9]+]]			// CHECK5-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG27:![0-9]+]]
				// CHECK5-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*, !dbg [[DBG27]]
				// CHECK5-NEXT: [[TMP2:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2, !dbg [[DBG27]]
				// CHECK5-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG27]]
	// CHECK5: arraydestroy.body:			// CHECK5: arraydestroy.body:
	// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ getelementptr inbounds ([[CLASS_TESTCLASS:%.]], %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG24]]			// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG27]]
	// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG24]]			// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG27]]
	// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG24]]			// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG27]]
	// CHECK5-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), !dbg [[DBG24]]			// CHECK5-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]], !dbg [[DBG27]]
	// CHECK5-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG24]]			// CHECK5-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG27]]
	// CHECK5: arraydestroy.done1:			// CHECK5: arraydestroy.done1:
	// CHECK5-NEXT: ret void, !dbg [[DBG24]]			// CHECK5-NEXT: ret void, !dbg [[DBG28:![0-9]+]]
	//
	//
	// CHECK5-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.
	// CHECK5-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG25:![0-9]+]] {
	// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK5-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG26:![0-9]+]]
	// CHECK5-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*, !dbg [[DBG26]]
	// CHECK5-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]]), !dbg [[DBG27:![0-9]+]]
	// CHECK5-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG26]]
	// CHECK5-NEXT: ret i8* [[TMP3]], !dbg [[DBG26]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.			// CHECK5-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_..3
	// CHECK5-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG28:![0-9]+]] {			// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG29:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK5-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB3:[0-9]+]]), !dbg [[DBG30:![0-9]+]]
	// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK5-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB3]], i8* bitcast ([2 x %class.TestClass]* @tc2 to i8), i8 (i8) @.__kmpc_global_ctor_..1, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..2), !dbg [[DBG30]]
	// CHECK5-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG29:![0-9]+]]			// CHECK5-NEXT: ret void, !dbg [[DBG30]]
	// CHECK5-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*, !dbg [[DBG29]]
	// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR3]], !dbg [[DBG29]]
	// CHECK5-NEXT: ret void, !dbg [[DBG30:![0-9]+]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_.			// CHECK5-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG31:![0-9]+]] {			// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG31:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]]), !dbg [[DBG32:![0-9]+]]			// CHECK5-NEXT: call void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) @tc), !dbg [[DBG32:![0-9]+]]
	// CHECK5-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%class.TestClass* @tc to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.), !dbg [[DBG32]]			// CHECK5-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%class.TestClass) @_ZN9TestClassD1Ev to void (i8)), i8* bitcast (%class.TestClass* @tc to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG34:![0-9]+]]
	// CHECK5-NEXT: ret void, !dbg [[DBG32]]			// CHECK5-NEXT: ret void, !dbg [[DBG32]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..2			// CHECK5-LABEL: define {{[^@]+}}@__cxx_global_var_init.4
	// CHECK5-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG33:![0-9]+]] {			// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG35:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK5-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8			// CHECK5-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
	// CHECK5-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4			// CHECK5-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
	// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK5-NEXT: br label [[ARRAYCTOR_LOOP:%.*]], !dbg [[DBG36:![0-9]+]]
	// CHECK5-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG34:![0-9]+]]
	// CHECK5-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x %class.TestClass]*, !dbg [[DBG34]]
	// CHECK5-NEXT: [[ARRAY_BEGIN:%.]] = getelementptr inbounds [2 x %class.TestClass], [2 x %class.TestClass] [[TMP2]], i32 0, i32 0, !dbg [[DBG35:![0-9]+]]
	// CHECK5-NEXT: [[ARRAYCTOR_END:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2, !dbg [[DBG35]]
	// CHECK5-NEXT: br label [[ARRAYCTOR_LOOP:%.*]], !dbg [[DBG35]]
	// CHECK5: arrayctor.loop:			// CHECK5: arrayctor.loop:
	// CHECK5-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ [[ARRAY_BEGIN]], [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ], !dbg [[DBG35]]			// CHECK5-NEXT: [[ARRAYCTOR_CUR:%.]] = phi %class.TestClass [ getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ENTRY:%.]] ], [ [[ARRAYCTOR_NEXT:%.]], [[INVOKE_CONT:%.*]] ], !dbg [[DBG36]]
	// CHECK5-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])			// CHECK5-NEXT: invoke void @_ZN9TestClassC1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYCTOR_CUR]])
	// CHECK5-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]], !dbg [[DBG35]]			// CHECK5-NEXT: to label [[INVOKE_CONT]] unwind label [[LPAD:%.*]], !dbg [[DBG36]]
	// CHECK5: invoke.cont:			// CHECK5: invoke.cont:
	// CHECK5-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYCTOR_CUR]], i64 1, !dbg [[DBG35]]			// CHECK5-NEXT: [[ARRAYCTOR_NEXT]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass [[ARRAYCTOR_CUR]], i64 1, !dbg [[DBG36]]
	// CHECK5-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], [[ARRAYCTOR_END]], !dbg [[DBG35]]			// CHECK5-NEXT: [[ARRAYCTOR_DONE:%.]] = icmp eq %class.TestClass [[ARRAYCTOR_NEXT]], getelementptr inbounds ([[CLASS_TESTCLASS]], %class.TestClass* getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2), !dbg [[DBG36]]
	// CHECK5-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]], !dbg [[DBG35]]			// CHECK5-NEXT: br i1 [[ARRAYCTOR_DONE]], label [[ARRAYCTOR_CONT:%.*]], label [[ARRAYCTOR_LOOP]], !dbg [[DBG36]]
	// CHECK5: arrayctor.cont:			// CHECK5: arrayctor.cont:
	// CHECK5-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG34]]			// CHECK5-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]], !dbg [[DBG38:![0-9]+]]
	// CHECK5-NEXT: ret i8* [[TMP3]], !dbg [[DBG34]]			// CHECK5-NEXT: ret void, !dbg [[DBG38]]
	// CHECK5: lpad:			// CHECK5: lpad:
	// CHECK5-NEXT: [[TMP4:%.]] = landingpad { i8, i32 }			// CHECK5-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
	// CHECK5-NEXT: cleanup, !dbg [[DBG36:![0-9]+]]			// CHECK5-NEXT: cleanup, !dbg [[DBG39:![0-9]+]]
	// CHECK5-NEXT: [[TMP5:%.]] = extractvalue { i8, i32 } [[TMP4]], 0, !dbg [[DBG36]]			// CHECK5-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0, !dbg [[DBG39]]
	// CHECK5-NEXT: store i8* [[TMP5]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG36]]			// CHECK5-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG39]]
	// CHECK5-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP4]], 1, !dbg [[DBG36]]			// CHECK5-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1, !dbg [[DBG39]]
	// CHECK5-NEXT: store i32 [[TMP6]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG36]]			// CHECK5-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG39]]
	// CHECK5-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass [[ARRAY_BEGIN]], [[ARRAYCTOR_CUR]], !dbg [[DBG35]]			// CHECK5-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), [[ARRAYCTOR_CUR]], !dbg [[DBG36]]
	// CHECK5-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG35]]			// CHECK5-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE1:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG36]]
	// CHECK5: arraydestroy.body:			// CHECK5: arraydestroy.body:
	// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG35]]			// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[ARRAYCTOR_CUR]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG36]]
	// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG35]]			// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG36]]
	// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG35]]			// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG36]]
	// CHECK5-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]], !dbg [[DBG35]]			// CHECK5-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), !dbg [[DBG36]]
	// CHECK5-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG35]]			// CHECK5-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG36]]
	// CHECK5: arraydestroy.done1:			// CHECK5: arraydestroy.done1:
	// CHECK5-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG35]]			// CHECK5-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG36]]
	// CHECK5: eh.resume:			// CHECK5: eh.resume:
	// CHECK5-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG35]]			// CHECK5-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG36]]
	// CHECK5-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG35]]			// CHECK5-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG36]]
	// CHECK5-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG35]]			// CHECK5-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG36]]
	// CHECK5-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG35]]			// CHECK5-NEXT: [[LPAD_VAL2:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG36]]
	// CHECK5-NEXT: resume { i8*, i32 } [[LPAD_VAL2]], !dbg [[DBG35]]			// CHECK5-NEXT: resume { i8*, i32 } [[LPAD_VAL2]], !dbg [[DBG36]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..3			// CHECK5-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
	// CHECK5-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG37:![0-9]+]] {			// CHECK5-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG40:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8			// CHECK5-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
	// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8			// CHECK5-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
	// CHECK5-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG38:![0-9]+]]			// CHECK5-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG41:![0-9]+]]
	// CHECK5-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %class.TestClass*, !dbg [[DBG38]]
	// CHECK5-NEXT: [[TMP2:%.]] = getelementptr inbounds [[CLASS_TESTCLASS:%.]], %class.TestClass* [[ARRAY_BEGIN]], i64 2, !dbg [[DBG38]]
	// CHECK5-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG38]]
	// CHECK5: arraydestroy.body:			// CHECK5: arraydestroy.body:
	// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG38]]			// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %class.TestClass [ getelementptr inbounds ([[CLASS_TESTCLASS:%.]], %class.TestClass getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), i64 2), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG41]]
	// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG38]]			// CHECK5-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[CLASS_TESTCLASS]], %class.TestClass* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG41]]
	// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG38]]			// CHECK5-NEXT: call void @_ZN9TestClassD1Ev(%class.TestClass* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG41]]
	// CHECK5-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]], !dbg [[DBG38]]			// CHECK5-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %class.TestClass [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %class.TestClass], [2 x %class.TestClass]* @tc2, i32 0, i32 0), !dbg [[DBG41]]
	// CHECK5-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG38]]			// CHECK5-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG41]]
	// CHECK5: arraydestroy.done1:			// CHECK5: arraydestroy.done1:
	// CHECK5-NEXT: ret void, !dbg [[DBG39:![0-9]+]]
	//
	//
	// CHECK5-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_..4
	// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG40:![0-9]+]] {
	// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB3:[0-9]+]]), !dbg [[DBG41:![0-9]+]]
	// CHECK5-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB3]], i8* bitcast ([2 x %class.TestClass]* @tc2 to i8), i8 (i8) @.__kmpc_global_ctor_..2, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..3), !dbg [[DBG41]]
	// CHECK5-NEXT: ret void, !dbg [[DBG41]]			// CHECK5-NEXT: ret void, !dbg [[DBG41]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@_ZN9TestClassC2Ev			// CHECK5-LABEL: define {{[^@]+}}@_ZN9TestClassC2Ev
	// CHECK5-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG42:![0-9]+]] {			// CHECK5-SAME: (%class.TestClass* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG42:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8			// CHECK5-NEXT: [[THIS_ADDR:%.]] = alloca %class.TestClass, align 8
	// CHECK5-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8			// CHECK5-NEXT: store %class.TestClass* [[THIS]], %class.TestClass** [[THIS_ADDR]], align 8
	▲ Show 20 Lines • Show All 798 Lines • ▼ Show 20 Lines
	// CHECK5-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]], !dbg [[DBG183]]			// CHECK5-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR13]], !dbg [[DBG183]]
	// CHECK5-NEXT: unreachable, !dbg [[DBG183]]			// CHECK5-NEXT: unreachable, !dbg [[DBG183]]
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_codegen.cpp			// CHECK5-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_codegen.cpp
	// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG186:![0-9]+]] {			// CHECK5-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" !dbg [[DBG186:![0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	// CHECK5-NEXT: call void @__cxx_global_var_init(), !dbg [[DBG187:![0-9]+]]			// CHECK5-NEXT: call void @__cxx_global_var_init(), !dbg [[DBG187:![0-9]+]]
	// CHECK5-NEXT: call void @__cxx_global_var_init.1(), !dbg [[DBG187]]			// CHECK5-NEXT: call void @__cxx_global_var_init.4(), !dbg [[DBG187]]
	// CHECK5-NEXT: call void @.__omp_threadprivate_init_.(), !dbg [[DBG187]]			// CHECK5-NEXT: call void @.__omp_threadprivate_init_.(), !dbg [[DBG187]]
	// CHECK5-NEXT: call void @.__omp_threadprivate_init_..4(), !dbg [[DBG187]]			// CHECK5-NEXT: call void @.__omp_threadprivate_init_..3(), !dbg [[DBG187]]
	// CHECK5-NEXT: ret void			// CHECK5-NEXT: ret void
	//			//
	//			//
	// CHECK6-LABEL: define {{[^@]+}}@_Z10array_funciPiP2St			// CHECK6-LABEL: define {{[^@]+}}@_Z10array_funciPiP2St
	// CHECK6-SAME: (i32 [[N:%.]], i32 [[A:%.]], %struct.St [[S:%.*]]) #[[ATTR0:[0-9]+]] {			// CHECK6-SAME: (i32 [[N:%.]], i32 [[A:%.]], %struct.St [[S:%.*]]) #[[ATTR0:[0-9]+]] {
	// CHECK6-NEXT: entry:			// CHECK6-NEXT: entry:
	// CHECK6-NEXT: [[N_ADDR:%.*]] = alloca i32, align 4			// CHECK6-NEXT: [[N_ADDR:%.*]] = alloca i32, align 4
	// CHECK6-NEXT: [[A_ADDR:%.]] = alloca i32, align 8			// CHECK6-NEXT: [[A_ADDR:%.]] = alloca i32, align 8
	▲ Show 20 Lines • Show All 1,258 Lines • Show Last 20 Lines

clang/test/OpenMP/single_firstprivate_codegen.cpp

	Show First 20 Lines • Show All 155 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK1-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK1-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK1-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK1-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK1-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK1: arraydestroy.done1:			// CHECK1: arraydestroy.done1:
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK1-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK1-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK1-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK1-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK1-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 352 Lines • ▼ Show 20 Lines
	// CHECK1-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK1-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8
	// CHECK1-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK1-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK1-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK1-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK1-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK1-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_firstprivate_codegen.cpp			// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_firstprivate_codegen.cpp
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @__cxx_global_var_init()			// CHECK1-NEXT: call void @__cxx_global_var_init()
	// CHECK1-NEXT: call void @__cxx_global_var_init.1()			// CHECK1-NEXT: call void @__cxx_global_var_init.1()
	// CHECK1-NEXT: call void @__cxx_global_var_init.2()			// CHECK1-NEXT: call void @__cxx_global_var_init.2()
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK2-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK2-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK2-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK2-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK2-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK2: arraydestroy.done1:			// CHECK2: arraydestroy.done1:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK2-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK2-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK2-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK2-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK2-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 352 Lines • ▼ Show 20 Lines
	// CHECK2-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK2-SAME: (%struct.S.0* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S.0, align 8
	// CHECK2-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S.0* [[THIS]], %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S.0, %struct.S.0** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK2-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK2-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK2-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK2-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK2-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_firstprivate_codegen.cpp			// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_firstprivate_codegen.cpp
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @__cxx_global_var_init()			// CHECK2-NEXT: call void @__cxx_global_var_init()
	// CHECK2-NEXT: call void @__cxx_global_var_init.1()			// CHECK2-NEXT: call void @__cxx_global_var_init.1()
	// CHECK2-NEXT: call void @__cxx_global_var_init.2()			// CHECK2-NEXT: call void @__cxx_global_var_init.2()
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK3-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK3-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK3-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK3-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK3-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK3: arraydestroy.done1:			// CHECK3: arraydestroy.done1:
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK3-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK3-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK3-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK3-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK3-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: call void @"_ZZZ4mainENK3$_0clEvENKUlvE_clEv"(%class.anon.0* nonnull dereferenceable(16) [[REF_TMP]])			// CHECK3-NEXT: call void @"_ZZZ4mainENK3$_0clEvENKUlvE_clEv"(%class.anon.0* nonnull dereferenceable(16) [[REF_TMP]])
	// CHECK3-NEXT: call void @__kmpc_end_single(%struct.ident_t* @[[GLOB1]], i32 [[TMP2]])			// CHECK3-NEXT: call void @__kmpc_end_single(%struct.ident_t* @[[GLOB1]], i32 [[TMP2]])
	// CHECK3-NEXT: br label [[OMP_IF_END]]			// CHECK3-NEXT: br label [[OMP_IF_END]]
	// CHECK3: omp_if.end:			// CHECK3: omp_if.end:
	// CHECK3-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP2]])			// CHECK3-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP2]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK3-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK3-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK3-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK3-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK3-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_firstprivate_codegen.cpp			// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_firstprivate_codegen.cpp
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @__cxx_global_var_init()			// CHECK3-NEXT: call void @__cxx_global_var_init()
	// CHECK3-NEXT: call void @__cxx_global_var_init.1()			// CHECK3-NEXT: call void @__cxx_global_var_init.1()
	// CHECK3-NEXT: call void @__cxx_global_var_init.2()			// CHECK3-NEXT: call void @__cxx_global_var_init.2()
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	Show All 21 Lines
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]			// CHECK4-NEXT: call void @_ZN1SIfED2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK4-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
				// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
				// CHECK4-NEXT: store float [[CONV]], float* [[F]], align 4
				// CHECK4-NEXT: ret void
				//
				//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: ret void
				//
				//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.1			// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 0), float 1.000000e+00)
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i64 0, i64 1), float 2.000000e+00)
	// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]			// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	Show All 22 Lines
	// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK4-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]			// CHECK4-NEXT: call void @_ZN1SIfED1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR2]]
	// CHECK4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)			// CHECK4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x %struct.S], [2 x %struct.S]* @s_arr, i32 0, i32 0)
	// CHECK4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK4: arraydestroy.done1:			// CHECK4: arraydestroy.done1:
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
				// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
				// CHECK4-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
				// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: store float [[A]], float* [[A_ADDR]], align 4
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
				// CHECK4-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
				// CHECK4-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
				// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
				// CHECK4-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
				// CHECK4-NEXT: store float [[ADD]], float* [[F]], align 4
				// CHECK4-NEXT: ret void
				//
				//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.2			// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)			// CHECK4-NEXT: call void @_ZN1SIfEC1Ef(%struct.S* nonnull dereferenceable(4) @var, float 3.000000e+00)
	// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]			// CHECK4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S) @_ZN1SIfED1Ev to void (i8)), i8* bitcast (%struct.S* @var to i8), i8 @__dso_handle) #[[ATTR2]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: store <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>* [[BLOCK_ADDR]], align 8			// CHECK4-NEXT: store <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>* [[BLOCK_ADDR]], align 8
	// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], i32 0, i32 5			// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], i32 0, i32 5
	// CHECK4-NEXT: store i32 2, i32* [[BLOCK_CAPTURE_ADDR]], align 8			// CHECK4-NEXT: store i32 2, i32* [[BLOCK_CAPTURE_ADDR]], align 8
	// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR1:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], i32 0, i32 6			// CHECK4-NEXT: [[BLOCK_CAPTURE_ADDR1:%.]] = getelementptr inbounds <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }>, <{ i8, i32, i32, i8, %struct.__block_descriptor, i32, i32 }> [[BLOCK]], i32 0, i32 6
	// CHECK4-NEXT: store i32 31, i32* [[BLOCK_CAPTURE_ADDR1]], align 4			// CHECK4-NEXT: store i32 31, i32* [[BLOCK_CAPTURE_ADDR1]], align 4
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ev
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP0:%.]] = load volatile i32, i32 @g, align 4
	// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP0]] to float
	// CHECK4-NEXT: store float [[CONV]], float* [[F]], align 4
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfED2Ev
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SIfEC2Ef
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.]], float [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: [[A_ADDR:%.*]] = alloca float, align 4
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: store float [[A]], float* [[A_ADDR]], align 4
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[F:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP0:%.]] = load float, float [[A_ADDR]], align 4
	// CHECK4-NEXT: [[TMP1:%.]] = load volatile i32, i32 @g, align 4
	// CHECK4-NEXT: [[CONV:%.*]] = sitofp i32 [[TMP1]] to float
	// CHECK4-NEXT: [[ADD:%.*]] = fadd float [[TMP0]], [[CONV]]
	// CHECK4-NEXT: store float [[ADD]], float* [[F]], align 4
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_firstprivate_codegen.cpp			// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_single_firstprivate_codegen.cpp
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @__cxx_global_var_init()			// CHECK4-NEXT: call void @__cxx_global_var_init()
	// CHECK4-NEXT: call void @__cxx_global_var_init.1()			// CHECK4-NEXT: call void @__cxx_global_var_init.1()
	// CHECK4-NEXT: call void @__cxx_global_var_init.2()			// CHECK4-NEXT: call void @__cxx_global_var_init.2()
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	▲ Show 20 Lines • Show All 832 Lines • Show Last 20 Lines

clang/test/OpenMP/task_codegen.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 145 Lines • ▼ Show 20 Lines
	// Copy `a` to the list of shared variables			// Copy `a` to the list of shared variables

	// Allocate task.			// Allocate task.
	// Copy shared vars.			// Copy shared vars.

	// Copy firstprivate value of `b`.			// Copy firstprivate value of `b`.
	#endif // UNTIEDRT			#endif // UNTIEDRT
	#endif			#endif
	// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK1-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @_ZN2S1C1Ev(%struct.S1* nonnull dereferenceable(4) @s1)
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN2S1C1Ev
	// CHECK1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
	// CHECK1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN2S1C2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
	// CHECK1-NEXT: ret void
	//
	//
	// CHECK1-LABEL: define {{[^@]+}}@main			// CHECK1-LABEL: define {{[^@]+}}@main
	// CHECK1-SAME: () #[[ATTR2:[0-9]+]] {			// CHECK1-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[B:%.*]] = alloca i8, align 1			// CHECK1-NEXT: [[B:%.*]] = alloca i8, align 1
	// CHECK1-NEXT: [[S:%.*]] = alloca [2 x %struct.S], align 4			// CHECK1-NEXT: [[S:%.*]] = alloca [2 x %struct.S], align 4
	// CHECK1-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8			// CHECK1-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8
	// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8			// CHECK1-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8
	// CHECK1-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 8			// CHECK1-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 8
	▲ Show 20 Lines • Show All 274 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: [[TMP169:%.]] = load i8, i8** [[SAVED_STACK]], align 8			// CHECK1-NEXT: [[TMP169:%.]] = load i8, i8** [[SAVED_STACK]], align 8
	// CHECK1-NEXT: call void @llvm.stackrestore(i8* [[TMP169]])			// CHECK1-NEXT: call void @llvm.stackrestore(i8* [[TMP169]])
	// CHECK1-NEXT: [[ARRAY_BEGIN32:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[S]], i32 0, i32 0			// CHECK1-NEXT: [[ARRAY_BEGIN32:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[S]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP170:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[ARRAY_BEGIN32]], i64 2			// CHECK1-NEXT: [[TMP170:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[ARRAY_BEGIN32]], i64 2
	// CHECK1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]			// CHECK1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
	// CHECK1: arraydestroy.body:			// CHECK1: arraydestroy.body:
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S [ [[TMP170]], [[ARRAYCTOR_CONT]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S [ [[TMP170]], [[ARRAYCTOR_CONT]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
	// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK1-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR5:[0-9]+]]			// CHECK1-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4:[0-9]+]]
	// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN32]]			// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN32]]
	// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE33:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE33:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK1: arraydestroy.done33:			// CHECK1: arraydestroy.done33:
	// CHECK1-NEXT: [[TMP171:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK1-NEXT: [[TMP171:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK1-NEXT: ret i32 [[TMP171]]			// CHECK1-NEXT: ret i32 [[TMP171]]
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SC1Ev			// CHECK1-LABEL: define {{[^@]+}}@_ZN1SC1Ev
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])			// CHECK1-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry.			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry.
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR4:[0-9]+]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR3:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon, align 8
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK1-NEXT: [[TMP15:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP14]], align 8			// CHECK1-NEXT: [[TMP15:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP14]], align 8
	// CHECK1-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP15]], i64 0, i64 0			// CHECK1-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP15]], i64 0, i64 0
	// CHECK1-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0			// CHECK1-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0
	// CHECK1-NEXT: store i32 10, i32* [[A_I]], align 4			// CHECK1-NEXT: store i32 10, i32* [[A_I]], align 4
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..2			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..2
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.0, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.0, align 8
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 24 Lines
	// CHECK1-NEXT: [[TMP12:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP11]], align 8			// CHECK1-NEXT: [[TMP12:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP11]], align 8
	// CHECK1-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP12]], i64 0, i64 1			// CHECK1-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP12]], i64 0, i64 1
	// CHECK1-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0			// CHECK1-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0
	// CHECK1-NEXT: store i32 10, i32* [[A_I]], align 4			// CHECK1-NEXT: store i32 10, i32* [[A_I]], align 4
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..4			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..4
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.2, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.2, align 8
	// CHECK1-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK1: .untied.done..i:			// CHECK1: .untied.done..i:
	// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK1-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK1-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK1: .untied.jmp..i:			// CHECK1: .untied.jmp..i:
	// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !31			// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !31
	// CHECK1-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK1-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !31			// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !31
	// CHECK1-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !31			// CHECK1-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !31
	// CHECK1-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT:%.*]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT:%.*]]
	// CHECK1: .untied.jmp.1.i:			// CHECK1: .untied.jmp.1.i:
	// CHECK1-NEXT: [[TMP17:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !31			// CHECK1-NEXT: [[TMP17:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !31
	// CHECK1-NEXT: call void @__kmpc_critical(%struct.ident_t* @[[GLOB1]], i32 [[TMP17]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR5]]			// CHECK1-NEXT: call void @__kmpc_critical(%struct.ident_t* @[[GLOB1]], i32 [[TMP17]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR4]]
	// CHECK1-NEXT: store i32 1, i32* @a, align 4			// CHECK1-NEXT: store i32 1, i32* @a, align 4
	// CHECK1-NEXT: call void @__kmpc_end_critical(%struct.ident_t* @[[GLOB1]], i32 [[TMP17]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR5]]			// CHECK1-NEXT: call void @__kmpc_end_critical(%struct.ident_t* @[[GLOB1]], i32 [[TMP17]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR4]]
	// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK1-NEXT: br label [[CLEANUP_I]]			// CHECK1-NEXT: br label [[CLEANUP_I]]
	// CHECK1: cleanup.i:			// CHECK1: cleanup.i:
	// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT]]
	// CHECK1: .omp_outlined..3.exit:			// CHECK1: .omp_outlined..3.exit:
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..6			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..6
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.4, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.4, align 8
	// CHECK1-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK1: .untied.done..i:			// CHECK1: .untied.done..i:
	// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK1-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK1-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK1: .untied.jmp..i:			// CHECK1: .untied.jmp..i:
	// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !41			// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !41
	// CHECK1-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK1-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !41			// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !41
	// CHECK1-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !41			// CHECK1-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !41
	// CHECK1-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT:%.*]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT:%.*]]
	// CHECK1: .untied.jmp.1.i:			// CHECK1: .untied.jmp.1.i:
	// CHECK1-NEXT: store i32 1, i32* @a, align 4			// CHECK1-NEXT: store i32 1, i32* @a, align 4
	// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK1-NEXT: br label [[CLEANUP_I]]			// CHECK1-NEXT: br label [[CLEANUP_I]]
	// CHECK1: cleanup.i:			// CHECK1: cleanup.i:
	// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT]]
	// CHECK1: .omp_outlined..5.exit:			// CHECK1: .omp_outlined..5.exit:
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..8			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..8
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.6, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.6, align 8
	// CHECK1-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK1: .untied.done..i:			// CHECK1: .untied.done..i:
	// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK1-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK1-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK1: .untied.jmp..i:			// CHECK1: .untied.jmp..i:
	// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !51			// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !51
	// CHECK1-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK1-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51			// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51
	// CHECK1-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !51			// CHECK1-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !51
	// CHECK1-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT:%.*]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT:%.*]]
	// CHECK1: .untied.jmp.1.i:			// CHECK1: .untied.jmp.1.i:
	// CHECK1-NEXT: store i32 1, i32* @a, align 4			// CHECK1-NEXT: store i32 1, i32* @a, align 4
	// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK1-NEXT: br label [[CLEANUP_I]]			// CHECK1-NEXT: br label [[CLEANUP_I]]
	// CHECK1: cleanup.i:			// CHECK1: cleanup.i:
	// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT]]
	// CHECK1: .omp_outlined..7.exit:			// CHECK1: .omp_outlined..7.exit:
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..10			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..10
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.9 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.9 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.8, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.8, align 8
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK1-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !61			// CHECK1-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !61
	// CHECK1-NEXT: store %struct.anon.8* [[TMP8]], %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61			// CHECK1-NEXT: store %struct.anon.8* [[TMP8]], %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61
	// CHECK1-NEXT: [[TMP10:%.]] = load %struct.anon.8, %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61			// CHECK1-NEXT: [[TMP10:%.]] = load %struct.anon.8, %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61
	// CHECK1-NEXT: store i32 2, i32* @a, align 4			// CHECK1-NEXT: store i32 2, i32* @a, align 4
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..12			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..12
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.11 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.11 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.10, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.10, align 8
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK1-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !71			// CHECK1-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !71
	// CHECK1-NEXT: store %struct.anon.10* [[TMP8]], %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71			// CHECK1-NEXT: store %struct.anon.10* [[TMP8]], %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71
	// CHECK1-NEXT: [[TMP10:%.]] = load %struct.anon.10, %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71			// CHECK1-NEXT: [[TMP10:%.]] = load %struct.anon.10, %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71
	// CHECK1-NEXT: store i32 2, i32* @a, align 4			// CHECK1-NEXT: store i32 2, i32* @a, align 4
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..14			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..14
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.13 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.13 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.12, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.12, align 8
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK1-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !81			// CHECK1-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !81
	// CHECK1-NEXT: store %struct.anon.12* [[TMP8]], %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81			// CHECK1-NEXT: store %struct.anon.12* [[TMP8]], %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81
	// CHECK1-NEXT: [[TMP10:%.]] = load %struct.anon.12, %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81			// CHECK1-NEXT: [[TMP10:%.]] = load %struct.anon.12, %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81
	// CHECK1-NEXT: store i32 3, i32* @a, align 4			// CHECK1-NEXT: store i32 3, i32* @a, align 4
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..16			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..16
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.15 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.15 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.14, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.14, align 8
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 22 Lines
	// CHECK1-NEXT: store i32 4, i32* @a, align 4			// CHECK1-NEXT: store i32 4, i32* @a, align 4
	// CHECK1-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_14:%.]], %struct.anon.14* [[TMP10]], i32 0, i32 0			// CHECK1-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_14:%.]], %struct.anon.14* [[TMP10]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP12:%.]] = load i32, i32** [[TMP11]], align 8			// CHECK1-NEXT: [[TMP12:%.]] = load i32, i32** [[TMP11]], align 8
	// CHECK1-NEXT: store i32 5, i32* [[TMP12]], align 128			// CHECK1-NEXT: store i32 5, i32* [[TMP12]], align 128
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_privates_map.			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_privates_map.
	// CHECK1-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR0]] {			// CHECK1-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR7:[0-9]+]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8			// CHECK1-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8
	// CHECK1-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK1-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK1-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK1-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK1-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK1-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0			// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK1-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK1-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8			// CHECK1-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..19			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..19
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.18 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.18 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.17, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.17, align 8
	// CHECK1-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8
	Show All 20 Lines
	// CHECK1-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101			// CHECK1-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101
	// CHECK1-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t, i32) @.omp_task_privates_map. to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101			// CHECK1-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t, i32) @.omp_task_privates_map. to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101
	// CHECK1-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !101			// CHECK1-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !101
	// CHECK1-NEXT: store %struct.anon.17* [[TMP8]], %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101			// CHECK1-NEXT: store %struct.anon.17* [[TMP8]], %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101
	// CHECK1-NEXT: [[TMP12:%.]] = load %struct.anon.17, %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101			// CHECK1-NEXT: [[TMP12:%.]] = load %struct.anon.17, %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101
	// CHECK1-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101			// CHECK1-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101
	// CHECK1-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101			// CHECK1-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101
	// CHECK1-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32)			// CHECK1-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32)
	// CHECK1-NEXT: call void [[TMP15]](i8* [[TMP14]], i32** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR5]]			// CHECK1-NEXT: call void [[TMP15]](i8* [[TMP14]], i32** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !101			// CHECK1-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !101
	// CHECK1-NEXT: store i32 4, i32* [[TMP16]], align 128			// CHECK1-NEXT: store i32 4, i32* [[TMP16]], align 128
	// CHECK1-NEXT: store i32 4, i32* @a, align 4			// CHECK1-NEXT: store i32 4, i32* @a, align 4
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN1SD1Ev			// CHECK1-LABEL: define {{[^@]+}}@_ZN1SD1Ev
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN1SD2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR5]]			// CHECK1-NEXT: call void @_ZN1SD2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR4]]
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_privates_map..20			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_privates_map..20
	// CHECK1-SAME: (%struct..kmp_privates.t.20* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.]], %struct.S* noalias [[TMP2:%.]], %struct.S** noalias [[TMP3:%.*]]) #[[ATTR0]] {			// CHECK1-SAME: (%struct..kmp_privates.t.20* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.]], %struct.S* noalias [[TMP2:%.]], %struct.S** noalias [[TMP3:%.*]]) #[[ATTR7]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.20, align 8			// CHECK1-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.20, align 8
	// CHECK1-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK1-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK1-NEXT: [[DOTADDR2:%.]] = alloca %struct.S*, align 8			// CHECK1-NEXT: [[DOTADDR2:%.]] = alloca %struct.S*, align 8
	// CHECK1-NEXT: [[DOTADDR3:%.]] = alloca %struct.S**, align 8			// CHECK1-NEXT: [[DOTADDR3:%.]] = alloca %struct.S**, align 8
	// CHECK1-NEXT: store %struct..kmp_privates.t.20* [[TMP0]], %struct..kmp_privates.t.20** [[DOTADDR]], align 8			// CHECK1-NEXT: store %struct..kmp_privates.t.20* [[TMP0]], %struct..kmp_privates.t.20** [[DOTADDR]], align 8
	// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK1-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK1-NEXT: store %struct.S [[TMP2]], %struct.S* [[DOTADDR2]], align 8			// CHECK1-NEXT: store %struct.S [[TMP2]], %struct.S* [[DOTADDR2]], align 8
	// CHECK1-NEXT: store %struct.S* [[TMP3]], %struct.S** [[DOTADDR3]], align 8			// CHECK1-NEXT: store %struct.S* [[TMP3]], %struct.S** [[DOTADDR3]], align 8
	// CHECK1-NEXT: [[TMP4:%.]] = load %struct..kmp_privates.t.20, %struct..kmp_privates.t.20** [[DOTADDR]], align 8			// CHECK1-NEXT: [[TMP4:%.]] = load %struct..kmp_privates.t.20, %struct..kmp_privates.t.20** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20:%.]], %struct..kmp_privates.t.20* [[TMP4]], i32 0, i32 0			// CHECK1-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20:%.]], %struct..kmp_privates.t.20* [[TMP4]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP6:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK1-NEXT: [[TMP6:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK1-NEXT: store i32* [[TMP5]], i32** [[TMP6]], align 8			// CHECK1-NEXT: store i32* [[TMP5]], i32** [[TMP6]], align 8
	// CHECK1-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 2			// CHECK1-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 2
	// CHECK1-NEXT: [[TMP8:%.]] = load %struct.S, %struct.S** [[DOTADDR3]], align 8			// CHECK1-NEXT: [[TMP8:%.]] = load %struct.S, %struct.S** [[DOTADDR3]], align 8
	// CHECK1-NEXT: store %struct.S [[TMP7]], %struct.S* [[TMP8]], align 8			// CHECK1-NEXT: store %struct.S [[TMP7]], %struct.S* [[TMP8]], align 8
	// CHECK1-NEXT: [[TMP9:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 3			// CHECK1-NEXT: [[TMP9:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 3
	// CHECK1-NEXT: [[TMP10:%.]] = load %struct.S, %struct.S** [[DOTADDR2]], align 8			// CHECK1-NEXT: [[TMP10:%.]] = load %struct.S, %struct.S** [[DOTADDR2]], align 8
	// CHECK1-NEXT: store %struct.S* [[TMP9]], %struct.S** [[TMP10]], align 8			// CHECK1-NEXT: store %struct.S* [[TMP9]], %struct.S** [[TMP10]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..21			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..21
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.19 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.19 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.16, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.16, align 8
	// CHECK1-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8
	Show All 24 Lines
	// CHECK1-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.20, i32, %struct.S, %struct.S*) @.omp_task_privates_map..20 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.20, i32, %struct.S, %struct.S*) @.omp_task_privates_map..20 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: store %struct.anon.16* [[TMP8]], %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: store %struct.anon.16* [[TMP8]], %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP12:%.]] = load %struct.anon.16, %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP12:%.]] = load %struct.anon.16, %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32, %struct.S, %struct.S*)			// CHECK1-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32, %struct.S, %struct.S*)
	// CHECK1-NEXT: call void [[TMP15]](i8* [[TMP14]], i32 [[DOTFIRSTPRIV_PTR_ADDR_I]], %struct.S [[DOTLOCAL_PTR_ADDR_I]], %struct.S*** [[DOTLOCAL_PTR_ADDR1_I]]) #[[ATTR5]]			// CHECK1-NEXT: call void [[TMP15]](i8* [[TMP14]], i32 [[DOTFIRSTPRIV_PTR_ADDR_I]], %struct.S [[DOTLOCAL_PTR_ADDR_I]], %struct.S*** [[DOTLOCAL_PTR_ADDR1_I]]) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP17:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP17:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP18:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR1_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP18:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR1_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP19:%.]] = load %struct.S, %struct.S** [[TMP18]], align 8			// CHECK1-NEXT: [[TMP19:%.]] = load %struct.S, %struct.S** [[TMP18]], align 8
	// CHECK1-NEXT: [[TMP20:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP20:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP21:%.]] = load i32, i32 [[TMP20]], align 4			// CHECK1-NEXT: [[TMP21:%.]] = load i32, i32 [[TMP20]], align 4
	// CHECK1-NEXT: switch i32 [[TMP21]], label [[DOTUNTIED_DONE__I:%.*]] [			// CHECK1-NEXT: switch i32 [[TMP21]], label [[DOTUNTIED_DONE__I:%.*]] [
	// CHECK1-NEXT: i32 0, label [[DOTUNTIED_JMP__I:%.*]]			// CHECK1-NEXT: i32 0, label [[DOTUNTIED_JMP__I:%.*]]
	// CHECK1-NEXT: i32 1, label [[DOTUNTIED_JMP_2_I:%.*]]			// CHECK1-NEXT: i32 1, label [[DOTUNTIED_JMP_2_I:%.*]]
	// CHECK1-NEXT: i32 2, label [[DOTUNTIED_JMP_3_I:%.*]]			// CHECK1-NEXT: i32 2, label [[DOTUNTIED_JMP_3_I:%.*]]
	// CHECK1-NEXT: i32 3, label [[DOTUNTIED_JMP_5_I:%.*]]			// CHECK1-NEXT: i32 3, label [[DOTUNTIED_JMP_5_I:%.*]]
	// CHECK1-NEXT: i32 4, label [[DOTUNTIED_JMP_7_I:%.*]]			// CHECK1-NEXT: i32 4, label [[DOTUNTIED_JMP_7_I:%.*]]
	// CHECK1-NEXT: i32 5, label [[DOTUNTIED_JMP_10_I:%.*]]			// CHECK1-NEXT: i32 5, label [[DOTUNTIED_JMP_10_I:%.*]]
	// CHECK1-NEXT: ]			// CHECK1-NEXT: ]
	// CHECK1: .untied.done..i:			// CHECK1: .untied.done..i:
	// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK1-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK1-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK1-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK1: .untied.jmp..i:			// CHECK1: .untied.jmp..i:
	// CHECK1-NEXT: [[TMP22:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP22:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: store i32 1, i32* [[TMP22]], align 4			// CHECK1-NEXT: store i32 1, i32* [[TMP22]], align 4
	// CHECK1-NEXT: [[TMP23:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP23:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP24:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP24:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP25:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP23]], i8* [[TMP24]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP25:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP23]], i8* [[TMP24]]) #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT:%.*]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT:%.*]]
	// CHECK1: .untied.jmp.2.i:			// CHECK1: .untied.jmp.2.i:
	// CHECK1-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[TMP17]]) #[[ATTR5]]			// CHECK1-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[TMP17]]) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP26:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP26:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[DOTS2__VOID_ADDR_I:%.]] = call i8 @__kmpc_alloc(i32 [[TMP26]], i64 4, i8* inttoptr (i64 7 to i8*)) #[[ATTR5]]			// CHECK1-NEXT: [[DOTS2__VOID_ADDR_I:%.]] = call i8 @__kmpc_alloc(i32 [[TMP26]], i64 4, i8* inttoptr (i64 7 to i8*)) #[[ATTR4]]
	// CHECK1-NEXT: [[DOTS2__ADDR_I:%.]] = bitcast i8 [[DOTS2__VOID_ADDR_I]] to %struct.S*			// CHECK1-NEXT: [[DOTS2__ADDR_I:%.]] = bitcast i8 [[DOTS2__VOID_ADDR_I]] to %struct.S*
	// CHECK1-NEXT: store %struct.S* [[DOTS2__ADDR_I]], %struct.S** [[TMP18]], align 8			// CHECK1-NEXT: store %struct.S* [[DOTS2__ADDR_I]], %struct.S** [[TMP18]], align 8
	// CHECK1-NEXT: [[TMP27:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP27:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: store i32 2, i32* [[TMP27]], align 4			// CHECK1-NEXT: store i32 2, i32* [[TMP27]], align 4
	// CHECK1-NEXT: [[TMP28:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP28:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP29:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP29:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP30:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP28]], i8* [[TMP29]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP30:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP28]], i8* [[TMP29]]) #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK1: .untied.jmp.3.i:			// CHECK1: .untied.jmp.3.i:
	// CHECK1-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[TMP19]]) #[[ATTR5]]			// CHECK1-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[TMP19]]) #[[ATTR4]]
	// CHECK1-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[TMP19]], i32 0, i32 0			// CHECK1-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[TMP19]], i32 0, i32 0
	// CHECK1-NEXT: store i32 0, i32* [[A_I]], align 4			// CHECK1-NEXT: store i32 0, i32* [[A_I]], align 4
	// CHECK1-NEXT: [[TMP31:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP31:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP32:%.]] = call i8 @__kmpc_omp_task_alloc(%struct.ident_t* @[[GLOB1]], i32 [[TMP31]], i32 1, i64 256, i64 1, i32 (i32, i8) bitcast (i32 (i32, %struct.kmp_task_t_with_privates.18) @.omp_task_entry..19 to i32 (i32, i8))) #[[ATTR5]]			// CHECK1-NEXT: [[TMP32:%.]] = call i8 @__kmpc_omp_task_alloc(%struct.ident_t* @[[GLOB1]], i32 [[TMP31]], i32 1, i64 256, i64 1, i32 (i32, i8) bitcast (i32 (i32, %struct.kmp_task_t_with_privates.18) @.omp_task_entry..19 to i32 (i32, i8))) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP33:%.]] = bitcast i8 [[TMP32]] to %struct.kmp_task_t_with_privates.18*			// CHECK1-NEXT: [[TMP33:%.]] = bitcast i8 [[TMP32]] to %struct.kmp_task_t_with_privates.18*
	// CHECK1-NEXT: [[TMP34:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18:%.]], %struct.kmp_task_t_with_privates.18* [[TMP33]], i32 0, i32 0			// CHECK1-NEXT: [[TMP34:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18:%.]], %struct.kmp_task_t_with_privates.18* [[TMP33]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP35:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18]], %struct.kmp_task_t_with_privates.18 [[TMP33]], i32 0, i32 2			// CHECK1-NEXT: [[TMP35:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18]], %struct.kmp_task_t_with_privates.18 [[TMP33]], i32 0, i32 2
	// CHECK1-NEXT: [[TMP36:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP35]], i32 0, i32 0			// CHECK1-NEXT: [[TMP36:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP35]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP37:%.]] = load i32, i32 [[TMP16]], align 128			// CHECK1-NEXT: [[TMP37:%.]] = load i32, i32 [[TMP16]], align 128
	// CHECK1-NEXT: store i32 [[TMP37]], i32* [[TMP36]], align 128			// CHECK1-NEXT: store i32 [[TMP37]], i32* [[TMP36]], align 128
	// CHECK1-NEXT: [[TMP38:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP38:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP39:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP38]], i8* [[TMP32]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP39:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP38]], i8* [[TMP32]]) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP40:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP40:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: store i32 3, i32* [[TMP40]], align 4			// CHECK1-NEXT: store i32 3, i32* [[TMP40]], align 4
	// CHECK1-NEXT: [[TMP41:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP41:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP42:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP42:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP43:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP41]], i8* [[TMP42]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP43:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP41]], i8* [[TMP42]]) #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK1: .untied.jmp.5.i:			// CHECK1: .untied.jmp.5.i:
	// CHECK1-NEXT: [[TMP44:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP44:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP45:%.]] = call i32 @__kmpc_omp_taskyield(%struct.ident_t @[[GLOB1]], i32 [[TMP44]], i32 0) #[[ATTR5]]			// CHECK1-NEXT: [[TMP45:%.]] = call i32 @__kmpc_omp_taskyield(%struct.ident_t @[[GLOB1]], i32 [[TMP44]], i32 0) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP46:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP46:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: store i32 4, i32* [[TMP46]], align 4			// CHECK1-NEXT: store i32 4, i32* [[TMP46]], align 4
	// CHECK1-NEXT: [[TMP47:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP47:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP48:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP48:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP49:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP47]], i8* [[TMP48]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP49:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP47]], i8* [[TMP48]]) #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK1: .untied.jmp.7.i:			// CHECK1: .untied.jmp.7.i:
	// CHECK1-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR5]]			// CHECK1-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP50:%.]] = bitcast %struct.S [[TMP17]] to i8*			// CHECK1-NEXT: [[TMP50:%.]] = bitcast %struct.S [[TMP17]] to i8*
	// CHECK1-NEXT: [[TMP51:%.]] = bitcast %struct.S [[REF_TMP_I]] to i8*			// CHECK1-NEXT: [[TMP51:%.]] = bitcast %struct.S [[REF_TMP_I]] to i8*
	// CHECK1-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 4 [[TMP50]], i8* align 4 [[TMP51]], i64 4, i1 false) #[[ATTR5]]			// CHECK1-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 4 [[TMP50]], i8* align 4 [[TMP51]], i64 4, i1 false) #[[ATTR4]]
	// CHECK1-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR5]]			// CHECK1-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR4]]
	// CHECK1-NEXT: [[A9_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[TMP19]], i32 0, i32 0			// CHECK1-NEXT: [[A9_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[TMP19]], i32 0, i32 0
	// CHECK1-NEXT: store i32 10, i32* [[A9_I]], align 4			// CHECK1-NEXT: store i32 10, i32* [[A9_I]], align 4
	// CHECK1-NEXT: [[TMP52:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP52:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP53:%.]] = call i32 @__kmpc_omp_taskwait(%struct.ident_t @[[GLOB1]], i32 [[TMP52]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP53:%.]] = call i32 @__kmpc_omp_taskwait(%struct.ident_t @[[GLOB1]], i32 [[TMP52]]) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP54:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP54:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: store i32 5, i32* [[TMP54]], align 4			// CHECK1-NEXT: store i32 5, i32* [[TMP54]], align 4
	// CHECK1-NEXT: [[TMP55:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP55:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP56:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK1-NEXT: [[TMP56:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK1-NEXT: [[TMP57:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP55]], i8* [[TMP56]]) #[[ATTR5]]			// CHECK1-NEXT: [[TMP57:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP55]], i8* [[TMP56]]) #[[ATTR4]]
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK1: .untied.jmp.10.i:			// CHECK1: .untied.jmp.10.i:
	// CHECK1-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[TMP19]]) #[[ATTR5]]			// CHECK1-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[TMP19]]) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP58:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK1-NEXT: [[TMP58:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK1-NEXT: [[TMP59:%.]] = bitcast %struct.S [[TMP19]] to i8*			// CHECK1-NEXT: [[TMP59:%.]] = bitcast %struct.S [[TMP19]] to i8*
	// CHECK1-NEXT: call void @__kmpc_free(i32 [[TMP58]], i8* [[TMP59]], i8* inttoptr (i64 7 to i8*)) #[[ATTR5]]			// CHECK1-NEXT: call void @__kmpc_free(i32 [[TMP58]], i8* [[TMP59]], i8* inttoptr (i64 7 to i8*)) #[[ATTR4]]
	// CHECK1-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[TMP17]]) #[[ATTR5]]			// CHECK1-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[TMP17]]) #[[ATTR4]]
	// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK1-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK1-NEXT: br label [[CLEANUP_I]]			// CHECK1-NEXT: br label [[CLEANUP_I]]
	// CHECK1: cleanup.i:			// CHECK1: cleanup.i:
	// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK1-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK1-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK1: .omp_outlined..17.exit:			// CHECK1: .omp_outlined..17.exit:
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	Show All 13 Lines
	// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK1-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
				// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK1-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: call void @_ZN2S1C1Ev(%struct.S1* nonnull dereferenceable(4) @s1)
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@_ZN2S1C1Ev
				// CHECK1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
				// CHECK1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
				// CHECK1-NEXT: call void @_ZN2S1C2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
				// CHECK1-NEXT: ret void
				//
				//
	// CHECK1-LABEL: define {{[^@]+}}@_ZN2S1C2Ev			// CHECK1-LABEL: define {{[^@]+}}@_ZN2S1C2Ev
	// CHECK1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8			// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
	// CHECK1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8			// CHECK1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8			// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
	// CHECK1-NEXT: call void @_ZN2S18taskinitEv(%struct.S1* nonnull dereferenceable(4) [[THIS1]])			// CHECK1-NEXT: call void @_ZN2S18taskinitEv(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	Show All 16 Lines
	// CHECK1-NEXT: [[TMP6:%.]] = load i8, i8** [[TMP5]], align 8			// CHECK1-NEXT: [[TMP6:%.]] = load i8, i8** [[TMP5]], align 8
	// CHECK1-NEXT: [[TMP7:%.]] = bitcast %struct.anon.21 [[AGG_CAPTURED]] to i8*			// CHECK1-NEXT: [[TMP7:%.]] = bitcast %struct.anon.21 [[AGG_CAPTURED]] to i8*
	// CHECK1-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[TMP6]], i8* align 8 [[TMP7]], i64 8, i1 false)			// CHECK1-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[TMP6]], i8* align 8 [[TMP7]], i64 8, i1 false)
	// CHECK1-NEXT: [[TMP8:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP0]], i8* [[TMP2]])			// CHECK1-NEXT: [[TMP8:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP0]], i8* [[TMP2]])
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..23			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..23
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.22 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.22 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.21, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.21, align 8
	// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	// CHECK1-NEXT: call void @__kmpc_end_single(%struct.ident_t* @[[GLOB1]], i32 [[TMP2]])			// CHECK1-NEXT: call void @__kmpc_end_single(%struct.ident_t* @[[GLOB1]], i32 [[TMP2]])
	// CHECK1-NEXT: br label [[OMP_IF_END]]			// CHECK1-NEXT: br label [[OMP_IF_END]]
	// CHECK1: omp_if.end:			// CHECK1: omp_if.end:
	// CHECK1-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP2]])			// CHECK1-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP2]])
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_privates_map..26			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_privates_map..26
	// CHECK1-SAME: (%struct..kmp_privates.t.25* noalias [[TMP0:%.]], double* noalias [[TMP1:%.*]]) #[[ATTR0]] {			// CHECK1-SAME: (%struct..kmp_privates.t.25* noalias [[TMP0:%.]], double* noalias [[TMP1:%.*]]) #[[ATTR7]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.25, align 8			// CHECK1-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.25, align 8
	// CHECK1-NEXT: [[DOTADDR1:%.]] = alloca double*, align 8			// CHECK1-NEXT: [[DOTADDR1:%.]] = alloca double*, align 8
	// CHECK1-NEXT: store %struct..kmp_privates.t.25* [[TMP0]], %struct..kmp_privates.t.25** [[DOTADDR]], align 8			// CHECK1-NEXT: store %struct..kmp_privates.t.25* [[TMP0]], %struct..kmp_privates.t.25** [[DOTADDR]], align 8
	// CHECK1-NEXT: store double [[TMP1]], double* [[DOTADDR1]], align 8			// CHECK1-NEXT: store double [[TMP1]], double* [[DOTADDR1]], align 8
	// CHECK1-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t.25, %struct..kmp_privates.t.25** [[DOTADDR]], align 8			// CHECK1-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t.25, %struct..kmp_privates.t.25** [[DOTADDR]], align 8
	// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_25:%.]], %struct..kmp_privates.t.25* [[TMP2]], i32 0, i32 0			// CHECK1-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_25:%.]], %struct..kmp_privates.t.25* [[TMP2]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP4:%.]] = load double, double** [[DOTADDR1]], align 8			// CHECK1-NEXT: [[TMP4:%.]] = load double, double** [[DOTADDR1]], align 8
	// CHECK1-NEXT: store double* [[TMP3]], double** [[TMP4]], align 8			// CHECK1-NEXT: store double* [[TMP3]], double** [[TMP4]], align 8
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..27			// CHECK1-LABEL: define {{[^@]+}}@.omp_task_entry..27
	// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.24 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK1-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.24 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK1-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK1-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK1-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.23, align 8			// CHECK1-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.23, align 8
	// CHECK1-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca double, align 8			// CHECK1-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca double, align 8
	Show All 20 Lines
	// CHECK1-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !131			// CHECK1-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !131
	// CHECK1-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.25, double) @.omp_task_privates_map..26 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !131			// CHECK1-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.25, double) @.omp_task_privates_map..26 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !131
	// CHECK1-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !131			// CHECK1-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !131
	// CHECK1-NEXT: store %struct.anon.23* [[TMP8]], %struct.anon.23** [[__CONTEXT_ADDR_I]], align 8, !noalias !131			// CHECK1-NEXT: store %struct.anon.23* [[TMP8]], %struct.anon.23** [[__CONTEXT_ADDR_I]], align 8, !noalias !131
	// CHECK1-NEXT: [[TMP12:%.]] = load %struct.anon.23, %struct.anon.23** [[__CONTEXT_ADDR_I]], align 8, !noalias !131			// CHECK1-NEXT: [[TMP12:%.]] = load %struct.anon.23, %struct.anon.23** [[__CONTEXT_ADDR_I]], align 8, !noalias !131
	// CHECK1-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !131			// CHECK1-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !131
	// CHECK1-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !131			// CHECK1-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !131
	// CHECK1-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, double)			// CHECK1-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, double)
	// CHECK1-NEXT: call void [[TMP15]](i8* [[TMP14]], double** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR5]]			// CHECK1-NEXT: call void [[TMP15]](i8* [[TMP14]], double** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR4]]
	// CHECK1-NEXT: [[TMP16:%.]] = load double, double** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !131			// CHECK1-NEXT: [[TMP16:%.]] = load double, double** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !131
	// CHECK1-NEXT: [[TMP17:%.]] = load double, double [[TMP16]], align 8			// CHECK1-NEXT: [[TMP17:%.]] = load double, double [[TMP16]], align 8
	// CHECK1-NEXT: [[TMP18:%.]] = getelementptr inbounds [[STRUCT_ANON_23:%.]], %struct.anon.23* [[TMP12]], i32 0, i32 0			// CHECK1-NEXT: [[TMP18:%.]] = getelementptr inbounds [[STRUCT_ANON_23:%.]], %struct.anon.23* [[TMP12]], i32 0, i32 0
	// CHECK1-NEXT: [[TMP19:%.]] = load float, float** [[TMP18]], align 8			// CHECK1-NEXT: [[TMP19:%.]] = load float, float** [[TMP18]], align 8
	// CHECK1-NEXT: [[TMP20:%.]] = load float, float [[TMP19]], align 4			// CHECK1-NEXT: [[TMP20:%.]] = load float, float [[TMP19]], align 4
	// CHECK1-NEXT: [[CONV_I:%.*]] = fpext float [[TMP20]] to double			// CHECK1-NEXT: [[CONV_I:%.*]] = fpext float [[TMP20]] to double
	// CHECK1-NEXT: [[ADD_I:%.*]] = fadd double [[CONV_I]], [[TMP17]]			// CHECK1-NEXT: [[ADD_I:%.*]] = fadd double [[CONV_I]], [[TMP17]]
	// CHECK1-NEXT: [[CONV1_I:%.*]] = fptrunc double [[ADD_I]] to float			// CHECK1-NEXT: [[CONV1_I:%.*]] = fptrunc double [[ADD_I]] to float
	// CHECK1-NEXT: store float [[CONV1_I]], float* [[TMP19]], align 4			// CHECK1-NEXT: store float [[CONV1_I]], float* [[TMP19]], align 4
	// CHECK1-NEXT: ret i32 0			// CHECK1-NEXT: ret i32 0
	//			//
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_task_codegen.cpp			// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_task_codegen.cpp
	// CHECK1-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK1-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @__cxx_global_var_init()			// CHECK1-NEXT: call void @__cxx_global_var_init()
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK2-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN2S1C1Ev(%struct.S1* nonnull dereferenceable(4) @s1)
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN2S1C1Ev
	// CHECK2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
	// CHECK2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: call void @_ZN2S1C2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@main			// CHECK2-LABEL: define {{[^@]+}}@main
	// CHECK2-SAME: () #[[ATTR2:[0-9]+]] {			// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[B:%.*]] = alloca i8, align 1			// CHECK2-NEXT: [[B:%.*]] = alloca i8, align 1
	// CHECK2-NEXT: [[S:%.*]] = alloca [2 x %struct.S], align 4			// CHECK2-NEXT: [[S:%.*]] = alloca [2 x %struct.S], align 4
	// CHECK2-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8			// CHECK2-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8
	// CHECK2-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 8			// CHECK2-NEXT: [[AGG_CAPTURED1:%.]] = alloca [[STRUCT_ANON_0:%.]], align 8
	▲ Show 20 Lines • Show All 274 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[TMP169:%.]] = load i8, i8** [[SAVED_STACK]], align 8			// CHECK2-NEXT: [[TMP169:%.]] = load i8, i8** [[SAVED_STACK]], align 8
	// CHECK2-NEXT: call void @llvm.stackrestore(i8* [[TMP169]])			// CHECK2-NEXT: call void @llvm.stackrestore(i8* [[TMP169]])
	// CHECK2-NEXT: [[ARRAY_BEGIN32:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[S]], i32 0, i32 0			// CHECK2-NEXT: [[ARRAY_BEGIN32:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[S]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP170:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[ARRAY_BEGIN32]], i64 2			// CHECK2-NEXT: [[TMP170:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[ARRAY_BEGIN32]], i64 2
	// CHECK2-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]			// CHECK2-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
	// CHECK2: arraydestroy.body:			// CHECK2: arraydestroy.body:
	// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S [ [[TMP170]], [[ARRAYCTOR_CONT]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]			// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S [ [[TMP170]], [[ARRAYCTOR_CONT]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
	// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK2-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR5:[0-9]+]]			// CHECK2-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4:[0-9]+]]
	// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN32]]			// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN32]]
	// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE33:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE33:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK2: arraydestroy.done33:			// CHECK2: arraydestroy.done33:
	// CHECK2-NEXT: [[TMP171:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK2-NEXT: [[TMP171:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK2-NEXT: ret i32 [[TMP171]]			// CHECK2-NEXT: ret i32 [[TMP171]]
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC1Ev			// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC1Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])			// CHECK2-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry.			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry.
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR4:[0-9]+]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR3:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon, align 8
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK2-NEXT: [[TMP15:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP14]], align 8			// CHECK2-NEXT: [[TMP15:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP14]], align 8
	// CHECK2-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP15]], i64 0, i64 0			// CHECK2-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP15]], i64 0, i64 0
	// CHECK2-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0			// CHECK2-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0
	// CHECK2-NEXT: store i32 10, i32* [[A_I]], align 4			// CHECK2-NEXT: store i32 10, i32* [[A_I]], align 4
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..2			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..2
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.0, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.0, align 8
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 24 Lines
	// CHECK2-NEXT: [[TMP12:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP11]], align 8			// CHECK2-NEXT: [[TMP12:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP11]], align 8
	// CHECK2-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP12]], i64 0, i64 1			// CHECK2-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP12]], i64 0, i64 1
	// CHECK2-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0			// CHECK2-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0
	// CHECK2-NEXT: store i32 10, i32* [[A_I]], align 4			// CHECK2-NEXT: store i32 10, i32* [[A_I]], align 4
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..4			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..4
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.2, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.2, align 8
	// CHECK2-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK2: .untied.done..i:			// CHECK2: .untied.done..i:
	// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK2-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK2-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK2: .untied.jmp..i:			// CHECK2: .untied.jmp..i:
	// CHECK2-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !31			// CHECK2-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !31
	// CHECK2-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK2-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !31			// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !31
	// CHECK2-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !31			// CHECK2-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !31
	// CHECK2-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT:%.*]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT:%.*]]
	// CHECK2: .untied.jmp.1.i:			// CHECK2: .untied.jmp.1.i:
	// CHECK2-NEXT: [[TMP17:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !31			// CHECK2-NEXT: [[TMP17:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !31
	// CHECK2-NEXT: call void @__kmpc_critical(%struct.ident_t* @[[GLOB1]], i32 [[TMP17]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR5]]			// CHECK2-NEXT: call void @__kmpc_critical(%struct.ident_t* @[[GLOB1]], i32 [[TMP17]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR4]]
	// CHECK2-NEXT: store i32 1, i32* @a, align 4			// CHECK2-NEXT: store i32 1, i32* @a, align 4
	// CHECK2-NEXT: call void @__kmpc_end_critical(%struct.ident_t* @[[GLOB1]], i32 [[TMP17]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR5]]			// CHECK2-NEXT: call void @__kmpc_end_critical(%struct.ident_t* @[[GLOB1]], i32 [[TMP17]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR4]]
	// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK2-NEXT: br label [[CLEANUP_I]]			// CHECK2-NEXT: br label [[CLEANUP_I]]
	// CHECK2: cleanup.i:			// CHECK2: cleanup.i:
	// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT]]
	// CHECK2: .omp_outlined..3.exit:			// CHECK2: .omp_outlined..3.exit:
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..6			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..6
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.4, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.4, align 8
	// CHECK2-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK2: .untied.done..i:			// CHECK2: .untied.done..i:
	// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK2-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK2-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK2: .untied.jmp..i:			// CHECK2: .untied.jmp..i:
	// CHECK2-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !41			// CHECK2-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !41
	// CHECK2-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK2-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !41			// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !41
	// CHECK2-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !41			// CHECK2-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !41
	// CHECK2-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT:%.*]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT:%.*]]
	// CHECK2: .untied.jmp.1.i:			// CHECK2: .untied.jmp.1.i:
	// CHECK2-NEXT: store i32 1, i32* @a, align 4			// CHECK2-NEXT: store i32 1, i32* @a, align 4
	// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK2-NEXT: br label [[CLEANUP_I]]			// CHECK2-NEXT: br label [[CLEANUP_I]]
	// CHECK2: cleanup.i:			// CHECK2: cleanup.i:
	// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT]]
	// CHECK2: .omp_outlined..5.exit:			// CHECK2: .omp_outlined..5.exit:
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..8			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..8
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.6, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.6, align 8
	// CHECK2-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK2: .untied.done..i:			// CHECK2: .untied.done..i:
	// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK2-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK2-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK2: .untied.jmp..i:			// CHECK2: .untied.jmp..i:
	// CHECK2-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !51			// CHECK2-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !51
	// CHECK2-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK2-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51			// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !51
	// CHECK2-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !51			// CHECK2-NEXT: [[TMP15:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !51
	// CHECK2-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP16:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP14]], i8* [[TMP15]]) #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT:%.*]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT:%.*]]
	// CHECK2: .untied.jmp.1.i:			// CHECK2: .untied.jmp.1.i:
	// CHECK2-NEXT: store i32 1, i32* @a, align 4			// CHECK2-NEXT: store i32 1, i32* @a, align 4
	// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK2-NEXT: br label [[CLEANUP_I]]			// CHECK2-NEXT: br label [[CLEANUP_I]]
	// CHECK2: cleanup.i:			// CHECK2: cleanup.i:
	// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT]]
	// CHECK2: .omp_outlined..7.exit:			// CHECK2: .omp_outlined..7.exit:
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..10			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..10
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.9 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.9 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.8, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.8, align 8
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK2-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !61			// CHECK2-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !61
	// CHECK2-NEXT: store %struct.anon.8* [[TMP8]], %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61			// CHECK2-NEXT: store %struct.anon.8* [[TMP8]], %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61
	// CHECK2-NEXT: [[TMP10:%.]] = load %struct.anon.8, %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61			// CHECK2-NEXT: [[TMP10:%.]] = load %struct.anon.8, %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61
	// CHECK2-NEXT: store i32 2, i32* @a, align 4			// CHECK2-NEXT: store i32 2, i32* @a, align 4
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..12			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..12
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.11 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.11 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.10, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.10, align 8
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK2-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !71			// CHECK2-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !71
	// CHECK2-NEXT: store %struct.anon.10* [[TMP8]], %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71			// CHECK2-NEXT: store %struct.anon.10* [[TMP8]], %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71
	// CHECK2-NEXT: [[TMP10:%.]] = load %struct.anon.10, %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71			// CHECK2-NEXT: [[TMP10:%.]] = load %struct.anon.10, %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71
	// CHECK2-NEXT: store i32 2, i32* @a, align 4			// CHECK2-NEXT: store i32 2, i32* @a, align 4
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..14			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..14
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.13 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.13 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.12, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.12, align 8
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK2-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !81			// CHECK2-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !81
	// CHECK2-NEXT: store %struct.anon.12* [[TMP8]], %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81			// CHECK2-NEXT: store %struct.anon.12* [[TMP8]], %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81
	// CHECK2-NEXT: [[TMP10:%.]] = load %struct.anon.12, %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81			// CHECK2-NEXT: [[TMP10:%.]] = load %struct.anon.12, %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81
	// CHECK2-NEXT: store i32 3, i32* @a, align 4			// CHECK2-NEXT: store i32 3, i32* @a, align 4
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..16			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..16
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.15 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.15 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.14, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.14, align 8
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 22 Lines
	// CHECK2-NEXT: store i32 4, i32* @a, align 4			// CHECK2-NEXT: store i32 4, i32* @a, align 4
	// CHECK2-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_14:%.]], %struct.anon.14* [[TMP10]], i32 0, i32 0			// CHECK2-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_14:%.]], %struct.anon.14* [[TMP10]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP12:%.]] = load i32, i32** [[TMP11]], align 8			// CHECK2-NEXT: [[TMP12:%.]] = load i32, i32** [[TMP11]], align 8
	// CHECK2-NEXT: store i32 5, i32* [[TMP12]], align 128			// CHECK2-NEXT: store i32 5, i32* [[TMP12]], align 128
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_privates_map.			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_privates_map.
	// CHECK2-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR0]] {			// CHECK2-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR7:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8			// CHECK2-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8
	// CHECK2-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK2-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK2-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK2-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK2-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK2-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0			// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK2-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK2-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8			// CHECK2-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..19			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..19
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.18 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.18 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.17, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.17, align 8
	// CHECK2-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8
	Show All 20 Lines
	// CHECK2-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101			// CHECK2-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101
	// CHECK2-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t, i32) @.omp_task_privates_map. to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101			// CHECK2-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t, i32) @.omp_task_privates_map. to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101
	// CHECK2-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !101			// CHECK2-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !101
	// CHECK2-NEXT: store %struct.anon.17* [[TMP8]], %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101			// CHECK2-NEXT: store %struct.anon.17* [[TMP8]], %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101
	// CHECK2-NEXT: [[TMP12:%.]] = load %struct.anon.17, %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101			// CHECK2-NEXT: [[TMP12:%.]] = load %struct.anon.17, %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101
	// CHECK2-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101			// CHECK2-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101
	// CHECK2-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101			// CHECK2-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101
	// CHECK2-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32)			// CHECK2-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32)
	// CHECK2-NEXT: call void [[TMP15]](i8* [[TMP14]], i32** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR5]]			// CHECK2-NEXT: call void [[TMP15]](i8* [[TMP14]], i32** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !101			// CHECK2-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !101
	// CHECK2-NEXT: store i32 4, i32* [[TMP16]], align 128			// CHECK2-NEXT: store i32 4, i32* [[TMP16]], align 128
	// CHECK2-NEXT: store i32 4, i32* @a, align 4			// CHECK2-NEXT: store i32 4, i32* @a, align 4
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SD1Ev			// CHECK2-LABEL: define {{[^@]+}}@_ZN1SD1Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: call void @_ZN1SD2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR5]]			// CHECK2-NEXT: call void @_ZN1SD2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR4]]
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_privates_map..20			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_privates_map..20
	// CHECK2-SAME: (%struct..kmp_privates.t.20* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.]], %struct.S* noalias [[TMP2:%.]], %struct.S** noalias [[TMP3:%.*]]) #[[ATTR0]] {			// CHECK2-SAME: (%struct..kmp_privates.t.20* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.]], %struct.S* noalias [[TMP2:%.]], %struct.S** noalias [[TMP3:%.*]]) #[[ATTR7]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.20, align 8			// CHECK2-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.20, align 8
	// CHECK2-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK2-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK2-NEXT: [[DOTADDR2:%.]] = alloca %struct.S*, align 8			// CHECK2-NEXT: [[DOTADDR2:%.]] = alloca %struct.S*, align 8
	// CHECK2-NEXT: [[DOTADDR3:%.]] = alloca %struct.S**, align 8			// CHECK2-NEXT: [[DOTADDR3:%.]] = alloca %struct.S**, align 8
	// CHECK2-NEXT: store %struct..kmp_privates.t.20* [[TMP0]], %struct..kmp_privates.t.20** [[DOTADDR]], align 8			// CHECK2-NEXT: store %struct..kmp_privates.t.20* [[TMP0]], %struct..kmp_privates.t.20** [[DOTADDR]], align 8
	// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK2-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK2-NEXT: store %struct.S [[TMP2]], %struct.S* [[DOTADDR2]], align 8			// CHECK2-NEXT: store %struct.S [[TMP2]], %struct.S* [[DOTADDR2]], align 8
	// CHECK2-NEXT: store %struct.S* [[TMP3]], %struct.S** [[DOTADDR3]], align 8			// CHECK2-NEXT: store %struct.S* [[TMP3]], %struct.S** [[DOTADDR3]], align 8
	// CHECK2-NEXT: [[TMP4:%.]] = load %struct..kmp_privates.t.20, %struct..kmp_privates.t.20** [[DOTADDR]], align 8			// CHECK2-NEXT: [[TMP4:%.]] = load %struct..kmp_privates.t.20, %struct..kmp_privates.t.20** [[DOTADDR]], align 8
	// CHECK2-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20:%.]], %struct..kmp_privates.t.20* [[TMP4]], i32 0, i32 0			// CHECK2-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20:%.]], %struct..kmp_privates.t.20* [[TMP4]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP6:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK2-NEXT: [[TMP6:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK2-NEXT: store i32* [[TMP5]], i32** [[TMP6]], align 8			// CHECK2-NEXT: store i32* [[TMP5]], i32** [[TMP6]], align 8
	// CHECK2-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 2			// CHECK2-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 2
	// CHECK2-NEXT: [[TMP8:%.]] = load %struct.S, %struct.S** [[DOTADDR3]], align 8			// CHECK2-NEXT: [[TMP8:%.]] = load %struct.S, %struct.S** [[DOTADDR3]], align 8
	// CHECK2-NEXT: store %struct.S [[TMP7]], %struct.S* [[TMP8]], align 8			// CHECK2-NEXT: store %struct.S [[TMP7]], %struct.S* [[TMP8]], align 8
	// CHECK2-NEXT: [[TMP9:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 3			// CHECK2-NEXT: [[TMP9:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 3
	// CHECK2-NEXT: [[TMP10:%.]] = load %struct.S, %struct.S** [[DOTADDR2]], align 8			// CHECK2-NEXT: [[TMP10:%.]] = load %struct.S, %struct.S** [[DOTADDR2]], align 8
	// CHECK2-NEXT: store %struct.S* [[TMP9]], %struct.S** [[TMP10]], align 8			// CHECK2-NEXT: store %struct.S* [[TMP9]], %struct.S** [[TMP10]], align 8
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..21			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..21
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.19 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.19 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.16, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.16, align 8
	// CHECK2-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8
	Show All 24 Lines
	// CHECK2-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.20, i32, %struct.S, %struct.S*) @.omp_task_privates_map..20 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.20, i32, %struct.S, %struct.S*) @.omp_task_privates_map..20 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: store %struct.anon.16* [[TMP8]], %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: store %struct.anon.16* [[TMP8]], %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP12:%.]] = load %struct.anon.16, %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP12:%.]] = load %struct.anon.16, %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32, %struct.S, %struct.S*)			// CHECK2-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32, %struct.S, %struct.S*)
	// CHECK2-NEXT: call void [[TMP15]](i8* [[TMP14]], i32 [[DOTFIRSTPRIV_PTR_ADDR_I]], %struct.S [[DOTLOCAL_PTR_ADDR_I]], %struct.S*** [[DOTLOCAL_PTR_ADDR1_I]]) #[[ATTR5]]			// CHECK2-NEXT: call void [[TMP15]](i8* [[TMP14]], i32 [[DOTFIRSTPRIV_PTR_ADDR_I]], %struct.S [[DOTLOCAL_PTR_ADDR_I]], %struct.S*** [[DOTLOCAL_PTR_ADDR1_I]]) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP17:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP17:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP18:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR1_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP18:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR1_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP19:%.]] = load %struct.S, %struct.S** [[TMP18]], align 8			// CHECK2-NEXT: [[TMP19:%.]] = load %struct.S, %struct.S** [[TMP18]], align 8
	// CHECK2-NEXT: [[TMP20:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP20:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP21:%.]] = load i32, i32 [[TMP20]], align 4			// CHECK2-NEXT: [[TMP21:%.]] = load i32, i32 [[TMP20]], align 4
	// CHECK2-NEXT: switch i32 [[TMP21]], label [[DOTUNTIED_DONE__I:%.*]] [			// CHECK2-NEXT: switch i32 [[TMP21]], label [[DOTUNTIED_DONE__I:%.*]] [
	// CHECK2-NEXT: i32 0, label [[DOTUNTIED_JMP__I:%.*]]			// CHECK2-NEXT: i32 0, label [[DOTUNTIED_JMP__I:%.*]]
	// CHECK2-NEXT: i32 1, label [[DOTUNTIED_JMP_2_I:%.*]]			// CHECK2-NEXT: i32 1, label [[DOTUNTIED_JMP_2_I:%.*]]
	// CHECK2-NEXT: i32 2, label [[DOTUNTIED_JMP_3_I:%.*]]			// CHECK2-NEXT: i32 2, label [[DOTUNTIED_JMP_3_I:%.*]]
	// CHECK2-NEXT: i32 3, label [[DOTUNTIED_JMP_5_I:%.*]]			// CHECK2-NEXT: i32 3, label [[DOTUNTIED_JMP_5_I:%.*]]
	// CHECK2-NEXT: i32 4, label [[DOTUNTIED_JMP_7_I:%.*]]			// CHECK2-NEXT: i32 4, label [[DOTUNTIED_JMP_7_I:%.*]]
	// CHECK2-NEXT: i32 5, label [[DOTUNTIED_JMP_10_I:%.*]]			// CHECK2-NEXT: i32 5, label [[DOTUNTIED_JMP_10_I:%.*]]
	// CHECK2-NEXT: ]			// CHECK2-NEXT: ]
	// CHECK2: .untied.done..i:			// CHECK2: .untied.done..i:
	// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK2-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK2-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK2-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK2: .untied.jmp..i:			// CHECK2: .untied.jmp..i:
	// CHECK2-NEXT: [[TMP22:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP22:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: store i32 1, i32* [[TMP22]], align 4			// CHECK2-NEXT: store i32 1, i32* [[TMP22]], align 4
	// CHECK2-NEXT: [[TMP23:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP23:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP24:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP24:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP25:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP23]], i8* [[TMP24]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP25:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP23]], i8* [[TMP24]]) #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT:%.*]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT:%.*]]
	// CHECK2: .untied.jmp.2.i:			// CHECK2: .untied.jmp.2.i:
	// CHECK2-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[TMP17]]) #[[ATTR5]]			// CHECK2-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[TMP17]]) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP26:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP26:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[DOTS2__VOID_ADDR_I:%.]] = call i8 @__kmpc_alloc(i32 [[TMP26]], i64 4, i8* inttoptr (i64 7 to i8*)) #[[ATTR5]]			// CHECK2-NEXT: [[DOTS2__VOID_ADDR_I:%.]] = call i8 @__kmpc_alloc(i32 [[TMP26]], i64 4, i8* inttoptr (i64 7 to i8*)) #[[ATTR4]]
	// CHECK2-NEXT: [[DOTS2__ADDR_I:%.]] = bitcast i8 [[DOTS2__VOID_ADDR_I]] to %struct.S*			// CHECK2-NEXT: [[DOTS2__ADDR_I:%.]] = bitcast i8 [[DOTS2__VOID_ADDR_I]] to %struct.S*
	// CHECK2-NEXT: store %struct.S* [[DOTS2__ADDR_I]], %struct.S** [[TMP18]], align 8			// CHECK2-NEXT: store %struct.S* [[DOTS2__ADDR_I]], %struct.S** [[TMP18]], align 8
	// CHECK2-NEXT: [[TMP27:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP27:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: store i32 2, i32* [[TMP27]], align 4			// CHECK2-NEXT: store i32 2, i32* [[TMP27]], align 4
	// CHECK2-NEXT: [[TMP28:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP28:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP29:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP29:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP30:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP28]], i8* [[TMP29]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP30:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP28]], i8* [[TMP29]]) #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK2: .untied.jmp.3.i:			// CHECK2: .untied.jmp.3.i:
	// CHECK2-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[TMP19]]) #[[ATTR5]]			// CHECK2-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[TMP19]]) #[[ATTR4]]
	// CHECK2-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[TMP19]], i32 0, i32 0			// CHECK2-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[TMP19]], i32 0, i32 0
	// CHECK2-NEXT: store i32 0, i32* [[A_I]], align 4			// CHECK2-NEXT: store i32 0, i32* [[A_I]], align 4
	// CHECK2-NEXT: [[TMP31:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP31:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP32:%.]] = call i8 @__kmpc_omp_task_alloc(%struct.ident_t* @[[GLOB1]], i32 [[TMP31]], i32 1, i64 256, i64 1, i32 (i32, i8) bitcast (i32 (i32, %struct.kmp_task_t_with_privates.18) @.omp_task_entry..19 to i32 (i32, i8))) #[[ATTR5]]			// CHECK2-NEXT: [[TMP32:%.]] = call i8 @__kmpc_omp_task_alloc(%struct.ident_t* @[[GLOB1]], i32 [[TMP31]], i32 1, i64 256, i64 1, i32 (i32, i8) bitcast (i32 (i32, %struct.kmp_task_t_with_privates.18) @.omp_task_entry..19 to i32 (i32, i8))) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP33:%.]] = bitcast i8 [[TMP32]] to %struct.kmp_task_t_with_privates.18*			// CHECK2-NEXT: [[TMP33:%.]] = bitcast i8 [[TMP32]] to %struct.kmp_task_t_with_privates.18*
	// CHECK2-NEXT: [[TMP34:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18:%.]], %struct.kmp_task_t_with_privates.18* [[TMP33]], i32 0, i32 0			// CHECK2-NEXT: [[TMP34:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18:%.]], %struct.kmp_task_t_with_privates.18* [[TMP33]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP35:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18]], %struct.kmp_task_t_with_privates.18 [[TMP33]], i32 0, i32 2			// CHECK2-NEXT: [[TMP35:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18]], %struct.kmp_task_t_with_privates.18 [[TMP33]], i32 0, i32 2
	// CHECK2-NEXT: [[TMP36:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP35]], i32 0, i32 0			// CHECK2-NEXT: [[TMP36:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP35]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP37:%.]] = load i32, i32 [[TMP16]], align 128			// CHECK2-NEXT: [[TMP37:%.]] = load i32, i32 [[TMP16]], align 128
	// CHECK2-NEXT: store i32 [[TMP37]], i32* [[TMP36]], align 128			// CHECK2-NEXT: store i32 [[TMP37]], i32* [[TMP36]], align 128
	// CHECK2-NEXT: [[TMP38:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP38:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP39:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP38]], i8* [[TMP32]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP39:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP38]], i8* [[TMP32]]) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP40:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP40:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: store i32 3, i32* [[TMP40]], align 4			// CHECK2-NEXT: store i32 3, i32* [[TMP40]], align 4
	// CHECK2-NEXT: [[TMP41:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP41:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP42:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP42:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP43:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP41]], i8* [[TMP42]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP43:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP41]], i8* [[TMP42]]) #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK2: .untied.jmp.5.i:			// CHECK2: .untied.jmp.5.i:
	// CHECK2-NEXT: [[TMP44:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP44:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP45:%.]] = call i32 @__kmpc_omp_taskyield(%struct.ident_t @[[GLOB1]], i32 [[TMP44]], i32 0) #[[ATTR5]]			// CHECK2-NEXT: [[TMP45:%.]] = call i32 @__kmpc_omp_taskyield(%struct.ident_t @[[GLOB1]], i32 [[TMP44]], i32 0) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP46:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP46:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: store i32 4, i32* [[TMP46]], align 4			// CHECK2-NEXT: store i32 4, i32* [[TMP46]], align 4
	// CHECK2-NEXT: [[TMP47:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP47:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP48:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP48:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP49:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP47]], i8* [[TMP48]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP49:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP47]], i8* [[TMP48]]) #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK2: .untied.jmp.7.i:			// CHECK2: .untied.jmp.7.i:
	// CHECK2-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR5]]			// CHECK2-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP50:%.]] = bitcast %struct.S [[TMP17]] to i8*			// CHECK2-NEXT: [[TMP50:%.]] = bitcast %struct.S [[TMP17]] to i8*
	// CHECK2-NEXT: [[TMP51:%.]] = bitcast %struct.S [[REF_TMP_I]] to i8*			// CHECK2-NEXT: [[TMP51:%.]] = bitcast %struct.S [[REF_TMP_I]] to i8*
	// CHECK2-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 4 [[TMP50]], i8* align 4 [[TMP51]], i64 4, i1 false) #[[ATTR5]]			// CHECK2-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 4 [[TMP50]], i8* align 4 [[TMP51]], i64 4, i1 false) #[[ATTR4]]
	// CHECK2-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR5]]			// CHECK2-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR4]]
	// CHECK2-NEXT: [[A9_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[TMP19]], i32 0, i32 0			// CHECK2-NEXT: [[A9_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[TMP19]], i32 0, i32 0
	// CHECK2-NEXT: store i32 10, i32* [[A9_I]], align 4			// CHECK2-NEXT: store i32 10, i32* [[A9_I]], align 4
	// CHECK2-NEXT: [[TMP52:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP52:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP53:%.]] = call i32 @__kmpc_omp_taskwait(%struct.ident_t @[[GLOB1]], i32 [[TMP52]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP53:%.]] = call i32 @__kmpc_omp_taskwait(%struct.ident_t @[[GLOB1]], i32 [[TMP52]]) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP54:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP54:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: store i32 5, i32* [[TMP54]], align 4			// CHECK2-NEXT: store i32 5, i32* [[TMP54]], align 4
	// CHECK2-NEXT: [[TMP55:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP55:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP56:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK2-NEXT: [[TMP56:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK2-NEXT: [[TMP57:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP55]], i8* [[TMP56]]) #[[ATTR5]]			// CHECK2-NEXT: [[TMP57:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP55]], i8* [[TMP56]]) #[[ATTR4]]
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK2: .untied.jmp.10.i:			// CHECK2: .untied.jmp.10.i:
	// CHECK2-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[TMP19]]) #[[ATTR5]]			// CHECK2-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[TMP19]]) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP58:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111			// CHECK2-NEXT: [[TMP58:%.]] = load i32, i32 [[DOTGLOBAL_TID__ADDR_I]], align 4, !noalias !111
	// CHECK2-NEXT: [[TMP59:%.]] = bitcast %struct.S [[TMP19]] to i8*			// CHECK2-NEXT: [[TMP59:%.]] = bitcast %struct.S [[TMP19]] to i8*
	// CHECK2-NEXT: call void @__kmpc_free(i32 [[TMP58]], i8* [[TMP59]], i8* inttoptr (i64 7 to i8*)) #[[ATTR5]]			// CHECK2-NEXT: call void @__kmpc_free(i32 [[TMP58]], i8* [[TMP59]], i8* inttoptr (i64 7 to i8*)) #[[ATTR4]]
	// CHECK2-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[TMP17]]) #[[ATTR5]]			// CHECK2-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[TMP17]]) #[[ATTR4]]
	// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK2-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK2-NEXT: br label [[CLEANUP_I]]			// CHECK2-NEXT: br label [[CLEANUP_I]]
	// CHECK2: cleanup.i:			// CHECK2: cleanup.i:
	// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK2-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK2-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK2: .omp_outlined..17.exit:			// CHECK2: .omp_outlined..17.exit:
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	Show All 13 Lines
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK2-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: call void @_ZN2S1C1Ev(%struct.S1* nonnull dereferenceable(4) @s1)
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@_ZN2S1C1Ev
				// CHECK2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
				// CHECK2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
				// CHECK2-NEXT: call void @_ZN2S1C2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN2S1C2Ev			// CHECK2-LABEL: define {{[^@]+}}@_ZN2S1C2Ev
	// CHECK2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
	// CHECK2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: call void @_ZN2S18taskinitEv(%struct.S1* nonnull dereferenceable(4) [[THIS1]])			// CHECK2-NEXT: call void @_ZN2S18taskinitEv(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	Show All 16 Lines
	// CHECK2-NEXT: [[TMP6:%.]] = load i8, i8** [[TMP5]], align 8			// CHECK2-NEXT: [[TMP6:%.]] = load i8, i8** [[TMP5]], align 8
	// CHECK2-NEXT: [[TMP7:%.]] = bitcast %struct.anon.21 [[AGG_CAPTURED]] to i8*			// CHECK2-NEXT: [[TMP7:%.]] = bitcast %struct.anon.21 [[AGG_CAPTURED]] to i8*
	// CHECK2-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[TMP6]], i8* align 8 [[TMP7]], i64 8, i1 false)			// CHECK2-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[TMP6]], i8* align 8 [[TMP7]], i64 8, i1 false)
	// CHECK2-NEXT: [[TMP8:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP0]], i8* [[TMP2]])			// CHECK2-NEXT: [[TMP8:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[TMP0]], i8* [[TMP2]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..23			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..23
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.22 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.22 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.21, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.21, align 8
	// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: call void @__kmpc_end_single(%struct.ident_t* @[[GLOB1]], i32 [[TMP2]])			// CHECK2-NEXT: call void @__kmpc_end_single(%struct.ident_t* @[[GLOB1]], i32 [[TMP2]])
	// CHECK2-NEXT: br label [[OMP_IF_END]]			// CHECK2-NEXT: br label [[OMP_IF_END]]
	// CHECK2: omp_if.end:			// CHECK2: omp_if.end:
	// CHECK2-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP2]])			// CHECK2-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 [[TMP2]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_privates_map..26			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_privates_map..26
	// CHECK2-SAME: (%struct..kmp_privates.t.25* noalias [[TMP0:%.]], double* noalias [[TMP1:%.*]]) #[[ATTR0]] {			// CHECK2-SAME: (%struct..kmp_privates.t.25* noalias [[TMP0:%.]], double* noalias [[TMP1:%.*]]) #[[ATTR7]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.25, align 8			// CHECK2-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.25, align 8
	// CHECK2-NEXT: [[DOTADDR1:%.]] = alloca double*, align 8			// CHECK2-NEXT: [[DOTADDR1:%.]] = alloca double*, align 8
	// CHECK2-NEXT: store %struct..kmp_privates.t.25* [[TMP0]], %struct..kmp_privates.t.25** [[DOTADDR]], align 8			// CHECK2-NEXT: store %struct..kmp_privates.t.25* [[TMP0]], %struct..kmp_privates.t.25** [[DOTADDR]], align 8
	// CHECK2-NEXT: store double [[TMP1]], double* [[DOTADDR1]], align 8			// CHECK2-NEXT: store double [[TMP1]], double* [[DOTADDR1]], align 8
	// CHECK2-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t.25, %struct..kmp_privates.t.25** [[DOTADDR]], align 8			// CHECK2-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t.25, %struct..kmp_privates.t.25** [[DOTADDR]], align 8
	// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_25:%.]], %struct..kmp_privates.t.25* [[TMP2]], i32 0, i32 0			// CHECK2-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_25:%.]], %struct..kmp_privates.t.25* [[TMP2]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP4:%.]] = load double, double** [[DOTADDR1]], align 8			// CHECK2-NEXT: [[TMP4:%.]] = load double, double** [[DOTADDR1]], align 8
	// CHECK2-NEXT: store double* [[TMP3]], double** [[TMP4]], align 8			// CHECK2-NEXT: store double* [[TMP3]], double** [[TMP4]], align 8
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..27			// CHECK2-LABEL: define {{[^@]+}}@.omp_task_entry..27
	// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.24 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK2-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.24 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK2-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK2-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.23, align 8			// CHECK2-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.23, align 8
	// CHECK2-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca double, align 8			// CHECK2-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca double, align 8
	Show All 20 Lines
	// CHECK2-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !131			// CHECK2-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !131
	// CHECK2-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.25, double) @.omp_task_privates_map..26 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !131			// CHECK2-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.25, double) @.omp_task_privates_map..26 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !131
	// CHECK2-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !131			// CHECK2-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !131
	// CHECK2-NEXT: store %struct.anon.23* [[TMP8]], %struct.anon.23** [[__CONTEXT_ADDR_I]], align 8, !noalias !131			// CHECK2-NEXT: store %struct.anon.23* [[TMP8]], %struct.anon.23** [[__CONTEXT_ADDR_I]], align 8, !noalias !131
	// CHECK2-NEXT: [[TMP12:%.]] = load %struct.anon.23, %struct.anon.23** [[__CONTEXT_ADDR_I]], align 8, !noalias !131			// CHECK2-NEXT: [[TMP12:%.]] = load %struct.anon.23, %struct.anon.23** [[__CONTEXT_ADDR_I]], align 8, !noalias !131
	// CHECK2-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !131			// CHECK2-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !131
	// CHECK2-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !131			// CHECK2-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !131
	// CHECK2-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, double)			// CHECK2-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, double)
	// CHECK2-NEXT: call void [[TMP15]](i8* [[TMP14]], double** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR5]]			// CHECK2-NEXT: call void [[TMP15]](i8* [[TMP14]], double** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR4]]
	// CHECK2-NEXT: [[TMP16:%.]] = load double, double** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !131			// CHECK2-NEXT: [[TMP16:%.]] = load double, double** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !131
	// CHECK2-NEXT: [[TMP17:%.]] = load double, double [[TMP16]], align 8			// CHECK2-NEXT: [[TMP17:%.]] = load double, double [[TMP16]], align 8
	// CHECK2-NEXT: [[TMP18:%.]] = getelementptr inbounds [[STRUCT_ANON_23:%.]], %struct.anon.23* [[TMP12]], i32 0, i32 0			// CHECK2-NEXT: [[TMP18:%.]] = getelementptr inbounds [[STRUCT_ANON_23:%.]], %struct.anon.23* [[TMP12]], i32 0, i32 0
	// CHECK2-NEXT: [[TMP19:%.]] = load float, float** [[TMP18]], align 8			// CHECK2-NEXT: [[TMP19:%.]] = load float, float** [[TMP18]], align 8
	// CHECK2-NEXT: [[TMP20:%.]] = load float, float [[TMP19]], align 4			// CHECK2-NEXT: [[TMP20:%.]] = load float, float [[TMP19]], align 4
	// CHECK2-NEXT: [[CONV_I:%.*]] = fpext float [[TMP20]] to double			// CHECK2-NEXT: [[CONV_I:%.*]] = fpext float [[TMP20]] to double
	// CHECK2-NEXT: [[ADD_I:%.*]] = fadd double [[CONV_I]], [[TMP17]]			// CHECK2-NEXT: [[ADD_I:%.*]] = fadd double [[CONV_I]], [[TMP17]]
	// CHECK2-NEXT: [[CONV1_I:%.*]] = fptrunc double [[ADD_I]] to float			// CHECK2-NEXT: [[CONV1_I:%.*]] = fptrunc double [[ADD_I]] to float
	// CHECK2-NEXT: store float [[CONV1_I]], float* [[TMP19]], align 4			// CHECK2-NEXT: store float [[CONV1_I]], float* [[TMP19]], align 4
	// CHECK2-NEXT: ret i32 0			// CHECK2-NEXT: ret i32 0
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_task_codegen.cpp			// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_task_codegen.cpp
	// CHECK2-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK2-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @__cxx_global_var_init()			// CHECK2-NEXT: call void @__cxx_global_var_init()
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK3-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @_ZN2S1C1Ev(%struct.S1* nonnull dereferenceable(4) @s1)
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN2S1C1Ev
	// CHECK3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
	// CHECK3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: call void @_ZN2S1C2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
	// CHECK3-NEXT: ret void
	//
	//
	// CHECK3-LABEL: define {{[^@]+}}@main			// CHECK3-LABEL: define {{[^@]+}}@main
	// CHECK3-SAME: () #[[ATTR2:[0-9]+]] {			// CHECK3-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[B:%.*]] = alloca i8, align 1			// CHECK3-NEXT: [[B:%.*]] = alloca i8, align 1
	// CHECK3-NEXT: [[S:%.*]] = alloca [2 x %struct.S], align 4			// CHECK3-NEXT: [[S:%.*]] = alloca [2 x %struct.S], align 4
	// CHECK3-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8			// CHECK3-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8
	// CHECK3-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8			// CHECK3-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8
	// CHECK3-NEXT: [[AGG_CAPTURED2:%.]] = alloca [[STRUCT_ANON_0:%.]], align 8			// CHECK3-NEXT: [[AGG_CAPTURED2:%.]] = alloca [[STRUCT_ANON_0:%.]], align 8
	▲ Show 20 Lines • Show All 293 Lines • ▼ Show 20 Lines
	// CHECK3-NEXT: [[TMP168:%.]] = load i8, i8** [[SAVED_STACK]], align 8			// CHECK3-NEXT: [[TMP168:%.]] = load i8, i8** [[SAVED_STACK]], align 8
	// CHECK3-NEXT: call void @llvm.stackrestore(i8* [[TMP168]])			// CHECK3-NEXT: call void @llvm.stackrestore(i8* [[TMP168]])
	// CHECK3-NEXT: [[ARRAY_BEGIN51:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[S]], i32 0, i32 0			// CHECK3-NEXT: [[ARRAY_BEGIN51:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[S]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP169:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[ARRAY_BEGIN51]], i64 2			// CHECK3-NEXT: [[TMP169:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[ARRAY_BEGIN51]], i64 2
	// CHECK3-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]			// CHECK3-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
	// CHECK3: arraydestroy.body:			// CHECK3: arraydestroy.body:
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S [ [[TMP169]], [[ARRAYCTOR_CONT]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S [ [[TMP169]], [[ARRAYCTOR_CONT]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
	// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK3-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR5:[0-9]+]]			// CHECK3-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4:[0-9]+]]
	// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN51]]			// CHECK3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN51]]
	// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE52:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE52:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK3: arraydestroy.done52:			// CHECK3: arraydestroy.done52:
	// CHECK3-NEXT: [[TMP170:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK3-NEXT: [[TMP170:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK3-NEXT: ret i32 [[TMP170]]			// CHECK3-NEXT: ret i32 [[TMP170]]
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SC1Ev			// CHECK3-LABEL: define {{[^@]+}}@_ZN1SC1Ev
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])			// CHECK3-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry.			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry.
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR4:[0-9]+]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR3:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon, align 8
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK3-NEXT: [[TMP15:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP14]], align 8			// CHECK3-NEXT: [[TMP15:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP14]], align 8
	// CHECK3-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP15]], i64 0, i64 0			// CHECK3-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP15]], i64 0, i64 0
	// CHECK3-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0			// CHECK3-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0
	// CHECK3-NEXT: store i32 10, i32* [[A_I]], align 4			// CHECK3-NEXT: store i32 10, i32* [[A_I]], align 4
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..2			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..2
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.0, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.0, align 8
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 24 Lines
	// CHECK3-NEXT: [[TMP12:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP11]], align 8			// CHECK3-NEXT: [[TMP12:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP11]], align 8
	// CHECK3-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP12]], i64 0, i64 1			// CHECK3-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP12]], i64 0, i64 1
	// CHECK3-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0			// CHECK3-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0
	// CHECK3-NEXT: store i32 10, i32* [[A_I]], align 4			// CHECK3-NEXT: store i32 10, i32* [[A_I]], align 4
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..4			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..4
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.2, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.2, align 8
	// CHECK3-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 27 Lines
	// CHECK3-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]			// CHECK3-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]
	// CHECK3-NEXT: ]			// CHECK3-NEXT: ]
	// CHECK3: .untied.done..i:			// CHECK3: .untied.done..i:
	// CHECK3-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK3-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK3-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK3-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK3: .untied.jmp..i:			// CHECK3: .untied.jmp..i:
	// CHECK3-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !31			// CHECK3-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !31
	// CHECK3-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK3-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB7]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB7]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !31			// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !31
	// CHECK3-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR4]]
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT:%.*]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT:%.*]]
	// CHECK3: .untied.jmp.1.i:			// CHECK3: .untied.jmp.1.i:
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM2_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM2_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR4]]
	// CHECK3-NEXT: call void @__kmpc_critical(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2_I]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR5]]			// CHECK3-NEXT: call void @__kmpc_critical(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2_I]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR4]]
	// CHECK3-NEXT: store i32 1, i32* @a, align 4			// CHECK3-NEXT: store i32 1, i32* @a, align 4
	// CHECK3-NEXT: call void @__kmpc_end_critical(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2_I]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR5]]			// CHECK3-NEXT: call void @__kmpc_end_critical(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2_I]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR4]]
	// CHECK3-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK3-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK3-NEXT: br label [[CLEANUP_I]]			// CHECK3-NEXT: br label [[CLEANUP_I]]
	// CHECK3: cleanup.i:			// CHECK3: cleanup.i:
	// CHECK3-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK3-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT]]
	// CHECK3: .omp_outlined..3.exit:			// CHECK3: .omp_outlined..3.exit:
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..6			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..6
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.4, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.4, align 8
	// CHECK3-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 27 Lines
	// CHECK3-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]			// CHECK3-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]
	// CHECK3-NEXT: ]			// CHECK3-NEXT: ]
	// CHECK3: .untied.done..i:			// CHECK3: .untied.done..i:
	// CHECK3-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK3-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK3-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK3-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK3: .untied.jmp..i:			// CHECK3: .untied.jmp..i:
	// CHECK3-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !41			// CHECK3-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !41
	// CHECK3-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK3-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB9]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB9]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !41			// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !41
	// CHECK3-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR4]]
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT:%.*]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT:%.*]]
	// CHECK3: .untied.jmp.1.i:			// CHECK3: .untied.jmp.1.i:
	// CHECK3-NEXT: store i32 1, i32* @a, align 4			// CHECK3-NEXT: store i32 1, i32* @a, align 4
	// CHECK3-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK3-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK3-NEXT: br label [[CLEANUP_I]]			// CHECK3-NEXT: br label [[CLEANUP_I]]
	// CHECK3: cleanup.i:			// CHECK3: cleanup.i:
	// CHECK3-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK3-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT]]
	// CHECK3: .omp_outlined..5.exit:			// CHECK3: .omp_outlined..5.exit:
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..8			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..8
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.6, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.6, align 8
	// CHECK3-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 27 Lines
	// CHECK3-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]			// CHECK3-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]
	// CHECK3-NEXT: ]			// CHECK3-NEXT: ]
	// CHECK3: .untied.done..i:			// CHECK3: .untied.done..i:
	// CHECK3-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK3-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK3-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK3-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK3: .untied.jmp..i:			// CHECK3: .untied.jmp..i:
	// CHECK3-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !51			// CHECK3-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !51
	// CHECK3-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK3-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB11]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB11]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !51			// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !51
	// CHECK3-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR4]]
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT:%.*]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT:%.*]]
	// CHECK3: .untied.jmp.1.i:			// CHECK3: .untied.jmp.1.i:
	// CHECK3-NEXT: store i32 1, i32* @a, align 4			// CHECK3-NEXT: store i32 1, i32* @a, align 4
	// CHECK3-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK3-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK3-NEXT: br label [[CLEANUP_I]]			// CHECK3-NEXT: br label [[CLEANUP_I]]
	// CHECK3: cleanup.i:			// CHECK3: cleanup.i:
	// CHECK3-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK3-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT]]
	// CHECK3: .omp_outlined..7.exit:			// CHECK3: .omp_outlined..7.exit:
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..10			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..10
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.9 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.9 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.8, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.8, align 8
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK3-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !61			// CHECK3-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !61
	// CHECK3-NEXT: store %struct.anon.8* [[TMP8]], %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61			// CHECK3-NEXT: store %struct.anon.8* [[TMP8]], %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61
	// CHECK3-NEXT: [[TMP10:%.]] = load %struct.anon.8, %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61			// CHECK3-NEXT: [[TMP10:%.]] = load %struct.anon.8, %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61
	// CHECK3-NEXT: store i32 2, i32* @a, align 4			// CHECK3-NEXT: store i32 2, i32* @a, align 4
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..12			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..12
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.11 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.11 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.10, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.10, align 8
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK3-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !71			// CHECK3-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !71
	// CHECK3-NEXT: store %struct.anon.10* [[TMP8]], %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71			// CHECK3-NEXT: store %struct.anon.10* [[TMP8]], %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71
	// CHECK3-NEXT: [[TMP10:%.]] = load %struct.anon.10, %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71			// CHECK3-NEXT: [[TMP10:%.]] = load %struct.anon.10, %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71
	// CHECK3-NEXT: store i32 2, i32* @a, align 4			// CHECK3-NEXT: store i32 2, i32* @a, align 4
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..14			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..14
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.13 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.13 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.12, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.12, align 8
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK3-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !81			// CHECK3-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !81
	// CHECK3-NEXT: store %struct.anon.12* [[TMP8]], %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81			// CHECK3-NEXT: store %struct.anon.12* [[TMP8]], %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81
	// CHECK3-NEXT: [[TMP10:%.]] = load %struct.anon.12, %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81			// CHECK3-NEXT: [[TMP10:%.]] = load %struct.anon.12, %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81
	// CHECK3-NEXT: store i32 3, i32* @a, align 4			// CHECK3-NEXT: store i32 3, i32* @a, align 4
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..16			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..16
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.15 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.15 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.14, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.14, align 8
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 22 Lines
	// CHECK3-NEXT: store i32 4, i32* @a, align 4			// CHECK3-NEXT: store i32 4, i32* @a, align 4
	// CHECK3-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_14:%.]], %struct.anon.14* [[TMP10]], i32 0, i32 0			// CHECK3-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_14:%.]], %struct.anon.14* [[TMP10]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP12:%.]] = load i32, i32** [[TMP11]], align 8			// CHECK3-NEXT: [[TMP12:%.]] = load i32, i32** [[TMP11]], align 8
	// CHECK3-NEXT: store i32 5, i32* [[TMP12]], align 128			// CHECK3-NEXT: store i32 5, i32* [[TMP12]], align 128
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_privates_map.			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_privates_map.
	// CHECK3-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR0]] {			// CHECK3-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR7:[0-9]+]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8
	// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK3-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK3-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK3-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0			// CHECK3-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK3-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK3-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8			// CHECK3-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..19			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..19
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.18 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.18 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.17, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.17, align 8
	// CHECK3-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8
	Show All 20 Lines
	// CHECK3-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101			// CHECK3-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101
	// CHECK3-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t, i32) @.omp_task_privates_map. to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101			// CHECK3-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t, i32) @.omp_task_privates_map. to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101
	// CHECK3-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !101			// CHECK3-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !101
	// CHECK3-NEXT: store %struct.anon.17* [[TMP8]], %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101			// CHECK3-NEXT: store %struct.anon.17* [[TMP8]], %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101
	// CHECK3-NEXT: [[TMP12:%.]] = load %struct.anon.17, %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101			// CHECK3-NEXT: [[TMP12:%.]] = load %struct.anon.17, %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101
	// CHECK3-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101			// CHECK3-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101
	// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101			// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101
	// CHECK3-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32)			// CHECK3-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32)
	// CHECK3-NEXT: call void [[TMP15]](i8* [[TMP14]], i32** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR5]]			// CHECK3-NEXT: call void [[TMP15]](i8* [[TMP14]], i32** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !101			// CHECK3-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !101
	// CHECK3-NEXT: store i32 4, i32* [[TMP16]], align 128			// CHECK3-NEXT: store i32 4, i32* [[TMP16]], align 128
	// CHECK3-NEXT: store i32 4, i32* @a, align 4			// CHECK3-NEXT: store i32 4, i32* @a, align 4
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN1SD1Ev			// CHECK3-LABEL: define {{[^@]+}}@_ZN1SD1Ev
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: call void @_ZN1SD2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR5]]			// CHECK3-NEXT: call void @_ZN1SD2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR4]]
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_privates_map..20			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_privates_map..20
	// CHECK3-SAME: (%struct..kmp_privates.t.20* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.]], %struct.S* noalias [[TMP2:%.]], %struct.S* noalias [[TMP3:%.*]]) #[[ATTR0]] {			// CHECK3-SAME: (%struct..kmp_privates.t.20* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.]], %struct.S* noalias [[TMP2:%.]], %struct.S* noalias [[TMP3:%.*]]) #[[ATTR7]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.20, align 8			// CHECK3-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.20, align 8
	// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK3-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK3-NEXT: [[DOTADDR2:%.]] = alloca %struct.S*, align 8			// CHECK3-NEXT: [[DOTADDR2:%.]] = alloca %struct.S*, align 8
	// CHECK3-NEXT: [[DOTADDR3:%.]] = alloca %struct.S*, align 8			// CHECK3-NEXT: [[DOTADDR3:%.]] = alloca %struct.S*, align 8
	// CHECK3-NEXT: store %struct..kmp_privates.t.20* [[TMP0]], %struct..kmp_privates.t.20** [[DOTADDR]], align 8			// CHECK3-NEXT: store %struct..kmp_privates.t.20* [[TMP0]], %struct..kmp_privates.t.20** [[DOTADDR]], align 8
	// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK3-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK3-NEXT: store %struct.S [[TMP2]], %struct.S* [[DOTADDR2]], align 8			// CHECK3-NEXT: store %struct.S [[TMP2]], %struct.S* [[DOTADDR2]], align 8
	// CHECK3-NEXT: store %struct.S [[TMP3]], %struct.S* [[DOTADDR3]], align 8			// CHECK3-NEXT: store %struct.S [[TMP3]], %struct.S* [[DOTADDR3]], align 8
	// CHECK3-NEXT: [[TMP4:%.]] = load %struct..kmp_privates.t.20, %struct..kmp_privates.t.20** [[DOTADDR]], align 8			// CHECK3-NEXT: [[TMP4:%.]] = load %struct..kmp_privates.t.20, %struct..kmp_privates.t.20** [[DOTADDR]], align 8
	// CHECK3-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20:%.]], %struct..kmp_privates.t.20* [[TMP4]], i32 0, i32 0			// CHECK3-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20:%.]], %struct..kmp_privates.t.20* [[TMP4]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP6:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK3-NEXT: [[TMP6:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK3-NEXT: store i32* [[TMP5]], i32** [[TMP6]], align 8			// CHECK3-NEXT: store i32* [[TMP5]], i32** [[TMP6]], align 8
	// CHECK3-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 1			// CHECK3-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 1
	// CHECK3-NEXT: [[TMP8:%.]] = load %struct.S, %struct.S** [[DOTADDR2]], align 8			// CHECK3-NEXT: [[TMP8:%.]] = load %struct.S, %struct.S** [[DOTADDR2]], align 8
	// CHECK3-NEXT: store %struct.S* [[TMP7]], %struct.S** [[TMP8]], align 8			// CHECK3-NEXT: store %struct.S* [[TMP7]], %struct.S** [[TMP8]], align 8
	// CHECK3-NEXT: [[TMP9:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 2			// CHECK3-NEXT: [[TMP9:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 2
	// CHECK3-NEXT: [[TMP10:%.]] = load %struct.S, %struct.S** [[DOTADDR3]], align 8			// CHECK3-NEXT: [[TMP10:%.]] = load %struct.S, %struct.S** [[DOTADDR3]], align 8
	// CHECK3-NEXT: store %struct.S* [[TMP9]], %struct.S** [[TMP10]], align 8			// CHECK3-NEXT: store %struct.S* [[TMP9]], %struct.S** [[TMP10]], align 8
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..21			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..21
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.19 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.19 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.16, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.16, align 8
	// CHECK3-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8
	Show All 26 Lines
	// CHECK3-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.20, i32, %struct.S, %struct.S) @.omp_task_privates_map..20 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.20, i32, %struct.S, %struct.S) @.omp_task_privates_map..20 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: store %struct.anon.16* [[TMP8]], %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: store %struct.anon.16* [[TMP8]], %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP12:%.]] = load %struct.anon.16, %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP12:%.]] = load %struct.anon.16, %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32, %struct.S, %struct.S)			// CHECK3-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32, %struct.S, %struct.S)
	// CHECK3-NEXT: call void [[TMP15]](i8* [[TMP14]], i32 [[DOTFIRSTPRIV_PTR_ADDR_I]], %struct.S [[DOTLOCAL_PTR_ADDR_I]], %struct.S** [[DOTLOCAL_PTR_ADDR1_I]]) #[[ATTR5]]			// CHECK3-NEXT: call void [[TMP15]](i8* [[TMP14]], i32 [[DOTFIRSTPRIV_PTR_ADDR_I]], %struct.S [[DOTLOCAL_PTR_ADDR_I]], %struct.S** [[DOTLOCAL_PTR_ADDR1_I]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP17:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP17:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP18:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR1_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP18:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR1_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP19:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP19:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4			// CHECK3-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4
	// CHECK3-NEXT: switch i32 [[TMP20]], label [[DOTUNTIED_DONE__I:%.*]] [			// CHECK3-NEXT: switch i32 [[TMP20]], label [[DOTUNTIED_DONE__I:%.*]] [
	// CHECK3-NEXT: i32 0, label [[DOTUNTIED_JMP__I:%.*]]			// CHECK3-NEXT: i32 0, label [[DOTUNTIED_JMP__I:%.*]]
	// CHECK3-NEXT: i32 1, label [[DOTUNTIED_JMP_2_I:%.*]]			// CHECK3-NEXT: i32 1, label [[DOTUNTIED_JMP_2_I:%.*]]
	// CHECK3-NEXT: i32 2, label [[DOTUNTIED_JMP_6_I:%.*]]			// CHECK3-NEXT: i32 2, label [[DOTUNTIED_JMP_6_I:%.*]]
	// CHECK3-NEXT: i32 3, label [[DOTUNTIED_JMP_10_I:%.*]]			// CHECK3-NEXT: i32 3, label [[DOTUNTIED_JMP_10_I:%.*]]
	// CHECK3-NEXT: i32 4, label [[DOTUNTIED_JMP_15_I:%.*]]			// CHECK3-NEXT: i32 4, label [[DOTUNTIED_JMP_15_I:%.*]]
	// CHECK3-NEXT: ]			// CHECK3-NEXT: ]
	// CHECK3: .untied.done..i:			// CHECK3: .untied.done..i:
	// CHECK3-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK3-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK3-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK3-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK3: .untied.jmp..i:			// CHECK3: .untied.jmp..i:
	// CHECK3-NEXT: [[TMP21:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP21:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: store i32 1, i32* [[TMP21]], align 4			// CHECK3-NEXT: store i32 1, i32* [[TMP21]], align 4
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP22:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP22:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP23:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP22]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP23:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP22]]) #[[ATTR4]]
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT:%.*]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT:%.*]]
	// CHECK3: .untied.jmp.2.i:			// CHECK3: .untied.jmp.2.i:
	// CHECK3-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[S1_I]]) #[[ATTR5]]			// CHECK3-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[S1_I]]) #[[ATTR4]]
	// CHECK3-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[S2_I]]) #[[ATTR5]]			// CHECK3-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[S2_I]]) #[[ATTR4]]
	// CHECK3-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[S2_I]], i32 0, i32 0			// CHECK3-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[S2_I]], i32 0, i32 0
	// CHECK3-NEXT: store i32 0, i32* [[A_I]], align 4, !noalias !111			// CHECK3-NEXT: store i32 0, i32* [[A_I]], align 4, !noalias !111
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM3_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB23:[0-9]+]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM3_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB23:[0-9]+]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP24:%.]] = call i8 @__kmpc_omp_task_alloc(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM3_I]], i32 1, i64 256, i64 1, i32 (i32, i8) bitcast (i32 (i32, %struct.kmp_task_t_with_privates.18) @.omp_task_entry..19 to i32 (i32, i8))) #[[ATTR5]]			// CHECK3-NEXT: [[TMP24:%.]] = call i8 @__kmpc_omp_task_alloc(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM3_I]], i32 1, i64 256, i64 1, i32 (i32, i8) bitcast (i32 (i32, %struct.kmp_task_t_with_privates.18) @.omp_task_entry..19 to i32 (i32, i8))) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP25:%.]] = bitcast i8 [[TMP24]] to %struct.kmp_task_t_with_privates.18*			// CHECK3-NEXT: [[TMP25:%.]] = bitcast i8 [[TMP24]] to %struct.kmp_task_t_with_privates.18*
	// CHECK3-NEXT: [[TMP26:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18:%.]], %struct.kmp_task_t_with_privates.18* [[TMP25]], i32 0, i32 0			// CHECK3-NEXT: [[TMP26:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18:%.]], %struct.kmp_task_t_with_privates.18* [[TMP25]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP27:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18]], %struct.kmp_task_t_with_privates.18 [[TMP25]], i32 0, i32 2			// CHECK3-NEXT: [[TMP27:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18]], %struct.kmp_task_t_with_privates.18 [[TMP25]], i32 0, i32 2
	// CHECK3-NEXT: [[TMP28:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP27]], i32 0, i32 0			// CHECK3-NEXT: [[TMP28:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP27]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP29:%.]] = load i32, i32 [[TMP16]], align 128			// CHECK3-NEXT: [[TMP29:%.]] = load i32, i32 [[TMP16]], align 128
	// CHECK3-NEXT: store i32 [[TMP29]], i32* [[TMP28]], align 128			// CHECK3-NEXT: store i32 [[TMP29]], i32* [[TMP28]], align 128
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM4_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB23]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM4_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB23]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP30:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM4_I]], i8* [[TMP24]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP30:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM4_I]], i8* [[TMP24]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP31:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP31:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: store i32 2, i32* [[TMP31]], align 4			// CHECK3-NEXT: store i32 2, i32* [[TMP31]], align 4
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM5_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM5_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP32:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP32:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP33:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM5_I]], i8* [[TMP32]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP33:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM5_I]], i8* [[TMP32]]) #[[ATTR4]]
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK3: .untied.jmp.6.i:			// CHECK3: .untied.jmp.6.i:
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM8_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM8_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP34:%.]] = call i32 @__kmpc_omp_taskyield(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM8_I]], i32 0) #[[ATTR5]]			// CHECK3-NEXT: [[TMP34:%.]] = call i32 @__kmpc_omp_taskyield(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM8_I]], i32 0) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP35:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP35:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: store i32 3, i32* [[TMP35]], align 4			// CHECK3-NEXT: store i32 3, i32* [[TMP35]], align 4
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM9_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM9_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP36:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP36:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP37:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM9_I]], i8* [[TMP36]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP37:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM9_I]], i8* [[TMP36]]) #[[ATTR4]]
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK3: .untied.jmp.10.i:			// CHECK3: .untied.jmp.10.i:
	// CHECK3-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR5]]			// CHECK3-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP38:%.]] = bitcast %struct.S [[S1_I]] to i8*			// CHECK3-NEXT: [[TMP38:%.]] = bitcast %struct.S [[S1_I]] to i8*
	// CHECK3-NEXT: [[TMP39:%.]] = bitcast %struct.S [[REF_TMP_I]] to i8*			// CHECK3-NEXT: [[TMP39:%.]] = bitcast %struct.S [[REF_TMP_I]] to i8*
	// CHECK3-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 4 [[TMP38]], i8* align 4 [[TMP39]], i64 4, i1 false) #[[ATTR5]], !noalias !111			// CHECK3-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 4 [[TMP38]], i8* align 4 [[TMP39]], i64 4, i1 false) #[[ATTR4]], !noalias !111
	// CHECK3-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR5]]			// CHECK3-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR4]]
	// CHECK3-NEXT: [[A12_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[S2_I]], i32 0, i32 0			// CHECK3-NEXT: [[A12_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[S2_I]], i32 0, i32 0
	// CHECK3-NEXT: store i32 10, i32* [[A12_I]], align 4, !noalias !111			// CHECK3-NEXT: store i32 10, i32* [[A12_I]], align 4, !noalias !111
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM13_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM13_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP40:%.]] = call i32 @__kmpc_omp_taskwait(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM13_I]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP40:%.]] = call i32 @__kmpc_omp_taskwait(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM13_I]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP41:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP41:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: store i32 4, i32* [[TMP41]], align 4			// CHECK3-NEXT: store i32 4, i32* [[TMP41]], align 4
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM14_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR5]]			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM14_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR4]]
	// CHECK3-NEXT: [[TMP42:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK3-NEXT: [[TMP42:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK3-NEXT: [[TMP43:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM14_I]], i8* [[TMP42]]) #[[ATTR5]]			// CHECK3-NEXT: [[TMP43:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM14_I]], i8* [[TMP42]]) #[[ATTR4]]
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK3: .untied.jmp.15.i:			// CHECK3: .untied.jmp.15.i:
	// CHECK3-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[S2_I]]) #[[ATTR5]]			// CHECK3-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[S2_I]]) #[[ATTR4]]
	// CHECK3-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[S1_I]]) #[[ATTR5]]			// CHECK3-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[S1_I]]) #[[ATTR4]]
	// CHECK3-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK3-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK3-NEXT: br label [[CLEANUP_I]]			// CHECK3-NEXT: br label [[CLEANUP_I]]
	// CHECK3: cleanup.i:			// CHECK3: cleanup.i:
	// CHECK3-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK3-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK3-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK3: .omp_outlined..17.exit:			// CHECK3: .omp_outlined..17.exit:
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	Show All 13 Lines
	// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK3-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
				// CHECK3-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK3-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: call void @_ZN2S1C1Ev(%struct.S1* nonnull dereferenceable(4) @s1)
				// CHECK3-NEXT: ret void
				//
				//
				// CHECK3-LABEL: define {{[^@]+}}@_ZN2S1C1Ev
				// CHECK3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK3-NEXT: entry:
				// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
				// CHECK3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
				// CHECK3-NEXT: call void @_ZN2S1C2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
				// CHECK3-NEXT: ret void
				//
				//
	// CHECK3-LABEL: define {{[^@]+}}@_ZN2S1C2Ev			// CHECK3-LABEL: define {{[^@]+}}@_ZN2S1C2Ev
	// CHECK3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8			// CHECK3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
	// CHECK3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8			// CHECK3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8			// CHECK3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
	// CHECK3-NEXT: call void @_ZN2S18taskinitEv(%struct.S1* nonnull dereferenceable(4) [[THIS1]])			// CHECK3-NEXT: call void @_ZN2S18taskinitEv(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	Show All 17 Lines
	// CHECK3-NEXT: [[TMP6:%.]] = bitcast %struct.anon.21 [[AGG_CAPTURED]] to i8*			// CHECK3-NEXT: [[TMP6:%.]] = bitcast %struct.anon.21 [[AGG_CAPTURED]] to i8*
	// CHECK3-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[TMP5]], i8* align 8 [[TMP6]], i64 8, i1 false)			// CHECK3-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[TMP5]], i8* align 8 [[TMP6]], i64 8, i1 false)
	// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM2:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB25]])			// CHECK3-NEXT: [[OMP_GLOBAL_THREAD_NUM2:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB25]])
	// CHECK3-NEXT: [[TMP7:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2]], i8* [[TMP1]])			// CHECK3-NEXT: [[TMP7:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2]], i8* [[TMP1]])
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..23			// CHECK3-LABEL: define {{[^@]+}}@.omp_task_entry..23
	// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.22 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK3-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.22 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK3-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK3-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK3-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.21, align 8			// CHECK3-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.21, align 8
	// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK3-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 22 Lines
	// CHECK3-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_21:%.]], %struct.anon.21* [[TMP10]], i32 0, i32 0			// CHECK3-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_21:%.]], %struct.anon.21* [[TMP10]], i32 0, i32 0
	// CHECK3-NEXT: [[TMP12:%.]] = load %struct.S1, %struct.S1** [[TMP11]], align 8			// CHECK3-NEXT: [[TMP12:%.]] = load %struct.S1, %struct.S1** [[TMP11]], align 8
	// CHECK3-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP12]], i32 0, i32 0			// CHECK3-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP12]], i32 0, i32 0
	// CHECK3-NEXT: store i32 0, i32* [[A_I]], align 4			// CHECK3-NEXT: store i32 0, i32* [[A_I]], align 4
	// CHECK3-NEXT: ret i32 0			// CHECK3-NEXT: ret i32 0
	//			//
	//			//
	// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_task_codegen.cpp			// CHECK3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_task_codegen.cpp
	// CHECK3-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK3-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK3-NEXT: entry:			// CHECK3-NEXT: entry:
	// CHECK3-NEXT: call void @__cxx_global_var_init()			// CHECK3-NEXT: call void @__cxx_global_var_init()
	// CHECK3-NEXT: ret void			// CHECK3-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK4-SAME: () #[[ATTR0:[0-9]+]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @_ZN2S1C1Ev(%struct.S1* nonnull dereferenceable(4) @s1)
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN2S1C1Ev
	// CHECK4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
	// CHECK4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: call void @_ZN2S1C2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
	// CHECK4-NEXT: ret void
	//
	//
	// CHECK4-LABEL: define {{[^@]+}}@main			// CHECK4-LABEL: define {{[^@]+}}@main
	// CHECK4-SAME: () #[[ATTR2:[0-9]+]] {			// CHECK4-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[RETVAL:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[B:%.*]] = alloca i8, align 1			// CHECK4-NEXT: [[B:%.*]] = alloca i8, align 1
	// CHECK4-NEXT: [[S:%.*]] = alloca [2 x %struct.S], align 4			// CHECK4-NEXT: [[S:%.*]] = alloca [2 x %struct.S], align 4
	// CHECK4-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[SAVED_STACK:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8			// CHECK4-NEXT: [[__VLA_EXPR0:%.*]] = alloca i64, align 8
	// CHECK4-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8			// CHECK4-NEXT: [[AGG_CAPTURED:%.]] = alloca [[STRUCT_ANON:%.]], align 8
	// CHECK4-NEXT: [[AGG_CAPTURED2:%.]] = alloca [[STRUCT_ANON_0:%.]], align 8			// CHECK4-NEXT: [[AGG_CAPTURED2:%.]] = alloca [[STRUCT_ANON_0:%.]], align 8
	▲ Show 20 Lines • Show All 293 Lines • ▼ Show 20 Lines
	// CHECK4-NEXT: [[TMP168:%.]] = load i8, i8** [[SAVED_STACK]], align 8			// CHECK4-NEXT: [[TMP168:%.]] = load i8, i8** [[SAVED_STACK]], align 8
	// CHECK4-NEXT: call void @llvm.stackrestore(i8* [[TMP168]])			// CHECK4-NEXT: call void @llvm.stackrestore(i8* [[TMP168]])
	// CHECK4-NEXT: [[ARRAY_BEGIN51:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[S]], i32 0, i32 0			// CHECK4-NEXT: [[ARRAY_BEGIN51:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[S]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP169:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[ARRAY_BEGIN51]], i64 2			// CHECK4-NEXT: [[TMP169:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[ARRAY_BEGIN51]], i64 2
	// CHECK4-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]			// CHECK4-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
	// CHECK4: arraydestroy.body:			// CHECK4: arraydestroy.body:
	// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S [ [[TMP169]], [[ARRAYCTOR_CONT]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]			// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S [ [[TMP169]], [[ARRAYCTOR_CONT]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
	// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1			// CHECK4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S]], %struct.S* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
	// CHECK4-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR5:[0-9]+]]			// CHECK4-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4:[0-9]+]]
	// CHECK4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN51]]			// CHECK4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN51]]
	// CHECK4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE52:%.*]], label [[ARRAYDESTROY_BODY]]			// CHECK4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE52:%.*]], label [[ARRAYDESTROY_BODY]]
	// CHECK4: arraydestroy.done52:			// CHECK4: arraydestroy.done52:
	// CHECK4-NEXT: [[TMP170:%.]] = load i32, i32 [[RETVAL]], align 4			// CHECK4-NEXT: [[TMP170:%.]] = load i32, i32 [[RETVAL]], align 4
	// CHECK4-NEXT: ret i32 [[TMP170]]			// CHECK4-NEXT: ret i32 [[TMP170]]
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SC1Ev			// CHECK4-LABEL: define {{[^@]+}}@_ZN1SC1Ev
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] align 2 {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])			// CHECK4-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry.			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry.
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR4:[0-9]+]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates noalias [[TMP1:%.*]]) #[[ATTR3:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon, align 8
	// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 29 Lines
	// CHECK4-NEXT: [[TMP15:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP14]], align 8			// CHECK4-NEXT: [[TMP15:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP14]], align 8
	// CHECK4-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP15]], i64 0, i64 0			// CHECK4-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP15]], i64 0, i64 0
	// CHECK4-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0			// CHECK4-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0
	// CHECK4-NEXT: store i32 10, i32* [[A_I]], align 4			// CHECK4-NEXT: store i32 10, i32* [[A_I]], align 4
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..2			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..2
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.1 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.0, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.0, align 8
	// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 24 Lines
	// CHECK4-NEXT: [[TMP12:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP11]], align 8			// CHECK4-NEXT: [[TMP12:%.]] = load [2 x %struct.S], [2 x %struct.S]** [[TMP11]], align 8
	// CHECK4-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP12]], i64 0, i64 1			// CHECK4-NEXT: [[ARRAYIDX_I:%.]] = getelementptr inbounds [2 x %struct.S], [2 x %struct.S] [[TMP12]], i64 0, i64 1
	// CHECK4-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0			// CHECK4-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[ARRAYIDX_I]], i32 0, i32 0
	// CHECK4-NEXT: store i32 10, i32* [[A_I]], align 4			// CHECK4-NEXT: store i32 10, i32* [[A_I]], align 4
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..4			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..4
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.3 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.2, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.2, align 8
	// CHECK4-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 27 Lines
	// CHECK4-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]			// CHECK4-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]
	// CHECK4-NEXT: ]			// CHECK4-NEXT: ]
	// CHECK4: .untied.done..i:			// CHECK4: .untied.done..i:
	// CHECK4-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK4-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK4-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK4-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK4: .untied.jmp..i:			// CHECK4: .untied.jmp..i:
	// CHECK4-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !31			// CHECK4-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !31
	// CHECK4-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK4-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB7]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB7]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !31			// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !31
	// CHECK4-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR4]]
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT:%.*]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT:%.*]]
	// CHECK4: .untied.jmp.1.i:			// CHECK4: .untied.jmp.1.i:
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM2_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM2_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR4]]
	// CHECK4-NEXT: call void @__kmpc_critical(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2_I]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR5]]			// CHECK4-NEXT: call void @__kmpc_critical(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2_I]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR4]]
	// CHECK4-NEXT: store i32 1, i32* @a, align 4			// CHECK4-NEXT: store i32 1, i32* @a, align 4
	// CHECK4-NEXT: call void @__kmpc_end_critical(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2_I]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR5]]			// CHECK4-NEXT: call void @__kmpc_end_critical(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2_I]], [8 x i32]* @.gomp_critical_user_.var) #[[ATTR4]]
	// CHECK4-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK4-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK4-NEXT: br label [[CLEANUP_I]]			// CHECK4-NEXT: br label [[CLEANUP_I]]
	// CHECK4: cleanup.i:			// CHECK4: cleanup.i:
	// CHECK4-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31			// CHECK4-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !31
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__3_EXIT]]
	// CHECK4: .omp_outlined..3.exit:			// CHECK4: .omp_outlined..3.exit:
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..6			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..6
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.5 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.4, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.4, align 8
	// CHECK4-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 27 Lines
	// CHECK4-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]			// CHECK4-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]
	// CHECK4-NEXT: ]			// CHECK4-NEXT: ]
	// CHECK4: .untied.done..i:			// CHECK4: .untied.done..i:
	// CHECK4-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK4-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK4-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK4-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK4: .untied.jmp..i:			// CHECK4: .untied.jmp..i:
	// CHECK4-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !41			// CHECK4-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !41
	// CHECK4-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK4-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB9]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB9]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !41			// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !41
	// CHECK4-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR4]]
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT:%.*]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT:%.*]]
	// CHECK4: .untied.jmp.1.i:			// CHECK4: .untied.jmp.1.i:
	// CHECK4-NEXT: store i32 1, i32* @a, align 4			// CHECK4-NEXT: store i32 1, i32* @a, align 4
	// CHECK4-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK4-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK4-NEXT: br label [[CLEANUP_I]]			// CHECK4-NEXT: br label [[CLEANUP_I]]
	// CHECK4: cleanup.i:			// CHECK4: cleanup.i:
	// CHECK4-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41			// CHECK4-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !41
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__5_EXIT]]
	// CHECK4: .omp_outlined..5.exit:			// CHECK4: .omp_outlined..5.exit:
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..8			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..8
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.7 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.6, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.6, align 8
	// CHECK4-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[CLEANUP_DEST_SLOT_I:%.*]] = alloca i32, align 4
	Show All 27 Lines
	// CHECK4-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]			// CHECK4-NEXT: i32 1, label [[DOTUNTIED_JMP_1_I:%.*]]
	// CHECK4-NEXT: ]			// CHECK4-NEXT: ]
	// CHECK4: .untied.done..i:			// CHECK4: .untied.done..i:
	// CHECK4-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK4-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK4-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK4-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK4: .untied.jmp..i:			// CHECK4: .untied.jmp..i:
	// CHECK4-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !51			// CHECK4-NEXT: [[TMP13:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !51
	// CHECK4-NEXT: store i32 1, i32* [[TMP13]], align 4			// CHECK4-NEXT: store i32 1, i32* [[TMP13]], align 4
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB11]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB11]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !51			// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !51
	// CHECK4-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP15:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP14]]) #[[ATTR4]]
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT:%.*]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT:%.*]]
	// CHECK4: .untied.jmp.1.i:			// CHECK4: .untied.jmp.1.i:
	// CHECK4-NEXT: store i32 1, i32* @a, align 4			// CHECK4-NEXT: store i32 1, i32* @a, align 4
	// CHECK4-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK4-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK4-NEXT: br label [[CLEANUP_I]]			// CHECK4-NEXT: br label [[CLEANUP_I]]
	// CHECK4: cleanup.i:			// CHECK4: cleanup.i:
	// CHECK4-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51			// CHECK4-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !51
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__7_EXIT]]
	// CHECK4: .omp_outlined..7.exit:			// CHECK4: .omp_outlined..7.exit:
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..10			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..10
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.9 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.9 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.8, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.8, align 8
	// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK4-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !61			// CHECK4-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !61
	// CHECK4-NEXT: store %struct.anon.8* [[TMP8]], %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61			// CHECK4-NEXT: store %struct.anon.8* [[TMP8]], %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61
	// CHECK4-NEXT: [[TMP10:%.]] = load %struct.anon.8, %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61			// CHECK4-NEXT: [[TMP10:%.]] = load %struct.anon.8, %struct.anon.8** [[__CONTEXT_ADDR_I]], align 8, !noalias !61
	// CHECK4-NEXT: store i32 2, i32* @a, align 4			// CHECK4-NEXT: store i32 2, i32* @a, align 4
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..12			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..12
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.11 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.11 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.10, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.10, align 8
	// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK4-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !71			// CHECK4-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !71
	// CHECK4-NEXT: store %struct.anon.10* [[TMP8]], %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71			// CHECK4-NEXT: store %struct.anon.10* [[TMP8]], %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71
	// CHECK4-NEXT: [[TMP10:%.]] = load %struct.anon.10, %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71			// CHECK4-NEXT: [[TMP10:%.]] = load %struct.anon.10, %struct.anon.10** [[__CONTEXT_ADDR_I]], align 8, !noalias !71
	// CHECK4-NEXT: store i32 2, i32* @a, align 4			// CHECK4-NEXT: store i32 2, i32* @a, align 4
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..14			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..14
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.13 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.13 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.12, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.12, align 8
	// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 19 Lines
	// CHECK4-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !81			// CHECK4-NEXT: store i8* [[TMP9]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !81
	// CHECK4-NEXT: store %struct.anon.12* [[TMP8]], %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81			// CHECK4-NEXT: store %struct.anon.12* [[TMP8]], %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81
	// CHECK4-NEXT: [[TMP10:%.]] = load %struct.anon.12, %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81			// CHECK4-NEXT: [[TMP10:%.]] = load %struct.anon.12, %struct.anon.12** [[__CONTEXT_ADDR_I]], align 8, !noalias !81
	// CHECK4-NEXT: store i32 3, i32* @a, align 4			// CHECK4-NEXT: store i32 3, i32* @a, align 4
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..16			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..16
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.15 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.15 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.14, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.14, align 8
	// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 22 Lines
	// CHECK4-NEXT: store i32 4, i32* @a, align 4			// CHECK4-NEXT: store i32 4, i32* @a, align 4
	// CHECK4-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_14:%.]], %struct.anon.14* [[TMP10]], i32 0, i32 0			// CHECK4-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_14:%.]], %struct.anon.14* [[TMP10]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP12:%.]] = load i32, i32** [[TMP11]], align 8			// CHECK4-NEXT: [[TMP12:%.]] = load i32, i32** [[TMP11]], align 8
	// CHECK4-NEXT: store i32 5, i32* [[TMP12]], align 128			// CHECK4-NEXT: store i32 5, i32* [[TMP12]], align 128
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_privates_map.			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_privates_map.
	// CHECK4-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR0]] {			// CHECK4-SAME: (%struct..kmp_privates.t* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.*]]) #[[ATTR7:[0-9]+]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8			// CHECK4-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t, align 8
	// CHECK4-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK4-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK4-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK4-NEXT: store %struct..kmp_privates.t* [[TMP0]], %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK4-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK4-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK4-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8			// CHECK4-NEXT: [[TMP2:%.]] = load %struct..kmp_privates.t, %struct..kmp_privates.t** [[DOTADDR]], align 8
	// CHECK4-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0			// CHECK4-NEXT: [[TMP3:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP2]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK4-NEXT: [[TMP4:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK4-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8			// CHECK4-NEXT: store i32* [[TMP3]], i32** [[TMP4]], align 8
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..19			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..19
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.18 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.18 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.17, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.17, align 8
	// CHECK4-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8
	Show All 20 Lines
	// CHECK4-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101			// CHECK4-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101
	// CHECK4-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t, i32) @.omp_task_privates_map. to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101			// CHECK4-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t, i32) @.omp_task_privates_map. to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101
	// CHECK4-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !101			// CHECK4-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !101
	// CHECK4-NEXT: store %struct.anon.17* [[TMP8]], %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101			// CHECK4-NEXT: store %struct.anon.17* [[TMP8]], %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101
	// CHECK4-NEXT: [[TMP12:%.]] = load %struct.anon.17, %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101			// CHECK4-NEXT: [[TMP12:%.]] = load %struct.anon.17, %struct.anon.17** [[__CONTEXT_ADDR_I]], align 8, !noalias !101
	// CHECK4-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101			// CHECK4-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !101
	// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101			// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !101
	// CHECK4-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32)			// CHECK4-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32)
	// CHECK4-NEXT: call void [[TMP15]](i8* [[TMP14]], i32** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR5]]			// CHECK4-NEXT: call void [[TMP15]](i8* [[TMP14]], i32** [[DOTFIRSTPRIV_PTR_ADDR_I]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !101			// CHECK4-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !101
	// CHECK4-NEXT: store i32 4, i32* [[TMP16]], align 128			// CHECK4-NEXT: store i32 4, i32* [[TMP16]], align 128
	// CHECK4-NEXT: store i32 4, i32* @a, align 4			// CHECK4-NEXT: store i32 4, i32* @a, align 4
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN1SD1Ev			// CHECK4-LABEL: define {{[^@]+}}@_ZN1SD1Ev
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: call void @_ZN1SD2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR5]]			// CHECK4-NEXT: call void @_ZN1SD2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR4]]
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_privates_map..20			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_privates_map..20
	// CHECK4-SAME: (%struct..kmp_privates.t.20* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.]], %struct.S* noalias [[TMP2:%.]], %struct.S* noalias [[TMP3:%.*]]) #[[ATTR0]] {			// CHECK4-SAME: (%struct..kmp_privates.t.20* noalias [[TMP0:%.]], i32* noalias [[TMP1:%.]], %struct.S* noalias [[TMP2:%.]], %struct.S* noalias [[TMP3:%.*]]) #[[ATTR7]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.20, align 8			// CHECK4-NEXT: [[DOTADDR:%.]] = alloca %struct..kmp_privates.t.20, align 8
	// CHECK4-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8			// CHECK4-NEXT: [[DOTADDR1:%.]] = alloca i32*, align 8
	// CHECK4-NEXT: [[DOTADDR2:%.]] = alloca %struct.S*, align 8			// CHECK4-NEXT: [[DOTADDR2:%.]] = alloca %struct.S*, align 8
	// CHECK4-NEXT: [[DOTADDR3:%.]] = alloca %struct.S*, align 8			// CHECK4-NEXT: [[DOTADDR3:%.]] = alloca %struct.S*, align 8
	// CHECK4-NEXT: store %struct..kmp_privates.t.20* [[TMP0]], %struct..kmp_privates.t.20** [[DOTADDR]], align 8			// CHECK4-NEXT: store %struct..kmp_privates.t.20* [[TMP0]], %struct..kmp_privates.t.20** [[DOTADDR]], align 8
	// CHECK4-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8			// CHECK4-NEXT: store i32 [[TMP1]], i32* [[DOTADDR1]], align 8
	// CHECK4-NEXT: store %struct.S [[TMP2]], %struct.S* [[DOTADDR2]], align 8			// CHECK4-NEXT: store %struct.S [[TMP2]], %struct.S* [[DOTADDR2]], align 8
	// CHECK4-NEXT: store %struct.S [[TMP3]], %struct.S* [[DOTADDR3]], align 8			// CHECK4-NEXT: store %struct.S [[TMP3]], %struct.S* [[DOTADDR3]], align 8
	// CHECK4-NEXT: [[TMP4:%.]] = load %struct..kmp_privates.t.20, %struct..kmp_privates.t.20** [[DOTADDR]], align 8			// CHECK4-NEXT: [[TMP4:%.]] = load %struct..kmp_privates.t.20, %struct..kmp_privates.t.20** [[DOTADDR]], align 8
	// CHECK4-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20:%.]], %struct..kmp_privates.t.20* [[TMP4]], i32 0, i32 0			// CHECK4-NEXT: [[TMP5:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20:%.]], %struct..kmp_privates.t.20* [[TMP4]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP6:%.]] = load i32, i32** [[DOTADDR1]], align 8			// CHECK4-NEXT: [[TMP6:%.]] = load i32, i32** [[DOTADDR1]], align 8
	// CHECK4-NEXT: store i32* [[TMP5]], i32** [[TMP6]], align 8			// CHECK4-NEXT: store i32* [[TMP5]], i32** [[TMP6]], align 8
	// CHECK4-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 1			// CHECK4-NEXT: [[TMP7:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 1
	// CHECK4-NEXT: [[TMP8:%.]] = load %struct.S, %struct.S** [[DOTADDR2]], align 8			// CHECK4-NEXT: [[TMP8:%.]] = load %struct.S, %struct.S** [[DOTADDR2]], align 8
	// CHECK4-NEXT: store %struct.S* [[TMP7]], %struct.S** [[TMP8]], align 8			// CHECK4-NEXT: store %struct.S* [[TMP7]], %struct.S** [[TMP8]], align 8
	// CHECK4-NEXT: [[TMP9:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 2			// CHECK4-NEXT: [[TMP9:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T_20]], %struct..kmp_privates.t.20 [[TMP4]], i32 0, i32 2
	// CHECK4-NEXT: [[TMP10:%.]] = load %struct.S, %struct.S** [[DOTADDR3]], align 8			// CHECK4-NEXT: [[TMP10:%.]] = load %struct.S, %struct.S** [[DOTADDR3]], align 8
	// CHECK4-NEXT: store %struct.S* [[TMP9]], %struct.S** [[TMP10]], align 8			// CHECK4-NEXT: store %struct.S* [[TMP9]], %struct.S** [[TMP10]], align 8
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..21			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..21
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.19 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.19 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.16, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.16, align 8
	// CHECK4-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTFIRSTPRIV_PTR_ADDR_I:%.]] = alloca i32, align 8
	Show All 26 Lines
	// CHECK4-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: store i8* [[TMP10]], i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.20, i32, %struct.S, %struct.S) @.omp_task_privates_map..20 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: store void (i8, ...) bitcast (void (%struct..kmp_privates.t.20, i32, %struct.S, %struct.S) @.omp_task_privates_map..20 to void (i8, ...)), void (i8, ...)* [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: store i8* [[TMP11]], i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: store %struct.anon.16* [[TMP8]], %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: store %struct.anon.16* [[TMP8]], %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP12:%.]] = load %struct.anon.16, %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP12:%.]] = load %struct.anon.16, %struct.anon.16** [[__CONTEXT_ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP13:%.]] = load void (i8, ...), void (i8, ...)** [[DOTCOPY_FN__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP14:%.]] = load i8, i8** [[DOTPRIVATES__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32, %struct.S, %struct.S)			// CHECK4-NEXT: [[TMP15:%.]] = bitcast void (i8, ...)* [[TMP13]] to void (i8, i32, %struct.S, %struct.S)
	// CHECK4-NEXT: call void [[TMP15]](i8* [[TMP14]], i32 [[DOTFIRSTPRIV_PTR_ADDR_I]], %struct.S [[DOTLOCAL_PTR_ADDR_I]], %struct.S** [[DOTLOCAL_PTR_ADDR1_I]]) #[[ATTR5]]			// CHECK4-NEXT: call void [[TMP15]](i8* [[TMP14]], i32 [[DOTFIRSTPRIV_PTR_ADDR_I]], %struct.S [[DOTLOCAL_PTR_ADDR_I]], %struct.S** [[DOTLOCAL_PTR_ADDR1_I]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP16:%.]] = load i32, i32** [[DOTFIRSTPRIV_PTR_ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP17:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP17:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP18:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR1_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP18:%.]] = load %struct.S, %struct.S** [[DOTLOCAL_PTR_ADDR1_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP19:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP19:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4			// CHECK4-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4
	// CHECK4-NEXT: switch i32 [[TMP20]], label [[DOTUNTIED_DONE__I:%.*]] [			// CHECK4-NEXT: switch i32 [[TMP20]], label [[DOTUNTIED_DONE__I:%.*]] [
	// CHECK4-NEXT: i32 0, label [[DOTUNTIED_JMP__I:%.*]]			// CHECK4-NEXT: i32 0, label [[DOTUNTIED_JMP__I:%.*]]
	// CHECK4-NEXT: i32 1, label [[DOTUNTIED_JMP_2_I:%.*]]			// CHECK4-NEXT: i32 1, label [[DOTUNTIED_JMP_2_I:%.*]]
	// CHECK4-NEXT: i32 2, label [[DOTUNTIED_JMP_6_I:%.*]]			// CHECK4-NEXT: i32 2, label [[DOTUNTIED_JMP_6_I:%.*]]
	// CHECK4-NEXT: i32 3, label [[DOTUNTIED_JMP_10_I:%.*]]			// CHECK4-NEXT: i32 3, label [[DOTUNTIED_JMP_10_I:%.*]]
	// CHECK4-NEXT: i32 4, label [[DOTUNTIED_JMP_15_I:%.*]]			// CHECK4-NEXT: i32 4, label [[DOTUNTIED_JMP_15_I:%.*]]
	// CHECK4-NEXT: ]			// CHECK4-NEXT: ]
	// CHECK4: .untied.done..i:			// CHECK4: .untied.done..i:
	// CHECK4-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK4-NEXT: store i32 1, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK4-NEXT: br label [[CLEANUP_I:%.*]]			// CHECK4-NEXT: br label [[CLEANUP_I:%.*]]
	// CHECK4: .untied.jmp..i:			// CHECK4: .untied.jmp..i:
	// CHECK4-NEXT: [[TMP21:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP21:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: store i32 1, i32* [[TMP21]], align 4			// CHECK4-NEXT: store i32 1, i32* [[TMP21]], align 4
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP22:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP22:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP23:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP22]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP23:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM_I]], i8* [[TMP22]]) #[[ATTR4]]
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT:%.*]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT:%.*]]
	// CHECK4: .untied.jmp.2.i:			// CHECK4: .untied.jmp.2.i:
	// CHECK4-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[S1_I]]) #[[ATTR5]]			// CHECK4-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[S1_I]]) #[[ATTR4]]
	// CHECK4-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[S2_I]]) #[[ATTR5]]			// CHECK4-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[S2_I]]) #[[ATTR4]]
	// CHECK4-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[S2_I]], i32 0, i32 0			// CHECK4-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[S2_I]], i32 0, i32 0
	// CHECK4-NEXT: store i32 0, i32* [[A_I]], align 4, !noalias !111			// CHECK4-NEXT: store i32 0, i32* [[A_I]], align 4, !noalias !111
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM3_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB23:[0-9]+]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM3_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB23:[0-9]+]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP24:%.]] = call i8 @__kmpc_omp_task_alloc(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM3_I]], i32 1, i64 256, i64 1, i32 (i32, i8) bitcast (i32 (i32, %struct.kmp_task_t_with_privates.18) @.omp_task_entry..19 to i32 (i32, i8))) #[[ATTR5]]			// CHECK4-NEXT: [[TMP24:%.]] = call i8 @__kmpc_omp_task_alloc(%struct.ident_t* @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM3_I]], i32 1, i64 256, i64 1, i32 (i32, i8) bitcast (i32 (i32, %struct.kmp_task_t_with_privates.18) @.omp_task_entry..19 to i32 (i32, i8))) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP25:%.]] = bitcast i8 [[TMP24]] to %struct.kmp_task_t_with_privates.18*			// CHECK4-NEXT: [[TMP25:%.]] = bitcast i8 [[TMP24]] to %struct.kmp_task_t_with_privates.18*
	// CHECK4-NEXT: [[TMP26:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18:%.]], %struct.kmp_task_t_with_privates.18* [[TMP25]], i32 0, i32 0			// CHECK4-NEXT: [[TMP26:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18:%.]], %struct.kmp_task_t_with_privates.18* [[TMP25]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP27:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18]], %struct.kmp_task_t_with_privates.18 [[TMP25]], i32 0, i32 2			// CHECK4-NEXT: [[TMP27:%.]] = getelementptr inbounds [[STRUCT_KMP_TASK_T_WITH_PRIVATES_18]], %struct.kmp_task_t_with_privates.18 [[TMP25]], i32 0, i32 2
	// CHECK4-NEXT: [[TMP28:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP27]], i32 0, i32 0			// CHECK4-NEXT: [[TMP28:%.]] = getelementptr inbounds [[STRUCT__KMP_PRIVATES_T:%.]], %struct..kmp_privates.t* [[TMP27]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP29:%.]] = load i32, i32 [[TMP16]], align 128			// CHECK4-NEXT: [[TMP29:%.]] = load i32, i32 [[TMP16]], align 128
	// CHECK4-NEXT: store i32 [[TMP29]], i32* [[TMP28]], align 128			// CHECK4-NEXT: store i32 [[TMP29]], i32* [[TMP28]], align 128
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM4_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB23]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM4_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB23]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP30:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM4_I]], i8* [[TMP24]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP30:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM4_I]], i8* [[TMP24]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP31:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP31:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: store i32 2, i32* [[TMP31]], align 4			// CHECK4-NEXT: store i32 2, i32* [[TMP31]], align 4
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM5_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM5_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP32:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP32:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP33:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM5_I]], i8* [[TMP32]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP33:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM5_I]], i8* [[TMP32]]) #[[ATTR4]]
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK4: .untied.jmp.6.i:			// CHECK4: .untied.jmp.6.i:
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM8_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM8_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP34:%.]] = call i32 @__kmpc_omp_taskyield(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM8_I]], i32 0) #[[ATTR5]]			// CHECK4-NEXT: [[TMP34:%.]] = call i32 @__kmpc_omp_taskyield(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM8_I]], i32 0) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP35:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP35:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: store i32 3, i32* [[TMP35]], align 4			// CHECK4-NEXT: store i32 3, i32* [[TMP35]], align 4
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM9_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM9_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP36:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP36:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP37:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM9_I]], i8* [[TMP36]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP37:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM9_I]], i8* [[TMP36]]) #[[ATTR4]]
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK4: .untied.jmp.10.i:			// CHECK4: .untied.jmp.10.i:
	// CHECK4-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR5]]			// CHECK4-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP38:%.]] = bitcast %struct.S [[S1_I]] to i8*			// CHECK4-NEXT: [[TMP38:%.]] = bitcast %struct.S [[S1_I]] to i8*
	// CHECK4-NEXT: [[TMP39:%.]] = bitcast %struct.S [[REF_TMP_I]] to i8*			// CHECK4-NEXT: [[TMP39:%.]] = bitcast %struct.S [[REF_TMP_I]] to i8*
	// CHECK4-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 4 [[TMP38]], i8* align 4 [[TMP39]], i64 4, i1 false) #[[ATTR5]], !noalias !111			// CHECK4-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 4 [[TMP38]], i8* align 4 [[TMP39]], i64 4, i1 false) #[[ATTR4]], !noalias !111
	// CHECK4-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR5]]			// CHECK4-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[REF_TMP_I]]) #[[ATTR4]]
	// CHECK4-NEXT: [[A12_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[S2_I]], i32 0, i32 0			// CHECK4-NEXT: [[A12_I:%.]] = getelementptr inbounds [[STRUCT_S]], %struct.S [[S2_I]], i32 0, i32 0
	// CHECK4-NEXT: store i32 10, i32* [[A12_I]], align 4, !noalias !111			// CHECK4-NEXT: store i32 10, i32* [[A12_I]], align 4, !noalias !111
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM13_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM13_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP40:%.]] = call i32 @__kmpc_omp_taskwait(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM13_I]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP40:%.]] = call i32 @__kmpc_omp_taskwait(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM13_I]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP41:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP41:%.]] = load i32, i32** [[DOTPART_ID__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: store i32 4, i32* [[TMP41]], align 4			// CHECK4-NEXT: store i32 4, i32* [[TMP41]], align 4
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM14_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR5]]			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM14_I:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB21]]) #[[ATTR4]]
	// CHECK4-NEXT: [[TMP42:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111			// CHECK4-NEXT: [[TMP42:%.]] = load i8, i8** [[DOTTASK_T__ADDR_I]], align 8, !noalias !111
	// CHECK4-NEXT: [[TMP43:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM14_I]], i8* [[TMP42]]) #[[ATTR5]]			// CHECK4-NEXT: [[TMP43:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM14_I]], i8* [[TMP42]]) #[[ATTR4]]
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK4: .untied.jmp.15.i:			// CHECK4: .untied.jmp.15.i:
	// CHECK4-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[S2_I]]) #[[ATTR5]]			// CHECK4-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[S2_I]]) #[[ATTR4]]
	// CHECK4-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[S1_I]]) #[[ATTR5]]			// CHECK4-NEXT: call void @_ZN1SD1Ev(%struct.S* nonnull dereferenceable(4) [[S1_I]]) #[[ATTR4]]
	// CHECK4-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK4-NEXT: store i32 0, i32* [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK4-NEXT: br label [[CLEANUP_I]]			// CHECK4-NEXT: br label [[CLEANUP_I]]
	// CHECK4: cleanup.i:			// CHECK4: cleanup.i:
	// CHECK4-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111			// CHECK4-NEXT: [[CLEANUP_DEST_I:%.]] = load i32, i32 [[CLEANUP_DEST_SLOT_I]], align 4, !noalias !111
	// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]			// CHECK4-NEXT: br label [[DOTOMP_OUTLINED__17_EXIT]]
	// CHECK4: .omp_outlined..17.exit:			// CHECK4: .omp_outlined..17.exit:
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	Show All 13 Lines
	// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK4-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
				// CHECK4-LABEL: define {{[^@]+}}@__cxx_global_var_init
				// CHECK4-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: call void @_ZN2S1C1Ev(%struct.S1* nonnull dereferenceable(4) @s1)
				// CHECK4-NEXT: ret void
				//
				//
				// CHECK4-LABEL: define {{[^@]+}}@_ZN2S1C1Ev
				// CHECK4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
				// CHECK4-NEXT: entry:
				// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
				// CHECK4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
				// CHECK4-NEXT: call void @_ZN2S1C2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
				// CHECK4-NEXT: ret void
				//
				//
	// CHECK4-LABEL: define {{[^@]+}}@_ZN2S1C2Ev			// CHECK4-LABEL: define {{[^@]+}}@_ZN2S1C2Ev
	// CHECK4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {			// CHECK4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] align 2 {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8			// CHECK4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
	// CHECK4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8			// CHECK4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8			// CHECK4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
	// CHECK4-NEXT: call void @_ZN2S18taskinitEv(%struct.S1* nonnull dereferenceable(4) [[THIS1]])			// CHECK4-NEXT: call void @_ZN2S18taskinitEv(%struct.S1* nonnull dereferenceable(4) [[THIS1]])
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	Show All 17 Lines
	// CHECK4-NEXT: [[TMP6:%.]] = bitcast %struct.anon.21 [[AGG_CAPTURED]] to i8*			// CHECK4-NEXT: [[TMP6:%.]] = bitcast %struct.anon.21 [[AGG_CAPTURED]] to i8*
	// CHECK4-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[TMP5]], i8* align 8 [[TMP6]], i64 8, i1 false)			// CHECK4-NEXT: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[TMP5]], i8* align 8 [[TMP6]], i64 8, i1 false)
	// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM2:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB25]])			// CHECK4-NEXT: [[OMP_GLOBAL_THREAD_NUM2:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB25]])
	// CHECK4-NEXT: [[TMP7:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2]], i8* [[TMP1]])			// CHECK4-NEXT: [[TMP7:%.]] = call i32 @__kmpc_omp_task(%struct.ident_t @[[GLOB1]], i32 [[OMP_GLOBAL_THREAD_NUM2]], i8* [[TMP1]])
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..23			// CHECK4-LABEL: define {{[^@]+}}@.omp_task_entry..23
	// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.22 noalias [[TMP1:%.*]]) #[[ATTR4]] {			// CHECK4-SAME: (i32 [[TMP0:%.]], %struct.kmp_task_t_with_privates.22 noalias [[TMP1:%.*]]) #[[ATTR3]] {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTGLOBAL_TID__ADDR_I:%.*]] = alloca i32, align 4
	// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8			// CHECK4-NEXT: [[DOTPART_ID__ADDR_I:%.]] = alloca i32, align 8
	// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTPRIVATES__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8			// CHECK4-NEXT: [[DOTCOPY_FN__ADDR_I:%.]] = alloca void (i8, ...)*, align 8
	// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8			// CHECK4-NEXT: [[DOTTASK_T__ADDR_I:%.]] = alloca i8, align 8
	// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.21, align 8			// CHECK4-NEXT: [[__CONTEXT_ADDR_I:%.]] = alloca %struct.anon.21, align 8
	// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4			// CHECK4-NEXT: [[DOTADDR:%.*]] = alloca i32, align 4
	Show All 22 Lines
	// CHECK4-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_21:%.]], %struct.anon.21* [[TMP10]], i32 0, i32 0			// CHECK4-NEXT: [[TMP11:%.]] = getelementptr inbounds [[STRUCT_ANON_21:%.]], %struct.anon.21* [[TMP10]], i32 0, i32 0
	// CHECK4-NEXT: [[TMP12:%.]] = load %struct.S1, %struct.S1** [[TMP11]], align 8			// CHECK4-NEXT: [[TMP12:%.]] = load %struct.S1, %struct.S1** [[TMP11]], align 8
	// CHECK4-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP12]], i32 0, i32 0			// CHECK4-NEXT: [[A_I:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP12]], i32 0, i32 0
	// CHECK4-NEXT: store i32 0, i32* [[A_I]], align 4			// CHECK4-NEXT: store i32 0, i32* [[A_I]], align 4
	// CHECK4-NEXT: ret i32 0			// CHECK4-NEXT: ret i32 0
	//			//
	//			//
	// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_task_codegen.cpp			// CHECK4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_task_codegen.cpp
	// CHECK4-SAME: () #[[ATTR0]] section "__TEXT,__StaticInit,regular,pure_instructions" {			// CHECK4-SAME: () #[[ATTR7]] section "__TEXT,__StaticInit,regular,pure_instructions" {
	// CHECK4-NEXT: entry:			// CHECK4-NEXT: entry:
	// CHECK4-NEXT: call void @__cxx_global_var_init()			// CHECK4-NEXT: call void @__cxx_global_var_init()
	// CHECK4-NEXT: ret void			// CHECK4-NEXT: ret void
	//			//
	//			//
	// CHECK5-LABEL: define {{[^@]+}}@main			// CHECK5-LABEL: define {{[^@]+}}@main
	// CHECK5-SAME: () #[[ATTR0:[0-9]+]] {			// CHECK5-SAME: () #[[ATTR0:[0-9]+]] {
	// CHECK5-NEXT: entry:			// CHECK5-NEXT: entry:
	▲ Show 20 Lines • Show All 334 Lines • Show Last 20 Lines

clang/test/OpenMP/taskgroup_codegen.cpp

	// RUN: %clang_cc1 -verify -fopenmp -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s			// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py UTC_ARGS: --function-signature --include-generated-funcs --replace-value-regex "__omp_offloading_[0-9a-z]+_[0-9a-z]+" "reduction_size[.].+[.]" "pl_cond[.].+[.\|,]" --prefix-filecheck-ir-name _
				// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple x86_64-unknown-unknown -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefix=CHECK1
	// RUN: %clang_cc1 -fopenmp -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s			// RUN: %clang_cc1 -fopenmp -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s
	// RUN: %clang_cc1 -fopenmp -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck %s			// RUN: %clang_cc1 -fopenmp -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck %s --check-prefix=CHECK2
	// RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp -fexceptions -fcxx-exceptions -debug-info-kind=line-tables-only -x c++ -emit-llvm %s -o - \| FileCheck %s --check-prefix=TERM_DEBUG			// RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp -fexceptions -fcxx-exceptions -debug-info-kind=line-tables-only -x c++ -emit-llvm %s -o - \| FileCheck %s --check-prefix=DEBUG1

	// RUN: %clang_cc1 -verify -fopenmp-simd -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck --check-prefix SIMD-ONLY0 %s			// RUN: %clang_cc1 -verify -fopenmp-simd -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --implicit-check-not="{{__kmpc\|__tgt}}"
	// RUN: %clang_cc1 -fopenmp-simd -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s			// RUN: %clang_cc1 -fopenmp-simd -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s
	// RUN: %clang_cc1 -fopenmp-simd -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefix SIMD-ONLY0 %s			// RUN: %clang_cc1 -fopenmp-simd -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck %s --implicit-check-not="{{__kmpc\|__tgt}}"
	// RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp-simd -fexceptions -fcxx-exceptions -debug-info-kind=line-tables-only -x c++ -emit-llvm %s -o - \| FileCheck --check-prefix SIMD-ONLY0 %s			// RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp-simd -fexceptions -fcxx-exceptions -debug-info-kind=line-tables-only -x c++ -emit-llvm %s -o - \| FileCheck %s --implicit-check-not="{{__kmpc\|__tgt}}"
	// SIMD-ONLY0-NOT: {{__kmpc\|__tgt}}
	// expected-no-diagnostics			// expected-no-diagnostics
	#ifndef HEADER			#ifndef HEADER
	#define HEADER			#define HEADER

	// CHECK: [[IDENT_T_TY:%.+]] = type { i32, i32, i32, i32, i8* }

	// CHECK: define {{.*}}void [[FOO:@.+]]()

	void foo() { extern void mayThrow(); mayThrow(); }			void foo() { extern void mayThrow(); mayThrow(); }

	// CHECK-LABEL: @main
	// TERM_DEBUG-LABEL: @main
	int main() {			int main() {
	// CHECK: [[A_ADDR:%.+]] = alloca i8
	char a;			char a;

	// CHECK: [[GTID:%.+]] = call {{.}}i32 @__kmpc_global_thread_num([[IDENT_T_TY]] [[DEFAULT_LOC:@.+]])
	// CHECK: call {{.}}void @__kmpc_taskgroup([[IDENT_T_TY]] [[DEFAULT_LOC]], i32 [[GTID]])
	// CHECK-NEXT: store i8 2, i8* [[A_ADDR]]
	// CHECK-NEXT: call {{.}}void @__kmpc_end_taskgroup([[IDENT_T_TY]] [[DEFAULT_LOC]], i32 [[GTID]])
	#pragma omp taskgroup			#pragma omp taskgroup
	a = 2;			a = 2;
	// CHECK: call {{.}}void @__kmpc_taskgroup([[IDENT_T_TY]] [[DEFAULT_LOC]], i32 [[GTID]])
	// CHECK-NEXT: invoke {{.*}}void [[FOO]]()
	// CHECK: call {{.}}void @__kmpc_end_taskgroup([[IDENT_T_TY]] [[DEFAULT_LOC]], i32 [[GTID]])
	#pragma omp taskgroup			#pragma omp taskgroup
	foo();			foo();
	// CHECK-NOT: call {{.*}}void @__kmpc_taskgroup
	// CHECK-NOT: call {{.*}}void @__kmpc_end_taskgroup
	// CHECK: ret
	return a;			return a;
	}			}

	// CHECK-LABEL: parallel_taskgroup
	// TERM_DEBUG-LABEL: parallel_taskgroup
	void parallel_taskgroup() {			void parallel_taskgroup() {
	#pragma omp parallel			#pragma omp parallel
	#pragma omp taskgroup			#pragma omp taskgroup
	// TERM_DEBUG-NOT: __kmpc_global_thread_num
	// TERM_DEBUG: call void @__kmpc_taskgroup({{.+}}), !dbg [[DBG_LOC_START:![0-9]+]]
	// TERM_DEBUG: invoke void {{.}}foo{{.}}()
	// TERM_DEBUG: unwind label %[[TERM_LPAD:.+]],
	// TERM_DEBUG-NOT: __kmpc_global_thread_num
	// TERM_DEBUG: call void @__kmpc_end_taskgroup({{.+}}), !dbg [[DBG_LOC_END:![0-9]+]]
	// TERM_DEBUG: [[TERM_LPAD]]
	// TERM_DEBUG: call void @__clang_call_terminate
	// TERM_DEBUG: unreachable
	foo();			foo();
	}			}
	// TERM_DEBUG-DAG: [[DBG_LOC_START]] = !DILocation(line: [[@LINE-12]],
	// TERM_DEBUG-DAG: [[DBG_LOC_END]] = !DILocation(line: [[@LINE-3]],
	#endif			#endif
				// CHECK1-LABEL: define {{[^@]+}}@_Z3foov
				// CHECK1-SAME: () #[[ATTR0:[0-9]+]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: call void @_Z8mayThrowv()
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@main
				// CHECK1-SAME: () #[[ATTR2:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: [[A:%.*]] = alloca i8, align 1
				// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
				// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
				// CHECK1-NEXT: store i32 0, i32* [[RETVAL]], align 4
				// CHECK1-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK1-NEXT: store i8 2, i8* [[A]], align 1
				// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK1-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK1-NEXT: invoke void @_Z3foov()
				// CHECK1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
				// CHECK1: invoke.cont:
				// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8 [[A]], align 1
				// CHECK1-NEXT: [[CONV:%.*]] = sext i8 [[TMP1]] to i32
				// CHECK1-NEXT: ret i32 [[CONV]]
				// CHECK1: lpad:
				// CHECK1-NEXT: [[TMP2:%.]] = landingpad { i8, i32 }
				// CHECK1-NEXT: catch i8* null
				// CHECK1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP2]], 0
				// CHECK1-NEXT: store i8* [[TMP3]], i8** [[EXN_SLOT]], align 8
				// CHECK1-NEXT: [[TMP4:%.]] = extractvalue { i8, i32 } [[TMP2]], 1
				// CHECK1-NEXT: store i32 [[TMP4]], i32* [[EHSELECTOR_SLOT]], align 4
				// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK1-NEXT: br label [[TERMINATE_HANDLER:%.*]]
				// CHECK1: terminate.handler:
				// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
				// CHECK1-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR8:[0-9]+]]
				// CHECK1-NEXT: unreachable
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@__clang_call_terminate
				// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR5:[0-9]+]] comdat {
				// CHECK1-NEXT: [[TMP2:%.]] = call i8 @__cxa_begin_catch(i8* [[TMP0]]) #[[ATTR3:[0-9]+]]
				// CHECK1-NEXT: call void @_ZSt9terminatev() #[[ATTR8]]
				// CHECK1-NEXT: unreachable
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@_Z18parallel_taskgroupv
				// CHECK1-SAME: () #[[ATTR6:[0-9]+]] {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*))
				// CHECK1-NEXT: ret void
				//
				//
				// CHECK1-LABEL: define {{[^@]+}}@.omp_outlined.
				// CHECK1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]]) #[[ATTR7:[0-9]+]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
				// CHECK1-NEXT: entry:
				// CHECK1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
				// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
				// CHECK1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
				// CHECK1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
				// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32** [[DOTGLOBAL_TID__ADDR]], align 8
				// CHECK1-NEXT: [[TMP1:%.]] = load i32, i32 [[TMP0]], align 4
				// CHECK1-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
				// CHECK1-NEXT: invoke void @_Z3foov()
				// CHECK1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
				// CHECK1: invoke.cont:
				// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
				// CHECK1-NEXT: ret void
				// CHECK1: lpad:
				// CHECK1-NEXT: [[TMP2:%.]] = landingpad { i8, i32 }
				// CHECK1-NEXT: catch i8* null
				// CHECK1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP2]], 0
				// CHECK1-NEXT: store i8* [[TMP3]], i8** [[EXN_SLOT]], align 8
				// CHECK1-NEXT: [[TMP4:%.]] = extractvalue { i8, i32 } [[TMP2]], 1
				// CHECK1-NEXT: store i32 [[TMP4]], i32* [[EHSELECTOR_SLOT]], align 4
				// CHECK1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
				// CHECK1-NEXT: br label [[TERMINATE_HANDLER:%.*]]
				// CHECK1: terminate.handler:
				// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
				// CHECK1-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR8]]
				// CHECK1-NEXT: unreachable
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@_Z3foov
				// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: call void @_Z8mayThrowv()
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@main
				// CHECK2-SAME: () #[[ATTR2:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: [[A:%.*]] = alloca i8, align 1
				// CHECK2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
				// CHECK2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
				// CHECK2-NEXT: store i32 0, i32* [[RETVAL]], align 4
				// CHECK2-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK2-NEXT: store i8 2, i8* [[A]], align 1
				// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK2-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK2-NEXT: invoke void @_Z3foov()
				// CHECK2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
				// CHECK2: invoke.cont:
				// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8 [[A]], align 1
				// CHECK2-NEXT: [[CONV:%.*]] = sext i8 [[TMP1]] to i32
				// CHECK2-NEXT: ret i32 [[CONV]]
				// CHECK2: lpad:
				// CHECK2-NEXT: [[TMP2:%.]] = landingpad { i8, i32 }
				// CHECK2-NEXT: catch i8* null
				// CHECK2-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP2]], 0
				// CHECK2-NEXT: store i8* [[TMP3]], i8** [[EXN_SLOT]], align 8
				// CHECK2-NEXT: [[TMP4:%.]] = extractvalue { i8, i32 } [[TMP2]], 1
				// CHECK2-NEXT: store i32 [[TMP4]], i32* [[EHSELECTOR_SLOT]], align 4
				// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
				// CHECK2-NEXT: br label [[TERMINATE_HANDLER:%.*]]
				// CHECK2: terminate.handler:
				// CHECK2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
				// CHECK2-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR8:[0-9]+]]
				// CHECK2-NEXT: unreachable
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@__clang_call_terminate
				// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR5:[0-9]+]] comdat {
				// CHECK2-NEXT: [[TMP2:%.]] = call i8 @__cxa_begin_catch(i8* [[TMP0]]) #[[ATTR3:[0-9]+]]
				// CHECK2-NEXT: call void @_ZSt9terminatev() #[[ATTR8]]
				// CHECK2-NEXT: unreachable
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@_Z18parallel_taskgroupv
				// CHECK2-SAME: () #[[ATTR6:[0-9]+]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB1]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*))
				// CHECK2-NEXT: ret void
				//
				//
				// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined.
				// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]]) #[[ATTR7:[0-9]+]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK2-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
				// CHECK2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
				// CHECK2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
				// CHECK2-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
				// CHECK2-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
				// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32** [[DOTGLOBAL_TID__ADDR]], align 8
				// CHECK2-NEXT: [[TMP1:%.]] = load i32, i32 [[TMP0]], align 4
				// CHECK2-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
				// CHECK2-NEXT: invoke void @_Z3foov()
				// CHECK2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
				// CHECK2: invoke.cont:
				// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
				// CHECK2-NEXT: ret void
				// CHECK2: lpad:
				// CHECK2-NEXT: [[TMP2:%.]] = landingpad { i8, i32 }
				// CHECK2-NEXT: catch i8* null
				// CHECK2-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP2]], 0
				// CHECK2-NEXT: store i8* [[TMP3]], i8** [[EXN_SLOT]], align 8
				// CHECK2-NEXT: [[TMP4:%.]] = extractvalue { i8, i32 } [[TMP2]], 1
				// CHECK2-NEXT: store i32 [[TMP4]], i32* [[EHSELECTOR_SLOT]], align 4
				// CHECK2-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
				// CHECK2-NEXT: br label [[TERMINATE_HANDLER:%.*]]
				// CHECK2: terminate.handler:
				// CHECK2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
				// CHECK2-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR8]]
				// CHECK2-NEXT: unreachable
				//
				//
				// DEBUG1-LABEL: define {{[^@]+}}@_Z3foov
				// DEBUG1-SAME: () #[[ATTR0:[0-9]+]] !dbg [[DBG6:![0-9]+]] {
				// DEBUG1-NEXT: entry:
				// DEBUG1-NEXT: call void @_Z8mayThrowv(), !dbg [[DBG9:![0-9]+]]
				// DEBUG1-NEXT: ret void, !dbg [[DBG10:![0-9]+]]
				//
				//
				// DEBUG1-LABEL: define {{[^@]+}}@main
				// DEBUG1-SAME: () #[[ATTR2:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG11:![0-9]+]] {
				// DEBUG1-NEXT: entry:
				// DEBUG1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
				// DEBUG1-NEXT: [[A:%.*]] = alloca i8, align 1
				// DEBUG1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
				// DEBUG1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
				// DEBUG1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
				// DEBUG1-NEXT: store i32 0, i32* [[RETVAL]], align 4
				// DEBUG1-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]]), !dbg [[DBG12:![0-9]+]]
				// DEBUG1-NEXT: store i8 2, i8* [[A]], align 1, !dbg [[DBG13:![0-9]+]]
				// DEBUG1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]]), !dbg [[DBG14:![0-9]+]]
				// DEBUG1-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB3:[0-9]+]], i32 [[TMP0]]), !dbg [[DBG15:![0-9]+]]
				// DEBUG1-NEXT: invoke void @_Z3foov()
				// DEBUG1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG16:![0-9]+]]
				// DEBUG1: invoke.cont:
				// DEBUG1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]]), !dbg [[DBG16]]
				// DEBUG1-NEXT: [[TMP1:%.]] = load i8, i8 [[A]], align 1, !dbg [[DBG17:![0-9]+]]
				// DEBUG1-NEXT: [[CONV:%.*]] = sext i8 [[TMP1]] to i32, !dbg [[DBG17]]
				// DEBUG1-NEXT: ret i32 [[CONV]], !dbg [[DBG18:![0-9]+]]
				// DEBUG1: lpad:
				// DEBUG1-NEXT: [[TMP2:%.]] = landingpad { i8, i32 }
				// DEBUG1-NEXT: catch i8* null, !dbg [[DBG19:![0-9]+]]
				// DEBUG1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP2]], 0, !dbg [[DBG19]]
				// DEBUG1-NEXT: store i8* [[TMP3]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG19]]
				// DEBUG1-NEXT: [[TMP4:%.]] = extractvalue { i8, i32 } [[TMP2]], 1, !dbg [[DBG19]]
				// DEBUG1-NEXT: store i32 [[TMP4]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG19]]
				// DEBUG1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]]), !dbg [[DBG16]]
				// DEBUG1-NEXT: br label [[TERMINATE_HANDLER:%.*]], !dbg [[DBG16]]
				// DEBUG1: terminate.handler:
				// DEBUG1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG16]]
				// DEBUG1-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR8:[0-9]+]], !dbg [[DBG16]]
				// DEBUG1-NEXT: unreachable, !dbg [[DBG16]]
				//
				//
				// DEBUG1-LABEL: define {{[^@]+}}@__clang_call_terminate
				// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR5:[0-9]+]] {
				// DEBUG1-NEXT: [[TMP2:%.]] = call i8 @__cxa_begin_catch(i8* [[TMP0]]) #[[ATTR3:[0-9]+]]
				// DEBUG1-NEXT: call void @_ZSt9terminatev() #[[ATTR8]]
				// DEBUG1-NEXT: unreachable
				//
				//
				// DEBUG1-LABEL: define {{[^@]+}}@_Z18parallel_taskgroupv
				// DEBUG1-SAME: () #[[ATTR6:[0-9]+]] !dbg [[DBG20:![0-9]+]] {
				// DEBUG1-NEXT: entry:
				// DEBUG1-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB7:[0-9]+]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*)), !dbg [[DBG21:![0-9]+]]
				// DEBUG1-NEXT: ret void, !dbg [[DBG22:![0-9]+]]
				//
				//
				// DEBUG1-LABEL: define {{[^@]+}}@.omp_outlined.
				// DEBUG1-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.]]) #[[ATTR7:[0-9]+]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG23:![0-9]+]] {
				// DEBUG1-NEXT: entry:
				// DEBUG1-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
				// DEBUG1-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
				// DEBUG1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
				// DEBUG1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
				// DEBUG1-NEXT: store i32* [[DOTGLOBAL_TID_]], i32** [[DOTGLOBAL_TID__ADDR]], align 8
				// DEBUG1-NEXT: store i32* [[DOTBOUND_TID_]], i32** [[DOTBOUND_TID__ADDR]], align 8
				// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32** [[DOTGLOBAL_TID__ADDR]], align 8, !dbg [[DBG24:![0-9]+]]
				// DEBUG1-NEXT: [[TMP1:%.]] = load i32, i32 [[TMP0]], align 4, !dbg [[DBG24]]
				// DEBUG1-NEXT: call void @__kmpc_taskgroup(%struct.ident_t* @[[GLOB5:[0-9]+]], i32 [[TMP1]]), !dbg [[DBG24]]
				// DEBUG1-NEXT: invoke void @_Z3foov()
				// DEBUG1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG25:![0-9]+]]
				// DEBUG1: invoke.cont:
				// DEBUG1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB5]], i32 [[TMP1]]), !dbg [[DBG25]]
				// DEBUG1-NEXT: ret void, !dbg [[DBG26:![0-9]+]]
				// DEBUG1: lpad:
				// DEBUG1-NEXT: [[TMP2:%.]] = landingpad { i8, i32 }
				// DEBUG1-NEXT: catch i8* null, !dbg [[DBG27:![0-9]+]]
				// DEBUG1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP2]], 0, !dbg [[DBG27]]
				// DEBUG1-NEXT: store i8* [[TMP3]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG27]]
				// DEBUG1-NEXT: [[TMP4:%.]] = extractvalue { i8, i32 } [[TMP2]], 1, !dbg [[DBG27]]
				// DEBUG1-NEXT: store i32 [[TMP4]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG27]]
				// DEBUG1-NEXT: call void @__kmpc_end_taskgroup(%struct.ident_t* @[[GLOB5]], i32 [[TMP1]]), !dbg [[DBG25]]
				// DEBUG1-NEXT: br label [[TERMINATE_HANDLER:%.*]], !dbg [[DBG25]]
				// DEBUG1: terminate.handler:
				// DEBUG1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG25]]
				// DEBUG1-NEXT: call void @__clang_call_terminate(i8* [[EXN]]) #[[ATTR8]], !dbg [[DBG25]]
				// DEBUG1-NEXT: unreachable, !dbg [[DBG25]]
				//

clang/test/OpenMP/threadprivate_codegen.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

// RUN: %clang_cc1 -verify -fopenmp -fnoopenmp-use-tls -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=CHECK,OMP50		// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py UTC_ARGS: --function-signature --include-generated-funcs --replace-value-regex "__omp_offloading_[0-9a-z]+_[0-9a-z]+" "reduction_size[.].+[.]" "pl_cond[.].+[.\|,]" --prefix-filecheck-ir-name _
// RUN: %clang_cc1 -verify -fopenmp -fopenmp-version=45 -fnoopenmp-use-tls -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=CHECK,OMP45		// RUN: %clang_cc1 -verify -fopenmp -fnoopenmp-use-tls -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=CHECK1
		// RUN: %clang_cc1 -verify -fopenmp -fopenmp-version=45 -fnoopenmp-use-tls -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=CHECK2

// RUN: %clang_cc1 -verify -fopenmp-simd -fnoopenmp-use-tls -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck --check-prefix SIMD-ONLY0 %s		// RUN: %clang_cc1 -verify -fopenmp-simd -fnoopenmp-use-tls -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck --check-prefix SIMD1 %s
// RUN: %clang_cc1 -fopenmp-simd -fnoopenmp-use-tls -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s		// RUN: %clang_cc1 -fopenmp-simd -fnoopenmp-use-tls -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s
// RUN: %clang_cc1 -fopenmp-simd -fnoopenmp-use-tls -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefix SIMD-ONLY0 %s		// RUN: %clang_cc1 -fopenmp-simd -fnoopenmp-use-tls -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefix SIMD2 %s
// SIMD-ONLY0-NOT: {{__kmpc\|__tgt}}		// RUN: %clang_cc1 -verify -fopenmp -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=CHECK-TLS1
		// RUN: %clang_cc1 -verify -fopenmp -fopenmp-version=45 -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=CHECK-TLS2
// RUN: %clang_cc1 -verify -fopenmp -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=CHECK-TLS,OMP50-TLS
// RUN: %clang_cc1 -verify -fopenmp -fopenmp-version=45 -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck %s --check-prefixes=CHECK-TLS,OMP45-TLS
// RUN: %clang_cc1 -fopenmp -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s		// RUN: %clang_cc1 -fopenmp -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s
// RUN: %clang_cc1 -fopenmp -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=CHECK-TLS,OMP50-TLS %s		// RUN: %clang_cc1 -fopenmp -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=CHECK-TLS3 %s
// RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s		// RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s
// RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=CHECK-TLS,OMP45-TLS %s		// RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=CHECK-TLS4 %s

// RUN: %clang_cc1 -verify -fopenmp-simd -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck --check-prefix SIMD-ONLY1 %s		// RUN: %clang_cc1 -verify -fopenmp-simd -DBODY -triple x86_64-unknown-unknown -x c++ -emit-llvm %s -fexceptions -fcxx-exceptions -o - \| FileCheck --check-prefix SIMD3 %s
// RUN: %clang_cc1 -fopenmp-simd -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s		// RUN: %clang_cc1 -fopenmp-simd -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s
// RUN: %clang_cc1 -fopenmp-simd -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefix SIMD-ONLY1 %s		// RUN: %clang_cc1 -fopenmp-simd -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefix SIMD4 %s

// RUN: %clang_cc1 -fopenmp -fnoopenmp-use-tls -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s		// RUN: %clang_cc1 -fopenmp -fnoopenmp-use-tls -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s
// RUN: %clang_cc1 -fopenmp -fnoopenmp-use-tls -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=CHECK-DEBUG,OMP50-DEBUG %s		// RUN: %clang_cc1 -fopenmp -fnoopenmp-use-tls -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=DEBUG1 %s
// RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -fnoopenmp-use-tls -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s		// RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -fnoopenmp-use-tls -x c++ -std=c++11 -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -emit-pch -o %t %s
// RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -fnoopenmp-use-tls -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=CHECK-DEBUG,OMP45-DEBUG %s		// RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -fnoopenmp-use-tls -DBODY -x c++ -triple x86_64-unknown-unknown -fexceptions -fcxx-exceptions -debug-info-kind=limited -std=c++11 -include-pch %t -verify %s -emit-llvm -o - \| FileCheck --check-prefixes=DEBUG2 %s

// SIMD-ONLY1-NOT: {{__kmpc\|__tgt}}

// expected-no-diagnostics		// expected-no-diagnostics
//
#ifndef HEADER		#ifndef HEADER
#define HEADER		#define HEADER
// CHECK-DAG: [[IDENT:%.+]] = type { i32, i32, i32, i32, i8* }
// CHECK-DAG: [[S1:%.+]] = type { [[INT:i[0-9]+]] }
// CHECK-DAG: [[S2:%.+]] = type { [[INT]], double }
// CHECK-DAG: [[S3:%.+]] = type { [[INT]], float }
// CHECK-DAG: [[S4:%.+]] = type { [[INT]], [[INT]] }
// CHECK-DAG: [[S5:%.+]] = type { [[INT]], [[INT]], [[INT]] }
// CHECK-DAG: [[SMAIN:%.+]] = type { [[INT]], double, double }
// CHECK-DEBUG-DAG: [[IDENT:%.+]] = type { i32, i32, i32, i32, i8* }
// CHECK-DEBUG-DAG: [[S1:%.+]] = type { [[INT:i[0-9]+]] }
// CHECK-DEBUG-DAG: [[S2:%.+]] = type { [[INT]], double }
// CHECK-DEBUG-DAG: [[S3:%.+]] = type { [[INT]], float }
// CHECK-DEBUG-DAG: [[S4:%.+]] = type { [[INT]], [[INT]] }
// CHECK-DEBUG-DAG: [[S5:%.+]] = type { [[INT]], [[INT]], [[INT]] }
// CHECK-DEBUG-DAG: [[SMAIN:%.+]] = type { [[INT]], double, double }
// CHECK-TLS-DAG: [[S1:%.+]] = type { [[INT:i[0-9]+]] }
// CHECK-TLS-DAG: [[S2:%.+]] = type { [[INT]], double }
// CHECK-TLS-DAG: [[S3:%.+]] = type { [[INT]], float }
// CHECK-TLS-DAG: [[S4:%.+]] = type { [[INT]], [[INT]] }
// CHECK-TLS-DAG: [[S5:%.+]] = type { [[INT]], [[INT]], [[INT]] }
// CHECK-TLS-DAG: [[SMAIN:%.+]] = type { [[INT]], double, double }

struct S1 {		struct S1 {
int a;		int a;
S1()		S1()
: a(0) {		: a(0) {
}		}
S1(int a)		S1(int a)
: a(a) {		: a(a) {
}		}
▲ Show 20 Lines • Show All 533 Lines • ▼ Show 20 Lines	#pragma omp threadprivate(sm)
// CHECK-DEBUG-NEXT: [[ST_INT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* {{.}}, i32 {{.}}, i8* bitcast ([[INT]]* [[ST_INT_ST]] to i8), i{{.}} {{[0-9]+}}, i8***		// CHECK-DEBUG-NEXT: [[ST_INT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* {{.}}, i32 {{.}}, i8* bitcast ([[INT]]* [[ST_INT_ST]] to i8), i{{.}} {{[0-9]+}}, i8***


// CHECK-DEBUG-NEXT: [[ST_INT_ST_ADDR:%.]] = bitcast i8 [[ST_INT_ST_TEMP_ADDR]] to [[INT]]*		// CHECK-DEBUG-NEXT: [[ST_INT_ST_ADDR:%.]] = bitcast i8 [[ST_INT_ST_TEMP_ADDR]] to [[INT]]*
// CHECK-DEBUG-NEXT: [[ST_INT_ST_VAL:%.]] = load [[INT]], [[INT]] [[ST_INT_ST_ADDR]]		// CHECK-DEBUG-NEXT: [[ST_INT_ST_VAL:%.]] = load [[INT]], [[INT]] [[ST_INT_ST_ADDR]]
// CHECK-DEBUG-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]		// CHECK-DEBUG-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]
// CHECK-DEBUG-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[ST_INT_ST_VAL]]		// CHECK-DEBUG-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[ST_INT_ST_VAL]]
// CHECK-DEBUG-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]		// CHECK-DEBUG-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]
//
// CHECK-TLS: [[ST_INT_ST_VAL:%.]] = load i32, i32 [[ST_INT_ST_ADDR:[^,]+]]		// CHECK-TLS: [[ST_INT_ST_VAL:%.]] = load i32, i32 [[ST_INT_ST_ADDR:[^,]+]]
// CHECK-TLS-NEXT: [[RES:%.]] = load i32, i32 [[RES_ADDR]]		// CHECK-TLS-NEXT: [[RES:%.]] = load i32, i32 [[RES_ADDR]]
// CHECK-TLS-NEXT: [[ADD:%.]] = add {{.}} i32 [[RES]], [[ST_INT_ST_VAL]]		// CHECK-TLS-NEXT: [[ADD:%.]] = add {{.}} i32 [[RES]], [[ST_INT_ST_VAL]]
// CHECK-TLS-NEXT: store i32 [[ADD]], i32* [[RES_ADDR]]		// CHECK-TLS-NEXT: store i32 [[ADD]], i32* [[RES_ADDR]]
Res += ST<int>::st;		Res += ST<int>::st;
// CHECK: [[ST_FLOAT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* [[DEFAULT_LOC]], i32 {{.}}, i8 bitcast (float* [[ST_FLOAT_ST]] to i8), i{{.}} {{[0-9]+}}, i8*** [[ST_FLOAT_ST]].cache.)		// CHECK: [[ST_FLOAT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* [[DEFAULT_LOC]], i32 {{.}}, i8 bitcast (float* [[ST_FLOAT_ST]] to i8), i{{.}} {{[0-9]+}}, i8*** [[ST_FLOAT_ST]].cache.)
// CHECK-NEXT: [[ST_FLOAT_ST_ADDR:%.]] = bitcast i8 [[ST_FLOAT_ST_TEMP_ADDR]] to float*		// CHECK-NEXT: [[ST_FLOAT_ST_ADDR:%.]] = bitcast i8 [[ST_FLOAT_ST_TEMP_ADDR]] to float*
// CHECK-NEXT: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR]]		// CHECK-NEXT: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR]]
// CHECK-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]		// CHECK-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]
// CHECK-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]		// CHECK-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]
// CHECK-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]		// CHECK-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]
// CHECK-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]		// CHECK-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]
// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* {{.}}, i32 {{.}}, i8* bitcast (float* [[ST_FLOAT_ST]] to i8), i{{.}} {{[0-9]+}}, i8***		// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* {{.}}, i32 {{.}}, i8* bitcast (float* [[ST_FLOAT_ST]] to i8), i{{.}} {{[0-9]+}}, i8***


// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_ADDR:%.]] = bitcast i8 [[ST_FLOAT_ST_TEMP_ADDR]] to float*		// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_ADDR:%.]] = bitcast i8 [[ST_FLOAT_ST_TEMP_ADDR]] to float*
// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR]]		// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR]]
// CHECK-DEBUG-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]		// CHECK-DEBUG-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]
// CHECK-DEBUG-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]		// CHECK-DEBUG-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]
// CHECK-DEBUG-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]		// CHECK-DEBUG-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]
// CHECK-DEBUG-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]		// CHECK-DEBUG-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]
//
// CHECK-TLS: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR:[^,]+]]		// CHECK-TLS: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR:[^,]+]]
// CHECK-TLS-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to i32		// CHECK-TLS-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to i32
// CHECK-TLS-NEXT: [[RES:%.]] = load i32, i32 [[RES_ADDR]]		// CHECK-TLS-NEXT: [[RES:%.]] = load i32, i32 [[RES_ADDR]]
// CHECK-TLS-NEXT: [[ADD:%.]] = add {{.}} i32 [[RES]], [[FLOAT_TO_INT_CONV]]		// CHECK-TLS-NEXT: [[ADD:%.]] = add {{.}} i32 [[RES]], [[FLOAT_TO_INT_CONV]]
// CHECK-TLS-NEXT: store i32 [[ADD]], i32* [[RES_ADDR]]		// CHECK-TLS-NEXT: store i32 [[ADD]], i32* [[RES_ADDR]]
Res += static_cast<int>(ST<float>::st);		Res += static_cast<int>(ST<float>::st);
// CHECK: [[ST_S4_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* [[DEFAULT_LOC]], i32 {{.}}, i8 bitcast ([[S4]]* [[ST_S4_ST]] to i8), i{{.}} {{[0-9]+}}, i8*** [[ST_S4_ST]].cache.)		// CHECK: [[ST_S4_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* [[DEFAULT_LOC]], i32 {{.}}, i8 bitcast ([[S4]]* [[ST_S4_ST]] to i8), i{{.}} {{[0-9]+}}, i8*** [[ST_S4_ST]].cache.)
// CHECK-NEXT: [[ST_S4_ST_ADDR:%.]] = bitcast i8 [[ST_S4_ST_TEMP_ADDR]] to [[S4]]*		// CHECK-NEXT: [[ST_S4_ST_ADDR:%.]] = bitcast i8 [[ST_S4_ST_TEMP_ADDR]] to [[S4]]*
▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines
// CHECK-TLS: define {{.}} [[S5]] [[GS3_TLS_INITD]]		// CHECK-TLS: define {{.}} [[S5]] [[GS3_TLS_INITD]]
// CHECK-TLS: call void [[GS3_TLS_INIT:@[^,]+]]		// CHECK-TLS: call void [[GS3_TLS_INIT:@[^,]+]]
// CHECK-TLS: ret [[S5]]* [[GS3]]		// CHECK-TLS: ret [[S5]]* [[GS3]]
// CHECK-TLS: }		// CHECK-TLS: }
// CHECK-TLS: define {{.}} [2 x [3 x [[S1]]]] [[ARR_X_TLS_INITD]]		// CHECK-TLS: define {{.}} [2 x [3 x [[S1]]]] [[ARR_X_TLS_INITD]]
// CHECK-TLS: call void [[ARR_X_TLS_INIT]]		// CHECK-TLS: call void [[ARR_X_TLS_INIT]]
// CHECK-TLS: ret [2 x [3 x [[S1]]]]* [[ARR_X]]		// CHECK-TLS: ret [2 x [3 x [[S1]]]]* [[ARR_X]]
// CHECK-TLS: }		// CHECK-TLS: }
//
//
//
//
//
//
//
//
// CHECK-TLS: define {{.}} [[S4]] [[ST_S4_ST_TLS_INITD]] {{#[0-9]+}} comdat {		// CHECK-TLS: define {{.}} [[S4]] [[ST_S4_ST_TLS_INITD]] {{#[0-9]+}} comdat {
// CHECK-TLS: call void [[ST_S4_ST_TLS_INIT]]		// CHECK-TLS: call void [[ST_S4_ST_TLS_INIT]]
// CHECK-TLS: ret [[S4]]* [[ST_S4_ST]]		// CHECK-TLS: ret [[S4]]* [[ST_S4_ST]]
// CHECK-TLS: }		// CHECK-TLS: }

#endif		#endif
// OMP50-TLS: define {{.}}void [[SM_CTOR2]]([[SMAIN]] {{.}}, i32 {{.}})		// OMP50-TLS: define {{.}}void [[SM_CTOR2]]([[SMAIN]] {{.}}, i32 {{.}})
// OMP50-TLS: define {{.}}void [[SM_DTOR2]]([[SMAIN]] {{.*}})		// OMP50-TLS: define {{.}}void [[SM_DTOR2]]([[SMAIN]] {{.*}})
▲ Show 20 Lines • Show All 123 Lines • ▼ Show 20 Lines	int foobar() {
// CHECK-DEBUG-NEXT: [[ST_INT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* {{.}}, i32 {{.}}, i8* bitcast ([[INT]]* [[ST_INT_ST]] to i8), i{{.}} {{[0-9]+}}, i8***		// CHECK-DEBUG-NEXT: [[ST_INT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* {{.}}, i32 {{.}}, i8* bitcast ([[INT]]* [[ST_INT_ST]] to i8), i{{.}} {{[0-9]+}}, i8***


// CHECK-DEBUG-NEXT: [[ST_INT_ST_ADDR:%.]] = bitcast i8 [[ST_INT_ST_TEMP_ADDR]] to [[INT]]*		// CHECK-DEBUG-NEXT: [[ST_INT_ST_ADDR:%.]] = bitcast i8 [[ST_INT_ST_TEMP_ADDR]] to [[INT]]*
// CHECK-DEBUG-NEXT: [[ST_INT_ST_VAL:%.]] = load [[INT]], [[INT]] [[ST_INT_ST_ADDR]]		// CHECK-DEBUG-NEXT: [[ST_INT_ST_VAL:%.]] = load [[INT]], [[INT]] [[ST_INT_ST_ADDR]]
// CHECK-DEBUG-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]		// CHECK-DEBUG-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]
// CHECK-DEBUG-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[ST_INT_ST_VAL]]		// CHECK-DEBUG-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[ST_INT_ST_VAL]]
// CHECK-DEBUG-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]		// CHECK-DEBUG-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]
//
// OMP45-TLS: [[ST_INT_ST_VAL:%.]] = load [[INT]], [[INT]] [[ST_INT_ST_ADDR:[^,]+]]		// OMP45-TLS: [[ST_INT_ST_VAL:%.]] = load [[INT]], [[INT]] [[ST_INT_ST_ADDR:[^,]+]]
// OMP45-TLS-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]		// OMP45-TLS-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]
// OMP45-TLS-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[ST_INT_ST_VAL]]		// OMP45-TLS-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[ST_INT_ST_VAL]]
// OMP45-TLS-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]		// OMP45-TLS-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]
Res += ST<int>::st;		Res += ST<int>::st;
// CHECK: [[ST_FLOAT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* [[DEFAULT_LOC]], i32 {{.}}, i8 bitcast (float* [[ST_FLOAT_ST]] to i8), i{{.}} {{[0-9]+}}, i8*** [[ST_FLOAT_ST]].cache.)		// CHECK: [[ST_FLOAT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* [[DEFAULT_LOC]], i32 {{.}}, i8 bitcast (float* [[ST_FLOAT_ST]] to i8), i{{.}} {{[0-9]+}}, i8*** [[ST_FLOAT_ST]].cache.)
// CHECK-NEXT: [[ST_FLOAT_ST_ADDR:%.]] = bitcast i8 [[ST_FLOAT_ST_TEMP_ADDR]] to float*		// CHECK-NEXT: [[ST_FLOAT_ST_ADDR:%.]] = bitcast i8 [[ST_FLOAT_ST_TEMP_ADDR]] to float*
// CHECK-NEXT: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR]]		// CHECK-NEXT: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR]]
// CHECK-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]		// CHECK-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]
// CHECK-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]		// CHECK-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]
// CHECK-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]		// CHECK-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]
// CHECK-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]		// CHECK-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]
// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* {{.}}, i32 {{.}}, i8* bitcast (float* [[ST_FLOAT_ST]] to i8), i{{.}} {{[0-9]+}}, i8***		// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* {{.}}, i32 {{.}}, i8* bitcast (float* [[ST_FLOAT_ST]] to i8), i{{.}} {{[0-9]+}}, i8***


// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_ADDR:%.]] = bitcast i8 [[ST_FLOAT_ST_TEMP_ADDR]] to float*		// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_ADDR:%.]] = bitcast i8 [[ST_FLOAT_ST_TEMP_ADDR]] to float*
// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR]]		// CHECK-DEBUG-NEXT: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR]]
// CHECK-DEBUG-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]		// CHECK-DEBUG-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]
// CHECK-DEBUG-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]		// CHECK-DEBUG-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]
// CHECK-DEBUG-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]		// CHECK-DEBUG-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]
// CHECK-DEBUG-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]		// CHECK-DEBUG-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]
//
// OMP45-TLS: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR:[^,]+]]		// OMP45-TLS: [[ST_FLOAT_ST_VAL:%.]] = load float, float [[ST_FLOAT_ST_ADDR:[^,]+]]
// OMP45-TLS-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]		// OMP45-TLS-NEXT: [[FLOAT_TO_INT_CONV:%.*]] = fptosi float [[ST_FLOAT_ST_VAL]] to [[INT]]
// OMP45-TLS-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]		// OMP45-TLS-NEXT: [[RES:%.]] = load [[INT]], [[INT]] [[RES_ADDR]]
// OMP45-TLS-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]		// OMP45-TLS-NEXT: [[ADD:%.]] = add {{.}} [[INT]] [[RES]], [[FLOAT_TO_INT_CONV]]
// OMP45-TLS-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]		// OMP45-TLS-NEXT: store [[INT]] [[ADD]], [[INT]]* [[RES:.+]]
Res += static_cast<int>(ST<float>::st);		Res += static_cast<int>(ST<float>::st);
// CHECK: [[ST_S4_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* [[DEFAULT_LOC]], i32 {{.}}, i8 bitcast ([[S4]]* [[ST_S4_ST]] to i8), i{{.}} {{[0-9]+}}, i8*** [[ST_S4_ST]].cache.)		// CHECK: [[ST_S4_ST_TEMP_ADDR:%.]] = call {{.}}i8* @__kmpc_threadprivate_cached([[IDENT]]* [[DEFAULT_LOC]], i32 {{.}}, i8 bitcast ([[S4]]* [[ST_S4_ST]] to i8), i{{.}} {{[0-9]+}}, i8*** [[ST_S4_ST]].cache.)
// CHECK-NEXT: [[ST_S4_ST_ADDR:%.]] = bitcast i8 [[ST_S4_ST_TEMP_ADDR]] to [[S4]]*		// CHECK-NEXT: [[ST_S4_ST_ADDR:%.]] = bitcast i8 [[ST_S4_ST_TEMP_ADDR]] to [[S4]]*
▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
// CHECK-TLS: call void [[GS1_CXX_INIT]]		// CHECK-TLS: call void [[GS1_CXX_INIT]]
// CHECK-TLS-NOT: call void [[GS2_CXX_INIT]]		// CHECK-TLS-NOT: call void [[GS2_CXX_INIT]]
// CHECK-TLS: call void [[ARR_X_CXX_INIT]]		// CHECK-TLS: call void [[ARR_X_CXX_INIT]]
// CHECK-TLS-NOT: call void [[ST_S4_ST_CXX_INIT]]		// CHECK-TLS-NOT: call void [[ST_S4_ST_CXX_INIT]]
// CHECK-TLS: [[DONE_LABEL]]		// CHECK-TLS: [[DONE_LABEL]]

// CHECK-TLS-DAG: declare {{.*}} void [[GS3_TLS_INIT]]		// CHECK-TLS-DAG: declare {{.*}} void [[GS3_TLS_INIT]]
// CHECK-TLS-DAG: declare {{.*}} void [[STATIC_S_TLS_INIT]]		// CHECK-TLS-DAG: declare {{.*}} void [[STATIC_S_TLS_INIT]]
		// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.
		// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0:[0-9]+]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S1*
		// CHECK1-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[TMP2]], i32 5)
		// CHECK1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: ret i8* [[TMP3]]
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// CHECK1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK1-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.
		// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S1*
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR3:[0-9]+]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// CHECK1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_.
		// CHECK1-SAME: () #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
		// CHECK1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.)
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..1
		// CHECK1-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// CHECK1-NEXT: [[ARRAYINIT_ENDOFINIT2:%.]] = alloca %struct.S1, align 8
		// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: [[ARRAYINIT_ENDOFINIT9:%.]] = alloca %struct.S1, align 8
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x [3 x %struct.S1]]*
		// CHECK1-NEXT: [[ARRAYINIT_BEGIN:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP2]], i64 0, i64 0
		// CHECK1-NEXT: store [3 x %struct.S1]* [[ARRAYINIT_BEGIN]], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK1-NEXT: [[ARRAYINIT_BEGIN1:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 0, i64 0
		// CHECK1-NEXT: store %struct.S1* [[ARRAYINIT_BEGIN1]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_BEGIN1]], i32 1)
		// CHECK1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// CHECK1: invoke.cont:
		// CHECK1-NEXT: [[ARRAYINIT_ELEMENT:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[ARRAYINIT_BEGIN1]], i64 1
		// CHECK1-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT]], i32 2)
		// CHECK1-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]]
		// CHECK1: invoke.cont3:
		// CHECK1-NEXT: [[ARRAYINIT_ELEMENT4:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_ELEMENT]], i64 1
		// CHECK1-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT4]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT4]], i32 3)
		// CHECK1-NEXT: to label [[INVOKE_CONT5:%.*]] unwind label [[LPAD]]
		// CHECK1: invoke.cont5:
		// CHECK1-NEXT: [[ARRAYINIT_ELEMENT7:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 1
		// CHECK1-NEXT: store [3 x %struct.S1]* [[ARRAYINIT_ELEMENT7]], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK1-NEXT: [[ARRAYINIT_BEGIN8:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_ELEMENT7]], i64 0, i64 0
		// CHECK1-NEXT: store %struct.S1* [[ARRAYINIT_BEGIN8]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_BEGIN8]], i32 4)
		// CHECK1-NEXT: to label [[INVOKE_CONT11:%.]] unwind label [[LPAD10:%.]]
		// CHECK1: invoke.cont11:
		// CHECK1-NEXT: [[ARRAYINIT_ELEMENT12:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_BEGIN8]], i64 1
		// CHECK1-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT12]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT12]], i32 5)
		// CHECK1-NEXT: to label [[INVOKE_CONT13:%.*]] unwind label [[LPAD10]]
		// CHECK1: invoke.cont13:
		// CHECK1-NEXT: [[ARRAYINIT_ELEMENT14:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_ELEMENT12]], i64 1
		// CHECK1-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT14]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT14]], i32 6)
		// CHECK1-NEXT: to label [[INVOKE_CONT15:%.*]] unwind label [[LPAD10]]
		// CHECK1: invoke.cont15:
		// CHECK1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: ret i8* [[TMP3]]
		// CHECK1: lpad:
		// CHECK1-NEXT: [[TMP4:%.]] = landingpad { i8, i32 }
		// CHECK1-NEXT: cleanup
		// CHECK1-NEXT: [[TMP5:%.]] = extractvalue { i8, i32 } [[TMP4]], 0
		// CHECK1-NEXT: store i8* [[TMP5]], i8** [[EXN_SLOT]], align 8
		// CHECK1-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP4]], 1
		// CHECK1-NEXT: store i32 [[TMP6]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK1-NEXT: [[TMP7:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8
		// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 [[ARRAYINIT_BEGIN1]], [[TMP7]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE6:%.]], label [[ARRAYDESTROY_BODY:%.]]
		// CHECK1: arraydestroy.body:
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP7]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], [[ARRAYINIT_BEGIN1]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE6]], label [[ARRAYDESTROY_BODY]]
		// CHECK1: arraydestroy.done6:
		// CHECK1-NEXT: br label [[EHCLEANUP:%.*]]
		// CHECK1: lpad10:
		// CHECK1-NEXT: [[TMP8:%.]] = landingpad { i8, i32 }
		// CHECK1-NEXT: cleanup
		// CHECK1-NEXT: [[TMP9:%.]] = extractvalue { i8, i32 } [[TMP8]], 0
		// CHECK1-NEXT: store i8* [[TMP9]], i8** [[EXN_SLOT]], align 8
		// CHECK1-NEXT: [[TMP10:%.]] = extractvalue { i8, i32 } [[TMP8]], 1
		// CHECK1-NEXT: store i32 [[TMP10]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK1-NEXT: [[TMP11:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8
		// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 [[ARRAYINIT_BEGIN8]], [[TMP11]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]]
		// CHECK1: arraydestroy.body17:
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[TMP11]], [[LPAD10]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ]
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]]
		// CHECK1-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], [[ARRAYINIT_BEGIN8]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]]
		// CHECK1: arraydestroy.done21:
		// CHECK1-NEXT: br label [[EHCLEANUP]]
		// CHECK1: ehcleanup:
		// CHECK1-NEXT: [[TMP12:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK1-NEXT: [[PAD_ARRAYBEGIN:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 0, i64 0
		// CHECK1-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP12]], i64 0, i64 0
		// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY22:%.]] = icmp eq %struct.S1 [[PAD_ARRAYBEGIN]], [[PAD_ARRAYEND]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY22]], label [[ARRAYDESTROY_DONE27:%.]], label [[ARRAYDESTROY_BODY23:%.]]
		// CHECK1: arraydestroy.body23:
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST24:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT25:%.*]], [[ARRAYDESTROY_BODY23]] ]
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT25]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST24]], i64 -1
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT25]]) #[[ATTR3]]
		// CHECK1-NEXT: [[ARRAYDESTROY_DONE26:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT25]], [[PAD_ARRAYBEGIN]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE26]], label [[ARRAYDESTROY_DONE27]], label [[ARRAYDESTROY_BODY23]]
		// CHECK1: arraydestroy.done27:
		// CHECK1-NEXT: br label [[EH_RESUME:%.*]]
		// CHECK1: eh.resume:
		// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// CHECK1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// CHECK1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// CHECK1-NEXT: [[LPAD_VAL28:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// CHECK1-NEXT: resume { i8*, i32 } [[LPAD_VAL28]]
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..2
		// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %struct.S1*
		// CHECK1-NEXT: [[TMP2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[ARRAY_BEGIN]], i64 6
		// CHECK1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
		// CHECK1: arraydestroy.body:
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
		// CHECK1: arraydestroy.done1:
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_..3
		// CHECK1-SAME: () #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i8 (i8) @.__kmpc_global_ctor_..1, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..2)
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// CHECK1-SAME: () #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5)
		// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// CHECK1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// CHECK1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// CHECK1-NEXT: store i32 0, i32* [[A]], align 4
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.4
		// CHECK1-SAME: () #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27)
		// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// CHECK1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK1-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]])
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// CHECK1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// CHECK1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// CHECK1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// CHECK1-NEXT: store i32 0, i32* [[A]], align 8
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.5
		// CHECK1-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// CHECK1-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// CHECK1-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// CHECK1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// CHECK1: invoke.cont:
		// CHECK1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// CHECK1-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]]
		// CHECK1: invoke.cont2:
		// CHECK1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// CHECK1-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]]
		// CHECK1: invoke.cont3:
		// CHECK1-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// CHECK1-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]]
		// CHECK1: invoke.cont7:
		// CHECK1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// CHECK1-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]]
		// CHECK1: invoke.cont8:
		// CHECK1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// CHECK1-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]]
		// CHECK1: invoke.cont9:
		// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		// CHECK1: lpad:
		// CHECK1-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// CHECK1-NEXT: cleanup
		// CHECK1-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0
		// CHECK1-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8
		// CHECK1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1
		// CHECK1-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK1-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]]
		// CHECK1: arraydestroy.body:
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]]
		// CHECK1: arraydestroy.done4:
		// CHECK1-NEXT: br label [[EHCLEANUP:%.*]]
		// CHECK1: lpad6:
		// CHECK1-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// CHECK1-NEXT: cleanup
		// CHECK1-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0
		// CHECK1-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8
		// CHECK1-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1
		// CHECK1-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK1-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]]
		// CHECK1: arraydestroy.body11:
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ]
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR3]]
		// CHECK1-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0)
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]]
		// CHECK1: arraydestroy.done15:
		// CHECK1-NEXT: br label [[EHCLEANUP]]
		// CHECK1: ehcleanup:
		// CHECK1-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK1-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0
		// CHECK1-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]]
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]]
		// CHECK1: arraydestroy.body17:
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ]
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]]
		// CHECK1-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]]
		// CHECK1: arraydestroy.done21:
		// CHECK1-NEXT: br label [[EH_RESUME:%.*]]
		// CHECK1: eh.resume:
		// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// CHECK1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// CHECK1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// CHECK1-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// CHECK1-NEXT: resume { i8*, i32 } [[LPAD_VAL22]]
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
		// CHECK1: arraydestroy.body:
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
		// CHECK1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0)
		// CHECK1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
		// CHECK1: arraydestroy.done1:
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@main
		// CHECK1-SAME: () #[[ATTR4:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK1-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// CHECK1-NEXT: [[TMP1:%.]] = load atomic i8, i8 bitcast (i64* @_ZGVZ4mainE2sm to i8*) acquire, align 8
		// CHECK1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP1]], 0
		// CHECK1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !prof [[PROF2:![0-9]+]]
		// CHECK1: init.check:
		// CHECK1-NEXT: [[TMP2:%.]] = call i32 @__cxa_guard_acquire(i64 @_ZGVZ4mainE2sm) #[[ATTR3]]
		// CHECK1-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP2]], 0
		// CHECK1-NEXT: br i1 [[TOBOOL]], label [[INIT:%.*]], label [[INIT_END]]
		// CHECK1: init:
		// CHECK1-NEXT: [[TMP3:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 (i8) @.__kmpc_global_ctor_..6, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..7)
		// CHECK1-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.)
		// CHECK1-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*
		// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP6:%.]] = load i32, i32 [[A]], align 4
		// CHECK1-NEXT: invoke void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP6]])
		// CHECK1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// CHECK1: invoke.cont:
		// CHECK1-NEXT: [[TMP7:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK1-NEXT: call void @__cxa_guard_release(i64* @_ZGVZ4mainE2sm) #[[ATTR3]]
		// CHECK1-NEXT: br label [[INIT_END]]
		// CHECK1: init.end:
		// CHECK1-NEXT: [[TMP8:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S3* @_ZN6Static1sE to i8), i64 8, i8** @_ZN6Static1sE.cache.)
		// CHECK1-NEXT: [[TMP9:%.]] = bitcast i8 [[TMP8]] to %struct.S3*
		// CHECK1-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP9]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP10:%.]] = load i32, i32 [[A1]], align 4
		// CHECK1-NEXT: store i32 [[TMP10]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP11:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i64 24, i8** @_ZZ4mainE2sm.cache.)
		// CHECK1-NEXT: [[TMP12:%.]] = bitcast i8 [[TMP11]] to %struct.Smain*
		// CHECK1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[TMP12]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32 [[A2]], align 8
		// CHECK1-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]
		// CHECK1-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP15:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.)
		// CHECK1-NEXT: [[TMP16:%.]] = bitcast i8 [[TMP15]] to %struct.S1*
		// CHECK1-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[TMP16]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP17:%.]] = load i32, i32 [[A3]], align 4
		// CHECK1-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP18]], [[TMP17]]
		// CHECK1-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP19:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// CHECK1-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]
		// CHECK1-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP21:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S5* @gs3 to i8), i64 12, i8** @gs3.cache.)
		// CHECK1-NEXT: [[TMP22:%.]] = bitcast i8 [[TMP21]] to %struct.S5*
		// CHECK1-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP22]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP23:%.]] = load i32, i32 [[A6]], align 4
		// CHECK1-NEXT: [[TMP24:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP24]], [[TMP23]]
		// CHECK1-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP25:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i64 24, i8** @arr_x.cache.)
		// CHECK1-NEXT: [[TMP26:%.]] = bitcast i8 [[TMP25]] to [2 x [3 x %struct.S1]]*
		// CHECK1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP26]], i64 0, i64 1
		// CHECK1-NEXT: [[ARRAYIDX8:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1
		// CHECK1-NEXT: [[A9:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX8]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP27:%.]] = load i32, i32 [[A9]], align 4
		// CHECK1-NEXT: [[TMP28:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP28]], [[TMP27]]
		// CHECK1-NEXT: store i32 [[ADD10]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP29:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (i32* @_ZN2STIiE2stE to i8), i64 4, i8** @_ZN2STIiE2stE.cache.)
		// CHECK1-NEXT: [[TMP30:%.]] = bitcast i8 [[TMP29]] to i32*
		// CHECK1-NEXT: [[TMP31:%.]] = load i32, i32 [[TMP30]], align 4
		// CHECK1-NEXT: [[TMP32:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP32]], [[TMP31]]
		// CHECK1-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP33:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (float* @_ZN2STIfE2stE to i8), i64 4, i8** @_ZN2STIfE2stE.cache.)
		// CHECK1-NEXT: [[TMP34:%.]] = bitcast i8 [[TMP33]] to float*
		// CHECK1-NEXT: [[TMP35:%.]] = load float, float [[TMP34]], align 4
		// CHECK1-NEXT: [[CONV:%.*]] = fptosi float [[TMP35]] to i32
		// CHECK1-NEXT: [[TMP36:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD12:%.*]] = add nsw i32 [[TMP36]], [[CONV]]
		// CHECK1-NEXT: store i32 [[ADD12]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP37:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i64 8, i8** @_ZN2STI2S4E2stE.cache.)
		// CHECK1-NEXT: [[TMP38:%.]] = bitcast i8 [[TMP37]] to %struct.S4*
		// CHECK1-NEXT: [[A13:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP38]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP39:%.]] = load i32, i32 [[A13]], align 4
		// CHECK1-NEXT: [[TMP40:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD14:%.*]] = add nsw i32 [[TMP40]], [[TMP39]]
		// CHECK1-NEXT: store i32 [[ADD14]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP41:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: ret i32 [[TMP41]]
		// CHECK1: lpad:
		// CHECK1-NEXT: [[TMP42:%.]] = landingpad { i8, i32 }
		// CHECK1-NEXT: cleanup
		// CHECK1-NEXT: [[TMP43:%.]] = extractvalue { i8, i32 } [[TMP42]], 0
		// CHECK1-NEXT: store i8* [[TMP43]], i8** [[EXN_SLOT]], align 8
		// CHECK1-NEXT: [[TMP44:%.]] = extractvalue { i8, i32 } [[TMP42]], 1
		// CHECK1-NEXT: store i32 [[TMP44]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK1-NEXT: call void @__cxa_guard_abort(i64* @_ZGVZ4mainE2sm) #[[ATTR3]]
		// CHECK1-NEXT: br label [[EH_RESUME:%.*]]
		// CHECK1: eh.resume:
		// CHECK1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// CHECK1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// CHECK1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// CHECK1-NEXT: [[LPAD_VAL15:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// CHECK1-NEXT: resume { i8*, i32 } [[LPAD_VAL15]]
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..6
		// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: [[TMP1:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to %struct.Smain*
		// CHECK1-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.)
		// CHECK1-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*
		// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP6:%.]] = load i32, i32 [[A]], align 4
		// CHECK1-NEXT: call void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) [[TMP3]], i32 [[TMP6]])
		// CHECK1-NEXT: [[TMP7:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: ret i8* [[TMP7]]
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// CHECK1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK1-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]])
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..7
		// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.Smain*
		// CHECK1-NEXT: call void @_ZZ4mainEN5SmainD1Ev(%struct.Smain* nonnull dereferenceable(24) [[TMP2]]) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// CHECK1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// CHECK1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// CHECK1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// CHECK1-NEXT: store i32 0, i32* [[A]], align 8
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_Z6foobarv
		// CHECK1-SAME: () #[[ATTR5:[0-9]+]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK1-NEXT: [[TMP1:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S3* @_ZN6Static1sE to i8), i64 8, i8** @_ZN6Static1sE.cache.)
		// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S3*
		// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP2]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP3:%.]] = load i32, i32 [[A]], align 4
		// CHECK1-NEXT: store i32 [[TMP3]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.)
		// CHECK1-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*
		// CHECK1-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP6:%.]] = load i32, i32 [[A1]], align 4
		// CHECK1-NEXT: [[TMP7:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP7]], [[TMP6]]
		// CHECK1-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP8:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// CHECK1-NEXT: [[TMP9:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP9]], [[TMP8]]
		// CHECK1-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP10:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S5* @gs3 to i8), i64 12, i8** @gs3.cache.)
		// CHECK1-NEXT: [[TMP11:%.]] = bitcast i8 [[TMP10]] to %struct.S5*
		// CHECK1-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP11]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP12:%.]] = load i32, i32 [[A3]], align 4
		// CHECK1-NEXT: [[TMP13:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP13]], [[TMP12]]
		// CHECK1-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP14:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i64 24, i8** @arr_x.cache.)
		// CHECK1-NEXT: [[TMP15:%.]] = bitcast i8 [[TMP14]] to [2 x [3 x %struct.S1]]*
		// CHECK1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP15]], i64 0, i64 1
		// CHECK1-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1
		// CHECK1-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX5]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP16:%.]] = load i32, i32 [[A6]], align 4
		// CHECK1-NEXT: [[TMP17:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP17]], [[TMP16]]
		// CHECK1-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP18:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (i32* @_ZN2STIiE2stE to i8), i64 4, i8** @_ZN2STIiE2stE.cache.)
		// CHECK1-NEXT: [[TMP19:%.]] = bitcast i8 [[TMP18]] to i32*
		// CHECK1-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4
		// CHECK1-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD8:%.*]] = add nsw i32 [[TMP21]], [[TMP20]]
		// CHECK1-NEXT: store i32 [[ADD8]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP22:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (float* @_ZN2STIfE2stE to i8), i64 4, i8** @_ZN2STIfE2stE.cache.)
		// CHECK1-NEXT: [[TMP23:%.]] = bitcast i8 [[TMP22]] to float*
		// CHECK1-NEXT: [[TMP24:%.]] = load float, float [[TMP23]], align 4
		// CHECK1-NEXT: [[CONV:%.*]] = fptosi float [[TMP24]] to i32
		// CHECK1-NEXT: [[TMP25:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP25]], [[CONV]]
		// CHECK1-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP26:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i64 8, i8** @_ZN2STI2S4E2stE.cache.)
		// CHECK1-NEXT: [[TMP27:%.]] = bitcast i8 [[TMP26]] to %struct.S4*
		// CHECK1-NEXT: [[A10:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP27]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP28:%.]] = load i32, i32 [[A10]], align 4
		// CHECK1-NEXT: [[TMP29:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP29]], [[TMP28]]
		// CHECK1-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4
		// CHECK1-NEXT: [[TMP30:%.]] = load i32, i32 [[RES]], align 4
		// CHECK1-NEXT: ret i32 [[TMP30]]
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@__cxx_global_var_init.8
		// CHECK1-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// CHECK1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// CHECK1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]]
		// CHECK1: init.check:
		// CHECK1-NEXT: [[TMP1:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 (i8) @.__kmpc_global_ctor_..9, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..10)
		// CHECK1-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23)
		// CHECK1-NEXT: [[TMP2:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK1-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// CHECK1-NEXT: br label [[INIT_END]]
		// CHECK1: init.end:
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..9
		// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S4*
		// CHECK1-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) [[TMP2]], i32 23)
		// CHECK1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: ret i8* [[TMP3]]
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// CHECK1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK1-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]])
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..10
		// CHECK1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S4*
		// CHECK1-NEXT: call void @_ZN2S4D1Ev(%struct.S4* nonnull dereferenceable(8) [[TMP2]]) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// CHECK1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR3]]
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// CHECK1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// CHECK1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// CHECK1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// CHECK1-NEXT: store i32 0, i32* [[A]], align 4
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// CHECK1-SAME: () #[[ATTR0]] {
		// CHECK1-NEXT: entry:
		// CHECK1-NEXT: call void @__cxx_global_var_init()
		// CHECK1-NEXT: call void @.__omp_threadprivate_init_.()
		// CHECK1-NEXT: call void @__cxx_global_var_init.4()
		// CHECK1-NEXT: call void @__cxx_global_var_init.5()
		// CHECK1-NEXT: call void @.__omp_threadprivate_init_..3()
		// CHECK1-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// CHECK2-SAME: () #[[ATTR0:[0-9]+]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5)
		// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// CHECK2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK2-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// CHECK2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.
		// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S1*
		// CHECK2-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[TMP2]], i32 5)
		// CHECK2-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: ret i8* [[TMP3]]
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.
		// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S1*
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_.
		// CHECK2-SAME: () #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]])
		// CHECK2-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.)
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// CHECK2-SAME: () #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27)
		// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// CHECK2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK2-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]])
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// CHECK2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// CHECK2-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// CHECK2-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// CHECK2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// CHECK2-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// CHECK2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// CHECK2: invoke.cont:
		// CHECK2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// CHECK2-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]]
		// CHECK2: invoke.cont2:
		// CHECK2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// CHECK2-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]]
		// CHECK2: invoke.cont3:
		// CHECK2-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// CHECK2-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]]
		// CHECK2: invoke.cont7:
		// CHECK2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// CHECK2-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]]
		// CHECK2: invoke.cont8:
		// CHECK2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// CHECK2-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]]
		// CHECK2: invoke.cont9:
		// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		// CHECK2: lpad:
		// CHECK2-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// CHECK2-NEXT: cleanup
		// CHECK2-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0
		// CHECK2-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8
		// CHECK2-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1
		// CHECK2-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK2-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK2-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]]
		// CHECK2: arraydestroy.body:
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]]
		// CHECK2: arraydestroy.done4:
		// CHECK2-NEXT: br label [[EHCLEANUP:%.*]]
		// CHECK2: lpad6:
		// CHECK2-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// CHECK2-NEXT: cleanup
		// CHECK2-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0
		// CHECK2-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8
		// CHECK2-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1
		// CHECK2-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK2-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK2-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]]
		// CHECK2: arraydestroy.body11:
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ]
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR3]]
		// CHECK2-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0)
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]]
		// CHECK2: arraydestroy.done15:
		// CHECK2-NEXT: br label [[EHCLEANUP]]
		// CHECK2: ehcleanup:
		// CHECK2-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK2-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0
		// CHECK2-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]]
		// CHECK2: arraydestroy.body17:
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ]
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]]
		// CHECK2-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]]
		// CHECK2: arraydestroy.done21:
		// CHECK2-NEXT: br label [[EH_RESUME:%.*]]
		// CHECK2: eh.resume:
		// CHECK2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// CHECK2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// CHECK2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// CHECK2-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// CHECK2-NEXT: resume { i8*, i32 } [[LPAD_VAL22]]
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
		// CHECK2: arraydestroy.body:
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0)
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
		// CHECK2: arraydestroy.done1:
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..3
		// CHECK2-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// CHECK2-NEXT: [[ARRAYINIT_ENDOFINIT2:%.]] = alloca %struct.S1, align 8
		// CHECK2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: [[ARRAYINIT_ENDOFINIT9:%.]] = alloca %struct.S1, align 8
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x [3 x %struct.S1]]*
		// CHECK2-NEXT: [[ARRAYINIT_BEGIN:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP2]], i64 0, i64 0
		// CHECK2-NEXT: store [3 x %struct.S1]* [[ARRAYINIT_BEGIN]], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK2-NEXT: [[ARRAYINIT_BEGIN1:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 0, i64 0
		// CHECK2-NEXT: store %struct.S1* [[ARRAYINIT_BEGIN1]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_BEGIN1]], i32 1)
		// CHECK2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// CHECK2: invoke.cont:
		// CHECK2-NEXT: [[ARRAYINIT_ELEMENT:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[ARRAYINIT_BEGIN1]], i64 1
		// CHECK2-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT]], i32 2)
		// CHECK2-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]]
		// CHECK2: invoke.cont3:
		// CHECK2-NEXT: [[ARRAYINIT_ELEMENT4:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_ELEMENT]], i64 1
		// CHECK2-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT4]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT4]], i32 3)
		// CHECK2-NEXT: to label [[INVOKE_CONT5:%.*]] unwind label [[LPAD]]
		// CHECK2: invoke.cont5:
		// CHECK2-NEXT: [[ARRAYINIT_ELEMENT7:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 1
		// CHECK2-NEXT: store [3 x %struct.S1]* [[ARRAYINIT_ELEMENT7]], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK2-NEXT: [[ARRAYINIT_BEGIN8:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_ELEMENT7]], i64 0, i64 0
		// CHECK2-NEXT: store %struct.S1* [[ARRAYINIT_BEGIN8]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_BEGIN8]], i32 4)
		// CHECK2-NEXT: to label [[INVOKE_CONT11:%.]] unwind label [[LPAD10:%.]]
		// CHECK2: invoke.cont11:
		// CHECK2-NEXT: [[ARRAYINIT_ELEMENT12:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_BEGIN8]], i64 1
		// CHECK2-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT12]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT12]], i32 5)
		// CHECK2-NEXT: to label [[INVOKE_CONT13:%.*]] unwind label [[LPAD10]]
		// CHECK2: invoke.cont13:
		// CHECK2-NEXT: [[ARRAYINIT_ELEMENT14:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_ELEMENT12]], i64 1
		// CHECK2-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT14]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8
		// CHECK2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT14]], i32 6)
		// CHECK2-NEXT: to label [[INVOKE_CONT15:%.*]] unwind label [[LPAD10]]
		// CHECK2: invoke.cont15:
		// CHECK2-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: ret i8* [[TMP3]]
		// CHECK2: lpad:
		// CHECK2-NEXT: [[TMP4:%.]] = landingpad { i8, i32 }
		// CHECK2-NEXT: cleanup
		// CHECK2-NEXT: [[TMP5:%.]] = extractvalue { i8, i32 } [[TMP4]], 0
		// CHECK2-NEXT: store i8* [[TMP5]], i8** [[EXN_SLOT]], align 8
		// CHECK2-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP4]], 1
		// CHECK2-NEXT: store i32 [[TMP6]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK2-NEXT: [[TMP7:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8
		// CHECK2-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 [[ARRAYINIT_BEGIN1]], [[TMP7]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE6:%.]], label [[ARRAYDESTROY_BODY:%.]]
		// CHECK2: arraydestroy.body:
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP7]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], [[ARRAYINIT_BEGIN1]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE6]], label [[ARRAYDESTROY_BODY]]
		// CHECK2: arraydestroy.done6:
		// CHECK2-NEXT: br label [[EHCLEANUP:%.*]]
		// CHECK2: lpad10:
		// CHECK2-NEXT: [[TMP8:%.]] = landingpad { i8, i32 }
		// CHECK2-NEXT: cleanup
		// CHECK2-NEXT: [[TMP9:%.]] = extractvalue { i8, i32 } [[TMP8]], 0
		// CHECK2-NEXT: store i8* [[TMP9]], i8** [[EXN_SLOT]], align 8
		// CHECK2-NEXT: [[TMP10:%.]] = extractvalue { i8, i32 } [[TMP8]], 1
		// CHECK2-NEXT: store i32 [[TMP10]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK2-NEXT: [[TMP11:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8
		// CHECK2-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 [[ARRAYINIT_BEGIN8]], [[TMP11]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]]
		// CHECK2: arraydestroy.body17:
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[TMP11]], [[LPAD10]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ]
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]]
		// CHECK2-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], [[ARRAYINIT_BEGIN8]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]]
		// CHECK2: arraydestroy.done21:
		// CHECK2-NEXT: br label [[EHCLEANUP]]
		// CHECK2: ehcleanup:
		// CHECK2-NEXT: [[TMP12:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK2-NEXT: [[PAD_ARRAYBEGIN:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 0, i64 0
		// CHECK2-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP12]], i64 0, i64 0
		// CHECK2-NEXT: [[ARRAYDESTROY_ISEMPTY22:%.]] = icmp eq %struct.S1 [[PAD_ARRAYBEGIN]], [[PAD_ARRAYEND]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY22]], label [[ARRAYDESTROY_DONE27:%.]], label [[ARRAYDESTROY_BODY23:%.]]
		// CHECK2: arraydestroy.body23:
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST24:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT25:%.*]], [[ARRAYDESTROY_BODY23]] ]
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT25]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST24]], i64 -1
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT25]]) #[[ATTR3]]
		// CHECK2-NEXT: [[ARRAYDESTROY_DONE26:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT25]], [[PAD_ARRAYBEGIN]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE26]], label [[ARRAYDESTROY_DONE27]], label [[ARRAYDESTROY_BODY23]]
		// CHECK2: arraydestroy.done27:
		// CHECK2-NEXT: br label [[EH_RESUME:%.*]]
		// CHECK2: eh.resume:
		// CHECK2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// CHECK2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// CHECK2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// CHECK2-NEXT: [[LPAD_VAL28:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// CHECK2-NEXT: resume { i8*, i32 } [[LPAD_VAL28]]
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..4
		// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %struct.S1*
		// CHECK2-NEXT: [[TMP2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[ARRAY_BEGIN]], i64 6
		// CHECK2-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
		// CHECK2: arraydestroy.body:
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
		// CHECK2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]]
		// CHECK2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
		// CHECK2: arraydestroy.done1:
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_..5
		// CHECK2-SAME: () #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK2-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i8 (i8) @.__kmpc_global_ctor_..3, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..4)
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@main
		// CHECK2-SAME: () #[[ATTR4:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK2-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// CHECK2-NEXT: [[TMP1:%.]] = load atomic i8, i8 bitcast (i64* @_ZGVZ4mainE2sm to i8*) acquire, align 8
		// CHECK2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP1]], 0
		// CHECK2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !prof [[PROF2:![0-9]+]]
		// CHECK2: init.check:
		// CHECK2-NEXT: [[TMP2:%.]] = call i32 @__cxa_guard_acquire(i64 @_ZGVZ4mainE2sm) #[[ATTR3]]
		// CHECK2-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP2]], 0
		// CHECK2-NEXT: br i1 [[TOBOOL]], label [[INIT:%.*]], label [[INIT_END]]
		// CHECK2: init:
		// CHECK2-NEXT: [[TMP3:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK2-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 (i8) @.__kmpc_global_ctor_..6, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..7)
		// CHECK2-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.)
		// CHECK2-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*
		// CHECK2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP6:%.]] = load i32, i32 [[A]], align 4
		// CHECK2-NEXT: invoke void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP6]])
		// CHECK2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// CHECK2: invoke.cont:
		// CHECK2-NEXT: [[TMP7:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK2-NEXT: call void @__cxa_guard_release(i64* @_ZGVZ4mainE2sm) #[[ATTR3]]
		// CHECK2-NEXT: br label [[INIT_END]]
		// CHECK2: init.end:
		// CHECK2-NEXT: [[TMP8:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S3* @_ZN6Static1sE to i8), i64 8, i8** @_ZN6Static1sE.cache.)
		// CHECK2-NEXT: [[TMP9:%.]] = bitcast i8 [[TMP8]] to %struct.S3*
		// CHECK2-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP9]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP10:%.]] = load i32, i32 [[A1]], align 4
		// CHECK2-NEXT: store i32 [[TMP10]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP11:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i64 24, i8** @_ZZ4mainE2sm.cache.)
		// CHECK2-NEXT: [[TMP12:%.]] = bitcast i8 [[TMP11]] to %struct.Smain*
		// CHECK2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[TMP12]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP13:%.]] = load i32, i32 [[A2]], align 8
		// CHECK2-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]
		// CHECK2-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP15:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.)
		// CHECK2-NEXT: [[TMP16:%.]] = bitcast i8 [[TMP15]] to %struct.S1*
		// CHECK2-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[TMP16]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP17:%.]] = load i32, i32 [[A3]], align 4
		// CHECK2-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP18]], [[TMP17]]
		// CHECK2-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP19:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// CHECK2-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]
		// CHECK2-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP21:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S5* @gs3 to i8), i64 12, i8** @gs3.cache.)
		// CHECK2-NEXT: [[TMP22:%.]] = bitcast i8 [[TMP21]] to %struct.S5*
		// CHECK2-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP22]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP23:%.]] = load i32, i32 [[A6]], align 4
		// CHECK2-NEXT: [[TMP24:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP24]], [[TMP23]]
		// CHECK2-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP25:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i64 24, i8** @arr_x.cache.)
		// CHECK2-NEXT: [[TMP26:%.]] = bitcast i8 [[TMP25]] to [2 x [3 x %struct.S1]]*
		// CHECK2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP26]], i64 0, i64 1
		// CHECK2-NEXT: [[ARRAYIDX8:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1
		// CHECK2-NEXT: [[A9:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX8]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP27:%.]] = load i32, i32 [[A9]], align 4
		// CHECK2-NEXT: [[TMP28:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP28]], [[TMP27]]
		// CHECK2-NEXT: store i32 [[ADD10]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP29:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (i32* @_ZN2STIiE2stE to i8), i64 4, i8** @_ZN2STIiE2stE.cache.)
		// CHECK2-NEXT: [[TMP30:%.]] = bitcast i8 [[TMP29]] to i32*
		// CHECK2-NEXT: [[TMP31:%.]] = load i32, i32 [[TMP30]], align 4
		// CHECK2-NEXT: [[TMP32:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP32]], [[TMP31]]
		// CHECK2-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP33:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (float* @_ZN2STIfE2stE to i8), i64 4, i8** @_ZN2STIfE2stE.cache.)
		// CHECK2-NEXT: [[TMP34:%.]] = bitcast i8 [[TMP33]] to float*
		// CHECK2-NEXT: [[TMP35:%.]] = load float, float [[TMP34]], align 4
		// CHECK2-NEXT: [[CONV:%.*]] = fptosi float [[TMP35]] to i32
		// CHECK2-NEXT: [[TMP36:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD12:%.*]] = add nsw i32 [[TMP36]], [[CONV]]
		// CHECK2-NEXT: store i32 [[ADD12]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP37:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i64 8, i8** @_ZN2STI2S4E2stE.cache.)
		// CHECK2-NEXT: [[TMP38:%.]] = bitcast i8 [[TMP37]] to %struct.S4*
		// CHECK2-NEXT: [[A13:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP38]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP39:%.]] = load i32, i32 [[A13]], align 4
		// CHECK2-NEXT: [[TMP40:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD14:%.*]] = add nsw i32 [[TMP40]], [[TMP39]]
		// CHECK2-NEXT: store i32 [[ADD14]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP41:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: ret i32 [[TMP41]]
		// CHECK2: lpad:
		// CHECK2-NEXT: [[TMP42:%.]] = landingpad { i8, i32 }
		// CHECK2-NEXT: cleanup
		// CHECK2-NEXT: [[TMP43:%.]] = extractvalue { i8, i32 } [[TMP42]], 0
		// CHECK2-NEXT: store i8* [[TMP43]], i8** [[EXN_SLOT]], align 8
		// CHECK2-NEXT: [[TMP44:%.]] = extractvalue { i8, i32 } [[TMP42]], 1
		// CHECK2-NEXT: store i32 [[TMP44]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK2-NEXT: call void @__cxa_guard_abort(i64* @_ZGVZ4mainE2sm) #[[ATTR3]]
		// CHECK2-NEXT: br label [[EH_RESUME:%.*]]
		// CHECK2: eh.resume:
		// CHECK2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// CHECK2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// CHECK2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// CHECK2-NEXT: [[LPAD_VAL15:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// CHECK2-NEXT: resume { i8*, i32 } [[LPAD_VAL15]]
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..6
		// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: [[TMP1:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to %struct.Smain*
		// CHECK2-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.)
		// CHECK2-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*
		// CHECK2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP6:%.]] = load i32, i32 [[A]], align 4
		// CHECK2-NEXT: call void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) [[TMP3]], i32 [[TMP6]])
		// CHECK2-NEXT: [[TMP7:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: ret i8* [[TMP7]]
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// CHECK2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK2-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]])
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..7
		// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.Smain*
		// CHECK2-NEXT: call void @_ZZ4mainEN5SmainD1Ev(%struct.Smain* nonnull dereferenceable(24) [[TMP2]]) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// CHECK2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_Z6foobarv
		// CHECK2-SAME: () #[[ATTR5:[0-9]+]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK2-NEXT: [[TMP1:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S3* @_ZN6Static1sE to i8), i64 8, i8** @_ZN6Static1sE.cache.)
		// CHECK2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S3*
		// CHECK2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP2]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP3:%.]] = load i32, i32 [[A]], align 4
		// CHECK2-NEXT: store i32 [[TMP3]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.)
		// CHECK2-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*
		// CHECK2-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP6:%.]] = load i32, i32 [[A1]], align 4
		// CHECK2-NEXT: [[TMP7:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP7]], [[TMP6]]
		// CHECK2-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP8:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// CHECK2-NEXT: [[TMP9:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP9]], [[TMP8]]
		// CHECK2-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP10:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S5* @gs3 to i8), i64 12, i8** @gs3.cache.)
		// CHECK2-NEXT: [[TMP11:%.]] = bitcast i8 [[TMP10]] to %struct.S5*
		// CHECK2-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP11]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP12:%.]] = load i32, i32 [[A3]], align 4
		// CHECK2-NEXT: [[TMP13:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP13]], [[TMP12]]
		// CHECK2-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP14:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i64 24, i8** @arr_x.cache.)
		// CHECK2-NEXT: [[TMP15:%.]] = bitcast i8 [[TMP14]] to [2 x [3 x %struct.S1]]*
		// CHECK2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP15]], i64 0, i64 1
		// CHECK2-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1
		// CHECK2-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX5]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP16:%.]] = load i32, i32 [[A6]], align 4
		// CHECK2-NEXT: [[TMP17:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP17]], [[TMP16]]
		// CHECK2-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP18:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (i32* @_ZN2STIiE2stE to i8), i64 4, i8** @_ZN2STIiE2stE.cache.)
		// CHECK2-NEXT: [[TMP19:%.]] = bitcast i8 [[TMP18]] to i32*
		// CHECK2-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4
		// CHECK2-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD8:%.*]] = add nsw i32 [[TMP21]], [[TMP20]]
		// CHECK2-NEXT: store i32 [[ADD8]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP22:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (float* @_ZN2STIfE2stE to i8), i64 4, i8** @_ZN2STIfE2stE.cache.)
		// CHECK2-NEXT: [[TMP23:%.]] = bitcast i8 [[TMP22]] to float*
		// CHECK2-NEXT: [[TMP24:%.]] = load float, float [[TMP23]], align 4
		// CHECK2-NEXT: [[CONV:%.*]] = fptosi float [[TMP24]] to i32
		// CHECK2-NEXT: [[TMP25:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP25]], [[CONV]]
		// CHECK2-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP26:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i64 8, i8** @_ZN2STI2S4E2stE.cache.)
		// CHECK2-NEXT: [[TMP27:%.]] = bitcast i8 [[TMP26]] to %struct.S4*
		// CHECK2-NEXT: [[A10:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP27]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP28:%.]] = load i32, i32 [[A10]], align 4
		// CHECK2-NEXT: [[TMP29:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP29]], [[TMP28]]
		// CHECK2-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4
		// CHECK2-NEXT: [[TMP30:%.]] = load i32, i32 [[RES]], align 4
		// CHECK2-NEXT: ret i32 [[TMP30]]
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init.8
		// CHECK2-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// CHECK2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// CHECK2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]]
		// CHECK2: init.check:
		// CHECK2-NEXT: [[TMP1:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1]])
		// CHECK2-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 (i8) @.__kmpc_global_ctor_..9, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..10)
		// CHECK2-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23)
		// CHECK2-NEXT: [[TMP2:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK2-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// CHECK2-NEXT: br label [[INIT_END]]
		// CHECK2: init.end:
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..9
		// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S4*
		// CHECK2-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) [[TMP2]], i32 23)
		// CHECK2-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: ret i8* [[TMP3]]
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// CHECK2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK2-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]])
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..10
		// CHECK2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8
		// CHECK2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S4*
		// CHECK2-NEXT: call void @_ZN2S4D1Ev(%struct.S4* nonnull dereferenceable(8) [[TMP2]]) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// CHECK2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR3]]
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// CHECK2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// CHECK2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// CHECK2-NEXT: store i32 0, i32* [[A]], align 4
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// CHECK2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// CHECK2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// CHECK2-NEXT: store i32 0, i32* [[A]], align 8
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// CHECK2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// CHECK2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// CHECK2-NEXT: store i32 0, i32* [[A]], align 8
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// CHECK2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// CHECK2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// CHECK2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// CHECK2-NEXT: store i32 0, i32* [[A]], align 4
		// CHECK2-NEXT: ret void
		//
		//
		// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// CHECK2-SAME: () #[[ATTR0]] {
		// CHECK2-NEXT: entry:
		// CHECK2-NEXT: call void @__cxx_global_var_init()
		// CHECK2-NEXT: call void @.__omp_threadprivate_init_.()
		// CHECK2-NEXT: call void @__cxx_global_var_init.1()
		// CHECK2-NEXT: call void @__cxx_global_var_init.2()
		// CHECK2-NEXT: call void @.__omp_threadprivate_init_..5()
		// CHECK2-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// SIMD1-SAME: () #[[ATTR0:[0-9]+]] {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5)
		// SIMD1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]]
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// SIMD1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD1-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// SIMD1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// SIMD1-SAME: () #[[ATTR0]] {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27)
		// SIMD1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR3]]
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// SIMD1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD1-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]])
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// SIMD1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR3]]
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// SIMD1-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// SIMD1-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// SIMD1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// SIMD1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// SIMD1-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// SIMD1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// SIMD1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// SIMD1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// SIMD1: invoke.cont:
		// SIMD1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// SIMD1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// SIMD1-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]]
		// SIMD1: invoke.cont2:
		// SIMD1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// SIMD1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// SIMD1-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]]
		// SIMD1: invoke.cont3:
		// SIMD1-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// SIMD1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// SIMD1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// SIMD1-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]]
		// SIMD1: invoke.cont7:
		// SIMD1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// SIMD1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// SIMD1-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]]
		// SIMD1: invoke.cont8:
		// SIMD1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// SIMD1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// SIMD1-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]]
		// SIMD1: invoke.cont9:
		// SIMD1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]
		// SIMD1-NEXT: ret void
		// SIMD1: lpad:
		// SIMD1-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// SIMD1-NEXT: cleanup
		// SIMD1-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0
		// SIMD1-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8
		// SIMD1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1
		// SIMD1-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4
		// SIMD1-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// SIMD1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]]
		// SIMD1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]]
		// SIMD1: arraydestroy.body:
		// SIMD1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
		// SIMD1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// SIMD1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// SIMD1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// SIMD1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]]
		// SIMD1: arraydestroy.done4:
		// SIMD1-NEXT: br label [[EHCLEANUP:%.*]]
		// SIMD1: lpad6:
		// SIMD1-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// SIMD1-NEXT: cleanup
		// SIMD1-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0
		// SIMD1-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8
		// SIMD1-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1
		// SIMD1-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4
		// SIMD1-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// SIMD1-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]]
		// SIMD1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]]
		// SIMD1: arraydestroy.body11:
		// SIMD1-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ]
		// SIMD1-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1
		// SIMD1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR3]]
		// SIMD1-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0)
		// SIMD1-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]]
		// SIMD1: arraydestroy.done15:
		// SIMD1-NEXT: br label [[EHCLEANUP]]
		// SIMD1: ehcleanup:
		// SIMD1-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// SIMD1-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0
		// SIMD1-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]]
		// SIMD1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]]
		// SIMD1: arraydestroy.body17:
		// SIMD1-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ]
		// SIMD1-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1
		// SIMD1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]]
		// SIMD1-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// SIMD1-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]]
		// SIMD1: arraydestroy.done21:
		// SIMD1-NEXT: br label [[EH_RESUME:%.*]]
		// SIMD1: eh.resume:
		// SIMD1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// SIMD1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// SIMD1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// SIMD1-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// SIMD1-NEXT: resume { i8*, i32 } [[LPAD_VAL22]]
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// SIMD1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// SIMD1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// SIMD1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
		// SIMD1: arraydestroy.body:
		// SIMD1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
		// SIMD1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// SIMD1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// SIMD1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0)
		// SIMD1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
		// SIMD1: arraydestroy.done1:
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@main
		// SIMD1-SAME: () #[[ATTR4:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: [[RES:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// SIMD1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// SIMD1-NEXT: [[TMP0:%.]] = load atomic i8, i8 bitcast (i64* @_ZGVZ4mainE2sm to i8*) acquire, align 8
		// SIMD1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// SIMD1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !prof [[PROF2:![0-9]+]]
		// SIMD1: init.check:
		// SIMD1-NEXT: [[TMP1:%.]] = call i32 @__cxa_guard_acquire(i64 @_ZGVZ4mainE2sm) #[[ATTR3]]
		// SIMD1-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP1]], 0
		// SIMD1-NEXT: br i1 [[TOBOOL]], label [[INIT:%.*]], label [[INIT_END]]
		// SIMD1: init:
		// SIMD1-NEXT: [[TMP2:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 @_ZL3gs1, i32 0, i32 0), align 4
		// SIMD1-NEXT: invoke void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP2]])
		// SIMD1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// SIMD1: invoke.cont:
		// SIMD1-NEXT: [[TMP3:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR3]]
		// SIMD1-NEXT: call void @__cxa_guard_release(i64* @_ZGVZ4mainE2sm) #[[ATTR3]]
		// SIMD1-NEXT: br label [[INIT_END]]
		// SIMD1: init.end:
		// SIMD1-NEXT: [[TMP4:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S3:%.]], %struct.S3 @_ZN6Static1sE, i32 0, i32 0), align 4
		// SIMD1-NEXT: store i32 [[TMP4]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_SMAIN:%.]], %struct.Smain @_ZZ4mainE2sm, i32 0, i32 0), align 8
		// SIMD1-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP6]], [[TMP5]]
		// SIMD1-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP7:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1]], %struct.S1* @_ZL3gs1, i32 0, i32 0), align 4
		// SIMD1-NEXT: [[TMP8:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD1:%.*]] = add nsw i32 [[TMP8]], [[TMP7]]
		// SIMD1-NEXT: store i32 [[ADD1]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP9:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// SIMD1-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP10]], [[TMP9]]
		// SIMD1-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP11:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S5:%.]], %struct.S5 @gs3, i32 0, i32 0), align 4
		// SIMD1-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP12]], [[TMP11]]
		// SIMD1-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP13:%.]] = load i32, i32 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1, i32 0), align 4
		// SIMD1-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]
		// SIMD1-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP15:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4
		// SIMD1-NEXT: [[TMP16:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP16]], [[TMP15]]
		// SIMD1-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP17:%.]] = load float, float @_ZN2STIfE2stE, align 4
		// SIMD1-NEXT: [[CONV:%.*]] = fptosi float [[TMP17]] to i32
		// SIMD1-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP18]], [[CONV]]
		// SIMD1-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP19:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S4:%.]], %struct.S4 @_ZN2STI2S4E2stE, i32 0, i32 0), align 4
		// SIMD1-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]
		// SIMD1-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: ret i32 [[TMP21]]
		// SIMD1: lpad:
		// SIMD1-NEXT: [[TMP22:%.]] = landingpad { i8, i32 }
		// SIMD1-NEXT: cleanup
		// SIMD1-NEXT: [[TMP23:%.]] = extractvalue { i8, i32 } [[TMP22]], 0
		// SIMD1-NEXT: store i8* [[TMP23]], i8** [[EXN_SLOT]], align 8
		// SIMD1-NEXT: [[TMP24:%.]] = extractvalue { i8, i32 } [[TMP22]], 1
		// SIMD1-NEXT: store i32 [[TMP24]], i32* [[EHSELECTOR_SLOT]], align 4
		// SIMD1-NEXT: call void @__cxa_guard_abort(i64* @_ZGVZ4mainE2sm) #[[ATTR3]]
		// SIMD1-NEXT: br label [[EH_RESUME:%.*]]
		// SIMD1: eh.resume:
		// SIMD1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// SIMD1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// SIMD1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// SIMD1-NEXT: [[LPAD_VAL8:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// SIMD1-NEXT: resume { i8*, i32 } [[LPAD_VAL8]]
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// SIMD1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD1-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]])
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// SIMD1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR3]]
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_Z6foobarv
		// SIMD1-SAME: () #[[ATTR5:[0-9]+]] {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[RES:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S3:%.]], %struct.S3 @_ZN6Static1sE, i32 0, i32 0), align 4
		// SIMD1-NEXT: store i32 [[TMP0]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP1:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 @_ZL3gs1, i32 0, i32 0), align 4
		// SIMD1-NEXT: [[TMP2:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP2]], [[TMP1]]
		// SIMD1-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP3:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// SIMD1-NEXT: [[TMP4:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD1:%.*]] = add nsw i32 [[TMP4]], [[TMP3]]
		// SIMD1-NEXT: store i32 [[ADD1]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S5:%.]], %struct.S5 @gs3, i32 0, i32 0), align 4
		// SIMD1-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP6]], [[TMP5]]
		// SIMD1-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP7:%.]] = load i32, i32 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1, i32 0), align 4
		// SIMD1-NEXT: [[TMP8:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP8]], [[TMP7]]
		// SIMD1-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP9:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4
		// SIMD1-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP10]], [[TMP9]]
		// SIMD1-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP11:%.]] = load float, float @_ZN2STIfE2stE, align 4
		// SIMD1-NEXT: [[CONV:%.*]] = fptosi float [[TMP11]] to i32
		// SIMD1-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP12]], [[CONV]]
		// SIMD1-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP13:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S4:%.]], %struct.S4 @_ZN2STI2S4E2stE, i32 0, i32 0), align 4
		// SIMD1-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]
		// SIMD1-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4
		// SIMD1-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4
		// SIMD1-NEXT: ret i32 [[TMP15]]
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@__cxx_global_var_init.3
		// SIMD1-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// SIMD1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// SIMD1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]]
		// SIMD1: init.check:
		// SIMD1-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23)
		// SIMD1-NEXT: [[TMP1:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR3]]
		// SIMD1-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// SIMD1-NEXT: br label [[INIT_END]]
		// SIMD1: init.end:
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// SIMD1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD1-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]])
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// SIMD1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR3]]
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// SIMD1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// SIMD1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// SIMD1-NEXT: store i32 0, i32* [[A]], align 4
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// SIMD1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// SIMD1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// SIMD1-NEXT: store i32 0, i32* [[A]], align 8
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// SIMD1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// SIMD1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// SIMD1-NEXT: store i32 0, i32* [[A]], align 8
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// SIMD1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// SIMD1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// SIMD1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// SIMD1-NEXT: store i32 0, i32* [[A]], align 4
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// SIMD1-SAME: () #[[ATTR0]] {
		// SIMD1-NEXT: entry:
		// SIMD1-NEXT: call void @__cxx_global_var_init()
		// SIMD1-NEXT: call void @__cxx_global_var_init.1()
		// SIMD1-NEXT: call void @__cxx_global_var_init.2()
		// SIMD1-NEXT: ret void
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// SIMD2-SAME: () #[[ATTR0:[0-9]+]] !dbg [[DBG115:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5), !dbg [[DBG118:![0-9]+]]
		// SIMD2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]], !dbg [[DBG120:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG121:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// SIMD2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 !dbg [[DBG122:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META123:![0-9]+]], metadata !DIExpression()), !dbg [[DBG125:![0-9]+]]
		// SIMD2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META126:![0-9]+]], metadata !DIExpression()), !dbg [[DBG127:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG128:![0-9]+]]
		// SIMD2-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG128]]
		// SIMD2-NEXT: ret void, !dbg [[DBG129:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// SIMD2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 !dbg [[DBG130:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META131:![0-9]+]], metadata !DIExpression()), !dbg [[DBG132:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]], !dbg [[DBG133:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG134:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// SIMD2-SAME: () #[[ATTR0]] !dbg [[DBG135:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27), !dbg [[DBG136:![0-9]+]]
		// SIMD2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG138:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG139:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// SIMD2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 !dbg [[DBG140:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META141:![0-9]+]], metadata !DIExpression()), !dbg [[DBG143:![0-9]+]]
		// SIMD2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META144:![0-9]+]], metadata !DIExpression()), !dbg [[DBG145:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG146:![0-9]+]]
		// SIMD2-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG146]]
		// SIMD2-NEXT: ret void, !dbg [[DBG147:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// SIMD2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG148:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META149:![0-9]+]], metadata !DIExpression()), !dbg [[DBG150:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR3]], !dbg [[DBG151:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG152:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// SIMD2-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG153:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// SIMD2-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// SIMD2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// SIMD2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// SIMD2-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG154:![0-9]+]]
		// SIMD2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG156:![0-9]+]]
		// SIMD2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// SIMD2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG157:![0-9]+]]
		// SIMD2: invoke.cont:
		// SIMD2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG156]]
		// SIMD2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// SIMD2-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]], !dbg [[DBG158:![0-9]+]]
		// SIMD2: invoke.cont2:
		// SIMD2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG156]]
		// SIMD2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// SIMD2-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]], !dbg [[DBG159:![0-9]+]]
		// SIMD2: invoke.cont3:
		// SIMD2-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG154]]
		// SIMD2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG160:![0-9]+]]
		// SIMD2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// SIMD2-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]], !dbg [[DBG161:![0-9]+]]
		// SIMD2: invoke.cont7:
		// SIMD2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG160]]
		// SIMD2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// SIMD2-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]], !dbg [[DBG162:![0-9]+]]
		// SIMD2: invoke.cont8:
		// SIMD2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG160]]
		// SIMD2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// SIMD2-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]], !dbg [[DBG163:![0-9]+]]
		// SIMD2: invoke.cont9:
		// SIMD2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]], !dbg [[DBG164:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG164]]
		// SIMD2: lpad:
		// SIMD2-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// SIMD2-NEXT: cleanup, !dbg [[DBG165:![0-9]+]]
		// SIMD2-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0, !dbg [[DBG165]]
		// SIMD2-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG165]]
		// SIMD2-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1, !dbg [[DBG165]]
		// SIMD2-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG165]]
		// SIMD2-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG156]]
		// SIMD2-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]], !dbg [[DBG156]]
		// SIMD2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG156]]
		// SIMD2: arraydestroy.body:
		// SIMD2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG156]]
		// SIMD2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG156]]
		// SIMD2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG156]]
		// SIMD2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG156]]
		// SIMD2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG156]]
		// SIMD2: arraydestroy.done4:
		// SIMD2-NEXT: br label [[EHCLEANUP:%.*]], !dbg [[DBG156]]
		// SIMD2: lpad6:
		// SIMD2-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// SIMD2-NEXT: cleanup, !dbg [[DBG165]]
		// SIMD2-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0, !dbg [[DBG165]]
		// SIMD2-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG165]]
		// SIMD2-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1, !dbg [[DBG165]]
		// SIMD2-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG165]]
		// SIMD2-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG160]]
		// SIMD2-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]], !dbg [[DBG160]]
		// SIMD2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]], !dbg [[DBG160]]
		// SIMD2: arraydestroy.body11:
		// SIMD2-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ], !dbg [[DBG160]]
		// SIMD2-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1, !dbg [[DBG160]]
		// SIMD2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR3]], !dbg [[DBG160]]
		// SIMD2-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), !dbg [[DBG160]]
		// SIMD2-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]], !dbg [[DBG160]]
		// SIMD2: arraydestroy.done15:
		// SIMD2-NEXT: br label [[EHCLEANUP]], !dbg [[DBG160]]
		// SIMD2: ehcleanup:
		// SIMD2-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG154]]
		// SIMD2-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0, !dbg [[DBG154]]
		// SIMD2-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]], !dbg [[DBG154]]
		// SIMD2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]], !dbg [[DBG154]]
		// SIMD2: arraydestroy.body17:
		// SIMD2-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ], !dbg [[DBG154]]
		// SIMD2-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1, !dbg [[DBG154]]
		// SIMD2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]], !dbg [[DBG154]]
		// SIMD2-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG154]]
		// SIMD2-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]], !dbg [[DBG154]]
		// SIMD2: arraydestroy.done21:
		// SIMD2-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG154]]
		// SIMD2: eh.resume:
		// SIMD2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG154]]
		// SIMD2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG154]]
		// SIMD2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG154]]
		// SIMD2-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG154]]
		// SIMD2-NEXT: resume { i8*, i32 } [[LPAD_VAL22]], !dbg [[DBG154]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// SIMD2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG166:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// SIMD2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META170:![0-9]+]], metadata !DIExpression()), !dbg [[DBG171:![0-9]+]]
		// SIMD2-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG171]]
		// SIMD2: arraydestroy.body:
		// SIMD2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG171]]
		// SIMD2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG171]]
		// SIMD2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG171]]
		// SIMD2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), !dbg [[DBG171]]
		// SIMD2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG171]]
		// SIMD2: arraydestroy.done1:
		// SIMD2-NEXT: ret void, !dbg [[DBG171]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@main
		// SIMD2-SAME: () #[[ATTR5:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG53:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: [[RES:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// SIMD2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META172:![0-9]+]], metadata !DIExpression()), !dbg [[DBG173:![0-9]+]]
		// SIMD2-NEXT: [[TMP0:%.]] = load atomic i8, i8 bitcast (i64* @_ZGVZ4mainE2sm to i8*) acquire, align 8, !dbg [[DBG174:![0-9]+]]
		// SIMD2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG174]]
		// SIMD2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG174]], !prof [[PROF175:![0-9]+]]
		// SIMD2: init.check:
		// SIMD2-NEXT: [[TMP1:%.]] = call i32 @__cxa_guard_acquire(i64 @_ZGVZ4mainE2sm) #[[ATTR3]], !dbg [[DBG174]]
		// SIMD2-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP1]], 0, !dbg [[DBG174]]
		// SIMD2-NEXT: br i1 [[TOBOOL]], label [[INIT:%.*]], label [[INIT_END]], !dbg [[DBG174]]
		// SIMD2: init:
		// SIMD2-NEXT: [[TMP2:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 @_ZL3gs1, i32 0, i32 0), align 4, !dbg [[DBG176:![0-9]+]]
		// SIMD2-NEXT: invoke void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP2]])
		// SIMD2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG177:![0-9]+]]
		// SIMD2: invoke.cont:
		// SIMD2-NEXT: [[TMP3:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG174]]
		// SIMD2-NEXT: call void @__cxa_guard_release(i64* @_ZGVZ4mainE2sm) #[[ATTR3]], !dbg [[DBG174]]
		// SIMD2-NEXT: br label [[INIT_END]], !dbg [[DBG174]]
		// SIMD2: init.end:
		// SIMD2-NEXT: [[TMP4:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S3:%.]], %struct.S3 @_ZN6Static1sE, i32 0, i32 0), align 4, !dbg [[DBG178:![0-9]+]]
		// SIMD2-NEXT: store i32 [[TMP4]], i32* [[RES]], align 4, !dbg [[DBG179:![0-9]+]]
		// SIMD2-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_SMAIN:%.]], %struct.Smain @_ZZ4mainE2sm, i32 0, i32 0), align 8, !dbg [[DBG180:![0-9]+]]
		// SIMD2-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG181:![0-9]+]]
		// SIMD2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP6]], [[TMP5]], !dbg [[DBG181]]
		// SIMD2-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG181]]
		// SIMD2-NEXT: [[TMP7:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1]], %struct.S1* @_ZL3gs1, i32 0, i32 0), align 4, !dbg [[DBG182:![0-9]+]]
		// SIMD2-NEXT: [[TMP8:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG183:![0-9]+]]
		// SIMD2-NEXT: [[ADD1:%.*]] = add nsw i32 [[TMP8]], [[TMP7]], !dbg [[DBG183]]
		// SIMD2-NEXT: store i32 [[ADD1]], i32* [[RES]], align 4, !dbg [[DBG183]]
		// SIMD2-NEXT: [[TMP9:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG184:![0-9]+]]
		// SIMD2-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG185:![0-9]+]]
		// SIMD2-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP10]], [[TMP9]], !dbg [[DBG185]]
		// SIMD2-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4, !dbg [[DBG185]]
		// SIMD2-NEXT: [[TMP11:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S5:%.]], %struct.S5 @gs3, i32 0, i32 0), align 4, !dbg [[DBG186:![0-9]+]]
		// SIMD2-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG187:![0-9]+]]
		// SIMD2-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP12]], [[TMP11]], !dbg [[DBG187]]
		// SIMD2-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4, !dbg [[DBG187]]
		// SIMD2-NEXT: [[TMP13:%.]] = load i32, i32 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1, i32 0), align 4, !dbg [[DBG188:![0-9]+]]
		// SIMD2-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG189:![0-9]+]]
		// SIMD2-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP14]], [[TMP13]], !dbg [[DBG189]]
		// SIMD2-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG189]]
		// SIMD2-NEXT: [[TMP15:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4, !dbg [[DBG190:![0-9]+]]
		// SIMD2-NEXT: [[TMP16:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG191:![0-9]+]]
		// SIMD2-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP16]], [[TMP15]], !dbg [[DBG191]]
		// SIMD2-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4, !dbg [[DBG191]]
		// SIMD2-NEXT: [[TMP17:%.]] = load float, float @_ZN2STIfE2stE, align 4, !dbg [[DBG192:![0-9]+]]
		// SIMD2-NEXT: [[CONV:%.*]] = fptosi float [[TMP17]] to i32, !dbg [[DBG192]]
		// SIMD2-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG193:![0-9]+]]
		// SIMD2-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP18]], [[CONV]], !dbg [[DBG193]]
		// SIMD2-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4, !dbg [[DBG193]]
		// SIMD2-NEXT: [[TMP19:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S4:%.]], %struct.S4 @_ZN2STI2S4E2stE, i32 0, i32 0), align 4, !dbg [[DBG194:![0-9]+]]
		// SIMD2-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG195:![0-9]+]]
		// SIMD2-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP20]], [[TMP19]], !dbg [[DBG195]]
		// SIMD2-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4, !dbg [[DBG195]]
		// SIMD2-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG196:![0-9]+]]
		// SIMD2-NEXT: ret i32 [[TMP21]], !dbg [[DBG197:![0-9]+]]
		// SIMD2: lpad:
		// SIMD2-NEXT: [[TMP22:%.]] = landingpad { i8, i32 }
		// SIMD2-NEXT: cleanup, !dbg [[DBG198:![0-9]+]]
		// SIMD2-NEXT: [[TMP23:%.]] = extractvalue { i8, i32 } [[TMP22]], 0, !dbg [[DBG198]]
		// SIMD2-NEXT: store i8* [[TMP23]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG198]]
		// SIMD2-NEXT: [[TMP24:%.]] = extractvalue { i8, i32 } [[TMP22]], 1, !dbg [[DBG198]]
		// SIMD2-NEXT: store i32 [[TMP24]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG198]]
		// SIMD2-NEXT: call void @__cxa_guard_abort(i64* @_ZGVZ4mainE2sm) #[[ATTR3]], !dbg [[DBG174]]
		// SIMD2-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG174]]
		// SIMD2: eh.resume:
		// SIMD2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG174]]
		// SIMD2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG174]]
		// SIMD2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG174]]
		// SIMD2-NEXT: [[LPAD_VAL8:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG174]]
		// SIMD2-NEXT: resume { i8*, i32 } [[LPAD_VAL8]], !dbg [[DBG174]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// SIMD2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 !dbg [[DBG199:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META200:![0-9]+]], metadata !DIExpression()), !dbg [[DBG202:![0-9]+]]
		// SIMD2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META203:![0-9]+]], metadata !DIExpression()), !dbg [[DBG204:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG205:![0-9]+]]
		// SIMD2-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG205]]
		// SIMD2-NEXT: ret void, !dbg [[DBG206:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// SIMD2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG207:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META208:![0-9]+]], metadata !DIExpression()), !dbg [[DBG209:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR3]], !dbg [[DBG210:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG211:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_Z6foobarv
		// SIMD2-SAME: () #[[ATTR6:[0-9]+]] !dbg [[DBG212:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[RES:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META213:![0-9]+]], metadata !DIExpression()), !dbg [[DBG214:![0-9]+]]
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S3:%.]], %struct.S3 @_ZN6Static1sE, i32 0, i32 0), align 4, !dbg [[DBG215:![0-9]+]]
		// SIMD2-NEXT: store i32 [[TMP0]], i32* [[RES]], align 4, !dbg [[DBG216:![0-9]+]]
		// SIMD2-NEXT: [[TMP1:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 @_ZL3gs1, i32 0, i32 0), align 4, !dbg [[DBG217:![0-9]+]]
		// SIMD2-NEXT: [[TMP2:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG218:![0-9]+]]
		// SIMD2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP2]], [[TMP1]], !dbg [[DBG218]]
		// SIMD2-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG218]]
		// SIMD2-NEXT: [[TMP3:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG219:![0-9]+]]
		// SIMD2-NEXT: [[TMP4:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG220:![0-9]+]]
		// SIMD2-NEXT: [[ADD1:%.*]] = add nsw i32 [[TMP4]], [[TMP3]], !dbg [[DBG220]]
		// SIMD2-NEXT: store i32 [[ADD1]], i32* [[RES]], align 4, !dbg [[DBG220]]
		// SIMD2-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S5:%.]], %struct.S5 @gs3, i32 0, i32 0), align 4, !dbg [[DBG221:![0-9]+]]
		// SIMD2-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG222:![0-9]+]]
		// SIMD2-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP6]], [[TMP5]], !dbg [[DBG222]]
		// SIMD2-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4, !dbg [[DBG222]]
		// SIMD2-NEXT: [[TMP7:%.]] = load i32, i32 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1, i32 0), align 4, !dbg [[DBG223:![0-9]+]]
		// SIMD2-NEXT: [[TMP8:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG224:![0-9]+]]
		// SIMD2-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP8]], [[TMP7]], !dbg [[DBG224]]
		// SIMD2-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4, !dbg [[DBG224]]
		// SIMD2-NEXT: [[TMP9:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4, !dbg [[DBG225:![0-9]+]]
		// SIMD2-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG226:![0-9]+]]
		// SIMD2-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP10]], [[TMP9]], !dbg [[DBG226]]
		// SIMD2-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG226]]
		// SIMD2-NEXT: [[TMP11:%.]] = load float, float @_ZN2STIfE2stE, align 4, !dbg [[DBG227:![0-9]+]]
		// SIMD2-NEXT: [[CONV:%.*]] = fptosi float [[TMP11]] to i32, !dbg [[DBG227]]
		// SIMD2-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG228:![0-9]+]]
		// SIMD2-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP12]], [[CONV]], !dbg [[DBG228]]
		// SIMD2-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4, !dbg [[DBG228]]
		// SIMD2-NEXT: [[TMP13:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S4:%.]], %struct.S4 @_ZN2STI2S4E2stE, i32 0, i32 0), align 4, !dbg [[DBG229:![0-9]+]]
		// SIMD2-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG230:![0-9]+]]
		// SIMD2-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP14]], [[TMP13]], !dbg [[DBG230]]
		// SIMD2-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4, !dbg [[DBG230]]
		// SIMD2-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG231:![0-9]+]]
		// SIMD2-NEXT: ret i32 [[TMP15]], !dbg [[DBG232:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@__cxx_global_var_init.3
		// SIMD2-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) !dbg [[DBG233:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG234:![0-9]+]]
		// SIMD2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG234]]
		// SIMD2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG234]]
		// SIMD2: init.check:
		// SIMD2-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23), !dbg [[DBG235:![0-9]+]]
		// SIMD2-NEXT: [[TMP1:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG234]]
		// SIMD2-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG234]]
		// SIMD2-NEXT: br label [[INIT_END]], !dbg [[DBG234]]
		// SIMD2: init.end:
		// SIMD2-NEXT: ret void, !dbg [[DBG237:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// SIMD2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 !dbg [[DBG238:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META239:![0-9]+]], metadata !DIExpression()), !dbg [[DBG241:![0-9]+]]
		// SIMD2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META242:![0-9]+]], metadata !DIExpression()), !dbg [[DBG243:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG244:![0-9]+]]
		// SIMD2-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG244]]
		// SIMD2-NEXT: ret void, !dbg [[DBG245:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// SIMD2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG246:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META247:![0-9]+]], metadata !DIExpression()), !dbg [[DBG248:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR3]], !dbg [[DBG249:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG250:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// SIMD2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG251:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META252:![0-9]+]], metadata !DIExpression()), !dbg [[DBG253:![0-9]+]]
		// SIMD2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META254:![0-9]+]], metadata !DIExpression()), !dbg [[DBG255:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG256:![0-9]+]]
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG257:![0-9]+]]
		// SIMD2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG256]]
		// SIMD2-NEXT: ret void, !dbg [[DBG258:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// SIMD2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG259:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META260:![0-9]+]], metadata !DIExpression()), !dbg [[DBG261:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG262:![0-9]+]]
		// SIMD2-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG264:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG265:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// SIMD2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG266:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META267:![0-9]+]], metadata !DIExpression()), !dbg [[DBG268:![0-9]+]]
		// SIMD2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META269:![0-9]+]], metadata !DIExpression()), !dbg [[DBG270:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG271:![0-9]+]]
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG272:![0-9]+]]
		// SIMD2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG271]]
		// SIMD2-NEXT: ret void, !dbg [[DBG273:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// SIMD2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG274:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META275:![0-9]+]], metadata !DIExpression()), !dbg [[DBG276:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG277:![0-9]+]]
		// SIMD2-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG279:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG280:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// SIMD2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG281:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META282:![0-9]+]], metadata !DIExpression()), !dbg [[DBG283:![0-9]+]]
		// SIMD2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META284:![0-9]+]], metadata !DIExpression()), !dbg [[DBG285:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG286:![0-9]+]]
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG287:![0-9]+]]
		// SIMD2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG286]]
		// SIMD2-NEXT: ret void, !dbg [[DBG288:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// SIMD2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG289:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META290:![0-9]+]], metadata !DIExpression()), !dbg [[DBG291:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG292:![0-9]+]]
		// SIMD2-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG294:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG295:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// SIMD2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG296:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META297:![0-9]+]], metadata !DIExpression()), !dbg [[DBG298:![0-9]+]]
		// SIMD2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META299:![0-9]+]], metadata !DIExpression()), !dbg [[DBG300:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG301:![0-9]+]]
		// SIMD2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG302:![0-9]+]]
		// SIMD2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG301]]
		// SIMD2-NEXT: ret void, !dbg [[DBG303:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// SIMD2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG304:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META305:![0-9]+]], metadata !DIExpression()), !dbg [[DBG306:![0-9]+]]
		// SIMD2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG307:![0-9]+]]
		// SIMD2-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG309:![0-9]+]]
		// SIMD2-NEXT: ret void, !dbg [[DBG310:![0-9]+]]
		//
		//
		// SIMD2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// SIMD2-SAME: () #[[ATTR0]] !dbg [[DBG311:![0-9]+]] {
		// SIMD2-NEXT: entry:
		// SIMD2-NEXT: call void @__cxx_global_var_init(), !dbg [[DBG313:![0-9]+]]
		// SIMD2-NEXT: call void @__cxx_global_var_init.1(), !dbg [[DBG313]]
		// SIMD2-NEXT: call void @__cxx_global_var_init.2(), !dbg [[DBG313]]
		// SIMD2-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// CHECK-TLS1-SAME: () #[[ATTR0:[0-9]+]] {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5)
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]]
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// CHECK-TLS1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// CHECK-TLS1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// CHECK-TLS1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// CHECK-TLS1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: store i32 0, i32* [[A]], align 4
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// CHECK-TLS1-SAME: () #[[ATTR0]] {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27)
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// CHECK-TLS1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]])
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// CHECK-TLS1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR3]]
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// CHECK-TLS1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// CHECK-TLS1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: store i32 0, i32* [[A]], align 8
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// CHECK-TLS1-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// CHECK-TLS1-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK-TLS1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS1-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK-TLS1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK-TLS1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// CHECK-TLS1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// CHECK-TLS1: invoke.cont:
		// CHECK-TLS1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK-TLS1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// CHECK-TLS1-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]]
		// CHECK-TLS1: invoke.cont2:
		// CHECK-TLS1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK-TLS1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// CHECK-TLS1-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]]
		// CHECK-TLS1: invoke.cont3:
		// CHECK-TLS1-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK-TLS1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK-TLS1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// CHECK-TLS1-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]]
		// CHECK-TLS1: invoke.cont7:
		// CHECK-TLS1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK-TLS1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// CHECK-TLS1-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]]
		// CHECK-TLS1: invoke.cont8:
		// CHECK-TLS1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK-TLS1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// CHECK-TLS1-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]]
		// CHECK-TLS1: invoke.cont9:
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = call i32 @__cxa_thread_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]
		// CHECK-TLS1-NEXT: ret void
		// CHECK-TLS1: lpad:
		// CHECK-TLS1-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// CHECK-TLS1-NEXT: cleanup
		// CHECK-TLS1-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0
		// CHECK-TLS1-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8
		// CHECK-TLS1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1
		// CHECK-TLS1-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK-TLS1-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]]
		// CHECK-TLS1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]]
		// CHECK-TLS1: arraydestroy.body:
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK-TLS1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// CHECK-TLS1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]]
		// CHECK-TLS1: arraydestroy.done4:
		// CHECK-TLS1-NEXT: br label [[EHCLEANUP:%.*]]
		// CHECK-TLS1: lpad6:
		// CHECK-TLS1-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// CHECK-TLS1-NEXT: cleanup
		// CHECK-TLS1-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0
		// CHECK-TLS1-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8
		// CHECK-TLS1-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1
		// CHECK-TLS1-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK-TLS1-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]]
		// CHECK-TLS1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]]
		// CHECK-TLS1: arraydestroy.body11:
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ]
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1
		// CHECK-TLS1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR3]]
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0)
		// CHECK-TLS1-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]]
		// CHECK-TLS1: arraydestroy.done15:
		// CHECK-TLS1-NEXT: br label [[EHCLEANUP]]
		// CHECK-TLS1: ehcleanup:
		// CHECK-TLS1-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK-TLS1-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]]
		// CHECK-TLS1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]]
		// CHECK-TLS1: arraydestroy.body17:
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ]
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1
		// CHECK-TLS1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]]
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// CHECK-TLS1-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]]
		// CHECK-TLS1: arraydestroy.done21:
		// CHECK-TLS1-NEXT: br label [[EH_RESUME:%.*]]
		// CHECK-TLS1: eh.resume:
		// CHECK-TLS1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// CHECK-TLS1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// CHECK-TLS1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// CHECK-TLS1-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// CHECK-TLS1-NEXT: resume { i8*, i32 } [[LPAD_VAL22]]
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// CHECK-TLS1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK-TLS1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK-TLS1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
		// CHECK-TLS1: arraydestroy.body:
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK-TLS1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// CHECK-TLS1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0)
		// CHECK-TLS1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
		// CHECK-TLS1: arraydestroy.done1:
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@main
		// CHECK-TLS1-SAME: () #[[ATTR4:[0-9]+]] {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i8, i8 @_ZGVZ4mainE2sm, align 1
		// CHECK-TLS1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// CHECK-TLS1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !prof [[PROF2:![0-9]+]]
		// CHECK-TLS1: init.check:
		// CHECK-TLS1-NEXT: [[TMP1:%.]] = call %struct.S1 @_ZTWL3gs1()
		// CHECK-TLS1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP2:%.]] = load i32, i32 [[A]], align 4
		// CHECK-TLS1-NEXT: call void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP2]])
		// CHECK-TLS1-NEXT: [[TMP3:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK-TLS1-NEXT: store i8 1, i8* @_ZGVZ4mainE2sm, align 1
		// CHECK-TLS1-NEXT: br label [[INIT_END]]
		// CHECK-TLS1: init.end:
		// CHECK-TLS1-NEXT: [[TMP4:%.]] = call %struct.S3 @_ZTWN6Static1sE()
		// CHECK-TLS1-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP4]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP5:%.]] = load i32, i32 [[A1]], align 4
		// CHECK-TLS1-NEXT: store i32 [[TMP5]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP6:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_SMAIN:%.]], %struct.Smain @_ZZ4mainE2sm, i32 0, i32 0), align 8
		// CHECK-TLS1-NEXT: [[TMP7:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP7]], [[TMP6]]
		// CHECK-TLS1-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP8:%.]] = call %struct.S1 @_ZTWL3gs1()
		// CHECK-TLS1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[TMP8]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP9:%.]] = load i32, i32 [[A2]], align 4
		// CHECK-TLS1-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP10]], [[TMP9]]
		// CHECK-TLS1-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP11:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// CHECK-TLS1-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP12]], [[TMP11]]
		// CHECK-TLS1-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP13:%.]] = call %struct.S5 @_ZTW3gs3()
		// CHECK-TLS1-NEXT: [[A5:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP13]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP14:%.]] = load i32, i32 [[A5]], align 4
		// CHECK-TLS1-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP15]], [[TMP14]]
		// CHECK-TLS1-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP16:%.]] = call [2 x [3 x %struct.S1]] @_ZTW5arr_x()
		// CHECK-TLS1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP16]], i64 0, i64 1
		// CHECK-TLS1-NEXT: [[ARRAYIDX7:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1
		// CHECK-TLS1-NEXT: [[A8:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX7]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP17:%.]] = load i32, i32 [[A8]], align 4
		// CHECK-TLS1-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP18]], [[TMP17]]
		// CHECK-TLS1-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP19:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4
		// CHECK-TLS1-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]
		// CHECK-TLS1-NEXT: store i32 [[ADD10]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP21:%.]] = load float, float @_ZN2STIfE2stE, align 4
		// CHECK-TLS1-NEXT: [[CONV:%.*]] = fptosi float [[TMP21]] to i32
		// CHECK-TLS1-NEXT: [[TMP22:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP22]], [[CONV]]
		// CHECK-TLS1-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP23:%.]] = call %struct.S4 @_ZTWN2STI2S4E2stE()
		// CHECK-TLS1-NEXT: [[A12:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP23]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP24:%.]] = load i32, i32 [[A12]], align 4
		// CHECK-TLS1-NEXT: [[TMP25:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD13:%.*]] = add nsw i32 [[TMP25]], [[TMP24]]
		// CHECK-TLS1-NEXT: store i32 [[ADD13]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP26:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: ret i32 [[TMP26]]
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZTWL3gs1
		// CHECK-TLS1-SAME: () #[[ATTR5:[0-9]+]] {
		// CHECK-TLS1-NEXT: call void @_ZTHL3gs1()
		// CHECK-TLS1-NEXT: ret %struct.S1* @_ZL3gs1
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// CHECK-TLS1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]])
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// CHECK-TLS1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR3]]
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZTWN6Static1sE
		// CHECK-TLS1-SAME: () #[[ATTR5]] comdat {
		// CHECK-TLS1-NEXT: br i1 icmp ne (void ()* @_ZTHN6Static1sE, void ()* null), label [[TMP1:%.]], label [[TMP2:%.]]
		// CHECK-TLS1: 1:
		// CHECK-TLS1-NEXT: call void @_ZTHN6Static1sE()
		// CHECK-TLS1-NEXT: br label [[TMP2]]
		// CHECK-TLS1: 2:
		// CHECK-TLS1-NEXT: ret %struct.S3* @_ZN6Static1sE
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZTW3gs3
		// CHECK-TLS1-SAME: () #[[ATTR5]] comdat {
		// CHECK-TLS1-NEXT: br i1 icmp ne (void ()* @_ZTH3gs3, void ()* null), label [[TMP1:%.]], label [[TMP2:%.]]
		// CHECK-TLS1: 1:
		// CHECK-TLS1-NEXT: call void @_ZTH3gs3()
		// CHECK-TLS1-NEXT: br label [[TMP2]]
		// CHECK-TLS1: 2:
		// CHECK-TLS1-NEXT: ret %struct.S5* @gs3
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZTW5arr_x
		// CHECK-TLS1-SAME: () #[[ATTR5]] comdat {
		// CHECK-TLS1-NEXT: call void @_ZTH5arr_x()
		// CHECK-TLS1-NEXT: ret [2 x [3 x %struct.S1]]* @arr_x
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZTWN2STI2S4E2stE
		// CHECK-TLS1-SAME: () #[[ATTR5]] comdat {
		// CHECK-TLS1-NEXT: call void @_ZTHN2STI2S4E2stE()
		// CHECK-TLS1-NEXT: ret %struct.S4* @_ZN2STI2S4E2stE
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// CHECK-TLS1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// CHECK-TLS1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: store i32 0, i32* [[A]], align 8
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_Z6foobarv
		// CHECK-TLS1-SAME: () #[[ATTR6:[0-9]+]] {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = call %struct.S3 @_ZTWN6Static1sE()
		// CHECK-TLS1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP0]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
		// CHECK-TLS1-NEXT: store i32 [[TMP1]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP2:%.]] = call %struct.S1 @_ZTWL3gs1()
		// CHECK-TLS1-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP2]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP3:%.]] = load i32, i32 [[A1]], align 4
		// CHECK-TLS1-NEXT: [[TMP4:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP4]], [[TMP3]]
		// CHECK-TLS1-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// CHECK-TLS1-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP6]], [[TMP5]]
		// CHECK-TLS1-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP7:%.]] = call %struct.S5 @_ZTW3gs3()
		// CHECK-TLS1-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP7]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP8:%.]] = load i32, i32 [[A3]], align 4
		// CHECK-TLS1-NEXT: [[TMP9:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP9]], [[TMP8]]
		// CHECK-TLS1-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP10:%.]] = call [2 x [3 x %struct.S1]] @_ZTW5arr_x()
		// CHECK-TLS1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP10]], i64 0, i64 1
		// CHECK-TLS1-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1
		// CHECK-TLS1-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX5]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP11:%.]] = load i32, i32 [[A6]], align 4
		// CHECK-TLS1-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP12]], [[TMP11]]
		// CHECK-TLS1-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP13:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4
		// CHECK-TLS1-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD8:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]
		// CHECK-TLS1-NEXT: store i32 [[ADD8]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP15:%.]] = load float, float @_ZN2STIfE2stE, align 4
		// CHECK-TLS1-NEXT: [[CONV:%.*]] = fptosi float [[TMP15]] to i32
		// CHECK-TLS1-NEXT: [[TMP16:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP16]], [[CONV]]
		// CHECK-TLS1-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP17:%.]] = call %struct.S4 @_ZTWN2STI2S4E2stE()
		// CHECK-TLS1-NEXT: [[A10:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP17]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP18:%.]] = load i32, i32 [[A10]], align 4
		// CHECK-TLS1-NEXT: [[TMP19:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP19]], [[TMP18]]
		// CHECK-TLS1-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4
		// CHECK-TLS1-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS1-NEXT: ret i32 [[TMP20]]
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@__cxx_global_var_init.3
		// CHECK-TLS1-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// CHECK-TLS1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// CHECK-TLS1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]]
		// CHECK-TLS1: init.check:
		// CHECK-TLS1-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23)
		// CHECK-TLS1-NEXT: [[TMP1:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR3]]
		// CHECK-TLS1-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// CHECK-TLS1-NEXT: br label [[INIT_END]]
		// CHECK-TLS1: init.end:
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// CHECK-TLS1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]])
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// CHECK-TLS1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR3]]
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// CHECK-TLS1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// CHECK-TLS1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// CHECK-TLS1-NEXT: store i32 0, i32* [[A]], align 4
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// CHECK-TLS1-SAME: () #[[ATTR0]] {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: call void @__cxx_global_var_init.1()
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS1-LABEL: define {{[^@]+}}@__tls_init
		// CHECK-TLS1-SAME: () #[[ATTR0]] {
		// CHECK-TLS1-NEXT: entry:
		// CHECK-TLS1-NEXT: [[TMP0:%.]] = load i8, i8 @__tls_guard, align 1
		// CHECK-TLS1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// CHECK-TLS1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT:%.]], label [[EXIT:%.]], !prof [[PROF2]]
		// CHECK-TLS1: init:
		// CHECK-TLS1-NEXT: store i8 1, i8* @__tls_guard, align 1
		// CHECK-TLS1-NEXT: call void @__cxx_global_var_init()
		// CHECK-TLS1-NEXT: call void @__cxx_global_var_init.2()
		// CHECK-TLS1-NEXT: br label [[EXIT]]
		// CHECK-TLS1: exit:
		// CHECK-TLS1-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@main
		// CHECK-TLS2-SAME: () #[[ATTR0:[0-9]+]] {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i8, i8 @_ZGVZ4mainE2sm, align 1
		// CHECK-TLS2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// CHECK-TLS2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !prof [[PROF2:![0-9]+]]
		// CHECK-TLS2: init.check:
		// CHECK-TLS2-NEXT: [[TMP1:%.]] = call %struct.S1 @_ZTWL3gs1()
		// CHECK-TLS2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP2:%.]] = load i32, i32 [[A]], align 4
		// CHECK-TLS2-NEXT: call void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP2]])
		// CHECK-TLS2-NEXT: [[TMP3:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR4:[0-9]+]]
		// CHECK-TLS2-NEXT: store i8 1, i8* @_ZGVZ4mainE2sm, align 1
		// CHECK-TLS2-NEXT: br label [[INIT_END]]
		// CHECK-TLS2: init.end:
		// CHECK-TLS2-NEXT: [[TMP4:%.]] = call %struct.S3 @_ZTWN6Static1sE()
		// CHECK-TLS2-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP4]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP5:%.]] = load i32, i32 [[A1]], align 4
		// CHECK-TLS2-NEXT: store i32 [[TMP5]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP6:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_SMAIN:%.]], %struct.Smain @_ZZ4mainE2sm, i32 0, i32 0), align 8
		// CHECK-TLS2-NEXT: [[TMP7:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP7]], [[TMP6]]
		// CHECK-TLS2-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP8:%.]] = call %struct.S1 @_ZTWL3gs1()
		// CHECK-TLS2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[TMP8]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP9:%.]] = load i32, i32 [[A2]], align 4
		// CHECK-TLS2-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP10]], [[TMP9]]
		// CHECK-TLS2-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP11:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// CHECK-TLS2-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP12]], [[TMP11]]
		// CHECK-TLS2-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP13:%.]] = call %struct.S5 @_ZTW3gs3()
		// CHECK-TLS2-NEXT: [[A5:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP13]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP14:%.]] = load i32, i32 [[A5]], align 4
		// CHECK-TLS2-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP15]], [[TMP14]]
		// CHECK-TLS2-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP16:%.]] = call [2 x [3 x %struct.S1]] @_ZTW5arr_x()
		// CHECK-TLS2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP16]], i64 0, i64 1
		// CHECK-TLS2-NEXT: [[ARRAYIDX7:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1
		// CHECK-TLS2-NEXT: [[A8:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX7]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP17:%.]] = load i32, i32 [[A8]], align 4
		// CHECK-TLS2-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP18]], [[TMP17]]
		// CHECK-TLS2-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP19:%.]] = call i32 @_ZTWN2STIiE2stE()
		// CHECK-TLS2-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4
		// CHECK-TLS2-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP21]], [[TMP20]]
		// CHECK-TLS2-NEXT: store i32 [[ADD10]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP22:%.]] = call float @_ZTWN2STIfE2stE()
		// CHECK-TLS2-NEXT: [[TMP23:%.]] = load float, float [[TMP22]], align 4
		// CHECK-TLS2-NEXT: [[CONV:%.*]] = fptosi float [[TMP23]] to i32
		// CHECK-TLS2-NEXT: [[TMP24:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP24]], [[CONV]]
		// CHECK-TLS2-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP25:%.]] = call %struct.S4 @_ZTWN2STI2S4E2stE()
		// CHECK-TLS2-NEXT: [[A12:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP25]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP26:%.]] = load i32, i32 [[A12]], align 4
		// CHECK-TLS2-NEXT: [[TMP27:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD13:%.*]] = add nsw i32 [[TMP27]], [[TMP26]]
		// CHECK-TLS2-NEXT: store i32 [[ADD13]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP28:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: ret i32 [[TMP28]]
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZTWL3gs1
		// CHECK-TLS2-SAME: () #[[ATTR1:[0-9]+]] {
		// CHECK-TLS2-NEXT: call void @_ZTHL3gs1()
		// CHECK-TLS2-NEXT: ret %struct.S1* @_ZL3gs1
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// CHECK-TLS2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2:[0-9]+]] align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]])
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// CHECK-TLS2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR3:[0-9]+]] align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR4]]
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZTWN6Static1sE
		// CHECK-TLS2-SAME: () #[[ATTR1]] comdat {
		// CHECK-TLS2-NEXT: br i1 icmp ne (void ()* @_ZTHN6Static1sE, void ()* null), label [[TMP1:%.]], label [[TMP2:%.]]
		// CHECK-TLS2: 1:
		// CHECK-TLS2-NEXT: call void @_ZTHN6Static1sE()
		// CHECK-TLS2-NEXT: br label [[TMP2]]
		// CHECK-TLS2: 2:
		// CHECK-TLS2-NEXT: ret %struct.S3* @_ZN6Static1sE
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZTW3gs3
		// CHECK-TLS2-SAME: () #[[ATTR1]] comdat {
		// CHECK-TLS2-NEXT: br i1 icmp ne (void ()* @_ZTH3gs3, void ()* null), label [[TMP1:%.]], label [[TMP2:%.]]
		// CHECK-TLS2: 1:
		// CHECK-TLS2-NEXT: call void @_ZTH3gs3()
		// CHECK-TLS2-NEXT: br label [[TMP2]]
		// CHECK-TLS2: 2:
		// CHECK-TLS2-NEXT: ret %struct.S5* @gs3
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZTW5arr_x
		// CHECK-TLS2-SAME: () #[[ATTR1]] comdat {
		// CHECK-TLS2-NEXT: call void @_ZTH5arr_x()
		// CHECK-TLS2-NEXT: ret [2 x [3 x %struct.S1]]* @arr_x
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZTWN2STIiE2stE
		// CHECK-TLS2-SAME: () #[[ATTR1]] comdat {
		// CHECK-TLS2-NEXT: ret i32* @_ZN2STIiE2stE
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZTWN2STIfE2stE
		// CHECK-TLS2-SAME: () #[[ATTR1]] comdat {
		// CHECK-TLS2-NEXT: ret float* @_ZN2STIfE2stE
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZTWN2STI2S4E2stE
		// CHECK-TLS2-SAME: () #[[ATTR1]] comdat {
		// CHECK-TLS2-NEXT: call void @_ZTHN2STI2S4E2stE()
		// CHECK-TLS2-NEXT: ret %struct.S4* @_ZN2STI2S4E2stE
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_Z6foobarv
		// CHECK-TLS2-SAME: () #[[ATTR5:[0-9]+]] {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = call %struct.S3 @_ZTWN6Static1sE()
		// CHECK-TLS2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP0]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
		// CHECK-TLS2-NEXT: store i32 [[TMP1]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP2:%.]] = call %struct.S1 @_ZTWL3gs1()
		// CHECK-TLS2-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP2]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP3:%.]] = load i32, i32 [[A1]], align 4
		// CHECK-TLS2-NEXT: [[TMP4:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP4]], [[TMP3]]
		// CHECK-TLS2-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// CHECK-TLS2-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP6]], [[TMP5]]
		// CHECK-TLS2-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP7:%.]] = call %struct.S5 @_ZTW3gs3()
		// CHECK-TLS2-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP7]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP8:%.]] = load i32, i32 [[A3]], align 4
		// CHECK-TLS2-NEXT: [[TMP9:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP9]], [[TMP8]]
		// CHECK-TLS2-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP10:%.]] = call [2 x [3 x %struct.S1]] @_ZTW5arr_x()
		// CHECK-TLS2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP10]], i64 0, i64 1
		// CHECK-TLS2-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1
		// CHECK-TLS2-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX5]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP11:%.]] = load i32, i32 [[A6]], align 4
		// CHECK-TLS2-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP12]], [[TMP11]]
		// CHECK-TLS2-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP13:%.]] = call i32 @_ZTWN2STIiE2stE()
		// CHECK-TLS2-NEXT: [[TMP14:%.]] = load i32, i32 [[TMP13]], align 4
		// CHECK-TLS2-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD8:%.*]] = add nsw i32 [[TMP15]], [[TMP14]]
		// CHECK-TLS2-NEXT: store i32 [[ADD8]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP16:%.]] = call float @_ZTWN2STIfE2stE()
		// CHECK-TLS2-NEXT: [[TMP17:%.]] = load float, float [[TMP16]], align 4
		// CHECK-TLS2-NEXT: [[CONV:%.*]] = fptosi float [[TMP17]] to i32
		// CHECK-TLS2-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP18]], [[CONV]]
		// CHECK-TLS2-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP19:%.]] = call %struct.S4 @_ZTWN2STI2S4E2stE()
		// CHECK-TLS2-NEXT: [[A10:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP19]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP20:%.]] = load i32, i32 [[A10]], align 4
		// CHECK-TLS2-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP21]], [[TMP20]]
		// CHECK-TLS2-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4
		// CHECK-TLS2-NEXT: [[TMP22:%.]] = load i32, i32 [[RES]], align 4
		// CHECK-TLS2-NEXT: ret i32 [[TMP22]]
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// CHECK-TLS2-SAME: () #[[ATTR6:[0-9]+]] {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5)
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR4]]
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// CHECK-TLS2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// CHECK-TLS2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR4]]
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// CHECK-TLS2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// CHECK-TLS2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: store i32 0, i32* [[A]], align 4
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// CHECK-TLS2-SAME: () #[[ATTR6]] {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27)
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR4]]
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// CHECK-TLS2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]])
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// CHECK-TLS2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR4]]
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// CHECK-TLS2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// CHECK-TLS2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: store i32 0, i32* [[A]], align 8
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// CHECK-TLS2-SAME: () #[[ATTR6]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// CHECK-TLS2-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK-TLS2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS2-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK-TLS2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK-TLS2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// CHECK-TLS2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// CHECK-TLS2: invoke.cont:
		// CHECK-TLS2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK-TLS2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// CHECK-TLS2-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]]
		// CHECK-TLS2: invoke.cont2:
		// CHECK-TLS2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK-TLS2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// CHECK-TLS2-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]]
		// CHECK-TLS2: invoke.cont3:
		// CHECK-TLS2-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK-TLS2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK-TLS2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// CHECK-TLS2-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]]
		// CHECK-TLS2: invoke.cont7:
		// CHECK-TLS2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK-TLS2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// CHECK-TLS2-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]]
		// CHECK-TLS2: invoke.cont8:
		// CHECK-TLS2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK-TLS2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// CHECK-TLS2-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]]
		// CHECK-TLS2: invoke.cont9:
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = call i32 @__cxa_thread_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR4]]
		// CHECK-TLS2-NEXT: ret void
		// CHECK-TLS2: lpad:
		// CHECK-TLS2-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// CHECK-TLS2-NEXT: cleanup
		// CHECK-TLS2-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0
		// CHECK-TLS2-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8
		// CHECK-TLS2-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1
		// CHECK-TLS2-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK-TLS2-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]]
		// CHECK-TLS2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]]
		// CHECK-TLS2: arraydestroy.body:
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK-TLS2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]]
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// CHECK-TLS2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]]
		// CHECK-TLS2: arraydestroy.done4:
		// CHECK-TLS2-NEXT: br label [[EHCLEANUP:%.*]]
		// CHECK-TLS2: lpad6:
		// CHECK-TLS2-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// CHECK-TLS2-NEXT: cleanup
		// CHECK-TLS2-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0
		// CHECK-TLS2-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8
		// CHECK-TLS2-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1
		// CHECK-TLS2-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4
		// CHECK-TLS2-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]]
		// CHECK-TLS2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]]
		// CHECK-TLS2: arraydestroy.body11:
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ]
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1
		// CHECK-TLS2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR4]]
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0)
		// CHECK-TLS2-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]]
		// CHECK-TLS2: arraydestroy.done15:
		// CHECK-TLS2-NEXT: br label [[EHCLEANUP]]
		// CHECK-TLS2: ehcleanup:
		// CHECK-TLS2-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// CHECK-TLS2-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]]
		// CHECK-TLS2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]]
		// CHECK-TLS2: arraydestroy.body17:
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ]
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1
		// CHECK-TLS2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR4]]
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// CHECK-TLS2-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]]
		// CHECK-TLS2: arraydestroy.done21:
		// CHECK-TLS2-NEXT: br label [[EH_RESUME:%.*]]
		// CHECK-TLS2: eh.resume:
		// CHECK-TLS2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// CHECK-TLS2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// CHECK-TLS2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// CHECK-TLS2-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// CHECK-TLS2-NEXT: resume { i8*, i32 } [[LPAD_VAL22]]
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// CHECK-TLS2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR6]] {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK-TLS2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK-TLS2-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
		// CHECK-TLS2: arraydestroy.body:
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// CHECK-TLS2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]]
		// CHECK-TLS2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0)
		// CHECK-TLS2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
		// CHECK-TLS2: arraydestroy.done1:
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// CHECK-TLS2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// CHECK-TLS2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: store i32 0, i32* [[A]], align 8
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@__cxx_global_var_init.3
		// CHECK-TLS2-SAME: () #[[ATTR6]] comdat($_ZN2STI2S4E2stE) {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// CHECK-TLS2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// CHECK-TLS2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]]
		// CHECK-TLS2: init.check:
		// CHECK-TLS2-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23)
		// CHECK-TLS2-NEXT: [[TMP1:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR4]]
		// CHECK-TLS2-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// CHECK-TLS2-NEXT: br label [[INIT_END]]
		// CHECK-TLS2: init.end:
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// CHECK-TLS2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]])
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// CHECK-TLS2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR4]]
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// CHECK-TLS2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// CHECK-TLS2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// CHECK-TLS2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// CHECK-TLS2-NEXT: store i32 0, i32* [[A]], align 4
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// CHECK-TLS2-SAME: () #[[ATTR6]] {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: call void @__cxx_global_var_init.1()
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS2-LABEL: define {{[^@]+}}@__tls_init
		// CHECK-TLS2-SAME: () #[[ATTR6]] {
		// CHECK-TLS2-NEXT: entry:
		// CHECK-TLS2-NEXT: [[TMP0:%.]] = load i8, i8 @__tls_guard, align 1
		// CHECK-TLS2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// CHECK-TLS2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT:%.]], label [[EXIT:%.]], !prof [[PROF2]]
		// CHECK-TLS2: init:
		// CHECK-TLS2-NEXT: store i8 1, i8* @__tls_guard, align 1
		// CHECK-TLS2-NEXT: call void @__cxx_global_var_init()
		// CHECK-TLS2-NEXT: call void @__cxx_global_var_init.2()
		// CHECK-TLS2-NEXT: br label [[EXIT]]
		// CHECK-TLS2: exit:
		// CHECK-TLS2-NEXT: ret void
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// CHECK-TLS3-SAME: () #[[ATTR0:[0-9]+]] !dbg [[DBG115:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5), !dbg [[DBG118:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]], !dbg [[DBG120:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG121:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// CHECK-TLS3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 !dbg [[DBG122:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META123:![0-9]+]], metadata !DIExpression()), !dbg [[DBG125:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META126:![0-9]+]], metadata !DIExpression()), !dbg [[DBG127:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG128:![0-9]+]]
		// CHECK-TLS3-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG128]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG129:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// CHECK-TLS3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 !dbg [[DBG130:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META131:![0-9]+]], metadata !DIExpression()), !dbg [[DBG132:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]], !dbg [[DBG133:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG134:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// CHECK-TLS3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG135:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META136:![0-9]+]], metadata !DIExpression()), !dbg [[DBG137:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META138:![0-9]+]], metadata !DIExpression()), !dbg [[DBG139:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG140:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG141:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG140]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG142:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// CHECK-TLS3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG143:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META144:![0-9]+]], metadata !DIExpression()), !dbg [[DBG145:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG146:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG148:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG149:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// CHECK-TLS3-SAME: () #[[ATTR0]] !dbg [[DBG150:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27), !dbg [[DBG151:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG153:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG154:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// CHECK-TLS3-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 !dbg [[DBG155:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META156:![0-9]+]], metadata !DIExpression()), !dbg [[DBG158:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META159:![0-9]+]], metadata !DIExpression()), !dbg [[DBG160:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG161:![0-9]+]]
		// CHECK-TLS3-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG161]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG162:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// CHECK-TLS3-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG163:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS3-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META164:![0-9]+]], metadata !DIExpression()), !dbg [[DBG165:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR3]], !dbg [[DBG166:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG167:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// CHECK-TLS3-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG168:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META169:![0-9]+]], metadata !DIExpression()), !dbg [[DBG170:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META171:![0-9]+]], metadata !DIExpression()), !dbg [[DBG172:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG173:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG174:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG173]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG175:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// CHECK-TLS3-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG176:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS3-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META177:![0-9]+]], metadata !DIExpression()), !dbg [[DBG178:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG179:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG181:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG182:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// CHECK-TLS3-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG183:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// CHECK-TLS3-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK-TLS3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS3-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG184:![0-9]+]]
		// CHECK-TLS3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG186:![0-9]+]]
		// CHECK-TLS3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// CHECK-TLS3-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG187:![0-9]+]]
		// CHECK-TLS3: invoke.cont:
		// CHECK-TLS3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG186]]
		// CHECK-TLS3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// CHECK-TLS3-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]], !dbg [[DBG188:![0-9]+]]
		// CHECK-TLS3: invoke.cont2:
		// CHECK-TLS3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG186]]
		// CHECK-TLS3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// CHECK-TLS3-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]], !dbg [[DBG189:![0-9]+]]
		// CHECK-TLS3: invoke.cont3:
		// CHECK-TLS3-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG190:![0-9]+]]
		// CHECK-TLS3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// CHECK-TLS3-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]], !dbg [[DBG191:![0-9]+]]
		// CHECK-TLS3: invoke.cont7:
		// CHECK-TLS3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG190]]
		// CHECK-TLS3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// CHECK-TLS3-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]], !dbg [[DBG192:![0-9]+]]
		// CHECK-TLS3: invoke.cont8:
		// CHECK-TLS3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG190]]
		// CHECK-TLS3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// CHECK-TLS3-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]], !dbg [[DBG193:![0-9]+]]
		// CHECK-TLS3: invoke.cont9:
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = call i32 @__cxa_thread_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]], !dbg [[DBG194:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG194]]
		// CHECK-TLS3: lpad:
		// CHECK-TLS3-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// CHECK-TLS3-NEXT: cleanup, !dbg [[DBG195:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG186]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]], !dbg [[DBG186]]
		// CHECK-TLS3-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG186]]
		// CHECK-TLS3: arraydestroy.body:
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG186]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG186]]
		// CHECK-TLS3-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG186]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG186]]
		// CHECK-TLS3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG186]]
		// CHECK-TLS3: arraydestroy.done4:
		// CHECK-TLS3-NEXT: br label [[EHCLEANUP:%.*]], !dbg [[DBG186]]
		// CHECK-TLS3: lpad6:
		// CHECK-TLS3-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// CHECK-TLS3-NEXT: cleanup, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG195]]
		// CHECK-TLS3-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG190]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]], !dbg [[DBG190]]
		// CHECK-TLS3-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]], !dbg [[DBG190]]
		// CHECK-TLS3: arraydestroy.body11:
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ], !dbg [[DBG190]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1, !dbg [[DBG190]]
		// CHECK-TLS3-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR3]], !dbg [[DBG190]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), !dbg [[DBG190]]
		// CHECK-TLS3-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]], !dbg [[DBG190]]
		// CHECK-TLS3: arraydestroy.done15:
		// CHECK-TLS3-NEXT: br label [[EHCLEANUP]], !dbg [[DBG190]]
		// CHECK-TLS3: ehcleanup:
		// CHECK-TLS3-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0, !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]], !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]], !dbg [[DBG184]]
		// CHECK-TLS3: arraydestroy.body17:
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ], !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1, !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]], !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]], !dbg [[DBG184]]
		// CHECK-TLS3: arraydestroy.done21:
		// CHECK-TLS3-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG184]]
		// CHECK-TLS3: eh.resume:
		// CHECK-TLS3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG184]]
		// CHECK-TLS3-NEXT: resume { i8*, i32 } [[LPAD_VAL22]], !dbg [[DBG184]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// CHECK-TLS3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG196:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK-TLS3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META200:![0-9]+]], metadata !DIExpression()), !dbg [[DBG201:![0-9]+]]
		// CHECK-TLS3-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG201]]
		// CHECK-TLS3: arraydestroy.body:
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG201]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG201]]
		// CHECK-TLS3-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG201]]
		// CHECK-TLS3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), !dbg [[DBG201]]
		// CHECK-TLS3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG201]]
		// CHECK-TLS3: arraydestroy.done1:
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG201]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@main
		// CHECK-TLS3-SAME: () #[[ATTR5:[0-9]+]] !dbg [[DBG53:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META202:![0-9]+]], metadata !DIExpression()), !dbg [[DBG203:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i8, i8 @_ZGVZ4mainE2sm, align 1, !dbg [[DBG204:![0-9]+]]
		// CHECK-TLS3-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG204]]
		// CHECK-TLS3-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG204]], !prof [[PROF205:![0-9]+]]
		// CHECK-TLS3: init.check:
		// CHECK-TLS3-NEXT: [[TMP1:%.]] = call %struct.S1 @_ZTWL3gs1(), !dbg [[DBG206:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP1]], i32 0, i32 0, !dbg [[DBG207:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP2:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG207]]
		// CHECK-TLS3-NEXT: call void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP2]]), !dbg [[DBG208:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP3:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG204]]
		// CHECK-TLS3-NEXT: store i8 1, i8* @_ZGVZ4mainE2sm, align 1, !dbg [[DBG204]]
		// CHECK-TLS3-NEXT: br label [[INIT_END]], !dbg [[DBG204]]
		// CHECK-TLS3: init.end:
		// CHECK-TLS3-NEXT: [[TMP4:%.]] = call %struct.S3 @_ZTWN6Static1sE(), !dbg [[DBG209:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP4]], i32 0, i32 0, !dbg [[DBG210:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP5:%.]] = load i32, i32 [[A1]], align 4, !dbg [[DBG210]]
		// CHECK-TLS3-NEXT: store i32 [[TMP5]], i32* [[RES]], align 4, !dbg [[DBG211:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP6:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_SMAIN:%.]], %struct.Smain @_ZZ4mainE2sm, i32 0, i32 0), align 8, !dbg [[DBG212:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP7:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG213:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP7]], [[TMP6]], !dbg [[DBG213]]
		// CHECK-TLS3-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG213]]
		// CHECK-TLS3-NEXT: [[TMP8:%.]] = call %struct.S1 @_ZTWL3gs1(), !dbg [[DBG214:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[TMP8]], i32 0, i32 0, !dbg [[DBG215:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP9:%.]] = load i32, i32 [[A2]], align 4, !dbg [[DBG215]]
		// CHECK-TLS3-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG216:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP10]], [[TMP9]], !dbg [[DBG216]]
		// CHECK-TLS3-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4, !dbg [[DBG216]]
		// CHECK-TLS3-NEXT: [[TMP11:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG217:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG218:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP12]], [[TMP11]], !dbg [[DBG218]]
		// CHECK-TLS3-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG218]]
		// CHECK-TLS3-NEXT: [[TMP13:%.]] = call %struct.S5 @_ZTW3gs3(), !dbg [[DBG219:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A5:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP13]], i32 0, i32 0, !dbg [[DBG220:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP14:%.]] = load i32, i32 [[A5]], align 4, !dbg [[DBG220]]
		// CHECK-TLS3-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG221:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP15]], [[TMP14]], !dbg [[DBG221]]
		// CHECK-TLS3-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4, !dbg [[DBG221]]
		// CHECK-TLS3-NEXT: [[TMP16:%.]] = call [2 x [3 x %struct.S1]] @_ZTW5arr_x(), !dbg [[DBG222:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP16]], i64 0, i64 1, !dbg [[DBG222]]
		// CHECK-TLS3-NEXT: [[ARRAYIDX7:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1, !dbg [[DBG222]]
		// CHECK-TLS3-NEXT: [[A8:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX7]], i32 0, i32 0, !dbg [[DBG223:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP17:%.]] = load i32, i32 [[A8]], align 4, !dbg [[DBG223]]
		// CHECK-TLS3-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG224:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP18]], [[TMP17]], !dbg [[DBG224]]
		// CHECK-TLS3-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4, !dbg [[DBG224]]
		// CHECK-TLS3-NEXT: [[TMP19:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4, !dbg [[DBG225:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG226:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP20]], [[TMP19]], !dbg [[DBG226]]
		// CHECK-TLS3-NEXT: store i32 [[ADD10]], i32* [[RES]], align 4, !dbg [[DBG226]]
		// CHECK-TLS3-NEXT: [[TMP21:%.]] = load float, float @_ZN2STIfE2stE, align 4, !dbg [[DBG227:![0-9]+]]
		// CHECK-TLS3-NEXT: [[CONV:%.*]] = fptosi float [[TMP21]] to i32, !dbg [[DBG227]]
		// CHECK-TLS3-NEXT: [[TMP22:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG228:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP22]], [[CONV]], !dbg [[DBG228]]
		// CHECK-TLS3-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4, !dbg [[DBG228]]
		// CHECK-TLS3-NEXT: [[TMP23:%.]] = call %struct.S4 @_ZTWN2STI2S4E2stE(), !dbg [[DBG229:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A12:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP23]], i32 0, i32 0, !dbg [[DBG230:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP24:%.]] = load i32, i32 [[A12]], align 4, !dbg [[DBG230]]
		// CHECK-TLS3-NEXT: [[TMP25:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG231:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD13:%.*]] = add nsw i32 [[TMP25]], [[TMP24]], !dbg [[DBG231]]
		// CHECK-TLS3-NEXT: store i32 [[ADD13]], i32* [[RES]], align 4, !dbg [[DBG231]]
		// CHECK-TLS3-NEXT: [[TMP26:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG232:![0-9]+]]
		// CHECK-TLS3-NEXT: ret i32 [[TMP26]], !dbg [[DBG233:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZTWL3gs1
		// CHECK-TLS3-SAME: () #[[ATTR6:[0-9]+]] {
		// CHECK-TLS3-NEXT: call void @_ZTHL3gs1()
		// CHECK-TLS3-NEXT: ret %struct.S1* @_ZL3gs1
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// CHECK-TLS3-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 !dbg [[DBG234:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META235:![0-9]+]], metadata !DIExpression()), !dbg [[DBG237:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META238:![0-9]+]], metadata !DIExpression()), !dbg [[DBG239:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG240:![0-9]+]]
		// CHECK-TLS3-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG240]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG241:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// CHECK-TLS3-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG242:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS3-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META243:![0-9]+]], metadata !DIExpression()), !dbg [[DBG244:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR3]], !dbg [[DBG245:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG246:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZTWN6Static1sE
		// CHECK-TLS3-SAME: () #[[ATTR6]] comdat {
		// CHECK-TLS3-NEXT: br i1 icmp ne (void ()* @_ZTHN6Static1sE, void ()* null), label [[TMP1:%.]], label [[TMP2:%.]]
		// CHECK-TLS3: 1:
		// CHECK-TLS3-NEXT: call void @_ZTHN6Static1sE()
		// CHECK-TLS3-NEXT: br label [[TMP2]]
		// CHECK-TLS3: 2:
		// CHECK-TLS3-NEXT: ret %struct.S3* @_ZN6Static1sE
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZTW3gs3
		// CHECK-TLS3-SAME: () #[[ATTR6]] comdat {
		// CHECK-TLS3-NEXT: br i1 icmp ne (void ()* @_ZTH3gs3, void ()* null), label [[TMP1:%.]], label [[TMP2:%.]]
		// CHECK-TLS3: 1:
		// CHECK-TLS3-NEXT: call void @_ZTH3gs3()
		// CHECK-TLS3-NEXT: br label [[TMP2]]
		// CHECK-TLS3: 2:
		// CHECK-TLS3-NEXT: ret %struct.S5* @gs3
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZTW5arr_x
		// CHECK-TLS3-SAME: () #[[ATTR6]] comdat {
		// CHECK-TLS3-NEXT: call void @_ZTH5arr_x()
		// CHECK-TLS3-NEXT: ret [2 x [3 x %struct.S1]]* @arr_x
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZTWN2STI2S4E2stE
		// CHECK-TLS3-SAME: () #[[ATTR6]] comdat {
		// CHECK-TLS3-NEXT: call void @_ZTHN2STI2S4E2stE()
		// CHECK-TLS3-NEXT: ret %struct.S4* @_ZN2STI2S4E2stE
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// CHECK-TLS3-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG247:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META248:![0-9]+]], metadata !DIExpression()), !dbg [[DBG249:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META250:![0-9]+]], metadata !DIExpression()), !dbg [[DBG251:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG252:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG253:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG252]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG254:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// CHECK-TLS3-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG255:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS3-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META256:![0-9]+]], metadata !DIExpression()), !dbg [[DBG257:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG258:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG260:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG261:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_Z6foobarv
		// CHECK-TLS3-SAME: () #[[ATTR7:[0-9]+]] !dbg [[DBG262:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META263:![0-9]+]], metadata !DIExpression()), !dbg [[DBG264:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = call %struct.S3 @_ZTWN6Static1sE(), !dbg [[DBG265:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP0]], i32 0, i32 0, !dbg [[DBG266:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG266]]
		// CHECK-TLS3-NEXT: store i32 [[TMP1]], i32* [[RES]], align 4, !dbg [[DBG267:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP2:%.]] = call %struct.S1 @_ZTWL3gs1(), !dbg [[DBG268:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP2]], i32 0, i32 0, !dbg [[DBG269:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP3:%.]] = load i32, i32 [[A1]], align 4, !dbg [[DBG269]]
		// CHECK-TLS3-NEXT: [[TMP4:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG270:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP4]], [[TMP3]], !dbg [[DBG270]]
		// CHECK-TLS3-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG270]]
		// CHECK-TLS3-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG271:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG272:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP6]], [[TMP5]], !dbg [[DBG272]]
		// CHECK-TLS3-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4, !dbg [[DBG272]]
		// CHECK-TLS3-NEXT: [[TMP7:%.]] = call %struct.S5 @_ZTW3gs3(), !dbg [[DBG273:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP7]], i32 0, i32 0, !dbg [[DBG274:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP8:%.]] = load i32, i32 [[A3]], align 4, !dbg [[DBG274]]
		// CHECK-TLS3-NEXT: [[TMP9:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG275:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP9]], [[TMP8]], !dbg [[DBG275]]
		// CHECK-TLS3-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG275]]
		// CHECK-TLS3-NEXT: [[TMP10:%.]] = call [2 x [3 x %struct.S1]] @_ZTW5arr_x(), !dbg [[DBG276:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP10]], i64 0, i64 1, !dbg [[DBG276]]
		// CHECK-TLS3-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1, !dbg [[DBG276]]
		// CHECK-TLS3-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX5]], i32 0, i32 0, !dbg [[DBG277:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP11:%.]] = load i32, i32 [[A6]], align 4, !dbg [[DBG277]]
		// CHECK-TLS3-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG278:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP12]], [[TMP11]], !dbg [[DBG278]]
		// CHECK-TLS3-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4, !dbg [[DBG278]]
		// CHECK-TLS3-NEXT: [[TMP13:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4, !dbg [[DBG279:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG280:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD8:%.*]] = add nsw i32 [[TMP14]], [[TMP13]], !dbg [[DBG280]]
		// CHECK-TLS3-NEXT: store i32 [[ADD8]], i32* [[RES]], align 4, !dbg [[DBG280]]
		// CHECK-TLS3-NEXT: [[TMP15:%.]] = load float, float @_ZN2STIfE2stE, align 4, !dbg [[DBG281:![0-9]+]]
		// CHECK-TLS3-NEXT: [[CONV:%.*]] = fptosi float [[TMP15]] to i32, !dbg [[DBG281]]
		// CHECK-TLS3-NEXT: [[TMP16:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG282:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP16]], [[CONV]], !dbg [[DBG282]]
		// CHECK-TLS3-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4, !dbg [[DBG282]]
		// CHECK-TLS3-NEXT: [[TMP17:%.]] = call %struct.S4 @_ZTWN2STI2S4E2stE(), !dbg [[DBG283:![0-9]+]]
		// CHECK-TLS3-NEXT: [[A10:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP17]], i32 0, i32 0, !dbg [[DBG284:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP18:%.]] = load i32, i32 [[A10]], align 4, !dbg [[DBG284]]
		// CHECK-TLS3-NEXT: [[TMP19:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG285:![0-9]+]]
		// CHECK-TLS3-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP19]], [[TMP18]], !dbg [[DBG285]]
		// CHECK-TLS3-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4, !dbg [[DBG285]]
		// CHECK-TLS3-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG286:![0-9]+]]
		// CHECK-TLS3-NEXT: ret i32 [[TMP20]], !dbg [[DBG287:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@__cxx_global_var_init.3
		// CHECK-TLS3-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) !dbg [[DBG288:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG289:![0-9]+]]
		// CHECK-TLS3-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG289]]
		// CHECK-TLS3-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG289]]
		// CHECK-TLS3: init.check:
		// CHECK-TLS3-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23), !dbg [[DBG290:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP1:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG289]]
		// CHECK-TLS3-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG289]]
		// CHECK-TLS3-NEXT: br label [[INIT_END]], !dbg [[DBG289]]
		// CHECK-TLS3: init.end:
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG292:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// CHECK-TLS3-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 !dbg [[DBG293:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META294:![0-9]+]], metadata !DIExpression()), !dbg [[DBG296:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META297:![0-9]+]], metadata !DIExpression()), !dbg [[DBG298:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG299:![0-9]+]]
		// CHECK-TLS3-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG299]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG300:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// CHECK-TLS3-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG301:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS3-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META302:![0-9]+]], metadata !DIExpression()), !dbg [[DBG303:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR3]], !dbg [[DBG304:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG305:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// CHECK-TLS3-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG306:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS3-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META307:![0-9]+]], metadata !DIExpression()), !dbg [[DBG308:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META309:![0-9]+]], metadata !DIExpression()), !dbg [[DBG310:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG311:![0-9]+]]
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG312:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG311]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG313:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// CHECK-TLS3-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG314:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS3-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META315:![0-9]+]], metadata !DIExpression()), !dbg [[DBG316:![0-9]+]]
		// CHECK-TLS3-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG317:![0-9]+]]
		// CHECK-TLS3-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG319:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void, !dbg [[DBG320:![0-9]+]]
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// CHECK-TLS3-SAME: () #[[ATTR0]] !dbg [[DBG321:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: call void @__cxx_global_var_init.1(), !dbg [[DBG323:![0-9]+]]
		// CHECK-TLS3-NEXT: ret void
		//
		//
		// CHECK-TLS3-LABEL: define {{[^@]+}}@__tls_init
		// CHECK-TLS3-SAME: () #[[ATTR0]] !dbg [[DBG324:![0-9]+]] {
		// CHECK-TLS3-NEXT: entry:
		// CHECK-TLS3-NEXT: [[TMP0:%.]] = load i8, i8 @__tls_guard, align 1, !dbg [[DBG325:![0-9]+]]
		// CHECK-TLS3-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG325]]
		// CHECK-TLS3-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT:%.]], label [[EXIT:%.]], !dbg [[DBG325]], !prof [[PROF205]]
		// CHECK-TLS3: init:
		// CHECK-TLS3-NEXT: store i8 1, i8* @__tls_guard, align 1, !dbg [[DBG325]]
		// CHECK-TLS3-NEXT: call void @__cxx_global_var_init(), !dbg [[DBG325]]
		// CHECK-TLS3-NEXT: call void @__cxx_global_var_init.2(), !dbg [[DBG325]]
		// CHECK-TLS3-NEXT: br label [[EXIT]], !dbg [[DBG325]]
		// CHECK-TLS3: exit:
		// CHECK-TLS3-NEXT: ret void
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@main
		// CHECK-TLS4-SAME: () #[[ATTR0:[0-9]+]] !dbg [[DBG10:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META115:![0-9]+]], metadata !DIExpression()), !dbg [[DBG116:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i8, i8 @_ZGVZ4mainE2sm, align 1, !dbg [[DBG117:![0-9]+]]
		// CHECK-TLS4-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG117]]
		// CHECK-TLS4-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG117]], !prof [[PROF118:![0-9]+]]
		// CHECK-TLS4: init.check:
		// CHECK-TLS4-NEXT: [[TMP1:%.]] = call %struct.S1 @_ZTWL3gs1(), !dbg [[DBG119:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP1]], i32 0, i32 0, !dbg [[DBG120:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP2:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG120]]
		// CHECK-TLS4-NEXT: call void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP2]]), !dbg [[DBG121:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP3:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR5:[0-9]+]], !dbg [[DBG117]]
		// CHECK-TLS4-NEXT: store i8 1, i8* @_ZGVZ4mainE2sm, align 1, !dbg [[DBG117]]
		// CHECK-TLS4-NEXT: br label [[INIT_END]], !dbg [[DBG117]]
		// CHECK-TLS4: init.end:
		// CHECK-TLS4-NEXT: [[TMP4:%.]] = call %struct.S3 @_ZTWN6Static1sE(), !dbg [[DBG122:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP4]], i32 0, i32 0, !dbg [[DBG123:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP5:%.]] = load i32, i32 [[A1]], align 4, !dbg [[DBG123]]
		// CHECK-TLS4-NEXT: store i32 [[TMP5]], i32* [[RES]], align 4, !dbg [[DBG124:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP6:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_SMAIN:%.]], %struct.Smain @_ZZ4mainE2sm, i32 0, i32 0), align 8, !dbg [[DBG125:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP7:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG126:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP7]], [[TMP6]], !dbg [[DBG126]]
		// CHECK-TLS4-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG126]]
		// CHECK-TLS4-NEXT: [[TMP8:%.]] = call %struct.S1 @_ZTWL3gs1(), !dbg [[DBG127:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[TMP8]], i32 0, i32 0, !dbg [[DBG128:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP9:%.]] = load i32, i32 [[A2]], align 4, !dbg [[DBG128]]
		// CHECK-TLS4-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG129:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP10]], [[TMP9]], !dbg [[DBG129]]
		// CHECK-TLS4-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4, !dbg [[DBG129]]
		// CHECK-TLS4-NEXT: [[TMP11:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG130:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG131:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP12]], [[TMP11]], !dbg [[DBG131]]
		// CHECK-TLS4-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG131]]
		// CHECK-TLS4-NEXT: [[TMP13:%.]] = call %struct.S5 @_ZTW3gs3(), !dbg [[DBG132:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A5:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP13]], i32 0, i32 0, !dbg [[DBG133:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP14:%.]] = load i32, i32 [[A5]], align 4, !dbg [[DBG133]]
		// CHECK-TLS4-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG134:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP15]], [[TMP14]], !dbg [[DBG134]]
		// CHECK-TLS4-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4, !dbg [[DBG134]]
		// CHECK-TLS4-NEXT: [[TMP16:%.]] = call [2 x [3 x %struct.S1]] @_ZTW5arr_x(), !dbg [[DBG135:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP16]], i64 0, i64 1, !dbg [[DBG135]]
		// CHECK-TLS4-NEXT: [[ARRAYIDX7:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1, !dbg [[DBG135]]
		// CHECK-TLS4-NEXT: [[A8:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX7]], i32 0, i32 0, !dbg [[DBG136:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP17:%.]] = load i32, i32 [[A8]], align 4, !dbg [[DBG136]]
		// CHECK-TLS4-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG137:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP18]], [[TMP17]], !dbg [[DBG137]]
		// CHECK-TLS4-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4, !dbg [[DBG137]]
		// CHECK-TLS4-NEXT: [[TMP19:%.]] = call i32 @_ZTWN2STIiE2stE(), !dbg [[DBG138:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4, !dbg [[DBG138]]
		// CHECK-TLS4-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG139:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP21]], [[TMP20]], !dbg [[DBG139]]
		// CHECK-TLS4-NEXT: store i32 [[ADD10]], i32* [[RES]], align 4, !dbg [[DBG139]]
		// CHECK-TLS4-NEXT: [[TMP22:%.]] = call float @_ZTWN2STIfE2stE(), !dbg [[DBG140:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP23:%.]] = load float, float [[TMP22]], align 4, !dbg [[DBG140]]
		// CHECK-TLS4-NEXT: [[CONV:%.*]] = fptosi float [[TMP23]] to i32, !dbg [[DBG140]]
		// CHECK-TLS4-NEXT: [[TMP24:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG141:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP24]], [[CONV]], !dbg [[DBG141]]
		// CHECK-TLS4-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4, !dbg [[DBG141]]
		// CHECK-TLS4-NEXT: [[TMP25:%.]] = call %struct.S4 @_ZTWN2STI2S4E2stE(), !dbg [[DBG142:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A12:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP25]], i32 0, i32 0, !dbg [[DBG143:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP26:%.]] = load i32, i32 [[A12]], align 4, !dbg [[DBG143]]
		// CHECK-TLS4-NEXT: [[TMP27:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG144:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD13:%.*]] = add nsw i32 [[TMP27]], [[TMP26]], !dbg [[DBG144]]
		// CHECK-TLS4-NEXT: store i32 [[ADD13]], i32* [[RES]], align 4, !dbg [[DBG144]]
		// CHECK-TLS4-NEXT: [[TMP28:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG145:![0-9]+]]
		// CHECK-TLS4-NEXT: ret i32 [[TMP28]], !dbg [[DBG146:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZTWL3gs1
		// CHECK-TLS4-SAME: () #[[ATTR2:[0-9]+]] {
		// CHECK-TLS4-NEXT: call void @_ZTHL3gs1()
		// CHECK-TLS4-NEXT: ret %struct.S1* @_ZL3gs1
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// CHECK-TLS4-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3:[0-9]+]] align 2 !dbg [[DBG147:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META148:![0-9]+]], metadata !DIExpression()), !dbg [[DBG150:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META151:![0-9]+]], metadata !DIExpression()), !dbg [[DBG152:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG153:![0-9]+]]
		// CHECK-TLS4-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG153]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG154:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// CHECK-TLS4-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR4:[0-9]+]] align 2 !dbg [[DBG155:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS4-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META156:![0-9]+]], metadata !DIExpression()), !dbg [[DBG157:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR5]], !dbg [[DBG158:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG159:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZTWN6Static1sE
		// CHECK-TLS4-SAME: () #[[ATTR2]] comdat {
		// CHECK-TLS4-NEXT: br i1 icmp ne (void ()* @_ZTHN6Static1sE, void ()* null), label [[TMP1:%.]], label [[TMP2:%.]]
		// CHECK-TLS4: 1:
		// CHECK-TLS4-NEXT: call void @_ZTHN6Static1sE()
		// CHECK-TLS4-NEXT: br label [[TMP2]]
		// CHECK-TLS4: 2:
		// CHECK-TLS4-NEXT: ret %struct.S3* @_ZN6Static1sE
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZTW3gs3
		// CHECK-TLS4-SAME: () #[[ATTR2]] comdat {
		// CHECK-TLS4-NEXT: br i1 icmp ne (void ()* @_ZTH3gs3, void ()* null), label [[TMP1:%.]], label [[TMP2:%.]]
		// CHECK-TLS4: 1:
		// CHECK-TLS4-NEXT: call void @_ZTH3gs3()
		// CHECK-TLS4-NEXT: br label [[TMP2]]
		// CHECK-TLS4: 2:
		// CHECK-TLS4-NEXT: ret %struct.S5* @gs3
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZTW5arr_x
		// CHECK-TLS4-SAME: () #[[ATTR2]] comdat {
		// CHECK-TLS4-NEXT: call void @_ZTH5arr_x()
		// CHECK-TLS4-NEXT: ret [2 x [3 x %struct.S1]]* @arr_x
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZTWN2STIiE2stE
		// CHECK-TLS4-SAME: () #[[ATTR2]] comdat {
		// CHECK-TLS4-NEXT: ret i32* @_ZN2STIiE2stE
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZTWN2STIfE2stE
		// CHECK-TLS4-SAME: () #[[ATTR2]] comdat {
		// CHECK-TLS4-NEXT: ret float* @_ZN2STIfE2stE
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZTWN2STI2S4E2stE
		// CHECK-TLS4-SAME: () #[[ATTR2]] comdat {
		// CHECK-TLS4-NEXT: call void @_ZTHN2STI2S4E2stE()
		// CHECK-TLS4-NEXT: ret %struct.S4* @_ZN2STI2S4E2stE
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_Z6foobarv
		// CHECK-TLS4-SAME: () #[[ATTR6:[0-9]+]] !dbg [[DBG160:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[RES:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META161:![0-9]+]], metadata !DIExpression()), !dbg [[DBG162:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = call %struct.S3 @_ZTWN6Static1sE(), !dbg [[DBG163:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP0]], i32 0, i32 0, !dbg [[DBG164:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG164]]
		// CHECK-TLS4-NEXT: store i32 [[TMP1]], i32* [[RES]], align 4, !dbg [[DBG165:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP2:%.]] = call %struct.S1 @_ZTWL3gs1(), !dbg [[DBG166:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP2]], i32 0, i32 0, !dbg [[DBG167:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP3:%.]] = load i32, i32 [[A1]], align 4, !dbg [[DBG167]]
		// CHECK-TLS4-NEXT: [[TMP4:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG168:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP4]], [[TMP3]], !dbg [[DBG168]]
		// CHECK-TLS4-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG168]]
		// CHECK-TLS4-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG169:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG170:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP6]], [[TMP5]], !dbg [[DBG170]]
		// CHECK-TLS4-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4, !dbg [[DBG170]]
		// CHECK-TLS4-NEXT: [[TMP7:%.]] = call %struct.S5 @_ZTW3gs3(), !dbg [[DBG171:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP7]], i32 0, i32 0, !dbg [[DBG172:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP8:%.]] = load i32, i32 [[A3]], align 4, !dbg [[DBG172]]
		// CHECK-TLS4-NEXT: [[TMP9:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG173:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP9]], [[TMP8]], !dbg [[DBG173]]
		// CHECK-TLS4-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG173]]
		// CHECK-TLS4-NEXT: [[TMP10:%.]] = call [2 x [3 x %struct.S1]] @_ZTW5arr_x(), !dbg [[DBG174:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP10]], i64 0, i64 1, !dbg [[DBG174]]
		// CHECK-TLS4-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1, !dbg [[DBG174]]
		// CHECK-TLS4-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX5]], i32 0, i32 0, !dbg [[DBG175:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP11:%.]] = load i32, i32 [[A6]], align 4, !dbg [[DBG175]]
		// CHECK-TLS4-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG176:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP12]], [[TMP11]], !dbg [[DBG176]]
		// CHECK-TLS4-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4, !dbg [[DBG176]]
		// CHECK-TLS4-NEXT: [[TMP13:%.]] = call i32 @_ZTWN2STIiE2stE(), !dbg [[DBG177:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP14:%.]] = load i32, i32 [[TMP13]], align 4, !dbg [[DBG177]]
		// CHECK-TLS4-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG178:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD8:%.*]] = add nsw i32 [[TMP15]], [[TMP14]], !dbg [[DBG178]]
		// CHECK-TLS4-NEXT: store i32 [[ADD8]], i32* [[RES]], align 4, !dbg [[DBG178]]
		// CHECK-TLS4-NEXT: [[TMP16:%.]] = call float @_ZTWN2STIfE2stE(), !dbg [[DBG179:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP17:%.]] = load float, float [[TMP16]], align 4, !dbg [[DBG179]]
		// CHECK-TLS4-NEXT: [[CONV:%.*]] = fptosi float [[TMP17]] to i32, !dbg [[DBG179]]
		// CHECK-TLS4-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG180:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP18]], [[CONV]], !dbg [[DBG180]]
		// CHECK-TLS4-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4, !dbg [[DBG180]]
		// CHECK-TLS4-NEXT: [[TMP19:%.]] = call %struct.S4 @_ZTWN2STI2S4E2stE(), !dbg [[DBG181:![0-9]+]]
		// CHECK-TLS4-NEXT: [[A10:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP19]], i32 0, i32 0, !dbg [[DBG182:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP20:%.]] = load i32, i32 [[A10]], align 4, !dbg [[DBG182]]
		// CHECK-TLS4-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG183:![0-9]+]]
		// CHECK-TLS4-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP21]], [[TMP20]], !dbg [[DBG183]]
		// CHECK-TLS4-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4, !dbg [[DBG183]]
		// CHECK-TLS4-NEXT: [[TMP22:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG184:![0-9]+]]
		// CHECK-TLS4-NEXT: ret i32 [[TMP22]], !dbg [[DBG185:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// CHECK-TLS4-SAME: () #[[ATTR7:[0-9]+]] !dbg [[DBG186:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5), !dbg [[DBG189:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR5]], !dbg [[DBG191:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG192:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// CHECK-TLS4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG193:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META194:![0-9]+]], metadata !DIExpression()), !dbg [[DBG196:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META197:![0-9]+]], metadata !DIExpression()), !dbg [[DBG198:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG199:![0-9]+]]
		// CHECK-TLS4-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG199]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG200:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// CHECK-TLS4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG201:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META202:![0-9]+]], metadata !DIExpression()), !dbg [[DBG203:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR5]], !dbg [[DBG204:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG205:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// CHECK-TLS4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG206:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META207:![0-9]+]], metadata !DIExpression()), !dbg [[DBG208:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META209:![0-9]+]], metadata !DIExpression()), !dbg [[DBG210:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG211:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG212:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG211]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG213:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// CHECK-TLS4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG214:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META215:![0-9]+]], metadata !DIExpression()), !dbg [[DBG216:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG217:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG219:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG220:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// CHECK-TLS4-SAME: () #[[ATTR7]] !dbg [[DBG221:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27), !dbg [[DBG222:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR5]], !dbg [[DBG224:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG225:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// CHECK-TLS4-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG226:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META227:![0-9]+]], metadata !DIExpression()), !dbg [[DBG229:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META230:![0-9]+]], metadata !DIExpression()), !dbg [[DBG231:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG232:![0-9]+]]
		// CHECK-TLS4-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG232]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG233:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// CHECK-TLS4-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG234:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS4-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META235:![0-9]+]], metadata !DIExpression()), !dbg [[DBG236:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR5]], !dbg [[DBG237:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG238:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// CHECK-TLS4-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG239:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META240:![0-9]+]], metadata !DIExpression()), !dbg [[DBG241:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META242:![0-9]+]], metadata !DIExpression()), !dbg [[DBG243:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG244:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG245:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG244]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG246:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// CHECK-TLS4-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG247:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// CHECK-TLS4-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META248:![0-9]+]], metadata !DIExpression()), !dbg [[DBG249:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG250:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG252:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG253:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// CHECK-TLS4-SAME: () #[[ATTR7]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG254:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// CHECK-TLS4-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS4-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// CHECK-TLS4-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// CHECK-TLS4-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG255:![0-9]+]]
		// CHECK-TLS4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG257:![0-9]+]]
		// CHECK-TLS4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// CHECK-TLS4-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG258:![0-9]+]]
		// CHECK-TLS4: invoke.cont:
		// CHECK-TLS4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG257]]
		// CHECK-TLS4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// CHECK-TLS4-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]], !dbg [[DBG259:![0-9]+]]
		// CHECK-TLS4: invoke.cont2:
		// CHECK-TLS4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG257]]
		// CHECK-TLS4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// CHECK-TLS4-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]], !dbg [[DBG260:![0-9]+]]
		// CHECK-TLS4: invoke.cont3:
		// CHECK-TLS4-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG261:![0-9]+]]
		// CHECK-TLS4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// CHECK-TLS4-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]], !dbg [[DBG262:![0-9]+]]
		// CHECK-TLS4: invoke.cont7:
		// CHECK-TLS4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG261]]
		// CHECK-TLS4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// CHECK-TLS4-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]], !dbg [[DBG263:![0-9]+]]
		// CHECK-TLS4: invoke.cont8:
		// CHECK-TLS4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG261]]
		// CHECK-TLS4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// CHECK-TLS4-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]], !dbg [[DBG264:![0-9]+]]
		// CHECK-TLS4: invoke.cont9:
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = call i32 @__cxa_thread_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR5]], !dbg [[DBG265:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG265]]
		// CHECK-TLS4: lpad:
		// CHECK-TLS4-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// CHECK-TLS4-NEXT: cleanup, !dbg [[DBG266:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG257]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]], !dbg [[DBG257]]
		// CHECK-TLS4-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG257]]
		// CHECK-TLS4: arraydestroy.body:
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG257]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG257]]
		// CHECK-TLS4-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR5]], !dbg [[DBG257]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG257]]
		// CHECK-TLS4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG257]]
		// CHECK-TLS4: arraydestroy.done4:
		// CHECK-TLS4-NEXT: br label [[EHCLEANUP:%.*]], !dbg [[DBG257]]
		// CHECK-TLS4: lpad6:
		// CHECK-TLS4-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// CHECK-TLS4-NEXT: cleanup, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG266]]
		// CHECK-TLS4-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG261]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]], !dbg [[DBG261]]
		// CHECK-TLS4-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]], !dbg [[DBG261]]
		// CHECK-TLS4: arraydestroy.body11:
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ], !dbg [[DBG261]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1, !dbg [[DBG261]]
		// CHECK-TLS4-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR5]], !dbg [[DBG261]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), !dbg [[DBG261]]
		// CHECK-TLS4-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]], !dbg [[DBG261]]
		// CHECK-TLS4: arraydestroy.done15:
		// CHECK-TLS4-NEXT: br label [[EHCLEANUP]], !dbg [[DBG261]]
		// CHECK-TLS4: ehcleanup:
		// CHECK-TLS4-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0, !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]], !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]], !dbg [[DBG255]]
		// CHECK-TLS4: arraydestroy.body17:
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ], !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1, !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR5]], !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]], !dbg [[DBG255]]
		// CHECK-TLS4: arraydestroy.done21:
		// CHECK-TLS4-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG255]]
		// CHECK-TLS4: eh.resume:
		// CHECK-TLS4-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG255]]
		// CHECK-TLS4-NEXT: resume { i8*, i32 } [[LPAD_VAL22]], !dbg [[DBG255]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// CHECK-TLS4-SAME: (i8* [[TMP0:%.*]]) #[[ATTR7]] !dbg [[DBG267:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// CHECK-TLS4-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META271:![0-9]+]], metadata !DIExpression()), !dbg [[DBG272:![0-9]+]]
		// CHECK-TLS4-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG272]]
		// CHECK-TLS4: arraydestroy.body:
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG272]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG272]]
		// CHECK-TLS4-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR5]], !dbg [[DBG272]]
		// CHECK-TLS4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), !dbg [[DBG272]]
		// CHECK-TLS4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG272]]
		// CHECK-TLS4: arraydestroy.done1:
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG272]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// CHECK-TLS4-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR4]] align 2 !dbg [[DBG273:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META274:![0-9]+]], metadata !DIExpression()), !dbg [[DBG275:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META276:![0-9]+]], metadata !DIExpression()), !dbg [[DBG277:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG278:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG279:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG278]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG280:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// CHECK-TLS4-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR4]] align 2 !dbg [[DBG281:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// CHECK-TLS4-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META282:![0-9]+]], metadata !DIExpression()), !dbg [[DBG283:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG284:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG286:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG287:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@__cxx_global_var_init.3
		// CHECK-TLS4-SAME: () #[[ATTR7]] comdat($_ZN2STI2S4E2stE) !dbg [[DBG288:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG289:![0-9]+]]
		// CHECK-TLS4-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG289]]
		// CHECK-TLS4-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG289]]
		// CHECK-TLS4: init.check:
		// CHECK-TLS4-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23), !dbg [[DBG290:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP1:%.]] = call i32 @__cxa_thread_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR5]], !dbg [[DBG289]]
		// CHECK-TLS4-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG289]]
		// CHECK-TLS4-NEXT: br label [[INIT_END]], !dbg [[DBG289]]
		// CHECK-TLS4: init.end:
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG292:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// CHECK-TLS4-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG293:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META294:![0-9]+]], metadata !DIExpression()), !dbg [[DBG296:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META297:![0-9]+]], metadata !DIExpression()), !dbg [[DBG298:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG299:![0-9]+]]
		// CHECK-TLS4-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG299]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG300:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// CHECK-TLS4-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG301:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS4-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META302:![0-9]+]], metadata !DIExpression()), !dbg [[DBG303:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR5]], !dbg [[DBG304:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG305:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// CHECK-TLS4-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG306:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// CHECK-TLS4-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META307:![0-9]+]], metadata !DIExpression()), !dbg [[DBG308:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META309:![0-9]+]], metadata !DIExpression()), !dbg [[DBG310:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG311:![0-9]+]]
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG312:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG311]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG313:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// CHECK-TLS4-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR4]] comdat align 2 !dbg [[DBG314:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// CHECK-TLS4-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META315:![0-9]+]], metadata !DIExpression()), !dbg [[DBG316:![0-9]+]]
		// CHECK-TLS4-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// CHECK-TLS4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG317:![0-9]+]]
		// CHECK-TLS4-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG319:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void, !dbg [[DBG320:![0-9]+]]
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// CHECK-TLS4-SAME: () #[[ATTR7]] !dbg [[DBG321:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: call void @__cxx_global_var_init.1(), !dbg [[DBG323:![0-9]+]]
		// CHECK-TLS4-NEXT: ret void
		//
		//
		// CHECK-TLS4-LABEL: define {{[^@]+}}@__tls_init
		// CHECK-TLS4-SAME: () #[[ATTR7]] !dbg [[DBG324:![0-9]+]] {
		// CHECK-TLS4-NEXT: entry:
		// CHECK-TLS4-NEXT: [[TMP0:%.]] = load i8, i8 @__tls_guard, align 1, !dbg [[DBG325:![0-9]+]]
		// CHECK-TLS4-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG325]]
		// CHECK-TLS4-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT:%.]], label [[EXIT:%.]], !dbg [[DBG325]], !prof [[PROF118]]
		// CHECK-TLS4: init:
		// CHECK-TLS4-NEXT: store i8 1, i8* @__tls_guard, align 1, !dbg [[DBG325]]
		// CHECK-TLS4-NEXT: call void @__cxx_global_var_init(), !dbg [[DBG325]]
		// CHECK-TLS4-NEXT: call void @__cxx_global_var_init.2(), !dbg [[DBG325]]
		// CHECK-TLS4-NEXT: br label [[EXIT]], !dbg [[DBG325]]
		// CHECK-TLS4: exit:
		// CHECK-TLS4-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// SIMD3-SAME: () #[[ATTR0:[0-9]+]] {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5)
		// SIMD3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]]
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// SIMD3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD3-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]])
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// SIMD3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]]
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// SIMD3-SAME: () #[[ATTR0]] {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27)
		// SIMD3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR3]]
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// SIMD3-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD3-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]])
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// SIMD3-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD3-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR3]]
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// SIMD3-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// SIMD3-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// SIMD3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// SIMD3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// SIMD3-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// SIMD3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// SIMD3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// SIMD3-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// SIMD3: invoke.cont:
		// SIMD3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// SIMD3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// SIMD3-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]]
		// SIMD3: invoke.cont2:
		// SIMD3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// SIMD3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// SIMD3-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]]
		// SIMD3: invoke.cont3:
		// SIMD3-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// SIMD3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// SIMD3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// SIMD3-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]]
		// SIMD3: invoke.cont7:
		// SIMD3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// SIMD3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// SIMD3-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]]
		// SIMD3: invoke.cont8:
		// SIMD3-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// SIMD3-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// SIMD3-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]]
		// SIMD3: invoke.cont9:
		// SIMD3-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]]
		// SIMD3-NEXT: ret void
		// SIMD3: lpad:
		// SIMD3-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// SIMD3-NEXT: cleanup
		// SIMD3-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0
		// SIMD3-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8
		// SIMD3-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1
		// SIMD3-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4
		// SIMD3-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8
		// SIMD3-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]]
		// SIMD3-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]]
		// SIMD3: arraydestroy.body:
		// SIMD3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ]
		// SIMD3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// SIMD3-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// SIMD3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// SIMD3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]]
		// SIMD3: arraydestroy.done4:
		// SIMD3-NEXT: br label [[EHCLEANUP:%.*]]
		// SIMD3: lpad6:
		// SIMD3-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// SIMD3-NEXT: cleanup
		// SIMD3-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0
		// SIMD3-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8
		// SIMD3-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1
		// SIMD3-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4
		// SIMD3-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8
		// SIMD3-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]]
		// SIMD3-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]]
		// SIMD3: arraydestroy.body11:
		// SIMD3-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ]
		// SIMD3-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1
		// SIMD3-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR3]]
		// SIMD3-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0)
		// SIMD3-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]]
		// SIMD3: arraydestroy.done15:
		// SIMD3-NEXT: br label [[EHCLEANUP]]
		// SIMD3: ehcleanup:
		// SIMD3-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8
		// SIMD3-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0
		// SIMD3-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]]
		// SIMD3-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]]
		// SIMD3: arraydestroy.body17:
		// SIMD3-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ]
		// SIMD3-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1
		// SIMD3-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]]
		// SIMD3-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0)
		// SIMD3-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]]
		// SIMD3: arraydestroy.done21:
		// SIMD3-NEXT: br label [[EH_RESUME:%.*]]
		// SIMD3: eh.resume:
		// SIMD3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// SIMD3-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// SIMD3-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// SIMD3-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// SIMD3-NEXT: resume { i8*, i32 } [[LPAD_VAL22]]
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// SIMD3-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// SIMD3-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// SIMD3-NEXT: br label [[ARRAYDESTROY_BODY:%.*]]
		// SIMD3: arraydestroy.body:
		// SIMD3-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ]
		// SIMD3-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1
		// SIMD3-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]]
		// SIMD3-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0)
		// SIMD3-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]]
		// SIMD3: arraydestroy.done1:
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@main
		// SIMD3-SAME: () #[[ATTR4:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: [[RES:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// SIMD3-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// SIMD3-NEXT: [[TMP0:%.]] = load atomic i8, i8 bitcast (i64* @_ZGVZ4mainE2sm to i8*) acquire, align 8
		// SIMD3-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// SIMD3-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !prof [[PROF2:![0-9]+]]
		// SIMD3: init.check:
		// SIMD3-NEXT: [[TMP1:%.]] = call i32 @__cxa_guard_acquire(i64 @_ZGVZ4mainE2sm) #[[ATTR3]]
		// SIMD3-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP1]], 0
		// SIMD3-NEXT: br i1 [[TOBOOL]], label [[INIT:%.*]], label [[INIT_END]]
		// SIMD3: init:
		// SIMD3-NEXT: [[TMP2:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 @_ZL3gs1, i32 0, i32 0), align 4
		// SIMD3-NEXT: invoke void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP2]])
		// SIMD3-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]]
		// SIMD3: invoke.cont:
		// SIMD3-NEXT: [[TMP3:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR3]]
		// SIMD3-NEXT: call void @__cxa_guard_release(i64* @_ZGVZ4mainE2sm) #[[ATTR3]]
		// SIMD3-NEXT: br label [[INIT_END]]
		// SIMD3: init.end:
		// SIMD3-NEXT: [[TMP4:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S3:%.]], %struct.S3 @_ZN6Static1sE, i32 0, i32 0), align 4
		// SIMD3-NEXT: store i32 [[TMP4]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_SMAIN:%.]], %struct.Smain @_ZZ4mainE2sm, i32 0, i32 0), align 8
		// SIMD3-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP6]], [[TMP5]]
		// SIMD3-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP7:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1]], %struct.S1* @_ZL3gs1, i32 0, i32 0), align 4
		// SIMD3-NEXT: [[TMP8:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD1:%.*]] = add nsw i32 [[TMP8]], [[TMP7]]
		// SIMD3-NEXT: store i32 [[ADD1]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP9:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// SIMD3-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP10]], [[TMP9]]
		// SIMD3-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP11:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S5:%.]], %struct.S5 @gs3, i32 0, i32 0), align 4
		// SIMD3-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP12]], [[TMP11]]
		// SIMD3-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP13:%.]] = load i32, i32 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1, i32 0), align 4
		// SIMD3-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]
		// SIMD3-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP15:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4
		// SIMD3-NEXT: [[TMP16:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP16]], [[TMP15]]
		// SIMD3-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP17:%.]] = load float, float @_ZN2STIfE2stE, align 4
		// SIMD3-NEXT: [[CONV:%.*]] = fptosi float [[TMP17]] to i32
		// SIMD3-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP18]], [[CONV]]
		// SIMD3-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP19:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S4:%.]], %struct.S4 @_ZN2STI2S4E2stE, i32 0, i32 0), align 4
		// SIMD3-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]
		// SIMD3-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: ret i32 [[TMP21]]
		// SIMD3: lpad:
		// SIMD3-NEXT: [[TMP22:%.]] = landingpad { i8, i32 }
		// SIMD3-NEXT: cleanup
		// SIMD3-NEXT: [[TMP23:%.]] = extractvalue { i8, i32 } [[TMP22]], 0
		// SIMD3-NEXT: store i8* [[TMP23]], i8** [[EXN_SLOT]], align 8
		// SIMD3-NEXT: [[TMP24:%.]] = extractvalue { i8, i32 } [[TMP22]], 1
		// SIMD3-NEXT: store i32 [[TMP24]], i32* [[EHSELECTOR_SLOT]], align 4
		// SIMD3-NEXT: call void @__cxa_guard_abort(i64* @_ZGVZ4mainE2sm) #[[ATTR3]]
		// SIMD3-NEXT: br label [[EH_RESUME:%.*]]
		// SIMD3: eh.resume:
		// SIMD3-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8
		// SIMD3-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4
		// SIMD3-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0
		// SIMD3-NEXT: [[LPAD_VAL8:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1
		// SIMD3-NEXT: resume { i8*, i32 } [[LPAD_VAL8]]
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// SIMD3-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD3-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]])
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// SIMD3-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD3-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR3]]
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_Z6foobarv
		// SIMD3-SAME: () #[[ATTR5:[0-9]+]] {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[RES:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S3:%.]], %struct.S3 @_ZN6Static1sE, i32 0, i32 0), align 4
		// SIMD3-NEXT: store i32 [[TMP0]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP1:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 @_ZL3gs1, i32 0, i32 0), align 4
		// SIMD3-NEXT: [[TMP2:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP2]], [[TMP1]]
		// SIMD3-NEXT: store i32 [[ADD]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP3:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8
		// SIMD3-NEXT: [[TMP4:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD1:%.*]] = add nsw i32 [[TMP4]], [[TMP3]]
		// SIMD3-NEXT: store i32 [[ADD1]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S5:%.]], %struct.S5 @gs3, i32 0, i32 0), align 4
		// SIMD3-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP6]], [[TMP5]]
		// SIMD3-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP7:%.]] = load i32, i32 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1, i32 0), align 4
		// SIMD3-NEXT: [[TMP8:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP8]], [[TMP7]]
		// SIMD3-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP9:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4
		// SIMD3-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP10]], [[TMP9]]
		// SIMD3-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP11:%.]] = load float, float @_ZN2STIfE2stE, align 4
		// SIMD3-NEXT: [[CONV:%.*]] = fptosi float [[TMP11]] to i32
		// SIMD3-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP12]], [[CONV]]
		// SIMD3-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP13:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S4:%.]], %struct.S4 @_ZN2STI2S4E2stE, i32 0, i32 0), align 4
		// SIMD3-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]
		// SIMD3-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4
		// SIMD3-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4
		// SIMD3-NEXT: ret i32 [[TMP15]]
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@__cxx_global_var_init.3
		// SIMD3-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// SIMD3-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0
		// SIMD3-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]]
		// SIMD3: init.check:
		// SIMD3-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23)
		// SIMD3-NEXT: [[TMP1:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR3]]
		// SIMD3-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8
		// SIMD3-NEXT: br label [[INIT_END]]
		// SIMD3: init.end:
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// SIMD3-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD3-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]])
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// SIMD3-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD3-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR3]]
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// SIMD3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD3-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// SIMD3-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD3-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0
		// SIMD3-NEXT: store i32 0, i32* [[A]], align 4
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// SIMD3-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD3-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// SIMD3-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD3-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0
		// SIMD3-NEXT: store i32 0, i32* [[A]], align 8
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// SIMD3-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD3-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// SIMD3-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD3-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0
		// SIMD3-NEXT: store i32 0, i32* [[A]], align 8
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// SIMD3-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD3-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD3-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// SIMD3-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4
		// SIMD3-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// SIMD3-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD3-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD3-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0
		// SIMD3-NEXT: store i32 0, i32* [[A]], align 4
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD3-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// SIMD3-SAME: () #[[ATTR0]] {
		// SIMD3-NEXT: entry:
		// SIMD3-NEXT: call void @__cxx_global_var_init()
		// SIMD3-NEXT: call void @__cxx_global_var_init.1()
		// SIMD3-NEXT: call void @__cxx_global_var_init.2()
		// SIMD3-NEXT: ret void
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// SIMD4-SAME: () #[[ATTR0:[0-9]+]] !dbg [[DBG115:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5), !dbg [[DBG118:![0-9]+]]
		// SIMD4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR3:[0-9]+]], !dbg [[DBG120:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG121:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// SIMD4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 !dbg [[DBG122:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META123:![0-9]+]], metadata !DIExpression()), !dbg [[DBG125:![0-9]+]]
		// SIMD4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META126:![0-9]+]], metadata !DIExpression()), !dbg [[DBG127:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG128:![0-9]+]]
		// SIMD4-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG128]]
		// SIMD4-NEXT: ret void, !dbg [[DBG129:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// SIMD4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 !dbg [[DBG130:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META131:![0-9]+]], metadata !DIExpression()), !dbg [[DBG132:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR3]], !dbg [[DBG133:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG134:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// SIMD4-SAME: () #[[ATTR0]] !dbg [[DBG135:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27), !dbg [[DBG136:![0-9]+]]
		// SIMD4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG138:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG139:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// SIMD4-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 !dbg [[DBG140:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META141:![0-9]+]], metadata !DIExpression()), !dbg [[DBG143:![0-9]+]]
		// SIMD4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META144:![0-9]+]], metadata !DIExpression()), !dbg [[DBG145:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG146:![0-9]+]]
		// SIMD4-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG146]]
		// SIMD4-NEXT: ret void, !dbg [[DBG147:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// SIMD4-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG148:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD4-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META149:![0-9]+]], metadata !DIExpression()), !dbg [[DBG150:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR3]], !dbg [[DBG151:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG152:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// SIMD4-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG153:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// SIMD4-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// SIMD4-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// SIMD4-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// SIMD4-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG154:![0-9]+]]
		// SIMD4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG156:![0-9]+]]
		// SIMD4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// SIMD4-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG157:![0-9]+]]
		// SIMD4: invoke.cont:
		// SIMD4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG156]]
		// SIMD4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// SIMD4-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]], !dbg [[DBG158:![0-9]+]]
		// SIMD4: invoke.cont2:
		// SIMD4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG156]]
		// SIMD4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// SIMD4-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]], !dbg [[DBG159:![0-9]+]]
		// SIMD4: invoke.cont3:
		// SIMD4-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG154]]
		// SIMD4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG160:![0-9]+]]
		// SIMD4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// SIMD4-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]], !dbg [[DBG161:![0-9]+]]
		// SIMD4: invoke.cont7:
		// SIMD4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG160]]
		// SIMD4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// SIMD4-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]], !dbg [[DBG162:![0-9]+]]
		// SIMD4: invoke.cont8:
		// SIMD4-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG160]]
		// SIMD4-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// SIMD4-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]], !dbg [[DBG163:![0-9]+]]
		// SIMD4: invoke.cont9:
		// SIMD4-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR3]], !dbg [[DBG164:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG164]]
		// SIMD4: lpad:
		// SIMD4-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// SIMD4-NEXT: cleanup, !dbg [[DBG165:![0-9]+]]
		// SIMD4-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0, !dbg [[DBG165]]
		// SIMD4-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG165]]
		// SIMD4-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1, !dbg [[DBG165]]
		// SIMD4-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG165]]
		// SIMD4-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG156]]
		// SIMD4-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]], !dbg [[DBG156]]
		// SIMD4-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG156]]
		// SIMD4: arraydestroy.body:
		// SIMD4-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG156]]
		// SIMD4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG156]]
		// SIMD4-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG156]]
		// SIMD4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG156]]
		// SIMD4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG156]]
		// SIMD4: arraydestroy.done4:
		// SIMD4-NEXT: br label [[EHCLEANUP:%.*]], !dbg [[DBG156]]
		// SIMD4: lpad6:
		// SIMD4-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// SIMD4-NEXT: cleanup, !dbg [[DBG165]]
		// SIMD4-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0, !dbg [[DBG165]]
		// SIMD4-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG165]]
		// SIMD4-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1, !dbg [[DBG165]]
		// SIMD4-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG165]]
		// SIMD4-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG160]]
		// SIMD4-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]], !dbg [[DBG160]]
		// SIMD4-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]], !dbg [[DBG160]]
		// SIMD4: arraydestroy.body11:
		// SIMD4-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ], !dbg [[DBG160]]
		// SIMD4-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1, !dbg [[DBG160]]
		// SIMD4-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR3]], !dbg [[DBG160]]
		// SIMD4-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), !dbg [[DBG160]]
		// SIMD4-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]], !dbg [[DBG160]]
		// SIMD4: arraydestroy.done15:
		// SIMD4-NEXT: br label [[EHCLEANUP]], !dbg [[DBG160]]
		// SIMD4: ehcleanup:
		// SIMD4-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG154]]
		// SIMD4-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0, !dbg [[DBG154]]
		// SIMD4-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]], !dbg [[DBG154]]
		// SIMD4-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]], !dbg [[DBG154]]
		// SIMD4: arraydestroy.body17:
		// SIMD4-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ], !dbg [[DBG154]]
		// SIMD4-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1, !dbg [[DBG154]]
		// SIMD4-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR3]], !dbg [[DBG154]]
		// SIMD4-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG154]]
		// SIMD4-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]], !dbg [[DBG154]]
		// SIMD4: arraydestroy.done21:
		// SIMD4-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG154]]
		// SIMD4: eh.resume:
		// SIMD4-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG154]]
		// SIMD4-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG154]]
		// SIMD4-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG154]]
		// SIMD4-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG154]]
		// SIMD4-NEXT: resume { i8*, i32 } [[LPAD_VAL22]], !dbg [[DBG154]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// SIMD4-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG166:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// SIMD4-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META170:![0-9]+]], metadata !DIExpression()), !dbg [[DBG171:![0-9]+]]
		// SIMD4-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG171]]
		// SIMD4: arraydestroy.body:
		// SIMD4-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG171]]
		// SIMD4-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG171]]
		// SIMD4-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR3]], !dbg [[DBG171]]
		// SIMD4-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), !dbg [[DBG171]]
		// SIMD4-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG171]]
		// SIMD4: arraydestroy.done1:
		// SIMD4-NEXT: ret void, !dbg [[DBG171]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@main
		// SIMD4-SAME: () #[[ATTR5:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG53:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: [[RES:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// SIMD4-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META172:![0-9]+]], metadata !DIExpression()), !dbg [[DBG173:![0-9]+]]
		// SIMD4-NEXT: [[TMP0:%.]] = load atomic i8, i8 bitcast (i64* @_ZGVZ4mainE2sm to i8*) acquire, align 8, !dbg [[DBG174:![0-9]+]]
		// SIMD4-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG174]]
		// SIMD4-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG174]], !prof [[PROF175:![0-9]+]]
		// SIMD4: init.check:
		// SIMD4-NEXT: [[TMP1:%.]] = call i32 @__cxa_guard_acquire(i64 @_ZGVZ4mainE2sm) #[[ATTR3]], !dbg [[DBG174]]
		// SIMD4-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP1]], 0, !dbg [[DBG174]]
		// SIMD4-NEXT: br i1 [[TOBOOL]], label [[INIT:%.*]], label [[INIT_END]], !dbg [[DBG174]]
		// SIMD4: init:
		// SIMD4-NEXT: [[TMP2:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 @_ZL3gs1, i32 0, i32 0), align 4, !dbg [[DBG176:![0-9]+]]
		// SIMD4-NEXT: invoke void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP2]])
		// SIMD4-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG177:![0-9]+]]
		// SIMD4: invoke.cont:
		// SIMD4-NEXT: [[TMP3:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG174]]
		// SIMD4-NEXT: call void @__cxa_guard_release(i64* @_ZGVZ4mainE2sm) #[[ATTR3]], !dbg [[DBG174]]
		// SIMD4-NEXT: br label [[INIT_END]], !dbg [[DBG174]]
		// SIMD4: init.end:
		// SIMD4-NEXT: [[TMP4:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S3:%.]], %struct.S3 @_ZN6Static1sE, i32 0, i32 0), align 4, !dbg [[DBG178:![0-9]+]]
		// SIMD4-NEXT: store i32 [[TMP4]], i32* [[RES]], align 4, !dbg [[DBG179:![0-9]+]]
		// SIMD4-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_SMAIN:%.]], %struct.Smain @_ZZ4mainE2sm, i32 0, i32 0), align 8, !dbg [[DBG180:![0-9]+]]
		// SIMD4-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG181:![0-9]+]]
		// SIMD4-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP6]], [[TMP5]], !dbg [[DBG181]]
		// SIMD4-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG181]]
		// SIMD4-NEXT: [[TMP7:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1]], %struct.S1* @_ZL3gs1, i32 0, i32 0), align 4, !dbg [[DBG182:![0-9]+]]
		// SIMD4-NEXT: [[TMP8:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG183:![0-9]+]]
		// SIMD4-NEXT: [[ADD1:%.*]] = add nsw i32 [[TMP8]], [[TMP7]], !dbg [[DBG183]]
		// SIMD4-NEXT: store i32 [[ADD1]], i32* [[RES]], align 4, !dbg [[DBG183]]
		// SIMD4-NEXT: [[TMP9:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG184:![0-9]+]]
		// SIMD4-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG185:![0-9]+]]
		// SIMD4-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP10]], [[TMP9]], !dbg [[DBG185]]
		// SIMD4-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4, !dbg [[DBG185]]
		// SIMD4-NEXT: [[TMP11:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S5:%.]], %struct.S5 @gs3, i32 0, i32 0), align 4, !dbg [[DBG186:![0-9]+]]
		// SIMD4-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG187:![0-9]+]]
		// SIMD4-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP12]], [[TMP11]], !dbg [[DBG187]]
		// SIMD4-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4, !dbg [[DBG187]]
		// SIMD4-NEXT: [[TMP13:%.]] = load i32, i32 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1, i32 0), align 4, !dbg [[DBG188:![0-9]+]]
		// SIMD4-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG189:![0-9]+]]
		// SIMD4-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP14]], [[TMP13]], !dbg [[DBG189]]
		// SIMD4-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG189]]
		// SIMD4-NEXT: [[TMP15:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4, !dbg [[DBG190:![0-9]+]]
		// SIMD4-NEXT: [[TMP16:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG191:![0-9]+]]
		// SIMD4-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP16]], [[TMP15]], !dbg [[DBG191]]
		// SIMD4-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4, !dbg [[DBG191]]
		// SIMD4-NEXT: [[TMP17:%.]] = load float, float @_ZN2STIfE2stE, align 4, !dbg [[DBG192:![0-9]+]]
		// SIMD4-NEXT: [[CONV:%.*]] = fptosi float [[TMP17]] to i32, !dbg [[DBG192]]
		// SIMD4-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG193:![0-9]+]]
		// SIMD4-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP18]], [[CONV]], !dbg [[DBG193]]
		// SIMD4-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4, !dbg [[DBG193]]
		// SIMD4-NEXT: [[TMP19:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S4:%.]], %struct.S4 @_ZN2STI2S4E2stE, i32 0, i32 0), align 4, !dbg [[DBG194:![0-9]+]]
		// SIMD4-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG195:![0-9]+]]
		// SIMD4-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP20]], [[TMP19]], !dbg [[DBG195]]
		// SIMD4-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4, !dbg [[DBG195]]
		// SIMD4-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG196:![0-9]+]]
		// SIMD4-NEXT: ret i32 [[TMP21]], !dbg [[DBG197:![0-9]+]]
		// SIMD4: lpad:
		// SIMD4-NEXT: [[TMP22:%.]] = landingpad { i8, i32 }
		// SIMD4-NEXT: cleanup, !dbg [[DBG198:![0-9]+]]
		// SIMD4-NEXT: [[TMP23:%.]] = extractvalue { i8, i32 } [[TMP22]], 0, !dbg [[DBG198]]
		// SIMD4-NEXT: store i8* [[TMP23]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG198]]
		// SIMD4-NEXT: [[TMP24:%.]] = extractvalue { i8, i32 } [[TMP22]], 1, !dbg [[DBG198]]
		// SIMD4-NEXT: store i32 [[TMP24]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG198]]
		// SIMD4-NEXT: call void @__cxa_guard_abort(i64* @_ZGVZ4mainE2sm) #[[ATTR3]], !dbg [[DBG174]]
		// SIMD4-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG174]]
		// SIMD4: eh.resume:
		// SIMD4-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG174]]
		// SIMD4-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG174]]
		// SIMD4-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG174]]
		// SIMD4-NEXT: [[LPAD_VAL8:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG174]]
		// SIMD4-NEXT: resume { i8*, i32 } [[LPAD_VAL8]], !dbg [[DBG174]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// SIMD4-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] align 2 !dbg [[DBG199:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META200:![0-9]+]], metadata !DIExpression()), !dbg [[DBG202:![0-9]+]]
		// SIMD4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META203:![0-9]+]], metadata !DIExpression()), !dbg [[DBG204:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG205:![0-9]+]]
		// SIMD4-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG205]]
		// SIMD4-NEXT: ret void, !dbg [[DBG206:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// SIMD4-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG207:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD4-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META208:![0-9]+]], metadata !DIExpression()), !dbg [[DBG209:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR3]], !dbg [[DBG210:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG211:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_Z6foobarv
		// SIMD4-SAME: () #[[ATTR6:[0-9]+]] !dbg [[DBG212:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[RES:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META213:![0-9]+]], metadata !DIExpression()), !dbg [[DBG214:![0-9]+]]
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S3:%.]], %struct.S3 @_ZN6Static1sE, i32 0, i32 0), align 4, !dbg [[DBG215:![0-9]+]]
		// SIMD4-NEXT: store i32 [[TMP0]], i32* [[RES]], align 4, !dbg [[DBG216:![0-9]+]]
		// SIMD4-NEXT: [[TMP1:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 @_ZL3gs1, i32 0, i32 0), align 4, !dbg [[DBG217:![0-9]+]]
		// SIMD4-NEXT: [[TMP2:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG218:![0-9]+]]
		// SIMD4-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP2]], [[TMP1]], !dbg [[DBG218]]
		// SIMD4-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG218]]
		// SIMD4-NEXT: [[TMP3:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG219:![0-9]+]]
		// SIMD4-NEXT: [[TMP4:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG220:![0-9]+]]
		// SIMD4-NEXT: [[ADD1:%.*]] = add nsw i32 [[TMP4]], [[TMP3]], !dbg [[DBG220]]
		// SIMD4-NEXT: store i32 [[ADD1]], i32* [[RES]], align 4, !dbg [[DBG220]]
		// SIMD4-NEXT: [[TMP5:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S5:%.]], %struct.S5 @gs3, i32 0, i32 0), align 4, !dbg [[DBG221:![0-9]+]]
		// SIMD4-NEXT: [[TMP6:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG222:![0-9]+]]
		// SIMD4-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP6]], [[TMP5]], !dbg [[DBG222]]
		// SIMD4-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4, !dbg [[DBG222]]
		// SIMD4-NEXT: [[TMP7:%.]] = load i32, i32 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1, i32 0), align 4, !dbg [[DBG223:![0-9]+]]
		// SIMD4-NEXT: [[TMP8:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG224:![0-9]+]]
		// SIMD4-NEXT: [[ADD3:%.*]] = add nsw i32 [[TMP8]], [[TMP7]], !dbg [[DBG224]]
		// SIMD4-NEXT: store i32 [[ADD3]], i32* [[RES]], align 4, !dbg [[DBG224]]
		// SIMD4-NEXT: [[TMP9:%.]] = load i32, i32 @_ZN2STIiE2stE, align 4, !dbg [[DBG225:![0-9]+]]
		// SIMD4-NEXT: [[TMP10:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG226:![0-9]+]]
		// SIMD4-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP10]], [[TMP9]], !dbg [[DBG226]]
		// SIMD4-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG226]]
		// SIMD4-NEXT: [[TMP11:%.]] = load float, float @_ZN2STIfE2stE, align 4, !dbg [[DBG227:![0-9]+]]
		// SIMD4-NEXT: [[CONV:%.*]] = fptosi float [[TMP11]] to i32, !dbg [[DBG227]]
		// SIMD4-NEXT: [[TMP12:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG228:![0-9]+]]
		// SIMD4-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP12]], [[CONV]], !dbg [[DBG228]]
		// SIMD4-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4, !dbg [[DBG228]]
		// SIMD4-NEXT: [[TMP13:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S4:%.]], %struct.S4 @_ZN2STI2S4E2stE, i32 0, i32 0), align 4, !dbg [[DBG229:![0-9]+]]
		// SIMD4-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG230:![0-9]+]]
		// SIMD4-NEXT: [[ADD6:%.*]] = add nsw i32 [[TMP14]], [[TMP13]], !dbg [[DBG230]]
		// SIMD4-NEXT: store i32 [[ADD6]], i32* [[RES]], align 4, !dbg [[DBG230]]
		// SIMD4-NEXT: [[TMP15:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG231:![0-9]+]]
		// SIMD4-NEXT: ret i32 [[TMP15]], !dbg [[DBG232:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@__cxx_global_var_init.3
		// SIMD4-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) !dbg [[DBG233:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG234:![0-9]+]]
		// SIMD4-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG234]]
		// SIMD4-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG234]]
		// SIMD4: init.check:
		// SIMD4-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23), !dbg [[DBG235:![0-9]+]]
		// SIMD4-NEXT: [[TMP1:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR3]], !dbg [[DBG234]]
		// SIMD4-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG234]]
		// SIMD4-NEXT: br label [[INIT_END]], !dbg [[DBG234]]
		// SIMD4: init.end:
		// SIMD4-NEXT: ret void, !dbg [[DBG237:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// SIMD4-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR1]] comdat align 2 !dbg [[DBG238:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META239:![0-9]+]], metadata !DIExpression()), !dbg [[DBG241:![0-9]+]]
		// SIMD4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META242:![0-9]+]], metadata !DIExpression()), !dbg [[DBG243:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG244:![0-9]+]]
		// SIMD4-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG244]]
		// SIMD4-NEXT: ret void, !dbg [[DBG245:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// SIMD4-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG246:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD4-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META247:![0-9]+]], metadata !DIExpression()), !dbg [[DBG248:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR3]], !dbg [[DBG249:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG250:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// SIMD4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG251:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META252:![0-9]+]], metadata !DIExpression()), !dbg [[DBG253:![0-9]+]]
		// SIMD4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META254:![0-9]+]], metadata !DIExpression()), !dbg [[DBG255:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG256:![0-9]+]]
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG257:![0-9]+]]
		// SIMD4-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG256]]
		// SIMD4-NEXT: ret void, !dbg [[DBG258:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// SIMD4-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG259:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// SIMD4-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META260:![0-9]+]], metadata !DIExpression()), !dbg [[DBG261:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG262:![0-9]+]]
		// SIMD4-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG264:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG265:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// SIMD4-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG266:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META267:![0-9]+]], metadata !DIExpression()), !dbg [[DBG268:![0-9]+]]
		// SIMD4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META269:![0-9]+]], metadata !DIExpression()), !dbg [[DBG270:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG271:![0-9]+]]
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG272:![0-9]+]]
		// SIMD4-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG271]]
		// SIMD4-NEXT: ret void, !dbg [[DBG273:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// SIMD4-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG274:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// SIMD4-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META275:![0-9]+]], metadata !DIExpression()), !dbg [[DBG276:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG277:![0-9]+]]
		// SIMD4-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG279:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG280:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// SIMD4-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG281:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META282:![0-9]+]], metadata !DIExpression()), !dbg [[DBG283:![0-9]+]]
		// SIMD4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META284:![0-9]+]], metadata !DIExpression()), !dbg [[DBG285:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG286:![0-9]+]]
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG287:![0-9]+]]
		// SIMD4-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG286]]
		// SIMD4-NEXT: ret void, !dbg [[DBG288:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// SIMD4-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG289:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// SIMD4-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META290:![0-9]+]], metadata !DIExpression()), !dbg [[DBG291:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG292:![0-9]+]]
		// SIMD4-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG294:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG295:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// SIMD4-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG296:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD4-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// SIMD4-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META297:![0-9]+]], metadata !DIExpression()), !dbg [[DBG298:![0-9]+]]
		// SIMD4-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META299:![0-9]+]], metadata !DIExpression()), !dbg [[DBG300:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG301:![0-9]+]]
		// SIMD4-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG302:![0-9]+]]
		// SIMD4-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG301]]
		// SIMD4-NEXT: ret void, !dbg [[DBG303:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// SIMD4-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG304:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// SIMD4-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META305:![0-9]+]], metadata !DIExpression()), !dbg [[DBG306:![0-9]+]]
		// SIMD4-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// SIMD4-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG307:![0-9]+]]
		// SIMD4-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG309:![0-9]+]]
		// SIMD4-NEXT: ret void, !dbg [[DBG310:![0-9]+]]
		//
		//
		// SIMD4-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// SIMD4-SAME: () #[[ATTR0]] !dbg [[DBG311:![0-9]+]] {
		// SIMD4-NEXT: entry:
		// SIMD4-NEXT: call void @__cxx_global_var_init(), !dbg [[DBG313:![0-9]+]]
		// SIMD4-NEXT: call void @__cxx_global_var_init.1(), !dbg [[DBG313]]
		// SIMD4-NEXT: call void @__cxx_global_var_init.2(), !dbg [[DBG313]]
		// SIMD4-NEXT: ret void
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.
		// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0:[0-9]+]] !dbg [[DBG115:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META117:![0-9]+]], metadata !DIExpression()), !dbg [[DBG119:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG120:![0-9]+]]
		// DEBUG1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S1*, !dbg [[DBG120]]
		// DEBUG1-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[TMP2]], i32 5), !dbg [[DBG121:![0-9]+]]
		// DEBUG1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG120]]
		// DEBUG1-NEXT: ret i8* [[TMP3]], !dbg [[DBG120]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// DEBUG1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 !dbg [[DBG122:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// DEBUG1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META123:![0-9]+]], metadata !DIExpression()), !dbg [[DBG125:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META126:![0-9]+]], metadata !DIExpression()), !dbg [[DBG127:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG128:![0-9]+]]
		// DEBUG1-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG128]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG129:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.
		// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG130:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META131:![0-9]+]], metadata !DIExpression()), !dbg [[DBG132:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG132]]
		// DEBUG1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S1*, !dbg [[DBG132]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR4:[0-9]+]], !dbg [[DBG132]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG133:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// DEBUG1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR3:[0-9]+]] comdat align 2 !dbg [[DBG134:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// DEBUG1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META135:![0-9]+]], metadata !DIExpression()), !dbg [[DBG136:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR4]], !dbg [[DBG137:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG138:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_.
		// DEBUG1-SAME: () #[[ATTR0]] !dbg [[DBG139:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]]), !dbg [[DBG140:![0-9]+]]
		// DEBUG1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.), !dbg [[DBG140]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG140]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..1
		// DEBUG1-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG141:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// DEBUG1-NEXT: [[ARRAYINIT_ENDOFINIT2:%.]] = alloca %struct.S1, align 8
		// DEBUG1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: [[ARRAYINIT_ENDOFINIT9:%.]] = alloca %struct.S1, align 8
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META142:![0-9]+]], metadata !DIExpression()), !dbg [[DBG143:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG144:![0-9]+]]
		// DEBUG1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x [3 x %struct.S1]]*, !dbg [[DBG144]]
		// DEBUG1-NEXT: [[ARRAYINIT_BEGIN:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP2]], i64 0, i64 0, !dbg [[DBG145:![0-9]+]]
		// DEBUG1-NEXT: store [3 x %struct.S1]* [[ARRAYINIT_BEGIN]], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG145]]
		// DEBUG1-NEXT: [[ARRAYINIT_BEGIN1:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 0, i64 0, !dbg [[DBG146:![0-9]+]]
		// DEBUG1-NEXT: store %struct.S1* [[ARRAYINIT_BEGIN1]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8, !dbg [[DBG146]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_BEGIN1]], i32 1)
		// DEBUG1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG147:![0-9]+]]
		// DEBUG1: invoke.cont:
		// DEBUG1-NEXT: [[ARRAYINIT_ELEMENT:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[ARRAYINIT_BEGIN1]], i64 1, !dbg [[DBG146]]
		// DEBUG1-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8, !dbg [[DBG146]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT]], i32 2)
		// DEBUG1-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]], !dbg [[DBG148:![0-9]+]]
		// DEBUG1: invoke.cont3:
		// DEBUG1-NEXT: [[ARRAYINIT_ELEMENT4:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_ELEMENT]], i64 1, !dbg [[DBG146]]
		// DEBUG1-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT4]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8, !dbg [[DBG146]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT4]], i32 3)
		// DEBUG1-NEXT: to label [[INVOKE_CONT5:%.*]] unwind label [[LPAD]], !dbg [[DBG149:![0-9]+]]
		// DEBUG1: invoke.cont5:
		// DEBUG1-NEXT: [[ARRAYINIT_ELEMENT7:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 1, !dbg [[DBG145]]
		// DEBUG1-NEXT: store [3 x %struct.S1]* [[ARRAYINIT_ELEMENT7]], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG145]]
		// DEBUG1-NEXT: [[ARRAYINIT_BEGIN8:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_ELEMENT7]], i64 0, i64 0, !dbg [[DBG150:![0-9]+]]
		// DEBUG1-NEXT: store %struct.S1* [[ARRAYINIT_BEGIN8]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8, !dbg [[DBG150]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_BEGIN8]], i32 4)
		// DEBUG1-NEXT: to label [[INVOKE_CONT11:%.]] unwind label [[LPAD10:%.]], !dbg [[DBG151:![0-9]+]]
		// DEBUG1: invoke.cont11:
		// DEBUG1-NEXT: [[ARRAYINIT_ELEMENT12:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_BEGIN8]], i64 1, !dbg [[DBG150]]
		// DEBUG1-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT12]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8, !dbg [[DBG150]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT12]], i32 5)
		// DEBUG1-NEXT: to label [[INVOKE_CONT13:%.*]] unwind label [[LPAD10]], !dbg [[DBG152:![0-9]+]]
		// DEBUG1: invoke.cont13:
		// DEBUG1-NEXT: [[ARRAYINIT_ELEMENT14:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_ELEMENT12]], i64 1, !dbg [[DBG150]]
		// DEBUG1-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT14]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8, !dbg [[DBG150]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT14]], i32 6)
		// DEBUG1-NEXT: to label [[INVOKE_CONT15:%.*]] unwind label [[LPAD10]], !dbg [[DBG153:![0-9]+]]
		// DEBUG1: invoke.cont15:
		// DEBUG1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG144]]
		// DEBUG1-NEXT: ret i8* [[TMP3]], !dbg [[DBG144]]
		// DEBUG1: lpad:
		// DEBUG1-NEXT: [[TMP4:%.]] = landingpad { i8, i32 }
		// DEBUG1-NEXT: cleanup, !dbg [[DBG143]]
		// DEBUG1-NEXT: [[TMP5:%.]] = extractvalue { i8, i32 } [[TMP4]], 0, !dbg [[DBG143]]
		// DEBUG1-NEXT: store i8* [[TMP5]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG143]]
		// DEBUG1-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP4]], 1, !dbg [[DBG143]]
		// DEBUG1-NEXT: store i32 [[TMP6]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG143]]
		// DEBUG1-NEXT: [[TMP7:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8, !dbg [[DBG146]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 [[ARRAYINIT_BEGIN1]], [[TMP7]], !dbg [[DBG146]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE6:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG146]]
		// DEBUG1: arraydestroy.body:
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP7]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG146]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG146]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]], !dbg [[DBG146]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], [[ARRAYINIT_BEGIN1]], !dbg [[DBG146]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE6]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG146]]
		// DEBUG1: arraydestroy.done6:
		// DEBUG1-NEXT: br label [[EHCLEANUP:%.*]], !dbg [[DBG146]]
		// DEBUG1: lpad10:
		// DEBUG1-NEXT: [[TMP8:%.]] = landingpad { i8, i32 }
		// DEBUG1-NEXT: cleanup, !dbg [[DBG143]]
		// DEBUG1-NEXT: [[TMP9:%.]] = extractvalue { i8, i32 } [[TMP8]], 0, !dbg [[DBG143]]
		// DEBUG1-NEXT: store i8* [[TMP9]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG143]]
		// DEBUG1-NEXT: [[TMP10:%.]] = extractvalue { i8, i32 } [[TMP8]], 1, !dbg [[DBG143]]
		// DEBUG1-NEXT: store i32 [[TMP10]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG143]]
		// DEBUG1-NEXT: [[TMP11:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8, !dbg [[DBG150]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 [[ARRAYINIT_BEGIN8]], [[TMP11]], !dbg [[DBG150]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]], !dbg [[DBG150]]
		// DEBUG1: arraydestroy.body17:
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[TMP11]], [[LPAD10]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ], !dbg [[DBG150]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1, !dbg [[DBG150]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR4]], !dbg [[DBG150]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], [[ARRAYINIT_BEGIN8]], !dbg [[DBG150]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]], !dbg [[DBG150]]
		// DEBUG1: arraydestroy.done21:
		// DEBUG1-NEXT: br label [[EHCLEANUP]], !dbg [[DBG150]]
		// DEBUG1: ehcleanup:
		// DEBUG1-NEXT: [[TMP12:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG145]]
		// DEBUG1-NEXT: [[PAD_ARRAYBEGIN:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 0, i64 0, !dbg [[DBG145]]
		// DEBUG1-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP12]], i64 0, i64 0, !dbg [[DBG145]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ISEMPTY22:%.]] = icmp eq %struct.S1 [[PAD_ARRAYBEGIN]], [[PAD_ARRAYEND]], !dbg [[DBG145]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY22]], label [[ARRAYDESTROY_DONE27:%.]], label [[ARRAYDESTROY_BODY23:%.]], !dbg [[DBG145]]
		// DEBUG1: arraydestroy.body23:
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENTPAST24:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT25:%.*]], [[ARRAYDESTROY_BODY23]] ], !dbg [[DBG145]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENT25]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST24]], i64 -1, !dbg [[DBG145]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT25]]) #[[ATTR4]], !dbg [[DBG145]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_DONE26:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT25]], [[PAD_ARRAYBEGIN]], !dbg [[DBG145]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_DONE26]], label [[ARRAYDESTROY_DONE27]], label [[ARRAYDESTROY_BODY23]], !dbg [[DBG145]]
		// DEBUG1: arraydestroy.done27:
		// DEBUG1-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG145]]
		// DEBUG1: eh.resume:
		// DEBUG1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG145]]
		// DEBUG1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG145]]
		// DEBUG1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG145]]
		// DEBUG1-NEXT: [[LPAD_VAL28:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG145]]
		// DEBUG1-NEXT: resume { i8*, i32 } [[LPAD_VAL28]], !dbg [[DBG145]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..2
		// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG154:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META155:![0-9]+]], metadata !DIExpression()), !dbg [[DBG156:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG156]]
		// DEBUG1-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %struct.S1*, !dbg [[DBG156]]
		// DEBUG1-NEXT: [[TMP2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[ARRAY_BEGIN]], i64 6, !dbg [[DBG156]]
		// DEBUG1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG156]]
		// DEBUG1: arraydestroy.body:
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG156]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG156]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]], !dbg [[DBG156]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]], !dbg [[DBG156]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG156]]
		// DEBUG1: arraydestroy.done1:
		// DEBUG1-NEXT: ret void, !dbg [[DBG157:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__omp_threadprivate_init_..3
		// DEBUG1-SAME: () #[[ATTR0]] !dbg [[DBG158:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB3:[0-9]+]]), !dbg [[DBG159:![0-9]+]]
		// DEBUG1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB3]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i8 (i8) @.__kmpc_global_ctor_..1, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..2), !dbg [[DBG159]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG159]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// DEBUG1-SAME: () #[[ATTR0]] !dbg [[DBG160:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5), !dbg [[DBG163:![0-9]+]]
		// DEBUG1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR4]], !dbg [[DBG165:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG166:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// DEBUG1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG167:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// DEBUG1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META168:![0-9]+]], metadata !DIExpression()), !dbg [[DBG169:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META170:![0-9]+]], metadata !DIExpression()), !dbg [[DBG171:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG172:![0-9]+]]
		// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG173:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG172]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG174:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// DEBUG1-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG175:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// DEBUG1-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META176:![0-9]+]], metadata !DIExpression()), !dbg [[DBG177:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG178:![0-9]+]]
		// DEBUG1-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG180:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG181:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@__cxx_global_var_init.4
		// DEBUG1-SAME: () #[[ATTR0]] !dbg [[DBG182:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27), !dbg [[DBG183:![0-9]+]]
		// DEBUG1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR4]], !dbg [[DBG185:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG186:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// DEBUG1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG187:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// DEBUG1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META188:![0-9]+]], metadata !DIExpression()), !dbg [[DBG190:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META191:![0-9]+]], metadata !DIExpression()), !dbg [[DBG192:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG193:![0-9]+]]
		// DEBUG1-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG193]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG194:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// DEBUG1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG195:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// DEBUG1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META196:![0-9]+]], metadata !DIExpression()), !dbg [[DBG197:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR4]], !dbg [[DBG198:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG199:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// DEBUG1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG200:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// DEBUG1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META201:![0-9]+]], metadata !DIExpression()), !dbg [[DBG202:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META203:![0-9]+]], metadata !DIExpression()), !dbg [[DBG204:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG205:![0-9]+]]
		// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG206:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG205]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG207:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// DEBUG1-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG208:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// DEBUG1-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META209:![0-9]+]], metadata !DIExpression()), !dbg [[DBG210:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG211:![0-9]+]]
		// DEBUG1-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG213:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG214:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@__cxx_global_var_init.5
		// DEBUG1-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG215:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// DEBUG1-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// DEBUG1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// DEBUG1-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG216:![0-9]+]]
		// DEBUG1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG218:![0-9]+]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// DEBUG1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG219:![0-9]+]]
		// DEBUG1: invoke.cont:
		// DEBUG1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG218]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// DEBUG1-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]], !dbg [[DBG220:![0-9]+]]
		// DEBUG1: invoke.cont2:
		// DEBUG1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG218]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// DEBUG1-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]], !dbg [[DBG221:![0-9]+]]
		// DEBUG1: invoke.cont3:
		// DEBUG1-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG216]]
		// DEBUG1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG222:![0-9]+]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// DEBUG1-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]], !dbg [[DBG223:![0-9]+]]
		// DEBUG1: invoke.cont7:
		// DEBUG1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG222]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// DEBUG1-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]], !dbg [[DBG224:![0-9]+]]
		// DEBUG1: invoke.cont8:
		// DEBUG1-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG222]]
		// DEBUG1-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// DEBUG1-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]], !dbg [[DBG225:![0-9]+]]
		// DEBUG1: invoke.cont9:
		// DEBUG1-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR4]], !dbg [[DBG226:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG226]]
		// DEBUG1: lpad:
		// DEBUG1-NEXT: [[TMP1:%.]] = landingpad { i8, i32 }
		// DEBUG1-NEXT: cleanup, !dbg [[DBG227:![0-9]+]]
		// DEBUG1-NEXT: [[TMP2:%.]] = extractvalue { i8, i32 } [[TMP1]], 0, !dbg [[DBG227]]
		// DEBUG1-NEXT: store i8* [[TMP2]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG227]]
		// DEBUG1-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP1]], 1, !dbg [[DBG227]]
		// DEBUG1-NEXT: store i32 [[TMP3]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG227]]
		// DEBUG1-NEXT: [[TMP4:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG218]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP4]], !dbg [[DBG218]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG218]]
		// DEBUG1: arraydestroy.body:
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP4]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG218]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG218]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]], !dbg [[DBG218]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG218]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG218]]
		// DEBUG1: arraydestroy.done4:
		// DEBUG1-NEXT: br label [[EHCLEANUP:%.*]], !dbg [[DBG218]]
		// DEBUG1: lpad6:
		// DEBUG1-NEXT: [[TMP5:%.]] = landingpad { i8, i32 }
		// DEBUG1-NEXT: cleanup, !dbg [[DBG227]]
		// DEBUG1-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP5]], 0, !dbg [[DBG227]]
		// DEBUG1-NEXT: store i8* [[TMP6]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG227]]
		// DEBUG1-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP5]], 1, !dbg [[DBG227]]
		// DEBUG1-NEXT: store i32 [[TMP7]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG227]]
		// DEBUG1-NEXT: [[TMP8:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG222]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP8]], !dbg [[DBG222]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]], !dbg [[DBG222]]
		// DEBUG1: arraydestroy.body11:
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP8]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ], !dbg [[DBG222]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1, !dbg [[DBG222]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR4]], !dbg [[DBG222]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), !dbg [[DBG222]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]], !dbg [[DBG222]]
		// DEBUG1: arraydestroy.done15:
		// DEBUG1-NEXT: br label [[EHCLEANUP]], !dbg [[DBG222]]
		// DEBUG1: ehcleanup:
		// DEBUG1-NEXT: [[TMP9:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG216]]
		// DEBUG1-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP9]], i64 0, i64 0, !dbg [[DBG216]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]], !dbg [[DBG216]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]], !dbg [[DBG216]]
		// DEBUG1: arraydestroy.body17:
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ], !dbg [[DBG216]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1, !dbg [[DBG216]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR4]], !dbg [[DBG216]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG216]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]], !dbg [[DBG216]]
		// DEBUG1: arraydestroy.done21:
		// DEBUG1-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG216]]
		// DEBUG1: eh.resume:
		// DEBUG1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG216]]
		// DEBUG1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG216]]
		// DEBUG1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG216]]
		// DEBUG1-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG216]]
		// DEBUG1-NEXT: resume { i8*, i32 } [[LPAD_VAL22]], !dbg [[DBG216]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG228:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META231:![0-9]+]], metadata !DIExpression()), !dbg [[DBG232:![0-9]+]]
		// DEBUG1-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG232]]
		// DEBUG1: arraydestroy.body:
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG232]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG232]]
		// DEBUG1-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]], !dbg [[DBG232]]
		// DEBUG1-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), !dbg [[DBG232]]
		// DEBUG1-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG232]]
		// DEBUG1: arraydestroy.done1:
		// DEBUG1-NEXT: ret void, !dbg [[DBG232]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@main
		// DEBUG1-SAME: () #[[ATTR5:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG53:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: [[RES:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB9:[0-9]+]])
		// DEBUG1-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META233:![0-9]+]], metadata !DIExpression()), !dbg [[DBG234:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = load atomic i8, i8 bitcast (i64* @_ZGVZ4mainE2sm to i8*) acquire, align 8, !dbg [[DBG235:![0-9]+]]
		// DEBUG1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP1]], 0, !dbg [[DBG235]]
		// DEBUG1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG235]], !prof [[PROF236:![0-9]+]]
		// DEBUG1: init.check:
		// DEBUG1-NEXT: [[TMP2:%.]] = call i32 @__cxa_guard_acquire(i64 @_ZGVZ4mainE2sm) #[[ATTR4]], !dbg [[DBG235]]
		// DEBUG1-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP2]], 0, !dbg [[DBG235]]
		// DEBUG1-NEXT: br i1 [[TOBOOL]], label [[INIT:%.*]], label [[INIT_END]], !dbg [[DBG235]]
		// DEBUG1: init:
		// DEBUG1-NEXT: [[TMP3:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB7:[0-9]+]]), !dbg [[DBG235]]
		// DEBUG1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB7]], i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 (i8) @.__kmpc_global_ctor_..6, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..7), !dbg [[DBG235]]
		// DEBUG1-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB9]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.), !dbg [[DBG237:![0-9]+]]
		// DEBUG1-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*, !dbg [[DBG237]]
		// DEBUG1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0, !dbg [[DBG238:![0-9]+]]
		// DEBUG1-NEXT: [[TMP6:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG238]]
		// DEBUG1-NEXT: invoke void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP6]])
		// DEBUG1-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG239:![0-9]+]]
		// DEBUG1: invoke.cont:
		// DEBUG1-NEXT: [[TMP7:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR4]], !dbg [[DBG235]]
		// DEBUG1-NEXT: call void @__cxa_guard_release(i64* @_ZGVZ4mainE2sm) #[[ATTR4]], !dbg [[DBG235]]
		// DEBUG1-NEXT: br label [[INIT_END]], !dbg [[DBG235]]
		// DEBUG1: init.end:
		// DEBUG1-NEXT: [[TMP8:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB11:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S3* @_ZN6Static1sE to i8), i64 8, i8** @_ZN6Static1sE.cache.), !dbg [[DBG240:![0-9]+]]
		// DEBUG1-NEXT: [[TMP9:%.]] = bitcast i8 [[TMP8]] to %struct.S3*, !dbg [[DBG240]]
		// DEBUG1-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP9]], i32 0, i32 0, !dbg [[DBG241:![0-9]+]]
		// DEBUG1-NEXT: [[TMP10:%.]] = load i32, i32 [[A1]], align 4, !dbg [[DBG241]]
		// DEBUG1-NEXT: store i32 [[TMP10]], i32* [[RES]], align 4, !dbg [[DBG242:![0-9]+]]
		// DEBUG1-NEXT: [[TMP11:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB13:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i64 24, i8** @_ZZ4mainE2sm.cache.), !dbg [[DBG243:![0-9]+]]
		// DEBUG1-NEXT: [[TMP12:%.]] = bitcast i8 [[TMP11]] to %struct.Smain*, !dbg [[DBG243]]
		// DEBUG1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[TMP12]], i32 0, i32 0, !dbg [[DBG244:![0-9]+]]
		// DEBUG1-NEXT: [[TMP13:%.]] = load i32, i32 [[A2]], align 8, !dbg [[DBG244]]
		// DEBUG1-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG245:![0-9]+]]
		// DEBUG1-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP14]], [[TMP13]], !dbg [[DBG245]]
		// DEBUG1-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG245]]
		// DEBUG1-NEXT: [[TMP15:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB15:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.), !dbg [[DBG246:![0-9]+]]
		// DEBUG1-NEXT: [[TMP16:%.]] = bitcast i8 [[TMP15]] to %struct.S1*, !dbg [[DBG246]]
		// DEBUG1-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[TMP16]], i32 0, i32 0, !dbg [[DBG247:![0-9]+]]
		// DEBUG1-NEXT: [[TMP17:%.]] = load i32, i32 [[A3]], align 4, !dbg [[DBG247]]
		// DEBUG1-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG248:![0-9]+]]
		// DEBUG1-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP18]], [[TMP17]], !dbg [[DBG248]]
		// DEBUG1-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG248]]
		// DEBUG1-NEXT: [[TMP19:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG249:![0-9]+]]
		// DEBUG1-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG250:![0-9]+]]
		// DEBUG1-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP20]], [[TMP19]], !dbg [[DBG250]]
		// DEBUG1-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4, !dbg [[DBG250]]
		// DEBUG1-NEXT: [[TMP21:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB17:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S5* @gs3 to i8), i64 12, i8** @gs3.cache.), !dbg [[DBG251:![0-9]+]]
		// DEBUG1-NEXT: [[TMP22:%.]] = bitcast i8 [[TMP21]] to %struct.S5*, !dbg [[DBG251]]
		// DEBUG1-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP22]], i32 0, i32 0, !dbg [[DBG252:![0-9]+]]
		// DEBUG1-NEXT: [[TMP23:%.]] = load i32, i32 [[A6]], align 4, !dbg [[DBG252]]
		// DEBUG1-NEXT: [[TMP24:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG253:![0-9]+]]
		// DEBUG1-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP24]], [[TMP23]], !dbg [[DBG253]]
		// DEBUG1-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4, !dbg [[DBG253]]
		// DEBUG1-NEXT: [[TMP25:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB19:[0-9]+]], i32 [[TMP0]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i64 24, i8** @arr_x.cache.), !dbg [[DBG254:![0-9]+]]
		// DEBUG1-NEXT: [[TMP26:%.]] = bitcast i8 [[TMP25]] to [2 x [3 x %struct.S1]]*, !dbg [[DBG254]]
		// DEBUG1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP26]], i64 0, i64 1, !dbg [[DBG254]]
		// DEBUG1-NEXT: [[ARRAYIDX8:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1, !dbg [[DBG254]]
		// DEBUG1-NEXT: [[A9:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX8]], i32 0, i32 0, !dbg [[DBG255:![0-9]+]]
		// DEBUG1-NEXT: [[TMP27:%.]] = load i32, i32 [[A9]], align 4, !dbg [[DBG255]]
		// DEBUG1-NEXT: [[TMP28:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG256:![0-9]+]]
		// DEBUG1-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP28]], [[TMP27]], !dbg [[DBG256]]
		// DEBUG1-NEXT: store i32 [[ADD10]], i32* [[RES]], align 4, !dbg [[DBG256]]
		// DEBUG1-NEXT: [[TMP29:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB21:[0-9]+]], i32 [[TMP0]], i8* bitcast (i32* @_ZN2STIiE2stE to i8), i64 4, i8** @_ZN2STIiE2stE.cache.), !dbg [[DBG257:![0-9]+]]
		// DEBUG1-NEXT: [[TMP30:%.]] = bitcast i8 [[TMP29]] to i32*, !dbg [[DBG257]]
		// DEBUG1-NEXT: [[TMP31:%.]] = load i32, i32 [[TMP30]], align 4, !dbg [[DBG257]]
		// DEBUG1-NEXT: [[TMP32:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG258:![0-9]+]]
		// DEBUG1-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP32]], [[TMP31]], !dbg [[DBG258]]
		// DEBUG1-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4, !dbg [[DBG258]]
		// DEBUG1-NEXT: [[TMP33:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB23:[0-9]+]], i32 [[TMP0]], i8* bitcast (float* @_ZN2STIfE2stE to i8), i64 4, i8** @_ZN2STIfE2stE.cache.), !dbg [[DBG259:![0-9]+]]
		// DEBUG1-NEXT: [[TMP34:%.]] = bitcast i8 [[TMP33]] to float*, !dbg [[DBG259]]
		// DEBUG1-NEXT: [[TMP35:%.]] = load float, float [[TMP34]], align 4, !dbg [[DBG259]]
		// DEBUG1-NEXT: [[CONV:%.*]] = fptosi float [[TMP35]] to i32, !dbg [[DBG259]]
		// DEBUG1-NEXT: [[TMP36:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG260:![0-9]+]]
		// DEBUG1-NEXT: [[ADD12:%.*]] = add nsw i32 [[TMP36]], [[CONV]], !dbg [[DBG260]]
		// DEBUG1-NEXT: store i32 [[ADD12]], i32* [[RES]], align 4, !dbg [[DBG260]]
		// DEBUG1-NEXT: [[TMP37:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB25:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i64 8, i8** @_ZN2STI2S4E2stE.cache.), !dbg [[DBG261:![0-9]+]]
		// DEBUG1-NEXT: [[TMP38:%.]] = bitcast i8 [[TMP37]] to %struct.S4*, !dbg [[DBG261]]
		// DEBUG1-NEXT: [[A13:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP38]], i32 0, i32 0, !dbg [[DBG262:![0-9]+]]
		// DEBUG1-NEXT: [[TMP39:%.]] = load i32, i32 [[A13]], align 4, !dbg [[DBG262]]
		// DEBUG1-NEXT: [[TMP40:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG263:![0-9]+]]
		// DEBUG1-NEXT: [[ADD14:%.*]] = add nsw i32 [[TMP40]], [[TMP39]], !dbg [[DBG263]]
		// DEBUG1-NEXT: store i32 [[ADD14]], i32* [[RES]], align 4, !dbg [[DBG263]]
		// DEBUG1-NEXT: [[TMP41:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG264:![0-9]+]]
		// DEBUG1-NEXT: ret i32 [[TMP41]], !dbg [[DBG265:![0-9]+]]
		// DEBUG1: lpad:
		// DEBUG1-NEXT: [[TMP42:%.]] = landingpad { i8, i32 }
		// DEBUG1-NEXT: cleanup, !dbg [[DBG266:![0-9]+]]
		// DEBUG1-NEXT: [[TMP43:%.]] = extractvalue { i8, i32 } [[TMP42]], 0, !dbg [[DBG266]]
		// DEBUG1-NEXT: store i8* [[TMP43]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG266]]
		// DEBUG1-NEXT: [[TMP44:%.]] = extractvalue { i8, i32 } [[TMP42]], 1, !dbg [[DBG266]]
		// DEBUG1-NEXT: store i32 [[TMP44]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG266]]
		// DEBUG1-NEXT: call void @__cxa_guard_abort(i64* @_ZGVZ4mainE2sm) #[[ATTR4]], !dbg [[DBG235]]
		// DEBUG1-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG235]]
		// DEBUG1: eh.resume:
		// DEBUG1-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG235]]
		// DEBUG1-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG235]]
		// DEBUG1-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG235]]
		// DEBUG1-NEXT: [[LPAD_VAL15:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG235]]
		// DEBUG1-NEXT: resume { i8*, i32 } [[LPAD_VAL15]], !dbg [[DBG235]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..6
		// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG267:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: [[TMP1:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB5:[0-9]+]])
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META268:![0-9]+]], metadata !DIExpression()), !dbg [[DBG269:![0-9]+]]
		// DEBUG1-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG270:![0-9]+]]
		// DEBUG1-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to %struct.Smain*, !dbg [[DBG270]]
		// DEBUG1-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB5]], i32 [[TMP1]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.), !dbg [[DBG271:![0-9]+]]
		// DEBUG1-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*, !dbg [[DBG271]]
		// DEBUG1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0, !dbg [[DBG272:![0-9]+]]
		// DEBUG1-NEXT: [[TMP6:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG272]]
		// DEBUG1-NEXT: call void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) [[TMP3]], i32 [[TMP6]]), !dbg [[DBG273:![0-9]+]]
		// DEBUG1-NEXT: [[TMP7:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG270]]
		// DEBUG1-NEXT: ret i8* [[TMP7]], !dbg [[DBG270]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// DEBUG1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG274:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// DEBUG1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META275:![0-9]+]], metadata !DIExpression()), !dbg [[DBG277:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META278:![0-9]+]], metadata !DIExpression()), !dbg [[DBG279:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG280:![0-9]+]]
		// DEBUG1-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG280]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG281:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..7
		// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG282:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META283:![0-9]+]], metadata !DIExpression()), !dbg [[DBG284:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG284]]
		// DEBUG1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.Smain*, !dbg [[DBG284]]
		// DEBUG1-NEXT: call void @_ZZ4mainEN5SmainD1Ev(%struct.Smain* nonnull dereferenceable(24) [[TMP2]]) #[[ATTR4]], !dbg [[DBG284]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG285:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// DEBUG1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] align 2 !dbg [[DBG286:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// DEBUG1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META287:![0-9]+]], metadata !DIExpression()), !dbg [[DBG288:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR4]], !dbg [[DBG289:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG290:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// DEBUG1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] align 2 !dbg [[DBG291:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// DEBUG1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META292:![0-9]+]], metadata !DIExpression()), !dbg [[DBG293:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META294:![0-9]+]], metadata !DIExpression()), !dbg [[DBG295:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG296:![0-9]+]]
		// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG297:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG296]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG298:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// DEBUG1-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] align 2 !dbg [[DBG299:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// DEBUG1-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META300:![0-9]+]], metadata !DIExpression()), !dbg [[DBG301:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG302:![0-9]+]]
		// DEBUG1-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG304:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG305:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_Z6foobarv
		// DEBUG1-SAME: () #[[ATTR6:[0-9]+]] !dbg [[DBG306:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[RES:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB27:[0-9]+]])
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META307:![0-9]+]], metadata !DIExpression()), !dbg [[DBG308:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB27]], i32 [[TMP0]], i8* bitcast (%struct.S3* @_ZN6Static1sE to i8), i64 8, i8** @_ZN6Static1sE.cache.), !dbg [[DBG309:![0-9]+]]
		// DEBUG1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S3*, !dbg [[DBG309]]
		// DEBUG1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP2]], i32 0, i32 0, !dbg [[DBG310:![0-9]+]]
		// DEBUG1-NEXT: [[TMP3:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG310]]
		// DEBUG1-NEXT: store i32 [[TMP3]], i32* [[RES]], align 4, !dbg [[DBG311:![0-9]+]]
		// DEBUG1-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB29:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.), !dbg [[DBG312:![0-9]+]]
		// DEBUG1-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*, !dbg [[DBG312]]
		// DEBUG1-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0, !dbg [[DBG313:![0-9]+]]
		// DEBUG1-NEXT: [[TMP6:%.]] = load i32, i32 [[A1]], align 4, !dbg [[DBG313]]
		// DEBUG1-NEXT: [[TMP7:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG314:![0-9]+]]
		// DEBUG1-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP7]], [[TMP6]], !dbg [[DBG314]]
		// DEBUG1-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG314]]
		// DEBUG1-NEXT: [[TMP8:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG315:![0-9]+]]
		// DEBUG1-NEXT: [[TMP9:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG316:![0-9]+]]
		// DEBUG1-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP9]], [[TMP8]], !dbg [[DBG316]]
		// DEBUG1-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4, !dbg [[DBG316]]
		// DEBUG1-NEXT: [[TMP10:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB31:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S5* @gs3 to i8), i64 12, i8** @gs3.cache.), !dbg [[DBG317:![0-9]+]]
		// DEBUG1-NEXT: [[TMP11:%.]] = bitcast i8 [[TMP10]] to %struct.S5*, !dbg [[DBG317]]
		// DEBUG1-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP11]], i32 0, i32 0, !dbg [[DBG318:![0-9]+]]
		// DEBUG1-NEXT: [[TMP12:%.]] = load i32, i32 [[A3]], align 4, !dbg [[DBG318]]
		// DEBUG1-NEXT: [[TMP13:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG319:![0-9]+]]
		// DEBUG1-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP13]], [[TMP12]], !dbg [[DBG319]]
		// DEBUG1-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG319]]
		// DEBUG1-NEXT: [[TMP14:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB33:[0-9]+]], i32 [[TMP0]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i64 24, i8** @arr_x.cache.), !dbg [[DBG320:![0-9]+]]
		// DEBUG1-NEXT: [[TMP15:%.]] = bitcast i8 [[TMP14]] to [2 x [3 x %struct.S1]]*, !dbg [[DBG320]]
		// DEBUG1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP15]], i64 0, i64 1, !dbg [[DBG320]]
		// DEBUG1-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1, !dbg [[DBG320]]
		// DEBUG1-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX5]], i32 0, i32 0, !dbg [[DBG321:![0-9]+]]
		// DEBUG1-NEXT: [[TMP16:%.]] = load i32, i32 [[A6]], align 4, !dbg [[DBG321]]
		// DEBUG1-NEXT: [[TMP17:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG322:![0-9]+]]
		// DEBUG1-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP17]], [[TMP16]], !dbg [[DBG322]]
		// DEBUG1-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4, !dbg [[DBG322]]
		// DEBUG1-NEXT: [[TMP18:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB35:[0-9]+]], i32 [[TMP0]], i8* bitcast (i32* @_ZN2STIiE2stE to i8), i64 4, i8** @_ZN2STIiE2stE.cache.), !dbg [[DBG323:![0-9]+]]
		// DEBUG1-NEXT: [[TMP19:%.]] = bitcast i8 [[TMP18]] to i32*, !dbg [[DBG323]]
		// DEBUG1-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4, !dbg [[DBG323]]
		// DEBUG1-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG324:![0-9]+]]
		// DEBUG1-NEXT: [[ADD8:%.*]] = add nsw i32 [[TMP21]], [[TMP20]], !dbg [[DBG324]]
		// DEBUG1-NEXT: store i32 [[ADD8]], i32* [[RES]], align 4, !dbg [[DBG324]]
		// DEBUG1-NEXT: [[TMP22:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB37:[0-9]+]], i32 [[TMP0]], i8* bitcast (float* @_ZN2STIfE2stE to i8), i64 4, i8** @_ZN2STIfE2stE.cache.), !dbg [[DBG325:![0-9]+]]
		// DEBUG1-NEXT: [[TMP23:%.]] = bitcast i8 [[TMP22]] to float*, !dbg [[DBG325]]
		// DEBUG1-NEXT: [[TMP24:%.]] = load float, float [[TMP23]], align 4, !dbg [[DBG325]]
		// DEBUG1-NEXT: [[CONV:%.*]] = fptosi float [[TMP24]] to i32, !dbg [[DBG325]]
		// DEBUG1-NEXT: [[TMP25:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG326:![0-9]+]]
		// DEBUG1-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP25]], [[CONV]], !dbg [[DBG326]]
		// DEBUG1-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4, !dbg [[DBG326]]
		// DEBUG1-NEXT: [[TMP26:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB39:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i64 8, i8** @_ZN2STI2S4E2stE.cache.), !dbg [[DBG327:![0-9]+]]
		// DEBUG1-NEXT: [[TMP27:%.]] = bitcast i8 [[TMP26]] to %struct.S4*, !dbg [[DBG327]]
		// DEBUG1-NEXT: [[A10:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP27]], i32 0, i32 0, !dbg [[DBG328:![0-9]+]]
		// DEBUG1-NEXT: [[TMP28:%.]] = load i32, i32 [[A10]], align 4, !dbg [[DBG328]]
		// DEBUG1-NEXT: [[TMP29:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG329:![0-9]+]]
		// DEBUG1-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP29]], [[TMP28]], !dbg [[DBG329]]
		// DEBUG1-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4, !dbg [[DBG329]]
		// DEBUG1-NEXT: [[TMP30:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG330:![0-9]+]]
		// DEBUG1-NEXT: ret i32 [[TMP30]], !dbg [[DBG331:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@__cxx_global_var_init.8
		// DEBUG1-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) !dbg [[DBG332:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG333:![0-9]+]]
		// DEBUG1-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG333]]
		// DEBUG1-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG333]]
		// DEBUG1: init.check:
		// DEBUG1-NEXT: [[TMP1:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB41:[0-9]+]]), !dbg [[DBG333]]
		// DEBUG1-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB41]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 (i8) @.__kmpc_global_ctor_..9, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..10), !dbg [[DBG333]]
		// DEBUG1-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23), !dbg [[DBG334:![0-9]+]]
		// DEBUG1-NEXT: [[TMP2:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR4]], !dbg [[DBG333]]
		// DEBUG1-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG333]]
		// DEBUG1-NEXT: br label [[INIT_END]], !dbg [[DBG333]]
		// DEBUG1: init.end:
		// DEBUG1-NEXT: ret void, !dbg [[DBG336:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..9
		// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG337:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META338:![0-9]+]], metadata !DIExpression()), !dbg [[DBG339:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG340:![0-9]+]]
		// DEBUG1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S4*, !dbg [[DBG340]]
		// DEBUG1-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) [[TMP2]], i32 23), !dbg [[DBG341:![0-9]+]]
		// DEBUG1-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG340]]
		// DEBUG1-NEXT: ret i8* [[TMP3]], !dbg [[DBG340]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// DEBUG1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG342:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// DEBUG1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META343:![0-9]+]], metadata !DIExpression()), !dbg [[DBG345:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META346:![0-9]+]], metadata !DIExpression()), !dbg [[DBG347:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG348:![0-9]+]]
		// DEBUG1-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG348]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG349:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..10
		// DEBUG1-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG350:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG1-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META351:![0-9]+]], metadata !DIExpression()), !dbg [[DBG352:![0-9]+]]
		// DEBUG1-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG352]]
		// DEBUG1-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S4*, !dbg [[DBG352]]
		// DEBUG1-NEXT: call void @_ZN2S4D1Ev(%struct.S4* nonnull dereferenceable(8) [[TMP2]]) #[[ATTR4]], !dbg [[DBG352]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG353:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// DEBUG1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG354:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// DEBUG1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META355:![0-9]+]], metadata !DIExpression()), !dbg [[DBG356:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR4]], !dbg [[DBG357:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG358:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// DEBUG1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG359:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// DEBUG1-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META360:![0-9]+]], metadata !DIExpression()), !dbg [[DBG361:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META362:![0-9]+]], metadata !DIExpression()), !dbg [[DBG363:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG364:![0-9]+]]
		// DEBUG1-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG365:![0-9]+]]
		// DEBUG1-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG364]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG366:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// DEBUG1-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG367:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// DEBUG1-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META368:![0-9]+]], metadata !DIExpression()), !dbg [[DBG369:![0-9]+]]
		// DEBUG1-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG1-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG370:![0-9]+]]
		// DEBUG1-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG372:![0-9]+]]
		// DEBUG1-NEXT: ret void, !dbg [[DBG373:![0-9]+]]
		//
		//
		// DEBUG1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// DEBUG1-SAME: () #[[ATTR0]] !dbg [[DBG374:![0-9]+]] {
		// DEBUG1-NEXT: entry:
		// DEBUG1-NEXT: call void @__cxx_global_var_init(), !dbg [[DBG375:![0-9]+]]
		// DEBUG1-NEXT: call void @.__omp_threadprivate_init_.(), !dbg [[DBG375]]
		// DEBUG1-NEXT: call void @__cxx_global_var_init.4(), !dbg [[DBG375]]
		// DEBUG1-NEXT: call void @__cxx_global_var_init.5(), !dbg [[DBG375]]
		// DEBUG1-NEXT: call void @.__omp_threadprivate_init_..3(), !dbg [[DBG375]]
		// DEBUG1-NEXT: ret void
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@__cxx_global_var_init
		// DEBUG2-SAME: () #[[ATTR0:[0-9]+]] !dbg [[DBG115:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB1:[0-9]+]]), !dbg [[DBG118:![0-9]+]]
		// DEBUG2-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB1]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 (i8) @.__kmpc_global_ctor_., i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_.), !dbg [[DBG118]]
		// DEBUG2-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) @_ZL3gs1, i32 5), !dbg [[DBG119:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S1) @_ZN2S1D1Ev to void (i8)), i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i8 @__dso_handle) #[[ATTR4:[0-9]+]], !dbg [[DBG118]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG121:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_.
		// DEBUG2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG122:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META124:![0-9]+]], metadata !DIExpression()), !dbg [[DBG126:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG127:![0-9]+]]
		// DEBUG2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S1*, !dbg [[DBG127]]
		// DEBUG2-NEXT: call void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[TMP2]], i32 5), !dbg [[DBG128:![0-9]+]]
		// DEBUG2-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG127]]
		// DEBUG2-NEXT: ret i8* [[TMP3]], !dbg [[DBG127]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S1C1Ei
		// DEBUG2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 !dbg [[DBG129:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// DEBUG2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META130:![0-9]+]], metadata !DIExpression()), !dbg [[DBG132:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META133:![0-9]+]], metadata !DIExpression()), !dbg [[DBG134:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG135:![0-9]+]]
		// DEBUG2-NEXT: call void @_ZN2S1C2Ei(%struct.S1* nonnull dereferenceable(4) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG135]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG136:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_.
		// DEBUG2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG137:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META138:![0-9]+]], metadata !DIExpression()), !dbg [[DBG139:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG139]]
		// DEBUG2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S1*, !dbg [[DBG139]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[TMP2]]) #[[ATTR4]], !dbg [[DBG139]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG140:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S1D1Ev
		// DEBUG2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR3:[0-9]+]] comdat align 2 !dbg [[DBG141:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// DEBUG2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META142:![0-9]+]], metadata !DIExpression()), !dbg [[DBG143:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @_ZN2S1D2Ev(%struct.S1* nonnull dereferenceable(4) [[THIS1]]) #[[ATTR4]], !dbg [[DBG144:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG145:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@__cxx_global_var_init.1
		// DEBUG2-SAME: () #[[ATTR0]] !dbg [[DBG146:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: call void @_ZN2S2C1Ei(%struct.S2* nonnull dereferenceable(16) @_ZL3gs2, i32 27), !dbg [[DBG147:![0-9]+]]
		// DEBUG2-NEXT: [[TMP0:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S2) @_ZN2S2D1Ev to void (i8)), i8* bitcast (%struct.S2* @_ZL3gs2 to i8), i8 @__dso_handle) #[[ATTR4]], !dbg [[DBG149:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG150:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S2C1Ei
		// DEBUG2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG151:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// DEBUG2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META152:![0-9]+]], metadata !DIExpression()), !dbg [[DBG154:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META155:![0-9]+]], metadata !DIExpression()), !dbg [[DBG156:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG157:![0-9]+]]
		// DEBUG2-NEXT: call void @_ZN2S2C2Ei(%struct.S2* nonnull dereferenceable(16) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG157]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG158:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S2D1Ev
		// DEBUG2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG159:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// DEBUG2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META160:![0-9]+]], metadata !DIExpression()), !dbg [[DBG161:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @_ZN2S2D2Ev(%struct.S2* nonnull dereferenceable(16) [[THIS1]]) #[[ATTR4]], !dbg [[DBG162:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG163:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@__cxx_global_var_init.2
		// DEBUG2-SAME: () #[[ATTR0]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG164:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// DEBUG2-NEXT: [[ARRAYINIT_ENDOFINIT1:%.]] = alloca %struct.S1, align 8
		// DEBUG2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: [[ARRAYINIT_ENDOFINIT5:%.]] = alloca %struct.S1, align 8
		// DEBUG2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB3:[0-9]+]]), !dbg [[DBG165:![0-9]+]]
		// DEBUG2-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB3]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i8 (i8) @.__kmpc_global_ctor_..3, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..4), !dbg [[DBG165]]
		// DEBUG2-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG166:![0-9]+]]
		// DEBUG2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG168:![0-9]+]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), i32 1)
		// DEBUG2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG169:![0-9]+]]
		// DEBUG2: invoke.cont:
		// DEBUG2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG168]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 1), i32 2)
		// DEBUG2-NEXT: to label [[INVOKE_CONT2:%.*]] unwind label [[LPAD]], !dbg [[DBG170:![0-9]+]]
		// DEBUG2: invoke.cont2:
		// DEBUG2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG168]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 2), i32 3)
		// DEBUG2-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]], !dbg [[DBG171:![0-9]+]]
		// DEBUG2: invoke.cont3:
		// DEBUG2-NEXT: store [3 x %struct.S1]* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1), [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG166]]
		// DEBUG2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG172:![0-9]+]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), i32 4)
		// DEBUG2-NEXT: to label [[INVOKE_CONT7:%.]] unwind label [[LPAD6:%.]], !dbg [[DBG173:![0-9]+]]
		// DEBUG2: invoke.cont7:
		// DEBUG2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG172]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 1), i32 5)
		// DEBUG2-NEXT: to label [[INVOKE_CONT8:%.*]] unwind label [[LPAD6]], !dbg [[DBG174:![0-9]+]]
		// DEBUG2: invoke.cont8:
		// DEBUG2-NEXT: store %struct.S1* getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG172]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 2), i32 6)
		// DEBUG2-NEXT: to label [[INVOKE_CONT9:%.*]] unwind label [[LPAD6]], !dbg [[DBG175:![0-9]+]]
		// DEBUG2: invoke.cont9:
		// DEBUG2-NEXT: [[TMP1:%.]] = call i32 @__cxa_atexit(void (i8)* @__cxx_global_array_dtor, i8* null, i8* @__dso_handle) #[[ATTR4]], !dbg [[DBG165]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG165]]
		// DEBUG2: lpad:
		// DEBUG2-NEXT: [[TMP2:%.]] = landingpad { i8, i32 }
		// DEBUG2-NEXT: cleanup, !dbg [[DBG176:![0-9]+]]
		// DEBUG2-NEXT: [[TMP3:%.]] = extractvalue { i8, i32 } [[TMP2]], 0, !dbg [[DBG176]]
		// DEBUG2-NEXT: store i8* [[TMP3]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG176]]
		// DEBUG2-NEXT: [[TMP4:%.]] = extractvalue { i8, i32 } [[TMP2]], 1, !dbg [[DBG176]]
		// DEBUG2-NEXT: store i32 [[TMP4]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG176]]
		// DEBUG2-NEXT: [[TMP5:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT1]], align 8, !dbg [[DBG168]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[TMP5]], !dbg [[DBG168]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE4:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG168]]
		// DEBUG2: arraydestroy.body:
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP5]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG168]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1 [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG168]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]], !dbg [[DBG168]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG168]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE4]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG168]]
		// DEBUG2: arraydestroy.done4:
		// DEBUG2-NEXT: br label [[EHCLEANUP:%.*]], !dbg [[DBG168]]
		// DEBUG2: lpad6:
		// DEBUG2-NEXT: [[TMP6:%.]] = landingpad { i8, i32 }
		// DEBUG2-NEXT: cleanup, !dbg [[DBG176]]
		// DEBUG2-NEXT: [[TMP7:%.]] = extractvalue { i8, i32 } [[TMP6]], 0, !dbg [[DBG176]]
		// DEBUG2-NEXT: store i8* [[TMP7]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG176]]
		// DEBUG2-NEXT: [[TMP8:%.]] = extractvalue { i8, i32 } [[TMP6]], 1, !dbg [[DBG176]]
		// DEBUG2-NEXT: store i32 [[TMP8]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG176]]
		// DEBUG2-NEXT: [[TMP9:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT5]], align 8, !dbg [[DBG172]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ISEMPTY10:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), [[TMP9]], !dbg [[DBG172]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY10]], label [[ARRAYDESTROY_DONE15:%.]], label [[ARRAYDESTROY_BODY11:%.]], !dbg [[DBG172]]
		// DEBUG2: arraydestroy.body11:
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENTPAST12:%.]] = phi %struct.S1 [ [[TMP9]], [[LPAD6]] ], [ [[ARRAYDESTROY_ELEMENT13:%.*]], [[ARRAYDESTROY_BODY11]] ], !dbg [[DBG172]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENT13]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST12]], i64 -1, !dbg [[DBG172]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT13]]) #[[ATTR4]], !dbg [[DBG172]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_DONE14:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT13]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 1, i64 0), !dbg [[DBG172]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_DONE14]], label [[ARRAYDESTROY_DONE15]], label [[ARRAYDESTROY_BODY11]], !dbg [[DBG172]]
		// DEBUG2: arraydestroy.done15:
		// DEBUG2-NEXT: br label [[EHCLEANUP]], !dbg [[DBG172]]
		// DEBUG2: ehcleanup:
		// DEBUG2-NEXT: [[TMP10:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG166]]
		// DEBUG2-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP10]], i64 0, i64 0, !dbg [[DBG166]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), [[PAD_ARRAYEND]], !dbg [[DBG166]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]], !dbg [[DBG166]]
		// DEBUG2: arraydestroy.body17:
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ], !dbg [[DBG166]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1, !dbg [[DBG166]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR4]], !dbg [[DBG166]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i64 0, i64 0, i64 0), !dbg [[DBG166]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]], !dbg [[DBG166]]
		// DEBUG2: arraydestroy.done21:
		// DEBUG2-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG166]]
		// DEBUG2: eh.resume:
		// DEBUG2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG166]]
		// DEBUG2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG166]]
		// DEBUG2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG166]]
		// DEBUG2-NEXT: [[LPAD_VAL22:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG166]]
		// DEBUG2-NEXT: resume { i8*, i32 } [[LPAD_VAL22]], !dbg [[DBG166]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..3
		// DEBUG2-SAME: (i8* [[TMP0:%.]]) #[[ATTR0]] personality i8 bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG177:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: [[ARRAYINIT_ENDOFINIT:%.]] = alloca [3 x %struct.S1], align 8
		// DEBUG2-NEXT: [[ARRAYINIT_ENDOFINIT2:%.]] = alloca %struct.S1, align 8
		// DEBUG2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: [[ARRAYINIT_ENDOFINIT9:%.]] = alloca %struct.S1, align 8
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META178:![0-9]+]], metadata !DIExpression()), !dbg [[DBG179:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG180:![0-9]+]]
		// DEBUG2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [2 x [3 x %struct.S1]]*, !dbg [[DBG180]]
		// DEBUG2-NEXT: [[ARRAYINIT_BEGIN:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP2]], i64 0, i64 0, !dbg [[DBG181:![0-9]+]]
		// DEBUG2-NEXT: store [3 x %struct.S1]* [[ARRAYINIT_BEGIN]], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG181]]
		// DEBUG2-NEXT: [[ARRAYINIT_BEGIN1:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 0, i64 0, !dbg [[DBG182:![0-9]+]]
		// DEBUG2-NEXT: store %struct.S1* [[ARRAYINIT_BEGIN1]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8, !dbg [[DBG182]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_BEGIN1]], i32 1)
		// DEBUG2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG183:![0-9]+]]
		// DEBUG2: invoke.cont:
		// DEBUG2-NEXT: [[ARRAYINIT_ELEMENT:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[ARRAYINIT_BEGIN1]], i64 1, !dbg [[DBG182]]
		// DEBUG2-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8, !dbg [[DBG182]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT]], i32 2)
		// DEBUG2-NEXT: to label [[INVOKE_CONT3:%.*]] unwind label [[LPAD]], !dbg [[DBG184:![0-9]+]]
		// DEBUG2: invoke.cont3:
		// DEBUG2-NEXT: [[ARRAYINIT_ELEMENT4:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_ELEMENT]], i64 1, !dbg [[DBG182]]
		// DEBUG2-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT4]], %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8, !dbg [[DBG182]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT4]], i32 3)
		// DEBUG2-NEXT: to label [[INVOKE_CONT5:%.*]] unwind label [[LPAD]], !dbg [[DBG185:![0-9]+]]
		// DEBUG2: invoke.cont5:
		// DEBUG2-NEXT: [[ARRAYINIT_ELEMENT7:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 1, !dbg [[DBG181]]
		// DEBUG2-NEXT: store [3 x %struct.S1]* [[ARRAYINIT_ELEMENT7]], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG181]]
		// DEBUG2-NEXT: [[ARRAYINIT_BEGIN8:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_ELEMENT7]], i64 0, i64 0, !dbg [[DBG186:![0-9]+]]
		// DEBUG2-NEXT: store %struct.S1* [[ARRAYINIT_BEGIN8]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8, !dbg [[DBG186]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_BEGIN8]], i32 4)
		// DEBUG2-NEXT: to label [[INVOKE_CONT11:%.]] unwind label [[LPAD10:%.]], !dbg [[DBG187:![0-9]+]]
		// DEBUG2: invoke.cont11:
		// DEBUG2-NEXT: [[ARRAYINIT_ELEMENT12:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_BEGIN8]], i64 1, !dbg [[DBG186]]
		// DEBUG2-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT12]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8, !dbg [[DBG186]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT12]], i32 5)
		// DEBUG2-NEXT: to label [[INVOKE_CONT13:%.*]] unwind label [[LPAD10]], !dbg [[DBG188:![0-9]+]]
		// DEBUG2: invoke.cont13:
		// DEBUG2-NEXT: [[ARRAYINIT_ELEMENT14:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYINIT_ELEMENT12]], i64 1, !dbg [[DBG186]]
		// DEBUG2-NEXT: store %struct.S1* [[ARRAYINIT_ELEMENT14]], %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8, !dbg [[DBG186]]
		// DEBUG2-NEXT: invoke void @_ZN2S1C1Ei(%struct.S1* nonnull dereferenceable(4) [[ARRAYINIT_ELEMENT14]], i32 6)
		// DEBUG2-NEXT: to label [[INVOKE_CONT15:%.*]] unwind label [[LPAD10]], !dbg [[DBG189:![0-9]+]]
		// DEBUG2: invoke.cont15:
		// DEBUG2-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG180]]
		// DEBUG2-NEXT: ret i8* [[TMP3]], !dbg [[DBG180]]
		// DEBUG2: lpad:
		// DEBUG2-NEXT: [[TMP4:%.]] = landingpad { i8, i32 }
		// DEBUG2-NEXT: cleanup, !dbg [[DBG179]]
		// DEBUG2-NEXT: [[TMP5:%.]] = extractvalue { i8, i32 } [[TMP4]], 0, !dbg [[DBG179]]
		// DEBUG2-NEXT: store i8* [[TMP5]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG179]]
		// DEBUG2-NEXT: [[TMP6:%.]] = extractvalue { i8, i32 } [[TMP4]], 1, !dbg [[DBG179]]
		// DEBUG2-NEXT: store i32 [[TMP6]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG179]]
		// DEBUG2-NEXT: [[TMP7:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT2]], align 8, !dbg [[DBG182]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ISEMPTY:%.]] = icmp eq %struct.S1 [[ARRAYINIT_BEGIN1]], [[TMP7]], !dbg [[DBG182]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY]], label [[ARRAYDESTROY_DONE6:%.]], label [[ARRAYDESTROY_BODY:%.]], !dbg [[DBG182]]
		// DEBUG2: arraydestroy.body:
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP7]], [[LPAD]] ], [ [[ARRAYDESTROY_ELEMENT:%.*]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG182]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG182]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]], !dbg [[DBG182]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], [[ARRAYINIT_BEGIN1]], !dbg [[DBG182]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE6]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG182]]
		// DEBUG2: arraydestroy.done6:
		// DEBUG2-NEXT: br label [[EHCLEANUP:%.*]], !dbg [[DBG182]]
		// DEBUG2: lpad10:
		// DEBUG2-NEXT: [[TMP8:%.]] = landingpad { i8, i32 }
		// DEBUG2-NEXT: cleanup, !dbg [[DBG179]]
		// DEBUG2-NEXT: [[TMP9:%.]] = extractvalue { i8, i32 } [[TMP8]], 0, !dbg [[DBG179]]
		// DEBUG2-NEXT: store i8* [[TMP9]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG179]]
		// DEBUG2-NEXT: [[TMP10:%.]] = extractvalue { i8, i32 } [[TMP8]], 1, !dbg [[DBG179]]
		// DEBUG2-NEXT: store i32 [[TMP10]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG179]]
		// DEBUG2-NEXT: [[TMP11:%.]] = load %struct.S1, %struct.S1** [[ARRAYINIT_ENDOFINIT9]], align 8, !dbg [[DBG186]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ISEMPTY16:%.]] = icmp eq %struct.S1 [[ARRAYINIT_BEGIN8]], [[TMP11]], !dbg [[DBG186]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY16]], label [[ARRAYDESTROY_DONE21:%.]], label [[ARRAYDESTROY_BODY17:%.]], !dbg [[DBG186]]
		// DEBUG2: arraydestroy.body17:
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENTPAST18:%.]] = phi %struct.S1 [ [[TMP11]], [[LPAD10]] ], [ [[ARRAYDESTROY_ELEMENT19:%.*]], [[ARRAYDESTROY_BODY17]] ], !dbg [[DBG186]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENT19]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST18]], i64 -1, !dbg [[DBG186]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT19]]) #[[ATTR4]], !dbg [[DBG186]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_DONE20:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT19]], [[ARRAYINIT_BEGIN8]], !dbg [[DBG186]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_DONE20]], label [[ARRAYDESTROY_DONE21]], label [[ARRAYDESTROY_BODY17]], !dbg [[DBG186]]
		// DEBUG2: arraydestroy.done21:
		// DEBUG2-NEXT: br label [[EHCLEANUP]], !dbg [[DBG186]]
		// DEBUG2: ehcleanup:
		// DEBUG2-NEXT: [[TMP12:%.]] = load [3 x %struct.S1], [3 x %struct.S1]** [[ARRAYINIT_ENDOFINIT]], align 8, !dbg [[DBG181]]
		// DEBUG2-NEXT: [[PAD_ARRAYBEGIN:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYINIT_BEGIN]], i64 0, i64 0, !dbg [[DBG181]]
		// DEBUG2-NEXT: [[PAD_ARRAYEND:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[TMP12]], i64 0, i64 0, !dbg [[DBG181]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ISEMPTY22:%.]] = icmp eq %struct.S1 [[PAD_ARRAYBEGIN]], [[PAD_ARRAYEND]], !dbg [[DBG181]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_ISEMPTY22]], label [[ARRAYDESTROY_DONE27:%.]], label [[ARRAYDESTROY_BODY23:%.]], !dbg [[DBG181]]
		// DEBUG2: arraydestroy.body23:
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENTPAST24:%.]] = phi %struct.S1 [ [[PAD_ARRAYEND]], [[EHCLEANUP]] ], [ [[ARRAYDESTROY_ELEMENT25:%.*]], [[ARRAYDESTROY_BODY23]] ], !dbg [[DBG181]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENT25]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST24]], i64 -1, !dbg [[DBG181]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT25]]) #[[ATTR4]], !dbg [[DBG181]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_DONE26:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT25]], [[PAD_ARRAYBEGIN]], !dbg [[DBG181]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_DONE26]], label [[ARRAYDESTROY_DONE27]], label [[ARRAYDESTROY_BODY23]], !dbg [[DBG181]]
		// DEBUG2: arraydestroy.done27:
		// DEBUG2-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG181]]
		// DEBUG2: eh.resume:
		// DEBUG2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG181]]
		// DEBUG2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG181]]
		// DEBUG2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG181]]
		// DEBUG2-NEXT: [[LPAD_VAL28:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG181]]
		// DEBUG2-NEXT: resume { i8*, i32 } [[LPAD_VAL28]], !dbg [[DBG181]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..4
		// DEBUG2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG190:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META191:![0-9]+]], metadata !DIExpression()), !dbg [[DBG192:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG192]]
		// DEBUG2-NEXT: [[ARRAY_BEGIN:%.]] = bitcast i8 [[TMP1]] to %struct.S1*, !dbg [[DBG192]]
		// DEBUG2-NEXT: [[TMP2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[ARRAY_BEGIN]], i64 6, !dbg [[DBG192]]
		// DEBUG2-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG192]]
		// DEBUG2: arraydestroy.body:
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ [[TMP2]], [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG192]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG192]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]], !dbg [[DBG192]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], [[ARRAY_BEGIN]], !dbg [[DBG192]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG192]]
		// DEBUG2: arraydestroy.done1:
		// DEBUG2-NEXT: ret void, !dbg [[DBG193:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@__cxx_global_array_dtor
		// DEBUG2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG194:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META197:![0-9]+]], metadata !DIExpression()), !dbg [[DBG198:![0-9]+]]
		// DEBUG2-NEXT: br label [[ARRAYDESTROY_BODY:%.*]], !dbg [[DBG198]]
		// DEBUG2: arraydestroy.body:
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENTPAST:%.]] = phi %struct.S1 [ getelementptr inbounds ([[STRUCT_S1:%.]], %struct.S1 getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), i64 6), [[ENTRY:%.]] ], [ [[ARRAYDESTROY_ELEMENT:%.]], [[ARRAYDESTROY_BODY]] ], !dbg [[DBG198]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_ELEMENT]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1* [[ARRAYDESTROY_ELEMENTPAST]], i64 -1, !dbg [[DBG198]]
		// DEBUG2-NEXT: call void @_ZN2S1D1Ev(%struct.S1* nonnull dereferenceable(4) [[ARRAYDESTROY_ELEMENT]]) #[[ATTR4]], !dbg [[DBG198]]
		// DEBUG2-NEXT: [[ARRAYDESTROY_DONE:%.]] = icmp eq %struct.S1 [[ARRAYDESTROY_ELEMENT]], getelementptr inbounds ([2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]]* @arr_x, i32 0, i32 0, i32 0), !dbg [[DBG198]]
		// DEBUG2-NEXT: br i1 [[ARRAYDESTROY_DONE]], label [[ARRAYDESTROY_DONE1:%.*]], label [[ARRAYDESTROY_BODY]], !dbg [[DBG198]]
		// DEBUG2: arraydestroy.done1:
		// DEBUG2-NEXT: ret void, !dbg [[DBG198]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@main
		// DEBUG2-SAME: () #[[ATTR5:[0-9]+]] personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) !dbg [[DBG53:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: [[RES:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: [[EXN_SLOT:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: [[EHSELECTOR_SLOT:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB9:[0-9]+]])
		// DEBUG2-NEXT: store i32 0, i32* [[RETVAL]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META199:![0-9]+]], metadata !DIExpression()), !dbg [[DBG200:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = load atomic i8, i8 bitcast (i64* @_ZGVZ4mainE2sm to i8*) acquire, align 8, !dbg [[DBG201:![0-9]+]]
		// DEBUG2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP1]], 0, !dbg [[DBG201]]
		// DEBUG2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG201]], !prof [[PROF202:![0-9]+]]
		// DEBUG2: init.check:
		// DEBUG2-NEXT: [[TMP2:%.]] = call i32 @__cxa_guard_acquire(i64 @_ZGVZ4mainE2sm) #[[ATTR4]], !dbg [[DBG201]]
		// DEBUG2-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP2]], 0, !dbg [[DBG201]]
		// DEBUG2-NEXT: br i1 [[TOBOOL]], label [[INIT:%.*]], label [[INIT_END]], !dbg [[DBG201]]
		// DEBUG2: init:
		// DEBUG2-NEXT: [[TMP3:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB7:[0-9]+]]), !dbg [[DBG201]]
		// DEBUG2-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB7]], i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 (i8) @.__kmpc_global_ctor_..5, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..6), !dbg [[DBG201]]
		// DEBUG2-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB9]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.), !dbg [[DBG203:![0-9]+]]
		// DEBUG2-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*, !dbg [[DBG203]]
		// DEBUG2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0, !dbg [[DBG204:![0-9]+]]
		// DEBUG2-NEXT: [[TMP6:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG204]]
		// DEBUG2-NEXT: invoke void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) @_ZZ4mainE2sm, i32 [[TMP6]])
		// DEBUG2-NEXT: to label [[INVOKE_CONT:%.]] unwind label [[LPAD:%.]], !dbg [[DBG205:![0-9]+]]
		// DEBUG2: invoke.cont:
		// DEBUG2-NEXT: [[TMP7:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.Smain) @_ZZ4mainEN5SmainD1Ev to void (i8)), i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i8 @__dso_handle) #[[ATTR4]], !dbg [[DBG201]]
		// DEBUG2-NEXT: call void @__cxa_guard_release(i64* @_ZGVZ4mainE2sm) #[[ATTR4]], !dbg [[DBG201]]
		// DEBUG2-NEXT: br label [[INIT_END]], !dbg [[DBG201]]
		// DEBUG2: init.end:
		// DEBUG2-NEXT: [[TMP8:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB11:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S3* @_ZN6Static1sE to i8), i64 8, i8** @_ZN6Static1sE.cache.), !dbg [[DBG206:![0-9]+]]
		// DEBUG2-NEXT: [[TMP9:%.]] = bitcast i8 [[TMP8]] to %struct.S3*, !dbg [[DBG206]]
		// DEBUG2-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP9]], i32 0, i32 0, !dbg [[DBG207:![0-9]+]]
		// DEBUG2-NEXT: [[TMP10:%.]] = load i32, i32 [[A1]], align 4, !dbg [[DBG207]]
		// DEBUG2-NEXT: store i32 [[TMP10]], i32* [[RES]], align 4, !dbg [[DBG208:![0-9]+]]
		// DEBUG2-NEXT: [[TMP11:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB13:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.Smain* @_ZZ4mainE2sm to i8), i64 24, i8** @_ZZ4mainE2sm.cache.), !dbg [[DBG209:![0-9]+]]
		// DEBUG2-NEXT: [[TMP12:%.]] = bitcast i8 [[TMP11]] to %struct.Smain*, !dbg [[DBG209]]
		// DEBUG2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[TMP12]], i32 0, i32 0, !dbg [[DBG210:![0-9]+]]
		// DEBUG2-NEXT: [[TMP13:%.]] = load i32, i32 [[A2]], align 8, !dbg [[DBG210]]
		// DEBUG2-NEXT: [[TMP14:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG211:![0-9]+]]
		// DEBUG2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP14]], [[TMP13]], !dbg [[DBG211]]
		// DEBUG2-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG211]]
		// DEBUG2-NEXT: [[TMP15:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB15:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.), !dbg [[DBG212:![0-9]+]]
		// DEBUG2-NEXT: [[TMP16:%.]] = bitcast i8 [[TMP15]] to %struct.S1*, !dbg [[DBG212]]
		// DEBUG2-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[TMP16]], i32 0, i32 0, !dbg [[DBG213:![0-9]+]]
		// DEBUG2-NEXT: [[TMP17:%.]] = load i32, i32 [[A3]], align 4, !dbg [[DBG213]]
		// DEBUG2-NEXT: [[TMP18:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG214:![0-9]+]]
		// DEBUG2-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP18]], [[TMP17]], !dbg [[DBG214]]
		// DEBUG2-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG214]]
		// DEBUG2-NEXT: [[TMP19:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG215:![0-9]+]]
		// DEBUG2-NEXT: [[TMP20:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG216:![0-9]+]]
		// DEBUG2-NEXT: [[ADD5:%.*]] = add nsw i32 [[TMP20]], [[TMP19]], !dbg [[DBG216]]
		// DEBUG2-NEXT: store i32 [[ADD5]], i32* [[RES]], align 4, !dbg [[DBG216]]
		// DEBUG2-NEXT: [[TMP21:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB17:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S5* @gs3 to i8), i64 12, i8** @gs3.cache.), !dbg [[DBG217:![0-9]+]]
		// DEBUG2-NEXT: [[TMP22:%.]] = bitcast i8 [[TMP21]] to %struct.S5*, !dbg [[DBG217]]
		// DEBUG2-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP22]], i32 0, i32 0, !dbg [[DBG218:![0-9]+]]
		// DEBUG2-NEXT: [[TMP23:%.]] = load i32, i32 [[A6]], align 4, !dbg [[DBG218]]
		// DEBUG2-NEXT: [[TMP24:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG219:![0-9]+]]
		// DEBUG2-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP24]], [[TMP23]], !dbg [[DBG219]]
		// DEBUG2-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4, !dbg [[DBG219]]
		// DEBUG2-NEXT: [[TMP25:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB19:[0-9]+]], i32 [[TMP0]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i64 24, i8** @arr_x.cache.), !dbg [[DBG220:![0-9]+]]
		// DEBUG2-NEXT: [[TMP26:%.]] = bitcast i8 [[TMP25]] to [2 x [3 x %struct.S1]]*, !dbg [[DBG220]]
		// DEBUG2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP26]], i64 0, i64 1, !dbg [[DBG220]]
		// DEBUG2-NEXT: [[ARRAYIDX8:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1, !dbg [[DBG220]]
		// DEBUG2-NEXT: [[A9:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX8]], i32 0, i32 0, !dbg [[DBG221:![0-9]+]]
		// DEBUG2-NEXT: [[TMP27:%.]] = load i32, i32 [[A9]], align 4, !dbg [[DBG221]]
		// DEBUG2-NEXT: [[TMP28:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG222:![0-9]+]]
		// DEBUG2-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP28]], [[TMP27]], !dbg [[DBG222]]
		// DEBUG2-NEXT: store i32 [[ADD10]], i32* [[RES]], align 4, !dbg [[DBG222]]
		// DEBUG2-NEXT: [[TMP29:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB21:[0-9]+]], i32 [[TMP0]], i8* bitcast (i32* @_ZN2STIiE2stE to i8), i64 4, i8** @_ZN2STIiE2stE.cache.), !dbg [[DBG223:![0-9]+]]
		// DEBUG2-NEXT: [[TMP30:%.]] = bitcast i8 [[TMP29]] to i32*, !dbg [[DBG223]]
		// DEBUG2-NEXT: [[TMP31:%.]] = load i32, i32 [[TMP30]], align 4, !dbg [[DBG223]]
		// DEBUG2-NEXT: [[TMP32:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG224:![0-9]+]]
		// DEBUG2-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP32]], [[TMP31]], !dbg [[DBG224]]
		// DEBUG2-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4, !dbg [[DBG224]]
		// DEBUG2-NEXT: [[TMP33:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB23:[0-9]+]], i32 [[TMP0]], i8* bitcast (float* @_ZN2STIfE2stE to i8), i64 4, i8** @_ZN2STIfE2stE.cache.), !dbg [[DBG225:![0-9]+]]
		// DEBUG2-NEXT: [[TMP34:%.]] = bitcast i8 [[TMP33]] to float*, !dbg [[DBG225]]
		// DEBUG2-NEXT: [[TMP35:%.]] = load float, float [[TMP34]], align 4, !dbg [[DBG225]]
		// DEBUG2-NEXT: [[CONV:%.*]] = fptosi float [[TMP35]] to i32, !dbg [[DBG225]]
		// DEBUG2-NEXT: [[TMP36:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG226:![0-9]+]]
		// DEBUG2-NEXT: [[ADD12:%.*]] = add nsw i32 [[TMP36]], [[CONV]], !dbg [[DBG226]]
		// DEBUG2-NEXT: store i32 [[ADD12]], i32* [[RES]], align 4, !dbg [[DBG226]]
		// DEBUG2-NEXT: [[TMP37:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB25:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i64 8, i8** @_ZN2STI2S4E2stE.cache.), !dbg [[DBG227:![0-9]+]]
		// DEBUG2-NEXT: [[TMP38:%.]] = bitcast i8 [[TMP37]] to %struct.S4*, !dbg [[DBG227]]
		// DEBUG2-NEXT: [[A13:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP38]], i32 0, i32 0, !dbg [[DBG228:![0-9]+]]
		// DEBUG2-NEXT: [[TMP39:%.]] = load i32, i32 [[A13]], align 4, !dbg [[DBG228]]
		// DEBUG2-NEXT: [[TMP40:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG229:![0-9]+]]
		// DEBUG2-NEXT: [[ADD14:%.*]] = add nsw i32 [[TMP40]], [[TMP39]], !dbg [[DBG229]]
		// DEBUG2-NEXT: store i32 [[ADD14]], i32* [[RES]], align 4, !dbg [[DBG229]]
		// DEBUG2-NEXT: [[TMP41:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG230:![0-9]+]]
		// DEBUG2-NEXT: ret i32 [[TMP41]], !dbg [[DBG231:![0-9]+]]
		// DEBUG2: lpad:
		// DEBUG2-NEXT: [[TMP42:%.]] = landingpad { i8, i32 }
		// DEBUG2-NEXT: cleanup, !dbg [[DBG232:![0-9]+]]
		// DEBUG2-NEXT: [[TMP43:%.]] = extractvalue { i8, i32 } [[TMP42]], 0, !dbg [[DBG232]]
		// DEBUG2-NEXT: store i8* [[TMP43]], i8** [[EXN_SLOT]], align 8, !dbg [[DBG232]]
		// DEBUG2-NEXT: [[TMP44:%.]] = extractvalue { i8, i32 } [[TMP42]], 1, !dbg [[DBG232]]
		// DEBUG2-NEXT: store i32 [[TMP44]], i32* [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG232]]
		// DEBUG2-NEXT: call void @__cxa_guard_abort(i64* @_ZGVZ4mainE2sm) #[[ATTR4]], !dbg [[DBG201]]
		// DEBUG2-NEXT: br label [[EH_RESUME:%.*]], !dbg [[DBG201]]
		// DEBUG2: eh.resume:
		// DEBUG2-NEXT: [[EXN:%.]] = load i8, i8** [[EXN_SLOT]], align 8, !dbg [[DBG201]]
		// DEBUG2-NEXT: [[SEL:%.]] = load i32, i32 [[EHSELECTOR_SLOT]], align 4, !dbg [[DBG201]]
		// DEBUG2-NEXT: [[LPAD_VAL:%.]] = insertvalue { i8, i32 } undef, i8* [[EXN]], 0, !dbg [[DBG201]]
		// DEBUG2-NEXT: [[LPAD_VAL15:%.]] = insertvalue { i8, i32 } [[LPAD_VAL]], i32 [[SEL]], 1, !dbg [[DBG201]]
		// DEBUG2-NEXT: resume { i8*, i32 } [[LPAD_VAL15]], !dbg [[DBG201]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..5
		// DEBUG2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG233:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: [[TMP1:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB5:[0-9]+]])
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META234:![0-9]+]], metadata !DIExpression()), !dbg [[DBG235:![0-9]+]]
		// DEBUG2-NEXT: [[TMP2:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG236:![0-9]+]]
		// DEBUG2-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to %struct.Smain*, !dbg [[DBG236]]
		// DEBUG2-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB5]], i32 [[TMP1]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.), !dbg [[DBG237:![0-9]+]]
		// DEBUG2-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*, !dbg [[DBG237]]
		// DEBUG2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0, !dbg [[DBG238:![0-9]+]]
		// DEBUG2-NEXT: [[TMP6:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG238]]
		// DEBUG2-NEXT: call void @_ZZ4mainEN5SmainC1Ei(%struct.Smain* nonnull dereferenceable(24) [[TMP3]], i32 [[TMP6]]), !dbg [[DBG239:![0-9]+]]
		// DEBUG2-NEXT: [[TMP7:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG236]]
		// DEBUG2-NEXT: ret i8* [[TMP7]], !dbg [[DBG236]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC1Ei
		// DEBUG2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] align 2 !dbg [[DBG240:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// DEBUG2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META241:![0-9]+]], metadata !DIExpression()), !dbg [[DBG243:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META244:![0-9]+]], metadata !DIExpression()), !dbg [[DBG245:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG246:![0-9]+]]
		// DEBUG2-NEXT: call void @_ZZ4mainEN5SmainC2Ei(%struct.Smain* nonnull dereferenceable(24) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG246]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG247:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..6
		// DEBUG2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG248:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META249:![0-9]+]], metadata !DIExpression()), !dbg [[DBG250:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG250]]
		// DEBUG2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.Smain*, !dbg [[DBG250]]
		// DEBUG2-NEXT: call void @_ZZ4mainEN5SmainD1Ev(%struct.Smain* nonnull dereferenceable(24) [[TMP2]]) #[[ATTR4]], !dbg [[DBG250]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG251:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD1Ev
		// DEBUG2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] align 2 !dbg [[DBG252:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// DEBUG2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META253:![0-9]+]], metadata !DIExpression()), !dbg [[DBG254:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @_ZZ4mainEN5SmainD2Ev(%struct.Smain* nonnull dereferenceable(24) [[THIS1]]) #[[ATTR4]], !dbg [[DBG255:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG256:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_Z6foobarv
		// DEBUG2-SAME: () #[[ATTR6:[0-9]+]] !dbg [[DBG257:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[RES:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: [[TMP0:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB27:[0-9]+]])
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[RES]], metadata [[META258:![0-9]+]], metadata !DIExpression()), !dbg [[DBG259:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB27]], i32 [[TMP0]], i8* bitcast (%struct.S3* @_ZN6Static1sE to i8), i64 8, i8** @_ZN6Static1sE.cache.), !dbg [[DBG260:![0-9]+]]
		// DEBUG2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S3*, !dbg [[DBG260]]
		// DEBUG2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S3:%.]], %struct.S3* [[TMP2]], i32 0, i32 0, !dbg [[DBG261:![0-9]+]]
		// DEBUG2-NEXT: [[TMP3:%.]] = load i32, i32 [[A]], align 4, !dbg [[DBG261]]
		// DEBUG2-NEXT: store i32 [[TMP3]], i32* [[RES]], align 4, !dbg [[DBG262:![0-9]+]]
		// DEBUG2-NEXT: [[TMP4:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB29:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S1* @_ZL3gs1 to i8), i64 4, i8** @_ZL3gs1.cache.), !dbg [[DBG263:![0-9]+]]
		// DEBUG2-NEXT: [[TMP5:%.]] = bitcast i8 [[TMP4]] to %struct.S1*, !dbg [[DBG263]]
		// DEBUG2-NEXT: [[A1:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[TMP5]], i32 0, i32 0, !dbg [[DBG264:![0-9]+]]
		// DEBUG2-NEXT: [[TMP6:%.]] = load i32, i32 [[A1]], align 4, !dbg [[DBG264]]
		// DEBUG2-NEXT: [[TMP7:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG265:![0-9]+]]
		// DEBUG2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP7]], [[TMP6]], !dbg [[DBG265]]
		// DEBUG2-NEXT: store i32 [[ADD]], i32* [[RES]], align 4, !dbg [[DBG265]]
		// DEBUG2-NEXT: [[TMP8:%.]] = load i32, i32 getelementptr inbounds ([[STRUCT_S2:%.]], %struct.S2 @_ZL3gs2, i32 0, i32 0), align 8, !dbg [[DBG266:![0-9]+]]
		// DEBUG2-NEXT: [[TMP9:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG267:![0-9]+]]
		// DEBUG2-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP9]], [[TMP8]], !dbg [[DBG267]]
		// DEBUG2-NEXT: store i32 [[ADD2]], i32* [[RES]], align 4, !dbg [[DBG267]]
		// DEBUG2-NEXT: [[TMP10:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB31:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S5* @gs3 to i8), i64 12, i8** @gs3.cache.), !dbg [[DBG268:![0-9]+]]
		// DEBUG2-NEXT: [[TMP11:%.]] = bitcast i8 [[TMP10]] to %struct.S5*, !dbg [[DBG268]]
		// DEBUG2-NEXT: [[A3:%.]] = getelementptr inbounds [[STRUCT_S5:%.]], %struct.S5* [[TMP11]], i32 0, i32 0, !dbg [[DBG269:![0-9]+]]
		// DEBUG2-NEXT: [[TMP12:%.]] = load i32, i32 [[A3]], align 4, !dbg [[DBG269]]
		// DEBUG2-NEXT: [[TMP13:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG270:![0-9]+]]
		// DEBUG2-NEXT: [[ADD4:%.*]] = add nsw i32 [[TMP13]], [[TMP12]], !dbg [[DBG270]]
		// DEBUG2-NEXT: store i32 [[ADD4]], i32* [[RES]], align 4, !dbg [[DBG270]]
		// DEBUG2-NEXT: [[TMP14:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB33:[0-9]+]], i32 [[TMP0]], i8* bitcast ([2 x [3 x %struct.S1]]* @arr_x to i8), i64 24, i8** @arr_x.cache.), !dbg [[DBG271:![0-9]+]]
		// DEBUG2-NEXT: [[TMP15:%.]] = bitcast i8 [[TMP14]] to [2 x [3 x %struct.S1]]*, !dbg [[DBG271]]
		// DEBUG2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [2 x [3 x %struct.S1]], [2 x [3 x %struct.S1]] [[TMP15]], i64 0, i64 1, !dbg [[DBG271]]
		// DEBUG2-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds [3 x %struct.S1], [3 x %struct.S1] [[ARRAYIDX]], i64 0, i64 1, !dbg [[DBG271]]
		// DEBUG2-NEXT: [[A6:%.]] = getelementptr inbounds [[STRUCT_S1]], %struct.S1 [[ARRAYIDX5]], i32 0, i32 0, !dbg [[DBG272:![0-9]+]]
		// DEBUG2-NEXT: [[TMP16:%.]] = load i32, i32 [[A6]], align 4, !dbg [[DBG272]]
		// DEBUG2-NEXT: [[TMP17:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG273:![0-9]+]]
		// DEBUG2-NEXT: [[ADD7:%.*]] = add nsw i32 [[TMP17]], [[TMP16]], !dbg [[DBG273]]
		// DEBUG2-NEXT: store i32 [[ADD7]], i32* [[RES]], align 4, !dbg [[DBG273]]
		// DEBUG2-NEXT: [[TMP18:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB35:[0-9]+]], i32 [[TMP0]], i8* bitcast (i32* @_ZN2STIiE2stE to i8), i64 4, i8** @_ZN2STIiE2stE.cache.), !dbg [[DBG274:![0-9]+]]
		// DEBUG2-NEXT: [[TMP19:%.]] = bitcast i8 [[TMP18]] to i32*, !dbg [[DBG274]]
		// DEBUG2-NEXT: [[TMP20:%.]] = load i32, i32 [[TMP19]], align 4, !dbg [[DBG274]]
		// DEBUG2-NEXT: [[TMP21:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG275:![0-9]+]]
		// DEBUG2-NEXT: [[ADD8:%.*]] = add nsw i32 [[TMP21]], [[TMP20]], !dbg [[DBG275]]
		// DEBUG2-NEXT: store i32 [[ADD8]], i32* [[RES]], align 4, !dbg [[DBG275]]
		// DEBUG2-NEXT: [[TMP22:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB37:[0-9]+]], i32 [[TMP0]], i8* bitcast (float* @_ZN2STIfE2stE to i8), i64 4, i8** @_ZN2STIfE2stE.cache.), !dbg [[DBG276:![0-9]+]]
		// DEBUG2-NEXT: [[TMP23:%.]] = bitcast i8 [[TMP22]] to float*, !dbg [[DBG276]]
		// DEBUG2-NEXT: [[TMP24:%.]] = load float, float [[TMP23]], align 4, !dbg [[DBG276]]
		// DEBUG2-NEXT: [[CONV:%.*]] = fptosi float [[TMP24]] to i32, !dbg [[DBG276]]
		// DEBUG2-NEXT: [[TMP25:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG277:![0-9]+]]
		// DEBUG2-NEXT: [[ADD9:%.*]] = add nsw i32 [[TMP25]], [[CONV]], !dbg [[DBG277]]
		// DEBUG2-NEXT: store i32 [[ADD9]], i32* [[RES]], align 4, !dbg [[DBG277]]
		// DEBUG2-NEXT: [[TMP26:%.]] = call i8 @__kmpc_threadprivate_cached(%struct.ident_t* @[[GLOB39:[0-9]+]], i32 [[TMP0]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i64 8, i8** @_ZN2STI2S4E2stE.cache.), !dbg [[DBG278:![0-9]+]]
		// DEBUG2-NEXT: [[TMP27:%.]] = bitcast i8 [[TMP26]] to %struct.S4*, !dbg [[DBG278]]
		// DEBUG2-NEXT: [[A10:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[TMP27]], i32 0, i32 0, !dbg [[DBG279:![0-9]+]]
		// DEBUG2-NEXT: [[TMP28:%.]] = load i32, i32 [[A10]], align 4, !dbg [[DBG279]]
		// DEBUG2-NEXT: [[TMP29:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG280:![0-9]+]]
		// DEBUG2-NEXT: [[ADD11:%.*]] = add nsw i32 [[TMP29]], [[TMP28]], !dbg [[DBG280]]
		// DEBUG2-NEXT: store i32 [[ADD11]], i32* [[RES]], align 4, !dbg [[DBG280]]
		// DEBUG2-NEXT: [[TMP30:%.]] = load i32, i32 [[RES]], align 4, !dbg [[DBG281:![0-9]+]]
		// DEBUG2-NEXT: ret i32 [[TMP30]], !dbg [[DBG282:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@__cxx_global_var_init.7
		// DEBUG2-SAME: () #[[ATTR0]] comdat($_ZN2STI2S4E2stE) !dbg [[DBG283:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[TMP0:%.]] = load i8, i8 bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG284:![0-9]+]]
		// DEBUG2-NEXT: [[GUARD_UNINITIALIZED:%.*]] = icmp eq i8 [[TMP0]], 0, !dbg [[DBG284]]
		// DEBUG2-NEXT: br i1 [[GUARD_UNINITIALIZED]], label [[INIT_CHECK:%.]], label [[INIT_END:%.]], !dbg [[DBG284]]
		// DEBUG2: init.check:
		// DEBUG2-NEXT: [[TMP1:%.]] = call i32 @__kmpc_global_thread_num(%struct.ident_t @[[GLOB41:[0-9]+]]), !dbg [[DBG284]]
		// DEBUG2-NEXT: call void @__kmpc_threadprivate_register(%struct.ident_t* @[[GLOB41]], i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 (i8) @.__kmpc_global_ctor_..8, i8* (i8, i8)* null, void (i8) @.__kmpc_global_dtor_..9), !dbg [[DBG284]]
		// DEBUG2-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) @_ZN2STI2S4E2stE, i32 23), !dbg [[DBG285:![0-9]+]]
		// DEBUG2-NEXT: [[TMP2:%.]] = call i32 @__cxa_atexit(void (i8)* bitcast (void (%struct.S4) @_ZN2S4D1Ev to void (i8)), i8* bitcast (%struct.S4* @_ZN2STI2S4E2stE to i8), i8 @__dso_handle) #[[ATTR4]], !dbg [[DBG284]]
		// DEBUG2-NEXT: store i8 1, i8* bitcast (i64* @_ZGVN2STI2S4E2stE to i8*), align 8, !dbg [[DBG284]]
		// DEBUG2-NEXT: br label [[INIT_END]], !dbg [[DBG284]]
		// DEBUG2: init.end:
		// DEBUG2-NEXT: ret void, !dbg [[DBG287:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@.__kmpc_global_ctor_..8
		// DEBUG2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG288:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META289:![0-9]+]], metadata !DIExpression()), !dbg [[DBG290:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG291:![0-9]+]]
		// DEBUG2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S4*, !dbg [[DBG291]]
		// DEBUG2-NEXT: call void @_ZN2S4C1Ei(%struct.S4* nonnull dereferenceable(8) [[TMP2]], i32 23), !dbg [[DBG292:![0-9]+]]
		// DEBUG2-NEXT: [[TMP3:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG291]]
		// DEBUG2-NEXT: ret i8* [[TMP3]], !dbg [[DBG291]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S4C1Ei
		// DEBUG2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR2]] comdat align 2 !dbg [[DBG293:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// DEBUG2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META294:![0-9]+]], metadata !DIExpression()), !dbg [[DBG296:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META297:![0-9]+]], metadata !DIExpression()), !dbg [[DBG298:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG299:![0-9]+]]
		// DEBUG2-NEXT: call void @_ZN2S4C2Ei(%struct.S4* nonnull dereferenceable(8) [[THIS1]], i32 [[TMP0]]), !dbg [[DBG299]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG300:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@.__kmpc_global_dtor_..9
		// DEBUG2-SAME: (i8* [[TMP0:%.*]]) #[[ATTR0]] !dbg [[DBG301:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[DOTADDR:%.]] = alloca i8, align 8
		// DEBUG2-NEXT: store i8* [[TMP0]], i8** [[DOTADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i8** [[DOTADDR]], metadata [[META302:![0-9]+]], metadata !DIExpression()), !dbg [[DBG303:![0-9]+]]
		// DEBUG2-NEXT: [[TMP1:%.]] = load i8, i8** [[DOTADDR]], align 8, !dbg [[DBG303]]
		// DEBUG2-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to %struct.S4*, !dbg [[DBG303]]
		// DEBUG2-NEXT: call void @_ZN2S4D1Ev(%struct.S4* nonnull dereferenceable(8) [[TMP2]]) #[[ATTR4]], !dbg [[DBG303]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG304:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S4D1Ev
		// DEBUG2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG305:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// DEBUG2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META306:![0-9]+]], metadata !DIExpression()), !dbg [[DBG307:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @_ZN2S4D2Ev(%struct.S4* nonnull dereferenceable(8) [[THIS1]]) #[[ATTR4]], !dbg [[DBG308:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG309:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S1C2Ei
		// DEBUG2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG310:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// DEBUG2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META311:![0-9]+]], metadata !DIExpression()), !dbg [[DBG312:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META313:![0-9]+]], metadata !DIExpression()), !dbg [[DBG314:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG315:![0-9]+]]
		// DEBUG2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG316:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG315]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG317:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S1D2Ev
		// DEBUG2-SAME: (%struct.S1* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG318:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S1, align 8
		// DEBUG2-NEXT: store %struct.S1* [[THIS]], %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S1** [[THIS_ADDR]], metadata [[META319:![0-9]+]], metadata !DIExpression()), !dbg [[DBG320:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S1, %struct.S1** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S1:%.]], %struct.S1* [[THIS1]], i32 0, i32 0, !dbg [[DBG321:![0-9]+]]
		// DEBUG2-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG323:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG324:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S2C2Ei
		// DEBUG2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG325:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// DEBUG2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META326:![0-9]+]], metadata !DIExpression()), !dbg [[DBG327:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META328:![0-9]+]], metadata !DIExpression()), !dbg [[DBG329:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG330:![0-9]+]]
		// DEBUG2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG331:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG330]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG332:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S2D2Ev
		// DEBUG2-SAME: (%struct.S2* nonnull dereferenceable(16) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG333:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S2, align 8
		// DEBUG2-NEXT: store %struct.S2* [[THIS]], %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S2** [[THIS_ADDR]], metadata [[META334:![0-9]+]], metadata !DIExpression()), !dbg [[DBG335:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S2, %struct.S2** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S2:%.]], %struct.S2* [[THIS1]], i32 0, i32 0, !dbg [[DBG336:![0-9]+]]
		// DEBUG2-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG338:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG339:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainC2Ei
		// DEBUG2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] align 2 !dbg [[DBG340:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// DEBUG2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META341:![0-9]+]], metadata !DIExpression()), !dbg [[DBG342:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META343:![0-9]+]], metadata !DIExpression()), !dbg [[DBG344:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG345:![0-9]+]]
		// DEBUG2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG346:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 8, !dbg [[DBG345]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG347:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZZ4mainEN5SmainD2Ev
		// DEBUG2-SAME: (%struct.Smain* nonnull dereferenceable(24) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] align 2 !dbg [[DBG348:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.Smain, align 8
		// DEBUG2-NEXT: store %struct.Smain* [[THIS]], %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.Smain** [[THIS_ADDR]], metadata [[META349:![0-9]+]], metadata !DIExpression()), !dbg [[DBG350:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.Smain, %struct.Smain** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_SMAIN:%.]], %struct.Smain* [[THIS1]], i32 0, i32 0, !dbg [[DBG351:![0-9]+]]
		// DEBUG2-NEXT: store i32 0, i32* [[A]], align 8, !dbg [[DBG353:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG354:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S4C2Ei
		// DEBUG2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.]], i32 [[A:%.]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG355:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// DEBUG2-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
		// DEBUG2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META356:![0-9]+]], metadata !DIExpression()), !dbg [[DBG357:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[A]], i32* [[A_ADDR]], align 4
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata i32* [[A_ADDR]], metadata [[META358:![0-9]+]], metadata !DIExpression()), !dbg [[DBG359:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[A2:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG360:![0-9]+]]
		// DEBUG2-NEXT: [[TMP0:%.]] = load i32, i32 [[A_ADDR]], align 4, !dbg [[DBG361:![0-9]+]]
		// DEBUG2-NEXT: store i32 [[TMP0]], i32* [[A2]], align 4, !dbg [[DBG360]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG362:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_ZN2S4D2Ev
		// DEBUG2-SAME: (%struct.S4* nonnull dereferenceable(8) [[THIS:%.*]]) unnamed_addr #[[ATTR3]] comdat align 2 !dbg [[DBG363:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S4, align 8
		// DEBUG2-NEXT: store %struct.S4* [[THIS]], %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: call void @llvm.dbg.declare(metadata %struct.S4** [[THIS_ADDR]], metadata [[META364:![0-9]+]], metadata !DIExpression()), !dbg [[DBG365:![0-9]+]]
		// DEBUG2-NEXT: [[THIS1:%.]] = load %struct.S4, %struct.S4** [[THIS_ADDR]], align 8
		// DEBUG2-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_S4:%.]], %struct.S4* [[THIS1]], i32 0, i32 0, !dbg [[DBG366:![0-9]+]]
		// DEBUG2-NEXT: store i32 0, i32* [[A]], align 4, !dbg [[DBG368:![0-9]+]]
		// DEBUG2-NEXT: ret void, !dbg [[DBG369:![0-9]+]]
		//
		//
		// DEBUG2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_threadprivate_codegen.cpp
		// DEBUG2-SAME: () #[[ATTR0]] !dbg [[DBG370:![0-9]+]] {
		// DEBUG2-NEXT: entry:
		// DEBUG2-NEXT: call void @__cxx_global_var_init(), !dbg [[DBG371:![0-9]+]]
		// DEBUG2-NEXT: call void @__cxx_global_var_init.1(), !dbg [[DBG371]]
		// DEBUG2-NEXT: call void @__cxx_global_var_init.2(), !dbg [[DBG371]]
		// DEBUG2-NEXT: ret void
		//

clang/test/OpenMP/tile_codegen.cpp

	Show First 20 Lines • Show All 1,072 Lines • ▼ Show 20 Lines
	//			//
	// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_tile_codegen.cpp			// CHECK1-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_tile_codegen.cpp
	// CHECK1-SAME: () #[[ATTR1]] section ".text.startup" {			// CHECK1-SAME: () #[[ATTR1]] section ".text.startup" {
	// CHECK1-NEXT: entry:			// CHECK1-NEXT: entry:
	// CHECK1-NEXT: call void @__cxx_global_var_init()			// CHECK1-NEXT: call void @__cxx_global_var_init()
	// CHECK1-NEXT: ret void			// CHECK1-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@body
	// CHECK2-SAME: (...) #[[ATTR0:[0-9]+]] {
	// CHECK2-NEXT: entry:
	// CHECK2-NEXT: ret void
	//
	//
	// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init			// CHECK2-LABEL: define {{[^@]+}}@__cxx_global_var_init
	// CHECK2-SAME: () #[[ATTR1:[0-9]+]] section ".text.startup" {			// CHECK2-SAME: () #[[ATTR0:[0-9]+]] section ".text.startup" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) @s)			// CHECK2-NEXT: call void @_ZN1SC1Ev(%struct.S* nonnull dereferenceable(4) @s)
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC1Ev			// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC1Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2:[0-9]+]] comdat align 2 {			// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1:[0-9]+]] comdat align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])			// CHECK2-NEXT: call void @_ZN1SC2Ev(%struct.S* nonnull dereferenceable(4) [[THIS1]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC2Ev			// CHECK2-LABEL: define {{[^@]+}}@_ZN1SC2Ev
	// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR2]] comdat align 2 {			// CHECK2-SAME: (%struct.S* nonnull dereferenceable(4) [[THIS:%.*]]) unnamed_addr #[[ATTR1]] comdat align 2 {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8			// CHECK2-NEXT: [[THIS_ADDR:%.]] = alloca %struct.S, align 8
	// CHECK2-NEXT: [[I:%.]] = alloca i32, align 8			// CHECK2-NEXT: [[I:%.]] = alloca i32, align 8
	// CHECK2-NEXT: [[DOTFLOOR_0_IV_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTFLOOR_0_IV_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTTILE_0_IV_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTTILE_0_IV_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: store %struct.S* [[THIS]], %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8			// CHECK2-NEXT: [[THIS1:%.]] = load %struct.S, %struct.S** [[THIS_ADDR]], align 8
	// CHECK2-NEXT: [[I2:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0			// CHECK2-NEXT: [[I2:%.]] = getelementptr inbounds [[STRUCT_S:%.]], %struct.S* [[THIS1]], i32 0, i32 0
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[TMP10:%.]] = load i32, i32 [[DOTFLOOR_0_IV_I]], align 4			// CHECK2-NEXT: [[TMP10:%.]] = load i32, i32 [[DOTFLOOR_0_IV_I]], align 4
	// CHECK2-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP10]], 5			// CHECK2-NEXT: [[ADD10:%.*]] = add nsw i32 [[TMP10]], 5
	// CHECK2-NEXT: store i32 [[ADD10]], i32* [[DOTFLOOR_0_IV_I]], align 4			// CHECK2-NEXT: store i32 [[ADD10]], i32* [[DOTFLOOR_0_IV_I]], align 4
	// CHECK2-NEXT: br label [[FOR_COND]], !llvm.loop [[LOOP4:![0-9]+]]			// CHECK2-NEXT: br label [[FOR_COND]], !llvm.loop [[LOOP4:![0-9]+]]
	// CHECK2: for.end11:			// CHECK2: for.end11:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
				// CHECK2-LABEL: define {{[^@]+}}@body
				// CHECK2-SAME: (...) #[[ATTR2:[0-9]+]] {
				// CHECK2-NEXT: entry:
				// CHECK2-NEXT: ret void
				//
				//
	// CHECK2-LABEL: define {{[^@]+}}@foo1			// CHECK2-LABEL: define {{[^@]+}}@foo1
	// CHECK2-SAME: (i32 [[START:%.]], i32 [[END:%.]], i32 [[STEP:%.*]]) #[[ATTR0]] {			// CHECK2-SAME: (i32 [[START:%.]], i32 [[END:%.]], i32 [[STEP:%.*]]) #[[ATTR2]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[START_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[START_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[END_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[END_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[STEP_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[STEP_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_2:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_2:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[ADD17:%.*]] = add nsw i32 [[TMP20]], 5			// CHECK2-NEXT: [[ADD17:%.*]] = add nsw i32 [[TMP20]], 5
	// CHECK2-NEXT: store i32 [[ADD17]], i32* [[DOTFLOOR_0_IV_I]], align 4			// CHECK2-NEXT: store i32 [[ADD17]], i32* [[DOTFLOOR_0_IV_I]], align 4
	// CHECK2-NEXT: br label [[FOR_COND]], !llvm.loop [[LOOP6:![0-9]+]]			// CHECK2-NEXT: br label [[FOR_COND]], !llvm.loop [[LOOP6:![0-9]+]]
	// CHECK2: for.end18:			// CHECK2: for.end18:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@foo2			// CHECK2-LABEL: define {{[^@]+}}@foo2
	// CHECK2-SAME: (i32 [[START:%.]], i32 [[END:%.]], i32 [[STEP:%.*]]) #[[ATTR0]] {			// CHECK2-SAME: (i32 [[START:%.]], i32 [[END:%.]], i32 [[STEP:%.*]]) #[[ATTR2]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[START_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[START_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[END_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[END_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[STEP_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[STEP_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[J:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[J:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTFLOOR_0_IV_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTFLOOR_0_IV_I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTFLOOR_1_IV_J:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTFLOOR_1_IV_J:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[ADD29:%.*]] = add nsw i32 [[TMP17]], 5			// CHECK2-NEXT: [[ADD29:%.*]] = add nsw i32 [[TMP17]], 5
	// CHECK2-NEXT: store i32 [[ADD29]], i32* [[DOTFLOOR_0_IV_I]], align 4			// CHECK2-NEXT: store i32 [[ADD29]], i32* [[DOTFLOOR_0_IV_I]], align 4
	// CHECK2-NEXT: br label [[FOR_COND]], !llvm.loop [[LOOP10:![0-9]+]]			// CHECK2-NEXT: br label [[FOR_COND]], !llvm.loop [[LOOP10:![0-9]+]]
	// CHECK2: for.end30:			// CHECK2: for.end30:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@foo3			// CHECK2-LABEL: define {{[^@]+}}@foo3
	// CHECK2-SAME: () #[[ATTR0]] {			// CHECK2-SAME: () #[[ATTR2]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTOMP_LB:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_LB:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTOMP_UB:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_UB:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTOMP_STRIDE:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_STRIDE:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTOMP_IS_LAST:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_IS_LAST:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTFLOOR_0_IV_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTFLOOR_0_IV_I:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: br label [[OMP_LOOP_EXIT:%.*]]			// CHECK2-NEXT: br label [[OMP_LOOP_EXIT:%.*]]
	// CHECK2: omp.loop.exit:			// CHECK2: omp.loop.exit:
	// CHECK2-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK2-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK2-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB3:[0-9]+]], i32 [[TMP0]])			// CHECK2-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB3:[0-9]+]], i32 [[TMP0]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@foo4			// CHECK2-LABEL: define {{[^@]+}}@foo4
	// CHECK2-SAME: () #[[ATTR0]] {			// CHECK2-SAME: () #[[ATTR2]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[_TMP1:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[_TMP1:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTOMP_LB:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_LB:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTOMP_UB:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_UB:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTOMP_STRIDE:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_STRIDE:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTOMP_IS_LAST:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTOMP_IS_LAST:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 136 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: br label [[OMP_LOOP_EXIT:%.*]]			// CHECK2-NEXT: br label [[OMP_LOOP_EXIT:%.*]]
	// CHECK2: omp.loop.exit:			// CHECK2: omp.loop.exit:
	// CHECK2-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK2-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK2-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]])			// CHECK2-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@foo5			// CHECK2-LABEL: define {{[^@]+}}@foo5
	// CHECK2-SAME: () #[[ATTR0]] {			// CHECK2-SAME: () #[[ATTR2]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[DOTOMP_IV:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTOMP_IV:%.*]] = alloca i64, align 8
	// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[TMP:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[_TMP1:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[_TMP1:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[_TMP2:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[_TMP2:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_3:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_3:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_5:%.*]] = alloca i64, align 8			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_5:%.*]] = alloca i64, align 8
	▲ Show 20 Lines • Show All 192 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])			// CHECK2-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP0]])
	// CHECK2-NEXT: br label [[OMP_PRECOND_END]]			// CHECK2-NEXT: br label [[OMP_PRECOND_END]]
	// CHECK2: omp.precond.end:			// CHECK2: omp.precond.end:
	// CHECK2-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]])			// CHECK2-NEXT: call void @__kmpc_barrier(%struct.ident_t* @[[GLOB3]], i32 [[TMP0]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@foo6			// CHECK2-LABEL: define {{[^@]+}}@foo6
	// CHECK2-SAME: () #[[ATTR0]] {			// CHECK2-SAME: () #[[ATTR2]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*))			// CHECK2-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*))
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined.			// CHECK2-LABEL: define {{[^@]+}}@.omp_outlined.
	// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR5:[0-9]+]] {			// CHECK2-SAME: (i32* noalias [[DOTGLOBAL_TID_:%.]], i32 noalias [[DOTBOUND_TID_:%.*]]) #[[ATTR5:[0-9]+]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	// CHECK2: omp.inner.for.end:			// CHECK2: omp.inner.for.end:
	// CHECK2-NEXT: br label [[OMP_LOOP_EXIT:%.*]]			// CHECK2-NEXT: br label [[OMP_LOOP_EXIT:%.*]]
	// CHECK2: omp.loop.exit:			// CHECK2: omp.loop.exit:
	// CHECK2-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// CHECK2-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@tfoo7			// CHECK2-LABEL: define {{[^@]+}}@tfoo7
	// CHECK2-SAME: () #[[ATTR0]] {			// CHECK2-SAME: () #[[ATTR2]] {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @_Z4foo7IiLi3ELi5EEvT_S0_(i32 0, i32 42)			// CHECK2-NEXT: call void @_Z4foo7IiLi3ELi5EEvT_S0_(i32 0, i32 42)
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_Z4foo7IiLi3ELi5EEvT_S0_			// CHECK2-LABEL: define {{[^@]+}}@_Z4foo7IiLi3ELi5EEvT_S0_
	// CHECK2-SAME: (i32 [[START:%.]], i32 [[END:%.]]) #[[ATTR0]] comdat {			// CHECK2-SAME: (i32 [[START:%.]], i32 [[END:%.]]) #[[ATTR2]] comdat {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: [[START_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[START_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[END_ADDR:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[END_ADDR:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_1:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTCAPTURE_EXPR_2:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTCAPTURE_EXPR_2:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[I:%.*]] = alloca i32, align 4
	// CHECK2-NEXT: [[DOTFLOOR_0_IV_I:%.*]] = alloca i32, align 4			// CHECK2-NEXT: [[DOTFLOOR_0_IV_I:%.*]] = alloca i32, align 4
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	// CHECK2-NEXT: [[ADD16:%.*]] = add nsw i32 [[TMP17]], 5			// CHECK2-NEXT: [[ADD16:%.*]] = add nsw i32 [[TMP17]], 5
	// CHECK2-NEXT: store i32 [[ADD16]], i32* [[DOTFLOOR_0_IV_I]], align 4			// CHECK2-NEXT: store i32 [[ADD16]], i32* [[DOTFLOOR_0_IV_I]], align 4
	// CHECK2-NEXT: br label [[FOR_COND]], !llvm.loop [[LOOP21:![0-9]+]]			// CHECK2-NEXT: br label [[FOR_COND]], !llvm.loop [[LOOP21:![0-9]+]]
	// CHECK2: for.end17:			// CHECK2: for.end17:
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//
	//			//
	// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_tile_codegen.cpp			// CHECK2-LABEL: define {{[^@]+}}@_GLOBAL__sub_I_tile_codegen.cpp
	// CHECK2-SAME: () #[[ATTR1]] section ".text.startup" {			// CHECK2-SAME: () #[[ATTR0]] section ".text.startup" {
	// CHECK2-NEXT: entry:			// CHECK2-NEXT: entry:
	// CHECK2-NEXT: call void @__cxx_global_var_init()			// CHECK2-NEXT: call void @__cxx_global_var_init()
	// CHECK2-NEXT: ret void			// CHECK2-NEXT: ret void
	//			//

clang/test/utils/update_cc_test_checks/Inputs/generated-funcs.c.generated.expected

	Show All 24 Lines
	void foo(void) {			void foo(void) {
	int i = 0;			int i = 0;

	#pragma omp parallel for			#pragma omp parallel for
	for (i = 0; i < size; ++i) {			for (i = 0; i < size; ++i) {
	A[i] = 1.0;			A[i] = 1.0;
	}			}
	}			}
	// OMP-LABEL: @foo(			// OMP-LABEL: @main(
	// OMP-NEXT: entry:			// OMP-NEXT: entry:
				// OMP-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// OMP-NEXT: [[I:%.*]] = alloca i32, align 4			// OMP-NEXT: [[I:%.*]] = alloca i32, align 4
				// OMP-NEXT: store i32 0, i32* [[RETVAL]], align 4
	// OMP-NEXT: store i32 0, i32* [[I]], align 4			// OMP-NEXT: store i32 0, i32* [[I]], align 4
	// OMP-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*))			// OMP-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*))
	// OMP-NEXT: ret void			// OMP-NEXT: call void @foo()
				// OMP-NEXT: ret i32 0
	//			//
	//			//
	// OMP-LABEL: @.omp_outlined.(			// OMP-LABEL: @.omp_outlined.(
	// OMP-NEXT: entry:			// OMP-NEXT: entry:
	// OMP-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// OMP-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// OMP-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// OMP-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// OMP-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// OMP-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	// OMP-NEXT: [[TMP:%.*]] = alloca i32, align 4			// OMP-NEXT: [[TMP:%.*]] = alloca i32, align 4
	Show All 33 Lines
	// OMP: omp.inner.for.body:			// OMP: omp.inner.for.body:
	// OMP-NEXT: [[TMP7:%.]] = load i32, i32 [[DOTOMP_IV]], align 4			// OMP-NEXT: [[TMP7:%.]] = load i32, i32 [[DOTOMP_IV]], align 4
	// OMP-NEXT: [[MUL:%.*]] = mul nsw i32 [[TMP7]], 1			// OMP-NEXT: [[MUL:%.*]] = mul nsw i32 [[TMP7]], 1
	// OMP-NEXT: [[ADD:%.*]] = add nsw i32 0, [[MUL]]			// OMP-NEXT: [[ADD:%.*]] = add nsw i32 0, [[MUL]]
	// OMP-NEXT: store i32 [[ADD]], i32* [[I]], align 4			// OMP-NEXT: store i32 [[ADD]], i32* [[I]], align 4
	// OMP-NEXT: [[TMP8:%.]] = load i32, i32 [[I]], align 4			// OMP-NEXT: [[TMP8:%.]] = load i32, i32 [[I]], align 4
	// OMP-NEXT: [[IDXPROM:%.*]] = sext i32 [[TMP8]] to i64			// OMP-NEXT: [[IDXPROM:%.*]] = sext i32 [[TMP8]] to i64
	// OMP-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [33554432 x double], [33554432 x double] @A, i64 0, i64 [[IDXPROM]]			// OMP-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [33554432 x double], [33554432 x double] @A, i64 0, i64 [[IDXPROM]]
	// OMP-NEXT: store double 1.000000e+00, double* [[ARRAYIDX]], align 8			// OMP-NEXT: store double 0.000000e+00, double* [[ARRAYIDX]], align 8
	// OMP-NEXT: br label [[OMP_BODY_CONTINUE:%.*]]			// OMP-NEXT: br label [[OMP_BODY_CONTINUE:%.*]]
	// OMP: omp.body.continue:			// OMP: omp.body.continue:
	// OMP-NEXT: br label [[OMP_INNER_FOR_INC:%.*]]			// OMP-NEXT: br label [[OMP_INNER_FOR_INC:%.*]]
	// OMP: omp.inner.for.inc:			// OMP: omp.inner.for.inc:
	// OMP-NEXT: [[TMP9:%.]] = load i32, i32 [[DOTOMP_IV]], align 4			// OMP-NEXT: [[TMP9:%.]] = load i32, i32 [[DOTOMP_IV]], align 4
	// OMP-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP9]], 1			// OMP-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP9]], 1
	// OMP-NEXT: store i32 [[ADD2]], i32* [[DOTOMP_IV]], align 4			// OMP-NEXT: store i32 [[ADD2]], i32* [[DOTOMP_IV]], align 4
	// OMP-NEXT: br label [[OMP_INNER_FOR_COND]]			// OMP-NEXT: br label [[OMP_INNER_FOR_COND]]
	// OMP: omp.inner.for.end:			// OMP: omp.inner.for.end:
	// OMP-NEXT: br label [[OMP_LOOP_EXIT:%.*]]			// OMP-NEXT: br label [[OMP_LOOP_EXIT:%.*]]
	// OMP: omp.loop.exit:			// OMP: omp.loop.exit:
	// OMP-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])			// OMP-NEXT: call void @__kmpc_for_static_fini(%struct.ident_t* @[[GLOB1]], i32 [[TMP1]])
	// OMP-NEXT: ret void			// OMP-NEXT: ret void
	//			//
	//			//
	// OMP-LABEL: @main(			// OMP-LABEL: @foo(
	// OMP-NEXT: entry:			// OMP-NEXT: entry:
	// OMP-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
	// OMP-NEXT: [[I:%.*]] = alloca i32, align 4			// OMP-NEXT: [[I:%.*]] = alloca i32, align 4
	// OMP-NEXT: store i32 0, i32* [[RETVAL]], align 4
	// OMP-NEXT: store i32 0, i32* [[I]], align 4			// OMP-NEXT: store i32 0, i32* [[I]], align 4
	// OMP-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..1 to void (i32, i32, ...)*))			// OMP-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..1 to void (i32, i32, ...)*))
	// OMP-NEXT: call void @foo()			// OMP-NEXT: ret void
	// OMP-NEXT: ret i32 0
	//			//
	//			//
	// OMP-LABEL: @.omp_outlined..1(			// OMP-LABEL: @.omp_outlined..1(
	// OMP-NEXT: entry:			// OMP-NEXT: entry:
	// OMP-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8			// OMP-NEXT: [[DOTGLOBAL_TID__ADDR:%.]] = alloca i32, align 8
	// OMP-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8			// OMP-NEXT: [[DOTBOUND_TID__ADDR:%.]] = alloca i32, align 8
	// OMP-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4			// OMP-NEXT: [[DOTOMP_IV:%.*]] = alloca i32, align 4
	// OMP-NEXT: [[TMP:%.*]] = alloca i32, align 4			// OMP-NEXT: [[TMP:%.*]] = alloca i32, align 4
	Show All 33 Lines
	// OMP: omp.inner.for.body:			// OMP: omp.inner.for.body:
	// OMP-NEXT: [[TMP7:%.]] = load i32, i32 [[DOTOMP_IV]], align 4			// OMP-NEXT: [[TMP7:%.]] = load i32, i32 [[DOTOMP_IV]], align 4
	// OMP-NEXT: [[MUL:%.*]] = mul nsw i32 [[TMP7]], 1			// OMP-NEXT: [[MUL:%.*]] = mul nsw i32 [[TMP7]], 1
	// OMP-NEXT: [[ADD:%.*]] = add nsw i32 0, [[MUL]]			// OMP-NEXT: [[ADD:%.*]] = add nsw i32 0, [[MUL]]
	// OMP-NEXT: store i32 [[ADD]], i32* [[I]], align 4			// OMP-NEXT: store i32 [[ADD]], i32* [[I]], align 4
	// OMP-NEXT: [[TMP8:%.]] = load i32, i32 [[I]], align 4			// OMP-NEXT: [[TMP8:%.]] = load i32, i32 [[I]], align 4
	// OMP-NEXT: [[IDXPROM:%.*]] = sext i32 [[TMP8]] to i64			// OMP-NEXT: [[IDXPROM:%.*]] = sext i32 [[TMP8]] to i64
	// OMP-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [33554432 x double], [33554432 x double] @A, i64 0, i64 [[IDXPROM]]			// OMP-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds [33554432 x double], [33554432 x double] @A, i64 0, i64 [[IDXPROM]]
	// OMP-NEXT: store double 0.000000e+00, double* [[ARRAYIDX]], align 8			// OMP-NEXT: store double 1.000000e+00, double* [[ARRAYIDX]], align 8
	// OMP-NEXT: br label [[OMP_BODY_CONTINUE:%.*]]			// OMP-NEXT: br label [[OMP_BODY_CONTINUE:%.*]]
	// OMP: omp.body.continue:			// OMP: omp.body.continue:
	// OMP-NEXT: br label [[OMP_INNER_FOR_INC:%.*]]			// OMP-NEXT: br label [[OMP_INNER_FOR_INC:%.*]]
	// OMP: omp.inner.for.inc:			// OMP: omp.inner.for.inc:
	// OMP-NEXT: [[TMP9:%.]] = load i32, i32 [[DOTOMP_IV]], align 4			// OMP-NEXT: [[TMP9:%.]] = load i32, i32 [[DOTOMP_IV]], align 4
	// OMP-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP9]], 1			// OMP-NEXT: [[ADD2:%.*]] = add nsw i32 [[TMP9]], 1
	// OMP-NEXT: store i32 [[ADD2]], i32* [[DOTOMP_IV]], align 4			// OMP-NEXT: store i32 [[ADD2]], i32* [[DOTOMP_IV]], align 4
	// OMP-NEXT: br label [[OMP_INNER_FOR_COND]]			// OMP-NEXT: br label [[OMP_INNER_FOR_COND]]
	▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

clang/test/utils/update_cc_test_checks/Inputs/generated-funcs.c.no-generated.expected

Show All 9 Lines
void foo(void);		void foo(void);

// OMP-LABEL: @main(		// OMP-LABEL: @main(
// OMP-NEXT: entry:		// OMP-NEXT: entry:
// OMP-NEXT: [[RETVAL:%.*]] = alloca i32, align 4		// OMP-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
// OMP-NEXT: [[I:%.*]] = alloca i32, align 4		// OMP-NEXT: [[I:%.*]] = alloca i32, align 4
// OMP-NEXT: store i32 0, i32* [[RETVAL]], align 4		// OMP-NEXT: store i32 0, i32* [[RETVAL]], align 4
// OMP-NEXT: store i32 0, i32* [[I]], align 4		// OMP-NEXT: store i32 0, i32* [[I]], align 4
// OMP-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..1 to void (i32, i32, ...)*))		// OMP-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2:[0-9]+]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*))
// OMP-NEXT: call void @foo()		// OMP-NEXT: call void @foo()
// OMP-NEXT: ret i32 0		// OMP-NEXT: ret i32 0
//		//
// NOOMP-LABEL: @main(		// NOOMP-LABEL: @main(
// NOOMP-NEXT: entry:		// NOOMP-NEXT: entry:
// NOOMP-NEXT: [[RETVAL:%.*]] = alloca i32, align 4		// NOOMP-NEXT: [[RETVAL:%.*]] = alloca i32, align 4
// NOOMP-NEXT: [[I:%.*]] = alloca i32, align 4		// NOOMP-NEXT: [[I:%.*]] = alloca i32, align 4
// NOOMP-NEXT: store i32 0, i32* [[RETVAL]], align 4		// NOOMP-NEXT: store i32 0, i32* [[RETVAL]], align 4
Show All 31 Lines	#pragma omp parallel for

return 0;		return 0;
}		}

// OMP-LABEL: @foo(		// OMP-LABEL: @foo(
// OMP-NEXT: entry:		// OMP-NEXT: entry:
// OMP-NEXT: [[I:%.*]] = alloca i32, align 4		// OMP-NEXT: [[I:%.*]] = alloca i32, align 4
// OMP-NEXT: store i32 0, i32* [[I]], align 4		// OMP-NEXT: store i32 0, i32* [[I]], align 4
// OMP-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined. to void (i32, i32, ...)*))		// OMP-NEXT: call void (%struct.ident_t, i32, void (i32, i32, ...), ...) @__kmpc_fork_call(%struct.ident_t* @[[GLOB2]], i32 0, void (i32, i32, ...)* bitcast (void (i32, i32)* @.omp_outlined..1 to void (i32, i32, ...)*))
// OMP-NEXT: ret void		// OMP-NEXT: ret void
//		//
// NOOMP-LABEL: @foo(		// NOOMP-LABEL: @foo(
// NOOMP-NEXT: entry:		// NOOMP-NEXT: entry:
// NOOMP-NEXT: [[I:%.*]] = alloca i32, align 4		// NOOMP-NEXT: [[I:%.*]] = alloca i32, align 4
// NOOMP-NEXT: store i32 0, i32* [[I]], align 4		// NOOMP-NEXT: store i32 0, i32* [[I]], align 4
// NOOMP-NEXT: store i32 0, i32* [[I]], align 4		// NOOMP-NEXT: store i32 0, i32* [[I]], align 4
// NOOMP-NEXT: br label [[FOR_COND:%.*]]		// NOOMP-NEXT: br label [[FOR_COND:%.*]]
Show All 26 Lines

llvm/include/llvm/Frontend/OpenMP/OMP.td

Show First 20 Lines • Show All 916 Lines • ▼ Show 20 Lines	let allowedClauses = [
VersionedClause<OMPC_LastPrivate>,		VersionedClause<OMPC_LastPrivate>,
VersionedClause<OMPC_Allocate>		VersionedClause<OMPC_Allocate>
];		];
let allowedOnceClauses = [		let allowedOnceClauses = [
VersionedClause<OMPC_Collapse>,		VersionedClause<OMPC_Collapse>,
VersionedClause<OMPC_DistSchedule>		VersionedClause<OMPC_DistSchedule>
];		];
}		}
		def OMP_BeginDeclareTarget : Directive<"begin declare target"> {
		let allowedClauses = [
		VersionedClause<OMPC_To>,
		VersionedClause<OMPC_Link>,
		VersionedClause<OMPC_DeviceType>,
		];
		}
def OMP_DeclareTarget : Directive<"declare target"> {		def OMP_DeclareTarget : Directive<"declare target"> {
let allowedClauses = [		let allowedClauses = [
VersionedClause<OMPC_To>,		VersionedClause<OMPC_To>,
VersionedClause<OMPC_Link>		VersionedClause<OMPC_Link>
];		];
}		}
def OMP_EndDeclareTarget : Directive<"end declare target"> {}		def OMP_EndDeclareTarget : Directive<"end declare target"> {}
def OMP_DistributeParallelFor : Directive<"distribute parallel for"> {		def OMP_DistributeParallelFor : Directive<"distribute parallel for"> {
▲ Show 20 Lines • Show All 757 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[OpenMP] Overhaul `declare target` handlingClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 343305

clang/include/clang/Basic/Attr.td

clang/include/clang/Basic/DiagnosticParseKinds.td

clang/include/clang/Basic/DiagnosticSemaKinds.td

clang/include/clang/Parse/Parser.h

clang/include/clang/Sema/Sema.h

clang/lib/AST/AttrImpl.cpp

clang/lib/CodeGen/CGDecl.cpp

clang/lib/CodeGen/CGOpenMPRuntime.cpp

clang/lib/CodeGen/CodeGenModule.h

clang/lib/CodeGen/CodeGenModule.cpp

clang/lib/Parse/ParseOpenMP.cpp

clang/lib/Sema/SemaDecl.cpp

clang/lib/Sema/SemaOpenMP.cpp

clang/test/Headers/nvptx_device_math_complex.c

clang/test/OpenMP/declare_target_codegen_globalization.cpp

clang/test/OpenMP/declare_target_device_only_compilation.cpp

clang/test/OpenMP/declare_target_messages.cpp

clang/test/OpenMP/declare_target_only_one_side_compilation.cpp

clang/test/OpenMP/for_firstprivate_codegen.cpp

clang/test/OpenMP/irbuilder_for_iterator.cpp

clang/test/OpenMP/irbuilder_for_rangefor.cpp

clang/test/OpenMP/irbuilder_for_unsigned.c

clang/test/OpenMP/irbuilder_nested_openmp_parallel_empty.c

clang/test/OpenMP/irbuilder_nested_parallel_for.c

clang/test/OpenMP/nvptx_declare_target_var_ctor_dtor_codegen.cpp

clang/test/OpenMP/nvptx_declare_variant_name_mangling.cpp

clang/test/OpenMP/nvptx_multi_target_parallel_codegen.cpp

clang/test/OpenMP/nvptx_nested_parallel_codegen.cpp

clang/test/OpenMP/nvptx_target_codegen.cpp

clang/test/OpenMP/parallel_for_codegen.cpp

clang/test/OpenMP/parallel_master_taskloop_codegen.cpp

clang/test/OpenMP/parallel_master_taskloop_simd_codegen.cpp

clang/test/OpenMP/remarks_parallel_in_multiple_target_state_machines.c

clang/test/OpenMP/remarks_parallel_in_target_state_machine.c

clang/test/OpenMP/sections_firstprivate_codegen.cpp

clang/test/OpenMP/single_codegen.cpp

clang/test/OpenMP/single_firstprivate_codegen.cpp

clang/test/OpenMP/task_codegen.cpp

clang/test/OpenMP/taskgroup_codegen.cpp

clang/test/OpenMP/threadprivate_codegen.cpp

clang/test/OpenMP/tile_codegen.cpp

clang/test/utils/update_cc_test_checks/Inputs/generated-funcs.c.generated.expected

clang/test/utils/update_cc_test_checks/Inputs/generated-funcs.c.no-generated.expected

llvm/include/llvm/Frontend/OpenMP/OMP.td

[OpenMP] Overhaul `declare target` handling
ClosedPublic