This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
clang/
-
lib/CodeGen/
-
CodeGen/
-
CGBuiltin.cpp
-
test/CodeGenOpenCL/
-
CodeGenOpenCL/
-
builtins-amdgcn-vi.cl
-
builtins-amdgcn.cl
-
llvm/
-
docs/
-
LangRef.rst
1/1
ReleaseNotes.rst
-
include/llvm/
-
llvm/
-
Analysis/
-
TargetLibraryInfo.h
-
CodeGen/
-
GlobalISel/
-
LegalizerHelper.h
-
MachineIRBuilder.h
-
ISDOpcodes.h
-
RuntimeLibcalls.h
-
IR/
-
ConstrainedOps.def
-
Intrinsics.td
-
RuntimeLibcalls.def
-
Support/
-
TargetOpcodes.def
-
Target/
-
GenericOpcodes.td
-
GlobalISel/
-
SelectionDAGCompat.td
-
TargetSelectionDAG.td
-
lib/
-
CodeGen/
-
GlobalISel/
-
IRTranslator.cpp
-
LegalizerHelper.cpp
-
SelectionDAG/
-
LegalizeDAG.cpp
-
LegalizeFloatTypes.cpp
-
LegalizeIntegerTypes.cpp
-
LegalizeTypes.h
-
LegalizeVectorOps.cpp
-
LegalizeVectorTypes.cpp
-
SelectionDAG.cpp
-
SelectionDAGBuilder.cpp
-
SelectionDAGDumper.cpp
-
TargetLoweringBase.cpp
-
Target/
-
AMDGPU/
-
AMDGPUISelDAGToDAG.cpp
-
AMDGPUISelLowering.h
-
AMDGPUISelLowering.cpp
-
AMDGPUInstrInfo.td
-
AMDGPULegalizerInfo.cpp
-
AMDGPURegisterBankInfo.cpp
-
SIISelLowering.h
-
SIISelLowering.cpp
-
VOP2Instructions.td
-
VOP3Instructions.td
-
Hexagon/
-
HexagonISelLowering.cpp
-
PowerPC/
-
PPCISelLowering.cpp
-
X86/
-
X86ISelLowering.cpp
-
test/
-
CodeGen/
-
AArch64/GlobalISel/
-
GlobalISel/
-
legalizer-info-validation.mir
-
AMDGPU/
-
GlobalISel/
-
inst-select-amdgcn.ldexp.mir
-
inst-select-amdgcn.ldexp.s16.mir
-
legalize-sitofp.mir
-
legalize-uitofp.mir
2/3
llvm.ldexp.ll
-
strict_ldexp.f16.ll
-
strict_ldexp.f32.ll
-
strict_ldexp.f64.ll
-
Mips/
-
ldexp.ll
-
PowerPC/
-
ldexp-libcall.ll
-
ldexp.ll
-
X86/
-
ldexp-f80.ll
-
ldexp-libcall.ll
-
ldexp-not-readonly.ll
-
ldexp-strict.ll
-
ldexp-wrong-signature.ll
-
ldexp-wrong-signature2.ll
-
ldexp.ll
-
MC/
-
AMDGPU/
1/2
gfx10_asm_vop2.s
-
gfx11_asm_vop3_from_vop2.s
-
gfx8_asm_vop3.s
-
gfx9_asm_vop3.s
-
Disassembler/AMDGPU/
-
AMDGPU/
2/4
gfx10_vop3.txt
-
gfx11_dasm_vop3_from_vop2.txt
-
gfx8_vop3.txt
-
gfx9_vop3.txt
-
Transforms/SpeculativeExecution/
-
SpeculativeExecution/
-
spec-calls.ll

Differential D14327

IR: Add llvm.ldexp and llvm.experimental.constrained.ldexp intrinsics
ClosedPublic

Authored by arsenm on Nov 4 2015, 2:54 AM.

Download Raw Diff

Details

Reviewers

• tstellarAMD
hfinkel
nhaehnle
jcranmer-intel
kpn
sepavloff
andrew.w.kaylor
spatel
foad

Summary

AMDGPU has native instructions and target intrinsics for this, but
these really should be subject to legalization and generic
optimizations. This will enable legalization of f16->f32 on targets
without f16 support.

Implement a somewhat horrible inline expansion for targets without
libcall support. This could be better if we could introduce control
flow (GlobalISel version not yet implemented). Support for strictfp
legalization is less complete but works for the simple cases.

Diff Detail

Unit TestsFailed

	Time	Test
	20,030 ms	libcxx CI - C++26 > llvm-libc++-shared-cfg-in.libcxx::transitive_includes.sh.cpp
	110 ms	x64 debian > LLVM.CodeGen/AMDGPU::llvm.amdgcn.ldexp.f16.ll

Event Timeline

nhaehnle updated this revision to Diff 39178.Nov 4 2015, 2:54 AM

nhaehnle retitled this revision from to Add llvm.ldexp.* intrinsic, associated SDNode and library calls.Nov 4 2015, 2:54 AM

nhaehnle updated this object.

Herald added subscribers: dsanders, arsenm, jfb. · View Herald TranscriptNov 4 2015, 2:54 AM

nhaehnle added a subscriber: llvm-commits.Nov 4 2015, 2:57 AM

arsenm added subscribers: scanon, resistor.Nov 4 2015, 9:32 AM

This mostly LGTM except for the question of error behavior. There should be a few additions to get more of the benefits of using an intrinsic over a libcall. ldexp should be added to isTriviallyVectorizable and isSafeToSpeculativelyExecute with appropriate tests, assuming we can assume it doesn't set errno. This could be a follow up patch.

docs/LangRef.rst
9889 ↗	(On Diff #39178)	I don't think this should be defined it to handling the same way as libm. I think we should say it does not set errno, and then to only do the libcall transformation if the call is marked readonly/readnone. This is an area that isn't handled particularly consistently by the existing math intrinsics.
test/CodeGen/AMDGPU/llvm.ldexp.ll
21 ↗	(On Diff #39178)	Should include vector versions for at least v2f32, v4f32 and v2f64 Also, can you merge the existing llvm.AMDGPU.ldexp.ll test into this one and rename them with a legacy_ prefix

arsenm added a subscriber: hfinkel.Nov 4 2015, 9:35 AM

Thank you for taking a look! I've made some changes based on your feedback:

AMDGPU: more llvm.ldexp.ll tests and assorted bugfixes
LangRef for llvm.ldexp.*: remove statement about handling error conditions
[VectorUtils] llvm.ldexp.* intrinsic is vectorizable
[ValueTracking] ldexp preserves the sign of its first argument

I agree that the error handling is a problem, and I have to admit that I don't
know what is best. At the time of the libcall transformation, we already have
an SDNode, so I do not know how to tell the attributes of the original call.

It's also some effort to provide an expansion that is guaranteed to never set
errno, because the most straightforward expansion uses exp2, which is in turn
likely to become a library call. I suppose one could write a custom implementation
in compiler-rt, but I don't think that that's the best use of my time.

For now, I have made changes that are in line with the other intrinsics like pow
and powi: those are marked as isTriviallyVectorizable, but *not* as
isSafeToSpeculativelyExecute.

I hope that this is good enough. There are quite a number of TODOs already in
the code regarding these error problems. In any case, I've left those changes
as separate commits locally, so it's easy enough for me to rearrange them.
(Though at least for some of them I believe they should definitely be squashed
before committing to SVN.)

Couldn't the original bug be fixed by marking ldexpf as unavailable for AMDGPU in lib/Analysis/TargetLibraryInfo.cpp ?

In D14327#292904, @tstellarAMD wrote:

Couldn't the original bug be fixed by marking ldexpf as unavailable for AMDGPU in lib/Analysis/TargetLibraryInfo.cpp ?

I think so, yes. Though Matt said that we do want to use the ldexp instruction because it is a full-rate instruction.

In D14327#292935, @nhaehnle wrote:

In D14327#292904, @tstellarAMD wrote:

Couldn't the original bug be fixed by marking ldexpf as unavailable for AMDGPU in lib/Analysis/TargetLibraryInfo.cpp ?

I think so, yes. Though Matt said that we do want to use the ldexp instruction because it is a full-rate instruction.

Ok, so for a temporary solution, rather than changing the intrinsic emitted by Mesa, I think we should mark this libcall as unavailable. This current patch could then be done as a follow up.

arsenm added inline comments.Jan 19 2016, 1:49 PM

test/CodeGen/X86/ldexp.ll
3 ↗	(On Diff #39403)	Vector tests here are probably a good idea as well

hfinkel added inline comments.Feb 2 2016, 5:03 PM

docs/LangRef.rst
9889 ↗	(On Diff #39403)	As I recall, we're very consistent about this, with one exception: @llvm.sqrt. And this causes a lot of confusion. That having been said, there is a precedent, and there are good reasons to do it. However, we do need to say what happens if the result is not representable. You really have two choices: "and handles error conditions in the same way" (i.e. perhaps sets errno) Has undefined behavior (it needs to be undefined because it might be implemented using libm, and we can't know whether libm will affect errno)
lib/CodeGen/SelectionDAG/LegalizeDAG.cpp
3251 ↗	(On Diff #39403)	This seems like a great idea is FEXP2 is legal, but otherwise, seems likely slower than the original library function call to ldexp. Unless we really know better, we should keep the original call.
lib/CodeGen/TargetLoweringBase.cpp
873 ↗	(On Diff #39403)	You should add FLDEXP here too.

Rebased on top of current trunk and addressed the various comments.

Since the TargetAction now defaults to Expand (which is actually LibCall
in disguise when available), I have removed several places where targets
redundantly set the action.

Herald added a reviewer: • tstellarAMD. · View Herald TranscriptFeb 10 2016, 3:16 PM

Herald added a subscriber: mzolotukhin. · View Herald Transcript

I've opted to go the "undefined range error" behaviour route in the revision since that seemed more useful to me given that he LibCallSimplifier is intrinsic->intrinsic and libcall->libcall now.

nhaehnle added reviewers: arsenm, hfinkel.Feb 10 2016, 3:17 PM

Could also use updating some IR places to handle it (e.g. TTI, isSafeToSpeculativelyExecute), but that's probably a separate patch

docs/LangRef.rst
9989 ↗	(On Diff #47547)	The returned value on underflow is defined to be zero, and HUGE_VAL, which may be infinity, on overflow. I think saying undefined behavior for the case is too strong. Maybe saying just the state of errno is undefined?

hfinkel added inline comments.Apr 26 2016, 6:00 PM

docs/LangRef.rst
9989 ↗	(On Diff #47547)	We don't have a way to model errno. We need to "prevent" a situation where we're allowed to reorder a call to ldexp in between, for example, a call to open() and a call to perror(). To get the benefits you want, however, you need to mark the function as readnone. However, it might be implemented using the underlying library call, which might set errno. Unless you make that undefined behavior, then the readnone on the intrinsic is wrong. Both overflow and underflow need to be undefined behavior. I realize that this is unfortunate.
lib/Target/PowerPC/PPCISelLowering.cpp
465 ↗	(On Diff #47547)	Don't do this. Set it to Expand by default (in TargetLoweringBase::initActions). That's our current best practice for new rarely-legal nodes.

arsenm added inline comments.Apr 27 2016, 1:27 PM

docs/LangRef.rst
9989 ↗	(On Diff #47547)	The converse is we already don't 'correctly' lower the existing intrinsics which are assumed to write errno because errno does not exist on the platform. I'm still generally confused about the inconsistency of errno handling. Why don't we have a separate set of math intrinsics for respecting errno, and not? Lowering the non-errno version with a library call would be an incorrect lowering for these. Alternatively, why doesn't the possibility of of writing errno always be a libcall, while the intrinsics are fine for -fno-math-errno? Currently -fno-math-errno adds readnone to the call site of the library call, and allows selecting to the corresponding DAG node. The inconsistency in behavior between the DAG nodes and intrinsics has always confused me. A readnone call to the library function will select to the corresponding chainless node, which could still be lowered to a call to an errno writing function. In the case of sqrt, this is further confused because < 0 inputs are no longer undefined. I would expect the intrinsics would be the for using a native instruction which ignores errno. The current set of math intrinsics, including those that say handle errors the same way, are already IntrNoMem (e.g. llvm.exp) and say nothing about undefined behavior. The sqrt intrinsic has undefined behavior for < 0, but we are able to fold an isnan() check before it out in the DAG. I'm not sure what an underflow/overflow test for ldexp would look like, but it would be more complicated than the simple compare and select for sqrt.

Regarding errno: it's totally valid to ignore if the implementation sets math_errhandling & MATH_ERRNO to zero. Of course, you need to know the C library to make that choice, but its value never changes at runtime. See C11 section 7.12, as well as the soon-to-be-published C++ paper p0108r1 which you can preview here.

spatel mentioned this in rG62a0a1b9eea7: [InstCombine] avoid crashing in exp2->ldexp.Feb 10 2023, 4:36 AM

spatel mentioned this in rG9dcd7195a21c: [InstCombine] avoid crashing in pow->ldexp.Feb 10 2023, 5:04 AM

arsenm commandeered this revision.May 1 2023, 7:24 AM

arsenm edited reviewers, added: nhaehnle; removed: arsenm.

Herald added a project: Restricted Project. · View Herald TranscriptMay 1 2023, 7:24 AM

Herald added subscribers: hoy, • pcwang-thead, kosarev and 8 others. · View Herald Transcript

Rebase forward 7 years. Add constrained version and GlobalISel support. Fix promotion for f16->f32. Replace fpow2 based legalization with an integer expansion which actually passes opencl conformance. Drop some redundant checks for the libcall signature.

Also fix treating the second operand as a fixed scalar value instead of a vector

Herald added a project: Restricted Project. · View Herald TranscriptMay 1 2023, 7:31 AM

Herald added subscribers: foad, atanasyan, jrtc27 and 2 others. · View Herald Transcript

arsenm added reviewers: jcranmer-intel, kpn, sepavloff, andrew.w.kaylor, spatel.May 1 2023, 7:33 AM

Herald added a subscriber: StephenFan. · View Herald TranscriptMay 1 2023, 7:33 AM

arsenm added a reviewer: foad.May 1 2023, 7:33 AM

arsenm added a child revision: D149587: InstSimplify: Simplifications for ldexp.May 1 2023, 7:36 AM

arsenm added a child revision: D149588: clang: Start emitting intrinsic for __builtin_ldexp*.

arsenm added a child revision: D149589: AMDGPU: Drop and auto-upgrade llvm.amdgcn.ldexp to llvm.ldexp.May 1 2023, 7:40 AM

arsenm added a child revision: D149590: ValueTracking: Implement computeKnownFPClass for ldexp.

arsenm mentioned this in D149589: AMDGPU: Drop and auto-upgrade llvm.amdgcn.ldexp to llvm.ldexp.May 1 2023, 8:35 AM

The constrained intrinsic version is not documented here.

Harbormaster completed remote builds in B229225: Diff 518436.May 1 2023, 9:06 AM

It would be great to add some tests for NVPTX as the patch may hit some corner cases there. NVPTX has no libcalls and fp16 support depends on the GPU variant (no fp16 before sm_60).

In D14327#4310305, @tra wrote:

NVPTX has no libcalls

The TargetLibraryInfo query says there is ldexp and then it doesn't work

Copy-paste docs like the other constrained intrinsics (is there a reason we don't just document them all as pairs?)

Harbormaster completed remote builds in B229405: Diff 518687.May 2 2023, 9:33 AM

In D14327#4312048, @arsenm wrote:

The TargetLibraryInfo query says there is ldexp and then it doesn't work

Interesting. How exactly does it fail? I'm pretty sure we used to make libcalls unavailable in the past (I think we could not lower the calls to them), but I'm having a hard time finding that code now. It may have changed when we've improved handling the unsupported libcalls in NVPTX.

foad added inline comments.May 3 2023, 9:01 AM

llvm/test/CodeGen/AMDGPU/llvm.ldexp.ll
260	This doesn't quite work because the instruction truncates v1 to 16 bits, so if you wanted ldexp(1.0, 0x10000) aka +inf you'll actually get ldexp(1.0, 0) aka 1.0.

In D14327#4313028, @tra wrote:

In D14327#4312048, @arsenm wrote:

The TargetLibraryInfo query says there is ldexp and then it doesn't work

Interesting. How exactly does it fail?

LLVM ERROR: Undefined external symbol "ldexpf"

llvm/test/CodeGen/AMDGPU/llvm.ldexp.ll
260	Ugh, the library does have clamp code for this. The tablegen definition claims this is VOP_F16_F16_I32 though

Clamp when truncating exp

Harbormaster completed remote builds in B229872: Diff 519328.May 3 2023, 9:38 PM

ping

This mostly LGTM, but it looks like some GlobalISel legalization is missing relative to SelectionDAG?

In D14327#4341602, @nhaehnle wrote:

This mostly LGTM, but it looks like some GlobalISel legalization is missing relative to SelectionDAG?

Yes. The full legalization expansion should be different, since it's possible to introduce control flow. I didn't see the point handling it right now since the only case I'm sure that expands now is x86 windows, which isn't complete enough to write an end to end test for.

Okay, makes sense.

This revision is now accepted and ready to land.May 15 2023, 5:59 AM

arsenm added a child revision: D150765: InstCombine: Fold select of ldexp to ldexp of select.May 17 2023, 2:50 AM

Joe_Nash added a subscriber: Joe_Nash.May 18 2023, 7:44 AM

Joe_Nash added inline comments.

llvm/test/CodeGen/AMDGPU/llvm.ldexp.ll
6	Typo GFX1

arsenm marked an inline comment as done.May 18 2023, 9:20 AM

Update some MC tests for operand change. Disassembler seems to have a bizarre behavior where it takes invalid instructions and prints invalid instructions with larger encodings than they started with

Harbormaster completed remote builds in B233144: Diff 523725.May 19 2023, 6:30 AM

jcranmer-intel added inline comments.May 25 2023, 10:26 AM

llvm/docs/ReleaseNotes.rst
59	Nit: mention constrained version as well?

release notes

Harbormaster completed remote builds in B234645: Diff 525794.May 25 2023, 6:23 PM

eece6ba283bd763e6d7109ae9e155e81cfee0651

foad added inline comments.Jun 7 2023, 6:31 AM

llvm/test/MC/Disassembler/AMDGPU/gfx10_vop3.txt
7523	What caused this change in the assembler/disassembler behaviour? It looks like it has broken round-tripping, since the "encoding" output is longer than the input.

arsenm added inline comments.Jun 7 2023, 6:40 AM

llvm/test/MC/Disassembler/AMDGPU/gfx10_vop3.txt
7523	The exp operand was incorrectly marked as i32 when it's really i16. The inline immediate values are then different

Joe_Nash added inline comments.Jun 7 2023, 7:00 AM

llvm/test/MC/Disassembler/AMDGPU/gfx10_vop3.txt
7523	I believe that operand should be f16. We still want to be able to assemble inline fp constants. From a semantic point of view, these are i16 constants, but from an encoding point of view they are f16. In the True16 support downstream I have been treating that argument as f16. If you want it to be i16 yet still support inline fp constants, we need to effectively revert 5f5f566b265db00f577ead268400d99f34ba9cdd

arsenm added inline comments.Jun 7 2023, 7:16 AM

llvm/test/MC/Disassembler/AMDGPU/gfx10_vop3.txt
7523	It is an i16 operand. In the broken hardware handling of the f16 inline immediates, +- 0.5/1.0/2.0/4.0 are all effectively aliases for 0. The assembler now rejects these as invalid literals. I don't really understand the disassembler's handling of this invalid case

foad added inline comments.Jun 7 2023, 7:29 AM

llvm/test/MC/AMDGPU/gfx10_asm_vop2.s
12937	The assembler now rejects these as invalid literals. Looks like it is still accepting -4.0 here?

arsenm added inline comments.Jun 7 2023, 7:41 AM

llvm/test/MC/AMDGPU/gfx10_asm_vop2.s
12937	It's being accepted as a 32-bit literal, which is valid on gfx10

Revision Contents

Path

Size

clang/

lib/

CodeGen/

CGBuiltin.cpp

9 lines

test/

CodeGenOpenCL/

builtins-amdgcn-vi.cl

2 lines

builtins-amdgcn.cl

4 lines

llvm/

docs/

LangRef.rst

82 lines

ReleaseNotes.rst

2 lines

include/

llvm/

Analysis/

TargetLibraryInfo.h

1 line

CodeGen/

GlobalISel/

1 line

7 lines

5 lines

4 lines

IR/

ConstrainedOps.def

1 line

Intrinsics.td

9 lines

RuntimeLibcalls.def

5 lines

Support/

TargetOpcodes.def

4 lines

Target/

GenericOpcodes.td

8 lines

GlobalISel/

SelectionDAGCompat.td

2 lines

TargetSelectionDAG.td

9 lines

lib/

CodeGen/

GlobalISel/

IRTranslator.cpp

4 lines

LegalizerHelper.cpp

65 lines

SelectionDAG/

LegalizeDAG.cpp

137 lines

LegalizeFloatTypes.cpp

29 lines

LegalizeIntegerTypes.cpp

31 lines

LegalizeTypes.h

19 lines

LegalizeVectorOps.cpp

1 line

LegalizeVectorTypes.cpp

108 lines

SelectionDAG.cpp

3 lines

SelectionDAGBuilder.cpp

12 lines

SelectionDAGDumper.cpp

2 lines

TargetLoweringBase.cpp

15 lines

Target/

AMDGPU/

AMDGPUISelDAGToDAG.cpp

2 lines

AMDGPUISelLowering.h

1 line

AMDGPUISelLowering.cpp

7 lines

AMDGPUInstrInfo.td

10 lines

AMDGPULegalizerInfo.cpp

23 lines

AMDGPURegisterBankInfo.cpp

3 lines

1 line

50 lines

8 lines

2 lines

Hexagon/

HexagonISelLowering.cpp

2 lines

PowerPC/

PPCISelLowering.cpp

1 line

X86/

X86ISelLowering.cpp

2 lines

test/

CodeGen/

AArch64/

GlobalISel/

legalizer-info-validation.mir

6 lines

AMDGPU/

GlobalISel/

inst-select-amdgcn.ldexp.mir

inst-select-amdgcn.ldexp.s16.mir

56 lines

48 lines

640 lines

400 lines

255 lines

180 lines

Mips/

ldexp.ll

172 lines

PowerPC/

ldexp-libcall.ll

66 lines

ldexp.ll

223 lines

X86/

ldexp-f80.ll

43 lines

ldexp-libcall.ll

77 lines

ldexp-not-readonly.ll

54 lines

ldexp-strict.ll

75 lines

ldexp-wrong-signature.ll

58 lines

ldexp-wrong-signature2.ll

53 lines

ldexp.ll

784 lines

MC/

AMDGPU/

gfx10_asm_vop2.s

6 lines

gfx11_asm_vop3_from_vop2.s

2 lines

gfx8_asm_vop3.s

7 lines

gfx9_asm_vop3.s

7 lines

Disassembler/

AMDGPU/

gfx10_vop3.txt

4 lines

gfx11_dasm_vop3_from_vop2.txt

2 lines

gfx8_vop3.txt

4 lines

gfx9_vop3.txt

4 lines

Transforms/

SpeculativeExecution/

spec-calls.ll

16 lines

Diff 525794

clang/lib/CodeGen/CGBuiltin.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	case AMDGPU::BI__builtin_amdgcn_cosh:			case AMDGPU::BI__builtin_amdgcn_cosh:
	return emitUnaryBuiltin(*this, E, Intrinsic::amdgcn_cos);			return emitUnaryBuiltin(*this, E, Intrinsic::amdgcn_cos);
	case AMDGPU::BI__builtin_amdgcn_dispatch_ptr:			case AMDGPU::BI__builtin_amdgcn_dispatch_ptr:
	return EmitAMDGPUDispatchPtr(*this, E);			return EmitAMDGPUDispatchPtr(*this, E);
	case AMDGPU::BI__builtin_amdgcn_log_clampf:			case AMDGPU::BI__builtin_amdgcn_log_clampf:
	return emitUnaryBuiltin(*this, E, Intrinsic::amdgcn_log_clamp);			return emitUnaryBuiltin(*this, E, Intrinsic::amdgcn_log_clamp);
	case AMDGPU::BI__builtin_amdgcn_ldexp:			case AMDGPU::BI__builtin_amdgcn_ldexp:
	case AMDGPU::BI__builtin_amdgcn_ldexpf:			case AMDGPU::BI__builtin_amdgcn_ldexpf:
	case AMDGPU::BI__builtin_amdgcn_ldexph:			case AMDGPU::BI__builtin_amdgcn_ldexph: {
	return emitFPIntBuiltin(*this, E, Intrinsic::amdgcn_ldexp);			llvm::Value *Src0 = EmitScalarExpr(E->getArg(0));
				llvm::Value *Src1 = EmitScalarExpr(E->getArg(1));
				llvm::Function *F =
				CGM.getIntrinsic(Intrinsic::ldexp, {Src0->getType(), Src1->getType()});
				return Builder.CreateCall(F, {Src0, Src1});
				}
	case AMDGPU::BI__builtin_amdgcn_frexp_mant:			case AMDGPU::BI__builtin_amdgcn_frexp_mant:
	case AMDGPU::BI__builtin_amdgcn_frexp_mantf:			case AMDGPU::BI__builtin_amdgcn_frexp_mantf:
	case AMDGPU::BI__builtin_amdgcn_frexp_manth:			case AMDGPU::BI__builtin_amdgcn_frexp_manth:
	return emitUnaryBuiltin(*this, E, Intrinsic::amdgcn_frexp_mant);			return emitUnaryBuiltin(*this, E, Intrinsic::amdgcn_frexp_mant);
	case AMDGPU::BI__builtin_amdgcn_frexp_exp:			case AMDGPU::BI__builtin_amdgcn_frexp_exp:
	case AMDGPU::BI__builtin_amdgcn_frexp_expf: {			case AMDGPU::BI__builtin_amdgcn_frexp_expf: {
	Value *Src0 = EmitScalarExpr(E->getArg(0));			Value *Src0 = EmitScalarExpr(E->getArg(0));
	Function *F = CGM.getIntrinsic(Intrinsic::amdgcn_frexp_exp,			Function *F = CGM.getIntrinsic(Intrinsic::amdgcn_frexp_exp,
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

clang/test/CodeGenOpenCL/builtins-amdgcn-vi.cl

	Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	// CHECK-LABEL: @test_cos_f16			// CHECK-LABEL: @test_cos_f16
	// CHECK: call half @llvm.amdgcn.cos.f16			// CHECK: call half @llvm.amdgcn.cos.f16
	void test_cos_f16(global half* out, half a)			void test_cos_f16(global half* out, half a)
	{			{
	*out = __builtin_amdgcn_cosh(a);			*out = __builtin_amdgcn_cosh(a);
	}			}

	// CHECK-LABEL: @test_ldexp_f16			// CHECK-LABEL: @test_ldexp_f16
	// CHECK: call half @llvm.amdgcn.ldexp.f16			// CHECK: call half @llvm.ldexp.f16.i32
	void test_ldexp_f16(global half* out, half a, int b)			void test_ldexp_f16(global half* out, half a, int b)
	{			{
	*out = __builtin_amdgcn_ldexph(a, b);			*out = __builtin_amdgcn_ldexph(a, b);
	}			}

	// CHECK-LABEL: @test_frexp_mant_f16			// CHECK-LABEL: @test_frexp_mant_f16
	// CHECK: call half @llvm.amdgcn.frexp.mant.f16			// CHECK: call half @llvm.amdgcn.frexp.mant.f16
	void test_frexp_mant_f16(global half* out, half a)			void test_frexp_mant_f16(global half* out, half a)
	▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

clang/test/CodeGenOpenCL/builtins-amdgcn.cl

	Show First 20 Lines • Show All 174 Lines • ▼ Show 20 Lines
	// CHECK-LABEL: @test_log_clamp_f32			// CHECK-LABEL: @test_log_clamp_f32
	// CHECK: call float @llvm.amdgcn.log.clamp.f32			// CHECK: call float @llvm.amdgcn.log.clamp.f32
	void test_log_clamp_f32(global float* out, float a)			void test_log_clamp_f32(global float* out, float a)
	{			{
	*out = __builtin_amdgcn_log_clampf(a);			*out = __builtin_amdgcn_log_clampf(a);
	}			}

	// CHECK-LABEL: @test_ldexp_f32			// CHECK-LABEL: @test_ldexp_f32
	// CHECK: call float @llvm.amdgcn.ldexp.f32			// CHECK: call float @llvm.ldexp.f32.i32
	void test_ldexp_f32(global float* out, float a, int b)			void test_ldexp_f32(global float* out, float a, int b)
	{			{
	*out = __builtin_amdgcn_ldexpf(a, b);			*out = __builtin_amdgcn_ldexpf(a, b);
	}			}

	// CHECK-LABEL: @test_ldexp_f64			// CHECK-LABEL: @test_ldexp_f64
	// CHECK: call double @llvm.amdgcn.ldexp.f64			// CHECK: call double @llvm.ldexp.f64.i32
	void test_ldexp_f64(global double* out, double a, int b)			void test_ldexp_f64(global double* out, double a, int b)
	{			{
	*out = __builtin_amdgcn_ldexp(a, b);			*out = __builtin_amdgcn_ldexp(a, b);
	}			}

	// CHECK-LABEL: @test_frexp_mant_f32			// CHECK-LABEL: @test_frexp_mant_f32
	// CHECK: call float @llvm.amdgcn.frexp.mant.f32			// CHECK: call float @llvm.amdgcn.frexp.mant.f32
	void test_frexp_mant_f32(global float* out, float a)			void test_frexp_mant_f32(global float* out, float a)
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/docs/LangRef.rst

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	""""""""""			""""""""""

	Return the same value as a corresponding libm '``exp2``' function but without			Return the same value as a corresponding libm '``exp2``' function but without
	trapping or setting ``errno``.			trapping or setting ``errno``.

	When specified with the fast-math-flag 'afn', the result may be approximated			When specified with the fast-math-flag 'afn', the result may be approximated
	using a less accurate calculation.			using a less accurate calculation.

				'``llvm.ldexp.*``' Intrinsic
				^^^^^^^^^^^^^^^^^^^^^^^^^^^

				Syntax:
				"""""""

				This is an overloaded intrinsic. You can use ``llvm.ldexp`` on any
				floating point or vector of floating point type. Not all targets support
				all types however.

				::

				declare float @llvm.ldexp.f32.i32(float %Val, i32 %Exp)
				declare double @llvm.ldexp.f64.i32(double %Val, i32 %Exp)
				declare x86_fp80 @llvm.ldexp.f80.i32(x86_fp80 %Val, i32 %Exp)
				declare fp128 @llvm.ldexp.f128.i32(fp128 %Val, i32 %Exp)
				declare ppc_fp128 @llvm.ldexp.ppcf128.i32(ppc_fp128 %Val, i32 %Exp)
				declare <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float> %Val, <2 x i32> %Exp)

				Overview:
				"""""""""

				The '``llvm.ldexp.*``' intrinsics perform the ldexp function.

				Arguments:
				""""""""""

				The first argument and the return value are :ref:`floating-point
				<t_floating>` or :ref:`vector <t_vector>` of floating-point values of
				the same type. The second argument is an integer with the same number
				of elements.

				Semantics:
				""""""""""

				This function multiplies the first argument by 2 raised to the second
				argument's power. If the first argument is NaN or infinite, the same
				value is returned. If the result underflows a zero with the same sign
				is returned. If the result overflows, the result is an infinity with
				the same sign.

	'``llvm.log.*``' Intrinsic			'``llvm.log.*``' Intrinsic
	^^^^^^^^^^^^^^^^^^^^^^^^^^			^^^^^^^^^^^^^^^^^^^^^^^^^^

	Syntax:			Syntax:
	"""""""			"""""""

	This is an overloaded intrinsic. You can use ``llvm.log`` on any			This is an overloaded intrinsic. You can use ``llvm.log`` on any
	floating-point or vector of floating-point type. Not all targets support			floating-point or vector of floating-point type. Not all targets support
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines

	Semantics:			Semantics:
	""""""""""			""""""""""

	This function returns the first value raised to the second power with an			This function returns the first value raised to the second power with an
	unspecified sequence of rounding operations.			unspecified sequence of rounding operations.


				'``llvm.experimental.constrained.ldexp``' Intrinsic
				^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

				Syntax:
				"""""""

				::

				declare <type0>
				@llvm.experimental.constrained.ldexp(<type0> <op1>, <type1> <op2>,
				metadata <rounding mode>,
				metadata <exception behavior>)

				Overview:
				"""""""""

				The '``llvm.experimental.constrained.ldexp``' performs the ldexp function.


				Arguments:
				""""""""""

				The first argument and the return value are :ref:`floating-point
				<t_floating>` or :ref:`vector <t_vector>` of floating-point values of
				the same type. The second argument is an integer with the same number
				of elements.


				The third and fourth arguments specify the rounding mode and exception
				behavior as described above.

				Semantics:
				""""""""""

				This function multiplies the first argument by 2 raised to the second
				argument's power. If the first argument is NaN or infinite, the same
				value is returned. If the result underflows a zero with the same sign
				is returned. If the result overflows, the result is an infinity with
				the same sign.


	'``llvm.experimental.constrained.sin``' Intrinsic			'``llvm.experimental.constrained.sin``' Intrinsic
	^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^			^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

	Syntax:			Syntax:
	"""""""			"""""""

	::			::

	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/docs/ReleaseNotes.rst

	Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	----------------------			----------------------

	* Typed pointers are no longer supported. See the `opaque pointers			* Typed pointers are no longer supported. See the `opaque pointers
	<OpaquePointers.html>`__ documentation for migration instructions.			<OpaquePointers.html>`__ documentation for migration instructions.

	* The ``nofpclass`` attribute was introduced. This allows more			* The ``nofpclass`` attribute was introduced. This allows more
	optimizations around special floating point value comparisons.			optimizations around special floating point value comparisons.

				* Introduced new ``llvm.ldexp`` and ``llvm.experimental.constrained.ldexp`` intrinsics.
				jcranmer-intelUnsubmitted Done Reply Inline Actions Nit: mention constrained version as well? jcranmer-intel: Nit: mention constrained version as well?

	* The constant expression variants of the following instructions have been			* The constant expression variants of the following instructions have been
	removed:			removed:

	* ``select``			* ``select``

	Changes to LLVM infrastructure			Changes to LLVM infrastructure
	------------------------------			------------------------------

	▲ Show 20 Lines • Show All 258 Lines • Show Last 20 Lines

llvm/include/llvm/Analysis/TargetLibraryInfo.h

Show First 20 Lines • Show All 372 Lines • ▼ Show 20 Lines	bool hasOptimizedCodeGen(LibFunc F) const {
case LibFunc_floor: case LibFunc_floorf: case LibFunc_floorl:		case LibFunc_floor: case LibFunc_floorf: case LibFunc_floorl:
case LibFunc_nearbyint: case LibFunc_nearbyintf: case LibFunc_nearbyintl:		case LibFunc_nearbyint: case LibFunc_nearbyintf: case LibFunc_nearbyintl:
case LibFunc_ceil: case LibFunc_ceilf: case LibFunc_ceill:		case LibFunc_ceil: case LibFunc_ceilf: case LibFunc_ceill:
case LibFunc_rint: case LibFunc_rintf: case LibFunc_rintl:		case LibFunc_rint: case LibFunc_rintf: case LibFunc_rintl:
case LibFunc_round: case LibFunc_roundf: case LibFunc_roundl:		case LibFunc_round: case LibFunc_roundf: case LibFunc_roundl:
case LibFunc_trunc: case LibFunc_truncf: case LibFunc_truncl:		case LibFunc_trunc: case LibFunc_truncf: case LibFunc_truncl:
case LibFunc_log2: case LibFunc_log2f: case LibFunc_log2l:		case LibFunc_log2: case LibFunc_log2f: case LibFunc_log2l:
case LibFunc_exp2: case LibFunc_exp2f: case LibFunc_exp2l:		case LibFunc_exp2: case LibFunc_exp2f: case LibFunc_exp2l:
		case LibFunc_ldexp: case LibFunc_ldexpf: case LibFunc_ldexpl:
case LibFunc_memcpy: case LibFunc_memset: case LibFunc_memmove:		case LibFunc_memcpy: case LibFunc_memset: case LibFunc_memmove:
case LibFunc_memcmp: case LibFunc_bcmp: case LibFunc_strcmp:		case LibFunc_memcmp: case LibFunc_bcmp: case LibFunc_strcmp:
case LibFunc_strcpy: case LibFunc_stpcpy: case LibFunc_strlen:		case LibFunc_strcpy: case LibFunc_stpcpy: case LibFunc_strlen:
case LibFunc_strnlen: case LibFunc_memchr: case LibFunc_mempcpy:		case LibFunc_strnlen: case LibFunc_memchr: case LibFunc_mempcpy:
return true;		return true;
}		}
return false;		return false;
}		}
▲ Show 20 Lines • Show All 202 Lines • Show Last 20 Lines

llvm/include/llvm/CodeGen/GlobalISel/LegalizerHelper.h

Show First 20 Lines • Show All 351 Lines • ▼ Show 20 Lines	public:
LegalizeResult narrowScalarInsert(MachineInstr &MI, unsigned TypeIdx, LLT Ty);		LegalizeResult narrowScalarInsert(MachineInstr &MI, unsigned TypeIdx, LLT Ty);

LegalizeResult narrowScalarBasic(MachineInstr &MI, unsigned TypeIdx, LLT Ty);		LegalizeResult narrowScalarBasic(MachineInstr &MI, unsigned TypeIdx, LLT Ty);
LegalizeResult narrowScalarExt(MachineInstr &MI, unsigned TypeIdx, LLT Ty);		LegalizeResult narrowScalarExt(MachineInstr &MI, unsigned TypeIdx, LLT Ty);
LegalizeResult narrowScalarSelect(MachineInstr &MI, unsigned TypeIdx, LLT Ty);		LegalizeResult narrowScalarSelect(MachineInstr &MI, unsigned TypeIdx, LLT Ty);
LegalizeResult narrowScalarCTLZ(MachineInstr &MI, unsigned TypeIdx, LLT Ty);		LegalizeResult narrowScalarCTLZ(MachineInstr &MI, unsigned TypeIdx, LLT Ty);
LegalizeResult narrowScalarCTTZ(MachineInstr &MI, unsigned TypeIdx, LLT Ty);		LegalizeResult narrowScalarCTTZ(MachineInstr &MI, unsigned TypeIdx, LLT Ty);
LegalizeResult narrowScalarCTPOP(MachineInstr &MI, unsigned TypeIdx, LLT Ty);		LegalizeResult narrowScalarCTPOP(MachineInstr &MI, unsigned TypeIdx, LLT Ty);
		LegalizeResult narrowScalarFLDEXP(MachineInstr &MI, unsigned TypeIdx, LLT Ty);

/// Perform Bitcast legalize action on G_EXTRACT_VECTOR_ELT.		/// Perform Bitcast legalize action on G_EXTRACT_VECTOR_ELT.
LegalizeResult bitcastExtractVectorElt(MachineInstr &MI, unsigned TypeIdx,		LegalizeResult bitcastExtractVectorElt(MachineInstr &MI, unsigned TypeIdx,
LLT CastTy);		LLT CastTy);

/// Perform Bitcast legalize action on G_INSERT_VECTOR_ELT.		/// Perform Bitcast legalize action on G_INSERT_VECTOR_ELT.
LegalizeResult bitcastInsertVectorElt(MachineInstr &MI, unsigned TypeIdx,		LegalizeResult bitcastInsertVectorElt(MachineInstr &MI, unsigned TypeIdx,
LLT CastTy);		LLT CastTy);
▲ Show 20 Lines • Show All 75 Lines • Show Last 20 Lines

llvm/include/llvm/CodeGen/GlobalISel/MachineIRBuilder.h

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines

	/// Build and insert \p Dst = G_FPOW \p Src0, \p Src1			/// Build and insert \p Dst = G_FPOW \p Src0, \p Src1
	MachineInstrBuilder buildFPow(const DstOp &Dst, const SrcOp &Src0,			MachineInstrBuilder buildFPow(const DstOp &Dst, const SrcOp &Src0,
	const SrcOp &Src1,			const SrcOp &Src1,
	std::optional<unsigned> Flags = std::nullopt) {			std::optional<unsigned> Flags = std::nullopt) {
	return buildInstr(TargetOpcode::G_FPOW, {Dst}, {Src0, Src1}, Flags);			return buildInstr(TargetOpcode::G_FPOW, {Dst}, {Src0, Src1}, Flags);
	}			}

				/// Build and insert \p Dst = G_FLDEXP \p Src0, \p Src1
				MachineInstrBuilder
				buildFLdexp(const DstOp &Dst, const SrcOp &Src0, const SrcOp &Src1,
				std::optional<unsigned> Flags = std::nullopt) {
				return buildInstr(TargetOpcode::G_FLDEXP, {Dst}, {Src0, Src1}, Flags);
				}

	/// Build and insert \p Res = G_FCOPYSIGN \p Op0, \p Op1			/// Build and insert \p Res = G_FCOPYSIGN \p Op0, \p Op1
	MachineInstrBuilder buildFCopysign(const DstOp &Dst, const SrcOp &Src0,			MachineInstrBuilder buildFCopysign(const DstOp &Dst, const SrcOp &Src0,
	const SrcOp &Src1) {			const SrcOp &Src1) {
	return buildInstr(TargetOpcode::G_FCOPYSIGN, {Dst}, {Src0, Src1});			return buildInstr(TargetOpcode::G_FCOPYSIGN, {Dst}, {Src0, Src1});
	}			}

	/// Build and insert \p Res = G_UITOFP \p Src0			/// Build and insert \p Res = G_UITOFP \p Src0
	MachineInstrBuilder buildUITOFP(const DstOp &Dst, const SrcOp &Src0) {			MachineInstrBuilder buildUITOFP(const DstOp &Dst, const SrcOp &Src0) {
	▲ Show 20 Lines • Show All 207 Lines • Show Last 20 Lines

llvm/include/llvm/CodeGen/ISDOpcodes.h

Show First 20 Lines • Show All 405 Lines • ▼ Show 20 Lines	enum NodeType {

/// Constrained versions of libm-equivalent floating point intrinsics.		/// Constrained versions of libm-equivalent floating point intrinsics.
/// These will be lowered to the equivalent non-constrained pseudo-op		/// These will be lowered to the equivalent non-constrained pseudo-op
/// (or expanded to the equivalent library call) before final selection.		/// (or expanded to the equivalent library call) before final selection.
/// They are used to limit optimizations while the DAG is being optimized.		/// They are used to limit optimizations while the DAG is being optimized.
STRICT_FSQRT,		STRICT_FSQRT,
STRICT_FPOW,		STRICT_FPOW,
STRICT_FPOWI,		STRICT_FPOWI,
		STRICT_FLDEXP,
STRICT_FSIN,		STRICT_FSIN,
STRICT_FCOS,		STRICT_FCOS,
STRICT_FEXP,		STRICT_FEXP,
STRICT_FEXP2,		STRICT_FEXP2,
STRICT_FLOG,		STRICT_FLOG,
STRICT_FLOG10,		STRICT_FLOG10,
STRICT_FLOG2,		STRICT_FLOG2,
STRICT_FRINT,		STRICT_FRINT,
▲ Show 20 Lines • Show All 499 Lines • ▼ Show 20 Lines	enum NodeType {
/// FPOWI, the result is undefined if if the integer operand doesn't fit into		/// FPOWI, the result is undefined if if the integer operand doesn't fit into
/// sizeof(int).		/// sizeof(int).
FNEG,		FNEG,
FABS,		FABS,
FSQRT,		FSQRT,
FCBRT,		FCBRT,
FSIN,		FSIN,
FCOS,		FCOS,
FPOWI,
FPOW,		FPOW,
		FPOWI,
		/// FLDEXP - ldexp, inspired by libm (op0 * 2**op1).
		FLDEXP,
FLOG,		FLOG,
FLOG2,		FLOG2,
FLOG10,		FLOG10,
FEXP,		FEXP,
FEXP2,		FEXP2,
FCEIL,		FCEIL,
FTRUNC,		FTRUNC,
FRINT,		FRINT,
▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/include/llvm/CodeGen/RuntimeLibcalls.h

Show First 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	#undef HANDLE_LIBCALL
/// getUINTTOFP - Return the UINTTOFP__ value for the given types, or		/// getUINTTOFP - Return the UINTTOFP__ value for the given types, or
/// UNKNOWN_LIBCALL if there is none.		/// UNKNOWN_LIBCALL if there is none.
Libcall getUINTTOFP(EVT OpVT, EVT RetVT);		Libcall getUINTTOFP(EVT OpVT, EVT RetVT);

/// getPOWI - Return the POWI_* value for the given types, or		/// getPOWI - Return the POWI_* value for the given types, or
/// UNKNOWN_LIBCALL if there is none.		/// UNKNOWN_LIBCALL if there is none.
Libcall getPOWI(EVT RetVT);		Libcall getPOWI(EVT RetVT);

		/// getLDEXP - Return the LDEXP_* value for the given types, or
		/// UNKNOWN_LIBCALL if there is none.
		Libcall getLDEXP(EVT RetVT);

/// Return the SYNC_FETCH_AND_* value for the given opcode and type, or		/// Return the SYNC_FETCH_AND_* value for the given opcode and type, or
/// UNKNOWN_LIBCALL if there is none.		/// UNKNOWN_LIBCALL if there is none.
Libcall getSYNC(unsigned Opc, MVT VT);		Libcall getSYNC(unsigned Opc, MVT VT);

/// Return the outline atomics value for the given opcode, atomic ordering		/// Return the outline atomics value for the given opcode, atomic ordering
/// and type, or UNKNOWN_LIBCALL if there is none.		/// and type, or UNKNOWN_LIBCALL if there is none.
Libcall getOUTLINE_ATOMIC(unsigned Opc, AtomicOrdering Order, MVT VT);		Libcall getOUTLINE_ATOMIC(unsigned Opc, AtomicOrdering Order, MVT VT);

Show All 19 Lines

llvm/include/llvm/IR/ConstrainedOps.def

	Show First 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	DAG_FUNCTION(llround, 1, 0, experimental_constrained_llround, LLROUND)			DAG_FUNCTION(llround, 1, 0, experimental_constrained_llround, LLROUND)
	DAG_FUNCTION(maxnum, 2, 0, experimental_constrained_maxnum, FMAXNUM)			DAG_FUNCTION(maxnum, 2, 0, experimental_constrained_maxnum, FMAXNUM)
	DAG_FUNCTION(minnum, 2, 0, experimental_constrained_minnum, FMINNUM)			DAG_FUNCTION(minnum, 2, 0, experimental_constrained_minnum, FMINNUM)
	DAG_FUNCTION(maximum, 2, 0, experimental_constrained_maximum, FMAXIMUM)			DAG_FUNCTION(maximum, 2, 0, experimental_constrained_maximum, FMAXIMUM)
	DAG_FUNCTION(minimum, 2, 0, experimental_constrained_minimum, FMINIMUM)			DAG_FUNCTION(minimum, 2, 0, experimental_constrained_minimum, FMINIMUM)
	DAG_FUNCTION(nearbyint, 1, 1, experimental_constrained_nearbyint, FNEARBYINT)			DAG_FUNCTION(nearbyint, 1, 1, experimental_constrained_nearbyint, FNEARBYINT)
	DAG_FUNCTION(pow, 2, 1, experimental_constrained_pow, FPOW)			DAG_FUNCTION(pow, 2, 1, experimental_constrained_pow, FPOW)
	DAG_FUNCTION(powi, 2, 1, experimental_constrained_powi, FPOWI)			DAG_FUNCTION(powi, 2, 1, experimental_constrained_powi, FPOWI)
				DAG_FUNCTION(ldexp, 2, 1, experimental_constrained_ldexp, FLDEXP)
	DAG_FUNCTION(rint, 1, 1, experimental_constrained_rint, FRINT)			DAG_FUNCTION(rint, 1, 1, experimental_constrained_rint, FRINT)
	DAG_FUNCTION(round, 1, 0, experimental_constrained_round, FROUND)			DAG_FUNCTION(round, 1, 0, experimental_constrained_round, FROUND)
	DAG_FUNCTION(roundeven, 1, 0, experimental_constrained_roundeven, FROUNDEVEN)			DAG_FUNCTION(roundeven, 1, 0, experimental_constrained_roundeven, FROUNDEVEN)
	DAG_FUNCTION(sin, 1, 1, experimental_constrained_sin, FSIN)			DAG_FUNCTION(sin, 1, 1, experimental_constrained_sin, FSIN)
	DAG_FUNCTION(sqrt, 1, 1, experimental_constrained_sqrt, FSQRT)			DAG_FUNCTION(sqrt, 1, 1, experimental_constrained_sqrt, FSQRT)
	DAG_FUNCTION(trunc, 1, 0, experimental_constrained_trunc, FTRUNC)			DAG_FUNCTION(trunc, 1, 0, experimental_constrained_trunc, FTRUNC)

	// This is definition for fmuladd intrinsic function, that is converted into			// This is definition for fmuladd intrinsic function, that is converted into
	// constrained FMA or FMUL + FADD intrinsics.			// constrained FMA or FMUL + FADD intrinsics.
	FUNCTION(fmuladd, 3, 1, experimental_constrained_fmuladd)			FUNCTION(fmuladd, 3, 1, experimental_constrained_fmuladd)

	#undef INSTRUCTION			#undef INSTRUCTION
	#undef FUNCTION			#undef FUNCTION
	#undef CMP_INSTRUCTION			#undef CMP_INSTRUCTION
	#undef DAG_INSTRUCTION			#undef DAG_INSTRUCTION
	#undef DAG_FUNCTION			#undef DAG_FUNCTION

llvm/include/llvm/IR/Intrinsics.td

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	// Arithmetic fence intrinsic.			// Arithmetic fence intrinsic.
	def int_arithmetic_fence : DefaultAttrsIntrinsic<[llvm_anyfloat_ty], [LLVMMatchType<0>],			def int_arithmetic_fence : DefaultAttrsIntrinsic<[llvm_anyfloat_ty], [LLVMMatchType<0>],
	[IntrNoMem]>;			[IntrNoMem]>;

	def int_lround : DefaultAttrsIntrinsic<[llvm_anyint_ty], [llvm_anyfloat_ty]>;			def int_lround : DefaultAttrsIntrinsic<[llvm_anyint_ty], [llvm_anyfloat_ty]>;
	def int_llround : DefaultAttrsIntrinsic<[llvm_anyint_ty], [llvm_anyfloat_ty]>;			def int_llround : DefaultAttrsIntrinsic<[llvm_anyint_ty], [llvm_anyfloat_ty]>;
	def int_lrint : DefaultAttrsIntrinsic<[llvm_anyint_ty], [llvm_anyfloat_ty]>;			def int_lrint : DefaultAttrsIntrinsic<[llvm_anyint_ty], [llvm_anyfloat_ty]>;
	def int_llrint : DefaultAttrsIntrinsic<[llvm_anyint_ty], [llvm_anyfloat_ty]>;			def int_llrint : DefaultAttrsIntrinsic<[llvm_anyint_ty], [llvm_anyfloat_ty]>;

				// TODO: int operand should be constrained to same number of elements as the result.
				def int_ldexp : DefaultAttrsIntrinsic<[llvm_anyfloat_ty], [LLVMMatchType<0>,
				llvm_anyint_ty]>;
	}			}

	def int_minnum : DefaultAttrsIntrinsic<[llvm_anyfloat_ty],			def int_minnum : DefaultAttrsIntrinsic<[llvm_anyfloat_ty],
	[LLVMMatchType<0>, LLVMMatchType<0>],			[LLVMMatchType<0>, LLVMMatchType<0>],
	[IntrNoMem, IntrSpeculatable, IntrWillReturn, Commutative]			[IntrNoMem, IntrSpeculatable, IntrWillReturn, Commutative]
	>;			>;
	def int_maxnum : DefaultAttrsIntrinsic<[llvm_anyfloat_ty],			def int_maxnum : DefaultAttrsIntrinsic<[llvm_anyfloat_ty],
	[LLVMMatchType<0>, LLVMMatchType<0>],			[LLVMMatchType<0>, LLVMMatchType<0>],
	▲ Show 20 Lines • Show All 112 Lines • ▼ Show 20 Lines
	[ LLVMMatchType<0>,			[ LLVMMatchType<0>,
	llvm_metadata_ty,			llvm_metadata_ty,
	llvm_metadata_ty ]>;			llvm_metadata_ty ]>;
	def int_experimental_constrained_powi : DefaultAttrsIntrinsic<[ llvm_anyfloat_ty ],			def int_experimental_constrained_powi : DefaultAttrsIntrinsic<[ llvm_anyfloat_ty ],
	[ LLVMMatchType<0>,			[ LLVMMatchType<0>,
	llvm_i32_ty,			llvm_i32_ty,
	llvm_metadata_ty,			llvm_metadata_ty,
	llvm_metadata_ty ]>;			llvm_metadata_ty ]>;
				def int_experimental_constrained_ldexp : DefaultAttrsIntrinsic<[ llvm_anyfloat_ty ],
				[ LLVMMatchType<0>,
				llvm_anyint_ty,
				llvm_metadata_ty,
				llvm_metadata_ty ]>;
	def int_experimental_constrained_sin : DefaultAttrsIntrinsic<[ llvm_anyfloat_ty ],			def int_experimental_constrained_sin : DefaultAttrsIntrinsic<[ llvm_anyfloat_ty ],
	[ LLVMMatchType<0>,			[ LLVMMatchType<0>,
	llvm_metadata_ty,			llvm_metadata_ty,
	llvm_metadata_ty ]>;			llvm_metadata_ty ]>;
	def int_experimental_constrained_cos : DefaultAttrsIntrinsic<[ llvm_anyfloat_ty ],			def int_experimental_constrained_cos : DefaultAttrsIntrinsic<[ llvm_anyfloat_ty ],
	[ LLVMMatchType<0>,			[ LLVMMatchType<0>,
	llvm_metadata_ty,			llvm_metadata_ty,
	llvm_metadata_ty ]>;			llvm_metadata_ty ]>;
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/include/llvm/IR/RuntimeLibcalls.def

	Show First 20 Lines • Show All 273 Lines • ▼ Show 20 Lines
	HANDLE_LIBCALL(LRINT_F80, "lrintl")			HANDLE_LIBCALL(LRINT_F80, "lrintl")
	HANDLE_LIBCALL(LRINT_F128, "lrintl")			HANDLE_LIBCALL(LRINT_F128, "lrintl")
	HANDLE_LIBCALL(LRINT_PPCF128, "lrintl")			HANDLE_LIBCALL(LRINT_PPCF128, "lrintl")
	HANDLE_LIBCALL(LLRINT_F32, "llrintf")			HANDLE_LIBCALL(LLRINT_F32, "llrintf")
	HANDLE_LIBCALL(LLRINT_F64, "llrint")			HANDLE_LIBCALL(LLRINT_F64, "llrint")
	HANDLE_LIBCALL(LLRINT_F80, "llrintl")			HANDLE_LIBCALL(LLRINT_F80, "llrintl")
	HANDLE_LIBCALL(LLRINT_F128, "llrintl")			HANDLE_LIBCALL(LLRINT_F128, "llrintl")
	HANDLE_LIBCALL(LLRINT_PPCF128, "llrintl")			HANDLE_LIBCALL(LLRINT_PPCF128, "llrintl")
				HANDLE_LIBCALL(LDEXP_F32, "ldexpf")
				HANDLE_LIBCALL(LDEXP_F64, "ldexp")
				HANDLE_LIBCALL(LDEXP_F80, "ldexpl")
				HANDLE_LIBCALL(LDEXP_F128, "ldexpl")
				HANDLE_LIBCALL(LDEXP_PPCF128, "ldexpl")

	// Conversion			// Conversion
	HANDLE_LIBCALL(FPEXT_F32_PPCF128, "__gcc_stoq")			HANDLE_LIBCALL(FPEXT_F32_PPCF128, "__gcc_stoq")
	HANDLE_LIBCALL(FPEXT_F64_PPCF128, "__gcc_dtoq")			HANDLE_LIBCALL(FPEXT_F64_PPCF128, "__gcc_dtoq")
	HANDLE_LIBCALL(FPEXT_F80_F128, "__extendxftf2")			HANDLE_LIBCALL(FPEXT_F80_F128, "__extendxftf2")
	HANDLE_LIBCALL(FPEXT_F64_F128, "__extenddftf2")			HANDLE_LIBCALL(FPEXT_F64_F128, "__extenddftf2")
	HANDLE_LIBCALL(FPEXT_F32_F128, "__extendsftf2")			HANDLE_LIBCALL(FPEXT_F32_F128, "__extendsftf2")
	HANDLE_LIBCALL(FPEXT_F16_F128, "__extendhftf2")			HANDLE_LIBCALL(FPEXT_F16_F128, "__extendhftf2")
	▲ Show 20 Lines • Show All 305 Lines • Show Last 20 Lines

llvm/include/llvm/Support/TargetOpcodes.def

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	HANDLE_TARGET_OPCODE(G_FLOG)			HANDLE_TARGET_OPCODE(G_FLOG)

	/// Floating point base-2 logarithm of a value.			/// Floating point base-2 logarithm of a value.
	HANDLE_TARGET_OPCODE(G_FLOG2)			HANDLE_TARGET_OPCODE(G_FLOG2)

	/// Floating point base-10 logarithm of a value.			/// Floating point base-10 logarithm of a value.
	HANDLE_TARGET_OPCODE(G_FLOG10)			HANDLE_TARGET_OPCODE(G_FLOG10)

				/// Floating point x * 2^n
				HANDLE_TARGET_OPCODE(G_FLDEXP)

	/// Generic FP negation.			/// Generic FP negation.
	HANDLE_TARGET_OPCODE(G_FNEG)			HANDLE_TARGET_OPCODE(G_FNEG)

	/// Generic FP extension.			/// Generic FP extension.
	HANDLE_TARGET_OPCODE(G_FPEXT)			HANDLE_TARGET_OPCODE(G_FPEXT)

	/// Generic float to signed-int conversion			/// Generic float to signed-int conversion
	HANDLE_TARGET_OPCODE(G_FPTRUNC)			HANDLE_TARGET_OPCODE(G_FPTRUNC)
	▲ Show 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	/// Strict floating point instructions.			/// Strict floating point instructions.
	HANDLE_TARGET_OPCODE(G_STRICT_FADD)			HANDLE_TARGET_OPCODE(G_STRICT_FADD)
	HANDLE_TARGET_OPCODE(G_STRICT_FSUB)			HANDLE_TARGET_OPCODE(G_STRICT_FSUB)
	HANDLE_TARGET_OPCODE(G_STRICT_FMUL)			HANDLE_TARGET_OPCODE(G_STRICT_FMUL)
	HANDLE_TARGET_OPCODE(G_STRICT_FDIV)			HANDLE_TARGET_OPCODE(G_STRICT_FDIV)
	HANDLE_TARGET_OPCODE(G_STRICT_FREM)			HANDLE_TARGET_OPCODE(G_STRICT_FREM)
	HANDLE_TARGET_OPCODE(G_STRICT_FMA)			HANDLE_TARGET_OPCODE(G_STRICT_FMA)
	HANDLE_TARGET_OPCODE(G_STRICT_FSQRT)			HANDLE_TARGET_OPCODE(G_STRICT_FSQRT)
				HANDLE_TARGET_OPCODE(G_STRICT_FLDEXP)

	/// read_register intrinsic			/// read_register intrinsic
	HANDLE_TARGET_OPCODE(G_READ_REGISTER)			HANDLE_TARGET_OPCODE(G_READ_REGISTER)

	/// write_register intrinsic			/// write_register intrinsic
	HANDLE_TARGET_OPCODE(G_WRITE_REGISTER)			HANDLE_TARGET_OPCODE(G_WRITE_REGISTER)

	/// llvm.memcpy intrinsic			/// llvm.memcpy intrinsic
	Show All 40 Lines

llvm/include/llvm/Target/GenericOpcodes.td

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines

	// Floating point base-10 logarithm of a value.			// Floating point base-10 logarithm of a value.
	def G_FLOG10 : GenericInstruction {			def G_FLOG10 : GenericInstruction {
	let OutOperandList = (outs type0:$dst);			let OutOperandList = (outs type0:$dst);
	let InOperandList = (ins type0:$src1);			let InOperandList = (ins type0:$src1);
	let hasSideEffects = false;			let hasSideEffects = false;
	}			}

				// Floating point x * 2^n
				def G_FLDEXP : GenericInstruction {
				let OutOperandList = (outs type0:$dst);
				let InOperandList = (ins type0:$src0, type1:$src1);
				let hasSideEffects = false;
				}

	// Floating point ceiling of a value.			// Floating point ceiling of a value.
	def G_FCEIL : GenericInstruction {			def G_FCEIL : GenericInstruction {
	let OutOperandList = (outs type0:$dst);			let OutOperandList = (outs type0:$dst);
	let InOperandList = (ins type0:$src1);			let InOperandList = (ins type0:$src1);
	let hasSideEffects = false;			let hasSideEffects = false;
	}			}

	// Floating point cosine of a value.			// Floating point cosine of a value.
	▲ Show 20 Lines • Show All 445 Lines • ▼ Show 20 Lines

	def G_STRICT_FADD : ConstrainedInstruction<G_FADD>;			def G_STRICT_FADD : ConstrainedInstruction<G_FADD>;
	def G_STRICT_FSUB : ConstrainedInstruction<G_FSUB>;			def G_STRICT_FSUB : ConstrainedInstruction<G_FSUB>;
	def G_STRICT_FMUL : ConstrainedInstruction<G_FMUL>;			def G_STRICT_FMUL : ConstrainedInstruction<G_FMUL>;
	def G_STRICT_FDIV : ConstrainedInstruction<G_FDIV>;			def G_STRICT_FDIV : ConstrainedInstruction<G_FDIV>;
	def G_STRICT_FREM : ConstrainedInstruction<G_FREM>;			def G_STRICT_FREM : ConstrainedInstruction<G_FREM>;
	def G_STRICT_FMA : ConstrainedInstruction<G_FMA>;			def G_STRICT_FMA : ConstrainedInstruction<G_FMA>;
	def G_STRICT_FSQRT : ConstrainedInstruction<G_FSQRT>;			def G_STRICT_FSQRT : ConstrainedInstruction<G_FSQRT>;
				def G_STRICT_FLDEXP : ConstrainedInstruction<G_FLDEXP>;

	//------------------------------------------------------------------------------			//------------------------------------------------------------------------------
	// Memory intrinsics			// Memory intrinsics
	//------------------------------------------------------------------------------			//------------------------------------------------------------------------------

	def G_MEMCPY : GenericInstruction {			def G_MEMCPY : GenericInstruction {
	let OutOperandList = (outs);			let OutOperandList = (outs);
	let InOperandList = (ins ptype0:$dst_addr, ptype1:$src_addr, type2:$size, untyped_imm_0:$tailcall);			let InOperandList = (ins ptype0:$dst_addr, ptype1:$src_addr, type2:$size, untyped_imm_0:$tailcall);
	▲ Show 20 Lines • Show All 81 Lines • Show Last 20 Lines

llvm/include/llvm/Target/GlobalISel/SelectionDAGCompat.td

	Show First 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
	def : GINodeEquiv<G_FMA, fma>;			def : GINodeEquiv<G_FMA, fma>;
	def : GINodeEquiv<G_FMAD, fmad>;			def : GINodeEquiv<G_FMAD, fmad>;
	def : GINodeEquiv<G_FMUL, fmul>;			def : GINodeEquiv<G_FMUL, fmul>;
	def : GINodeEquiv<G_FDIV, fdiv>;			def : GINodeEquiv<G_FDIV, fdiv>;
	def : GINodeEquiv<G_FREM, frem>;			def : GINodeEquiv<G_FREM, frem>;
	def : GINodeEquiv<G_FPOW, fpow>;			def : GINodeEquiv<G_FPOW, fpow>;
	def : GINodeEquiv<G_FEXP2, fexp2>;			def : GINodeEquiv<G_FEXP2, fexp2>;
	def : GINodeEquiv<G_FLOG2, flog2>;			def : GINodeEquiv<G_FLOG2, flog2>;
				def : GINodeEquiv<G_FLDEXP, fldexp>;
	def : GINodeEquiv<G_FCANONICALIZE, fcanonicalize>;			def : GINodeEquiv<G_FCANONICALIZE, fcanonicalize>;
	def : GINodeEquiv<G_IS_FPCLASS, is_fpclass>;			def : GINodeEquiv<G_IS_FPCLASS, is_fpclass>;
	def : GINodeEquiv<G_INTRINSIC, intrinsic_wo_chain>;			def : GINodeEquiv<G_INTRINSIC, intrinsic_wo_chain>;
	// ISD::INTRINSIC_VOID can also be handled with G_INTRINSIC_W_SIDE_EFFECTS.			// ISD::INTRINSIC_VOID can also be handled with G_INTRINSIC_W_SIDE_EFFECTS.
	def : GINodeEquiv<G_INTRINSIC_W_SIDE_EFFECTS, intrinsic_void>;			def : GINodeEquiv<G_INTRINSIC_W_SIDE_EFFECTS, intrinsic_void>;
	def : GINodeEquiv<G_INTRINSIC_W_SIDE_EFFECTS, intrinsic_w_chain>;			def : GINodeEquiv<G_INTRINSIC_W_SIDE_EFFECTS, intrinsic_w_chain>;
	def : GINodeEquiv<G_BR, br>;			def : GINodeEquiv<G_BR, br>;
	def : GINodeEquiv<G_BSWAP, bswap>;			def : GINodeEquiv<G_BSWAP, bswap>;
	Show All 39 Lines

	def : GINodeEquiv<G_STRICT_FADD, strict_fadd>;			def : GINodeEquiv<G_STRICT_FADD, strict_fadd>;
	def : GINodeEquiv<G_STRICT_FSUB, strict_fsub>;			def : GINodeEquiv<G_STRICT_FSUB, strict_fsub>;
	def : GINodeEquiv<G_STRICT_FMUL, strict_fmul>;			def : GINodeEquiv<G_STRICT_FMUL, strict_fmul>;
	def : GINodeEquiv<G_STRICT_FDIV, strict_fdiv>;			def : GINodeEquiv<G_STRICT_FDIV, strict_fdiv>;
	def : GINodeEquiv<G_STRICT_FREM, strict_frem>;			def : GINodeEquiv<G_STRICT_FREM, strict_frem>;
	def : GINodeEquiv<G_STRICT_FMA, strict_fma>;			def : GINodeEquiv<G_STRICT_FMA, strict_fma>;
	def : GINodeEquiv<G_STRICT_FSQRT, strict_fsqrt>;			def : GINodeEquiv<G_STRICT_FSQRT, strict_fsqrt>;
				def : GINodeEquiv<G_STRICT_FLDEXP, strict_fldexp>;

	// Broadly speaking G_LOAD is equivalent to ISD::LOAD but there are some			// Broadly speaking G_LOAD is equivalent to ISD::LOAD but there are some
	// complications that tablegen must take care of. For example, Predicates such			// complications that tablegen must take care of. For example, Predicates such
	// as isSignExtLoad require that this is not a perfect 1:1 mapping since a			// as isSignExtLoad require that this is not a perfect 1:1 mapping since a
	// sign-extending load is (G_SEXTLOAD x) in GlobalISel. Additionally,			// sign-extending load is (G_SEXTLOAD x) in GlobalISel. Additionally,
	// G_LOAD handles both atomic and non-atomic loads where as SelectionDAG had			// G_LOAD handles both atomic and non-atomic loads where as SelectionDAG had
	// separate nodes for them. This GINodeEquiv maps the non-atomic loads to			// separate nodes for them. This GINodeEquiv maps the non-atomic loads to
	// G_LOAD with a non-atomic MachineMemOperand.			// G_LOAD with a non-atomic MachineMemOperand.
	▲ Show 20 Lines • Show All 63 Lines • Show Last 20 Lines

llvm/include/llvm/Target/TargetSelectionDAG.td

Show First 20 Lines • Show All 167 Lines • ▼ Show 20 Lines	def SDTIntToFPOp : SDTypeProfile<1, 1, [ // [su]int_to_fp
SDTCisFP<0>, SDTCisInt<1>, SDTCisSameNumEltsAs<0, 1>		SDTCisFP<0>, SDTCisInt<1>, SDTCisSameNumEltsAs<0, 1>
]>;		]>;
def SDTFPToIntOp : SDTypeProfile<1, 1, [ // fp_to_[su]int		def SDTFPToIntOp : SDTypeProfile<1, 1, [ // fp_to_[su]int
SDTCisInt<0>, SDTCisFP<1>, SDTCisSameNumEltsAs<0, 1>		SDTCisInt<0>, SDTCisFP<1>, SDTCisSameNumEltsAs<0, 1>
]>;		]>;
def SDTFPToIntSatOp : SDTypeProfile<1, 2, [ // fp_to_[su]int_sat		def SDTFPToIntSatOp : SDTypeProfile<1, 2, [ // fp_to_[su]int_sat
SDTCisInt<0>, SDTCisFP<1>, SDTCisSameNumEltsAs<0, 1>, SDTCisVT<2, OtherVT>		SDTCisInt<0>, SDTCisFP<1>, SDTCisSameNumEltsAs<0, 1>, SDTCisVT<2, OtherVT>
]>;		]>;
		def SDTFPExpOp : SDTypeProfile<1, 2, [ // ldexp
		SDTCisSameAs<0, 1>, SDTCisFP<0>, SDTCisInt<2>
		]>;
def SDTExtInreg : SDTypeProfile<1, 2, [ // sext_inreg		def SDTExtInreg : SDTypeProfile<1, 2, [ // sext_inreg
SDTCisSameAs<0, 1>, SDTCisInt<0>, SDTCisVT<2, OtherVT>,		SDTCisSameAs<0, 1>, SDTCisInt<0>, SDTCisVT<2, OtherVT>,
SDTCisVTSmallerThanOp<2, 1>		SDTCisVTSmallerThanOp<2, 1>
]>;		]>;
def SDTExtInvec : SDTypeProfile<1, 1, [ // sext_invec		def SDTExtInvec : SDTypeProfile<1, 1, [ // sext_invec
SDTCisInt<0>, SDTCisVec<0>, SDTCisInt<1>, SDTCisVec<1>,		SDTCisInt<0>, SDTCisVec<0>, SDTCisInt<1>, SDTCisVec<1>,
SDTCisOpSmallerThanOp<1, 0>		SDTCisOpSmallerThanOp<1, 0>
]>;		]>;
▲ Show 20 Lines • Show All 310 Lines • ▼ Show 20 Lines
def fcanonicalize : SDNode<"ISD::FCANONICALIZE", SDTFPUnaryOp>;		def fcanonicalize : SDNode<"ISD::FCANONICALIZE", SDTFPUnaryOp>;
def fneg : SDNode<"ISD::FNEG" , SDTFPUnaryOp>;		def fneg : SDNode<"ISD::FNEG" , SDTFPUnaryOp>;
def fsqrt : SDNode<"ISD::FSQRT" , SDTFPUnaryOp>;		def fsqrt : SDNode<"ISD::FSQRT" , SDTFPUnaryOp>;
def fsin : SDNode<"ISD::FSIN" , SDTFPUnaryOp>;		def fsin : SDNode<"ISD::FSIN" , SDTFPUnaryOp>;
def fcos : SDNode<"ISD::FCOS" , SDTFPUnaryOp>;		def fcos : SDNode<"ISD::FCOS" , SDTFPUnaryOp>;
def fexp2 : SDNode<"ISD::FEXP2" , SDTFPUnaryOp>;		def fexp2 : SDNode<"ISD::FEXP2" , SDTFPUnaryOp>;
def fpow : SDNode<"ISD::FPOW" , SDTFPBinOp>;		def fpow : SDNode<"ISD::FPOW" , SDTFPBinOp>;
def flog2 : SDNode<"ISD::FLOG2" , SDTFPUnaryOp>;		def flog2 : SDNode<"ISD::FLOG2" , SDTFPUnaryOp>;
		def fldexp : SDNode<"ISD::FLDEXP" , SDTFPExpOp>;
def frint : SDNode<"ISD::FRINT" , SDTFPUnaryOp>;		def frint : SDNode<"ISD::FRINT" , SDTFPUnaryOp>;
def ftrunc : SDNode<"ISD::FTRUNC" , SDTFPUnaryOp>;		def ftrunc : SDNode<"ISD::FTRUNC" , SDTFPUnaryOp>;
def fceil : SDNode<"ISD::FCEIL" , SDTFPUnaryOp>;		def fceil : SDNode<"ISD::FCEIL" , SDTFPUnaryOp>;
def ffloor : SDNode<"ISD::FFLOOR" , SDTFPUnaryOp>;		def ffloor : SDNode<"ISD::FFLOOR" , SDTFPUnaryOp>;
def fnearbyint : SDNode<"ISD::FNEARBYINT" , SDTFPUnaryOp>;		def fnearbyint : SDNode<"ISD::FNEARBYINT" , SDTFPUnaryOp>;
def fround : SDNode<"ISD::FROUND" , SDTFPUnaryOp>;		def fround : SDNode<"ISD::FROUND" , SDTFPUnaryOp>;
def froundeven : SDNode<"ISD::FROUNDEVEN" , SDTFPUnaryOp>;		def froundeven : SDNode<"ISD::FROUNDEVEN" , SDTFPUnaryOp>;

Show All 34 Lines
def strict_fsin : SDNode<"ISD::STRICT_FSIN",		def strict_fsin : SDNode<"ISD::STRICT_FSIN",
SDTFPUnaryOp, [SDNPHasChain]>;		SDTFPUnaryOp, [SDNPHasChain]>;
def strict_fcos : SDNode<"ISD::STRICT_FCOS",		def strict_fcos : SDNode<"ISD::STRICT_FCOS",
SDTFPUnaryOp, [SDNPHasChain]>;		SDTFPUnaryOp, [SDNPHasChain]>;
def strict_fexp2 : SDNode<"ISD::STRICT_FEXP2",		def strict_fexp2 : SDNode<"ISD::STRICT_FEXP2",
SDTFPUnaryOp, [SDNPHasChain]>;		SDTFPUnaryOp, [SDNPHasChain]>;
def strict_fpow : SDNode<"ISD::STRICT_FPOW",		def strict_fpow : SDNode<"ISD::STRICT_FPOW",
SDTFPBinOp, [SDNPHasChain]>;		SDTFPBinOp, [SDNPHasChain]>;
		def strict_fldexp : SDNode<"ISD::STRICT_FLDEXP",
		SDTFPExpOp, [SDNPHasChain]>;
def strict_flog2 : SDNode<"ISD::STRICT_FLOG2",		def strict_flog2 : SDNode<"ISD::STRICT_FLOG2",
SDTFPUnaryOp, [SDNPHasChain]>;		SDTFPUnaryOp, [SDNPHasChain]>;
def strict_frint : SDNode<"ISD::STRICT_FRINT",		def strict_frint : SDNode<"ISD::STRICT_FRINT",
SDTFPUnaryOp, [SDNPHasChain]>;		SDTFPUnaryOp, [SDNPHasChain]>;
def strict_lrint : SDNode<"ISD::STRICT_LRINT",		def strict_lrint : SDNode<"ISD::STRICT_LRINT",
SDTFPToIntOp, [SDNPHasChain]>;		SDTFPToIntOp, [SDNPHasChain]>;
def strict_llrint : SDNode<"ISD::STRICT_LLRINT",		def strict_llrint : SDNode<"ISD::STRICT_LLRINT",
SDTFPToIntOp, [SDNPHasChain]>;		SDTFPToIntOp, [SDNPHasChain]>;
▲ Show 20 Lines • Show All 884 Lines • ▼ Show 20 Lines	def any_fcos : PatFrags<(ops node:$src),
[(strict_fcos node:$src),		[(strict_fcos node:$src),
(fcos node:$src)]>;		(fcos node:$src)]>;
def any_fexp2 : PatFrags<(ops node:$src),		def any_fexp2 : PatFrags<(ops node:$src),
[(strict_fexp2 node:$src),		[(strict_fexp2 node:$src),
(fexp2 node:$src)]>;		(fexp2 node:$src)]>;
def any_fpow : PatFrags<(ops node:$lhs, node:$rhs),		def any_fpow : PatFrags<(ops node:$lhs, node:$rhs),
[(strict_fpow node:$lhs, node:$rhs),		[(strict_fpow node:$lhs, node:$rhs),
(fpow node:$lhs, node:$rhs)]>;		(fpow node:$lhs, node:$rhs)]>;
		def any_fldexp : PatFrags<(ops node:$lhs, node:$rhs),
		[(strict_fldexp node:$lhs, node:$rhs),
		(fldexp node:$lhs, node:$rhs)]>;
def any_flog2 : PatFrags<(ops node:$src),		def any_flog2 : PatFrags<(ops node:$src),
[(strict_flog2 node:$src),		[(strict_flog2 node:$src),
(flog2 node:$src)]>;		(flog2 node:$src)]>;
def any_frint : PatFrags<(ops node:$src),		def any_frint : PatFrags<(ops node:$src),
[(strict_frint node:$src),		[(strict_frint node:$src),
(frint node:$src)]>;		(frint node:$src)]>;
def any_lrint : PatFrags<(ops node:$src),		def any_lrint : PatFrags<(ops node:$src),
[(strict_lrint node:$src),		[(strict_lrint node:$src),
▲ Show 20 Lines • Show All 433 Lines • Show Last 20 Lines

llvm/lib/CodeGen/GlobalISel/IRTranslator.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	case Intrinsic::fma:			case Intrinsic::fma:
	return TargetOpcode::G_FMA;			return TargetOpcode::G_FMA;
	case Intrinsic::log:			case Intrinsic::log:
	return TargetOpcode::G_FLOG;			return TargetOpcode::G_FLOG;
	case Intrinsic::log2:			case Intrinsic::log2:
	return TargetOpcode::G_FLOG2;			return TargetOpcode::G_FLOG2;
	case Intrinsic::log10:			case Intrinsic::log10:
	return TargetOpcode::G_FLOG10;			return TargetOpcode::G_FLOG10;
				case Intrinsic::ldexp:
				return TargetOpcode::G_FLDEXP;
	case Intrinsic::nearbyint:			case Intrinsic::nearbyint:
	return TargetOpcode::G_FNEARBYINT;			return TargetOpcode::G_FNEARBYINT;
	case Intrinsic::pow:			case Intrinsic::pow:
	return TargetOpcode::G_FPOW;			return TargetOpcode::G_FPOW;
	case Intrinsic::powi:			case Intrinsic::powi:
	return TargetOpcode::G_FPOWI;			return TargetOpcode::G_FPOWI;
	case Intrinsic::rint:			case Intrinsic::rint:
	return TargetOpcode::G_FRINT;			return TargetOpcode::G_FRINT;
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	case Intrinsic::experimental_constrained_fdiv:			case Intrinsic::experimental_constrained_fdiv:
	return TargetOpcode::G_STRICT_FDIV;			return TargetOpcode::G_STRICT_FDIV;
	case Intrinsic::experimental_constrained_frem:			case Intrinsic::experimental_constrained_frem:
	return TargetOpcode::G_STRICT_FREM;			return TargetOpcode::G_STRICT_FREM;
	case Intrinsic::experimental_constrained_fma:			case Intrinsic::experimental_constrained_fma:
	return TargetOpcode::G_STRICT_FMA;			return TargetOpcode::G_STRICT_FMA;
	case Intrinsic::experimental_constrained_sqrt:			case Intrinsic::experimental_constrained_sqrt:
	return TargetOpcode::G_STRICT_FSQRT;			return TargetOpcode::G_STRICT_FSQRT;
				case Intrinsic::experimental_constrained_ldexp:
				return TargetOpcode::G_STRICT_FLDEXP;
	default:			default:
	return 0;			return 0;
	}			}
	}			}

	bool IRTranslator::translateConstrainedFPIntrinsic(			bool IRTranslator::translateConstrainedFPIntrinsic(
	const ConstrainedFPIntrinsic &FPI, MachineIRBuilder &MIRBuilder) {			const ConstrainedFPIntrinsic &FPI, MachineIRBuilder &MIRBuilder) {
	fp::ExceptionBehavior EB = *FPI.getExceptionBehavior();			fp::ExceptionBehavior EB = *FPI.getExceptionBehavior();
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp

	Show First 20 Lines • Show All 536 Lines • ▼ Show 20 Lines
	case TargetOpcode::G_FCOS:			case TargetOpcode::G_FCOS:
	RTLIBCASE(COS_F);			RTLIBCASE(COS_F);
	case TargetOpcode::G_FLOG10:			case TargetOpcode::G_FLOG10:
	RTLIBCASE(LOG10_F);			RTLIBCASE(LOG10_F);
	case TargetOpcode::G_FLOG:			case TargetOpcode::G_FLOG:
	RTLIBCASE(LOG_F);			RTLIBCASE(LOG_F);
	case TargetOpcode::G_FLOG2:			case TargetOpcode::G_FLOG2:
	RTLIBCASE(LOG2_F);			RTLIBCASE(LOG2_F);
				case TargetOpcode::G_FLDEXP:
				RTLIBCASE(LDEXP_F);
	case TargetOpcode::G_FCEIL:			case TargetOpcode::G_FCEIL:
	RTLIBCASE(CEIL_F);			RTLIBCASE(CEIL_F);
	case TargetOpcode::G_FFLOOR:			case TargetOpcode::G_FFLOOR:
	RTLIBCASE(FLOOR_F);			RTLIBCASE(FLOOR_F);
	case TargetOpcode::G_FMINNUM:			case TargetOpcode::G_FMINNUM:
	RTLIBCASE(FMIN_F);			RTLIBCASE(FMIN_F);
	case TargetOpcode::G_FMAXNUM:			case TargetOpcode::G_FMAXNUM:
	RTLIBCASE(FMAX_F);			RTLIBCASE(FMAX_F);
	▲ Show 20 Lines • Show All 268 Lines • ▼ Show 20 Lines
	case TargetOpcode::G_FMA:			case TargetOpcode::G_FMA:
	case TargetOpcode::G_FPOW:			case TargetOpcode::G_FPOW:
	case TargetOpcode::G_FREM:			case TargetOpcode::G_FREM:
	case TargetOpcode::G_FCOS:			case TargetOpcode::G_FCOS:
	case TargetOpcode::G_FSIN:			case TargetOpcode::G_FSIN:
	case TargetOpcode::G_FLOG10:			case TargetOpcode::G_FLOG10:
	case TargetOpcode::G_FLOG:			case TargetOpcode::G_FLOG:
	case TargetOpcode::G_FLOG2:			case TargetOpcode::G_FLOG2:
				case TargetOpcode::G_FLDEXP:
	case TargetOpcode::G_FEXP:			case TargetOpcode::G_FEXP:
	case TargetOpcode::G_FEXP2:			case TargetOpcode::G_FEXP2:
	case TargetOpcode::G_FCEIL:			case TargetOpcode::G_FCEIL:
	case TargetOpcode::G_FFLOOR:			case TargetOpcode::G_FFLOOR:
	case TargetOpcode::G_FMINNUM:			case TargetOpcode::G_FMINNUM:
	case TargetOpcode::G_FMAXNUM:			case TargetOpcode::G_FMAXNUM:
	case TargetOpcode::G_FSQRT:			case TargetOpcode::G_FSQRT:
	case TargetOpcode::G_FRINT:			case TargetOpcode::G_FRINT:
	▲ Show 20 Lines • Show All 571 Lines • ▼ Show 20 Lines
	return narrowScalarFPTOI(MI, TypeIdx, NarrowTy);			return narrowScalarFPTOI(MI, TypeIdx, NarrowTy);
	case TargetOpcode::G_FPEXT:			case TargetOpcode::G_FPEXT:
	if (TypeIdx != 0)			if (TypeIdx != 0)
	return UnableToLegalize;			return UnableToLegalize;
	Observer.changingInstr(MI);			Observer.changingInstr(MI);
	narrowScalarDst(MI, NarrowTy, 0, TargetOpcode::G_FPEXT);			narrowScalarDst(MI, NarrowTy, 0, TargetOpcode::G_FPEXT);
	Observer.changedInstr(MI);			Observer.changedInstr(MI);
	return Legalized;			return Legalized;
				case TargetOpcode::G_FLDEXP:
				case TargetOpcode::G_STRICT_FLDEXP:
				return narrowScalarFLDEXP(MI, TypeIdx, NarrowTy);
	}			}
	}			}

	Register LegalizerHelper::coerceToScalar(Register Val) {			Register LegalizerHelper::coerceToScalar(Register Val) {
	LLT Ty = MRI.getType(Val);			LLT Ty = MRI.getType(Val);
	if (Ty.isScalar())			if (Ty.isScalar())
	return Val;			return Val;

	▲ Show 20 Lines • Show All 1,124 Lines • ▼ Show 20 Lines
	Observer.changingInstr(MI);			Observer.changingInstr(MI);

	for (unsigned I = 1, E = MI.getNumOperands(); I != E; ++I)			for (unsigned I = 1, E = MI.getNumOperands(); I != E; ++I)
	widenScalarSrc(MI, WideTy, I, TargetOpcode::G_FPEXT);			widenScalarSrc(MI, WideTy, I, TargetOpcode::G_FPEXT);

	widenScalarDst(MI, WideTy, 0, TargetOpcode::G_FPTRUNC);			widenScalarDst(MI, WideTy, 0, TargetOpcode::G_FPTRUNC);
	Observer.changedInstr(MI);			Observer.changedInstr(MI);
	return Legalized;			return Legalized;
	case TargetOpcode::G_FPOWI: {			case TargetOpcode::G_FPOWI:
	if (TypeIdx != 0)			case TargetOpcode::G_FLDEXP:
	return UnableToLegalize;			case TargetOpcode::G_STRICT_FLDEXP: {
	Observer.changingInstr(MI);			if (TypeIdx == 0) {
	widenScalarSrc(MI, WideTy, 1, TargetOpcode::G_FPEXT);			if (MI.getOpcode() == TargetOpcode::G_STRICT_FLDEXP)
	widenScalarDst(MI, WideTy, 0, TargetOpcode::G_FPTRUNC);			return UnableToLegalize;
	Observer.changedInstr(MI);
	return Legalized;			Observer.changingInstr(MI);
				widenScalarSrc(MI, WideTy, 1, TargetOpcode::G_FPEXT);
				widenScalarDst(MI, WideTy, 0, TargetOpcode::G_FPTRUNC);
				Observer.changedInstr(MI);
				return Legalized;
				}

				if (TypeIdx == 1) {
				// For some reason SelectionDAG tries to promote to a libcall without
				// actually changing the integer type for promotion.
				Observer.changingInstr(MI);
				widenScalarSrc(MI, WideTy, 2, TargetOpcode::G_SEXT);
				Observer.changedInstr(MI);
				return Legalized;
				}

				return UnableToLegalize;
	}			}
	case TargetOpcode::G_INTTOPTR:			case TargetOpcode::G_INTTOPTR:
	if (TypeIdx != 1)			if (TypeIdx != 1)
	return UnableToLegalize;			return UnableToLegalize;

	Observer.changingInstr(MI);			Observer.changingInstr(MI);
	widenScalarSrc(MI, WideTy, 1, TargetOpcode::G_ZEXT);			widenScalarSrc(MI, WideTy, 1, TargetOpcode::G_ZEXT);
	Observer.changedInstr(MI);			Observer.changedInstr(MI);
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	case G_FMA:			case G_FMA:
	case G_FMAD:			case G_FMAD:
	case G_FPOW:			case G_FPOW:
	case G_FEXP:			case G_FEXP:
	case G_FEXP2:			case G_FEXP2:
	case G_FLOG:			case G_FLOG:
	case G_FLOG2:			case G_FLOG2:
	case G_FLOG10:			case G_FLOG10:
				case G_FLDEXP:
	case G_FNEARBYINT:			case G_FNEARBYINT:
	case G_FCEIL:			case G_FCEIL:
	case G_FFLOOR:			case G_FFLOOR:
	case G_FRINT:			case G_FRINT:
	case G_INTRINSIC_ROUND:			case G_INTRINSIC_ROUND:
	case G_INTRINSIC_ROUNDEVEN:			case G_INTRINSIC_ROUNDEVEN:
	case G_INTRINSIC_TRUNC:			case G_INTRINSIC_TRUNC:
	case G_FCOS:			case G_FCOS:
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	case G_SADDO:			case G_SADDO:
	case G_SSUBO:			case G_SSUBO:
	case G_SADDE:			case G_SADDE:
	case G_SSUBE:			case G_SSUBE:
	case G_STRICT_FADD:			case G_STRICT_FADD:
	case G_STRICT_FSUB:			case G_STRICT_FSUB:
	case G_STRICT_FMUL:			case G_STRICT_FMUL:
	case G_STRICT_FMA:			case G_STRICT_FMA:
				case G_STRICT_FLDEXP:
	return fewerElementsVectorMultiEltType(GMI, NumElts);			return fewerElementsVectorMultiEltType(GMI, NumElts);
	case G_ICMP:			case G_ICMP:
	case G_FCMP:			case G_FCMP:
	return fewerElementsVectorMultiEltType(GMI, NumElts, {1 /cpm predicate/});			return fewerElementsVectorMultiEltType(GMI, NumElts, {1 /cpm predicate/});
	case G_IS_FPCLASS:			case G_IS_FPCLASS:
	return fewerElementsVectorMultiEltType(GMI, NumElts, {2, 3 /mask,fpsem/});			return fewerElementsVectorMultiEltType(GMI, NumElts, {2, 3 /mask,fpsem/});
	case G_SELECT:			case G_SELECT:
	if (MRI.getType(MI.getOperand(1).getReg()).isVector())			if (MRI.getType(MI.getOperand(1).getReg()).isVector())
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines

	MI.eraseFromParent();			MI.eraseFromParent();
	return Legalized;			return Legalized;
	}			}

	return UnableToLegalize;			return UnableToLegalize;
	}			}

				LegalizerHelper::LegalizeResult
				LegalizerHelper::narrowScalarFLDEXP(MachineInstr &MI, unsigned TypeIdx,
				LLT NarrowTy) {
				if (TypeIdx != 1)
				return UnableToLegalize;

				MachineIRBuilder &B = MIRBuilder;
				Register ExpReg = MI.getOperand(2).getReg();
				LLT ExpTy = MRI.getType(ExpReg);

				unsigned ClampSize = NarrowTy.getScalarSizeInBits();

				// Clamp the exponent to the range of the target type.
				auto MinExp = B.buildConstant(ExpTy, minIntN(ClampSize));
				auto ClampMin = B.buildSMax(ExpTy, ExpReg, MinExp);
				auto MaxExp = B.buildConstant(ExpTy, maxIntN(ClampSize));
				auto Clamp = B.buildSMin(ExpTy, ClampMin, MaxExp);

				auto Trunc = B.buildTrunc(NarrowTy, Clamp);
				Observer.changingInstr(MI);
				MI.getOperand(2).setReg(Trunc.getReg(0));
				Observer.changedInstr(MI);
				return Legalized;
				}

	LegalizerHelper::LegalizeResult			LegalizerHelper::LegalizeResult
	LegalizerHelper::lowerBitCount(MachineInstr &MI) {			LegalizerHelper::lowerBitCount(MachineInstr &MI) {
	unsigned Opc = MI.getOpcode();			unsigned Opc = MI.getOpcode();
	const auto &TII = MIRBuilder.getTII();			const auto &TII = MIRBuilder.getTII();
	auto isSupported = [this](const LegalityQuery &Q) {			auto isSupported = [this](const LegalityQuery &Q) {
	auto QAction = LI.getAction(Q).Action;			auto QAction = LI.getAction(Q).Action;
	return QAction == Legal \|\| QAction == Libcall \|\| QAction == Custom;			return QAction == Legal \|\| QAction == Libcall \|\| QAction == Custom;
	};			};
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/LegalizeDAG.cpp

	Show First 20 Lines • Show All 166 Lines • ▼ Show 20 Lines
	SmallVectorImpl<SDValue> &Results);			SmallVectorImpl<SDValue> &Results);
	void getSignAsIntValue(FloatSignAsInt &State, const SDLoc &DL,			void getSignAsIntValue(FloatSignAsInt &State, const SDLoc &DL,
	SDValue Value) const;			SDValue Value) const;
	SDValue modifySignAsInt(const FloatSignAsInt &State, const SDLoc &DL,			SDValue modifySignAsInt(const FloatSignAsInt &State, const SDLoc &DL,
	SDValue NewIntValue) const;			SDValue NewIntValue) const;
	SDValue ExpandFCOPYSIGN(SDNode *Node) const;			SDValue ExpandFCOPYSIGN(SDNode *Node) const;
	SDValue ExpandFABS(SDNode *Node) const;			SDValue ExpandFABS(SDNode *Node) const;
	SDValue ExpandFNEG(SDNode *Node) const;			SDValue ExpandFNEG(SDNode *Node) const;
				SDValue expandLdexp(SDNode *Node) const;

	SDValue ExpandLegalINT_TO_FP(SDNode *Node, SDValue &Chain);			SDValue ExpandLegalINT_TO_FP(SDNode *Node, SDValue &Chain);
	void PromoteLegalINT_TO_FP(SDNode *N, const SDLoc &dl,			void PromoteLegalINT_TO_FP(SDNode *N, const SDLoc &dl,
	SmallVectorImpl<SDValue> &Results);			SmallVectorImpl<SDValue> &Results);
	void PromoteLegalFP_TO_INT(SDNode *N, const SDLoc &dl,			void PromoteLegalFP_TO_INT(SDNode *N, const SDLoc &dl,
	SmallVectorImpl<SDValue> &Results);			SmallVectorImpl<SDValue> &Results);
	SDValue PromoteLegalFP_TO_INT_SAT(SDNode *Node, const SDLoc &dl);			SDValue PromoteLegalFP_TO_INT_SAT(SDNode *Node, const SDLoc &dl);

	SDValue ExpandPARITY(SDValue Op, const SDLoc &dl);			SDValue ExpandPARITY(SDValue Op, const SDLoc &dl);
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	std::pair<SDValue, SDValue> CallInfo = TLI.LowerCallTo(CLI);			std::pair<SDValue, SDValue> CallInfo = TLI.LowerCallTo(CLI);

	Results.push_back(			Results.push_back(
	DAG.getLoad(RetVT, dl, CallInfo.second, SinPtr, MachinePointerInfo()));			DAG.getLoad(RetVT, dl, CallInfo.second, SinPtr, MachinePointerInfo()));
	Results.push_back(			Results.push_back(
	DAG.getLoad(RetVT, dl, CallInfo.second, CosPtr, MachinePointerInfo()));			DAG.getLoad(RetVT, dl, CallInfo.second, CosPtr, MachinePointerInfo()));
	}			}

				SDValue SelectionDAGLegalize::expandLdexp(SDNode *Node) const {
				SDLoc dl(Node);
				EVT VT = Node->getValueType(0);
				SDValue X = Node->getOperand(0);
				SDValue N = Node->getOperand(1);
				EVT ExpVT = N.getValueType();
				EVT AsIntVT = VT.changeTypeToInteger();
				if (AsIntVT == EVT()) // TODO: How to handle f80?
				return SDValue();

				if (Node->getOpcode() == ISD::STRICT_FLDEXP) // TODO
				return SDValue();

				SDNodeFlags NSW;
				NSW.setNoSignedWrap(true);
				SDNodeFlags NUW_NSW;
				NUW_NSW.setNoUnsignedWrap(true);
				NUW_NSW.setNoSignedWrap(true);

				EVT SetCCVT =
				TLI.getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), ExpVT);
				const fltSemantics &FltSem = SelectionDAG::EVTToAPFloatSemantics(VT);

				const APFloat::ExponentType MaxExpVal = APFloat::semanticsMaxExponent(FltSem);
				const APFloat::ExponentType MinExpVal = APFloat::semanticsMinExponent(FltSem);
				const int Precision = APFloat::semanticsPrecision(FltSem);

				const SDValue MaxExp = DAG.getConstant(MaxExpVal, dl, ExpVT);
				const SDValue MinExp = DAG.getConstant(MinExpVal, dl, ExpVT);

				const SDValue DoubleMaxExp = DAG.getConstant(2 * MaxExpVal, dl, ExpVT);

				const APFloat One(FltSem, "1.0");
				APFloat ScaleUpK = scalbn(One, MaxExpVal, APFloat::rmNearestTiesToEven);

				// Offset by precision to avoid denormal range.
				APFloat ScaleDownK =
				scalbn(One, MinExpVal + Precision, APFloat::rmNearestTiesToEven);

				// TODO: Should really introduce control flow and use a block for the >
				// MaxExp, < MinExp cases

				// First, handle exponents Exp > MaxExp and scale down.
				SDValue NGtMaxExp = DAG.getSetCC(dl, SetCCVT, N, MaxExp, ISD::SETGT);

				SDValue DecN0 = DAG.getNode(ISD::SUB, dl, ExpVT, N, MaxExp, NSW);
				SDValue ClampMaxVal = DAG.getConstant(3 * MaxExpVal, dl, ExpVT);
				SDValue ClampN_Big = DAG.getNode(ISD::SMIN, dl, ExpVT, N, ClampMaxVal);
				SDValue DecN1 =
				DAG.getNode(ISD::SUB, dl, ExpVT, ClampN_Big, DoubleMaxExp, NSW);

				SDValue ScaleUpTwice =
				DAG.getSetCC(dl, SetCCVT, N, DoubleMaxExp, ISD::SETUGT);

				const SDValue ScaleUpVal = DAG.getConstantFP(ScaleUpK, dl, VT);
				SDValue ScaleUp0 = DAG.getNode(ISD::FMUL, dl, VT, X, ScaleUpVal);
				SDValue ScaleUp1 = DAG.getNode(ISD::FMUL, dl, VT, ScaleUp0, ScaleUpVal);

				SDValue SelectN_Big =
				DAG.getNode(ISD::SELECT, dl, ExpVT, ScaleUpTwice, DecN1, DecN0);
				SDValue SelectX_Big =
				DAG.getNode(ISD::SELECT, dl, VT, ScaleUpTwice, ScaleUp1, ScaleUp0);

				// Now handle exponents Exp < MinExp
				SDValue NLtMinExp = DAG.getSetCC(dl, SetCCVT, N, MinExp, ISD::SETLT);

				SDValue Increment0 = DAG.getConstant(-(MinExpVal + Precision), dl, ExpVT);
				SDValue Increment1 = DAG.getConstant(-2 * (MinExpVal + Precision), dl, ExpVT);

				SDValue IncN0 = DAG.getNode(ISD::ADD, dl, ExpVT, N, Increment0, NUW_NSW);

				SDValue ClampMinVal =
				DAG.getConstant(3 * MinExpVal + 2 * Precision, dl, ExpVT);
				SDValue ClampN_Small = DAG.getNode(ISD::SMAX, dl, ExpVT, N, ClampMinVal);
				SDValue IncN1 =
				DAG.getNode(ISD::ADD, dl, ExpVT, ClampN_Small, Increment1, NSW);

				const SDValue ScaleDownVal = DAG.getConstantFP(ScaleDownK, dl, VT);
				SDValue ScaleDown0 = DAG.getNode(ISD::FMUL, dl, VT, X, ScaleDownVal);
				SDValue ScaleDown1 = DAG.getNode(ISD::FMUL, dl, VT, ScaleDown0, ScaleDownVal);

				SDValue ScaleDownTwice = DAG.getSetCC(
				dl, SetCCVT, N, DAG.getConstant(2 * MinExpVal + Precision, dl, ExpVT),
				ISD::SETULT);

				SDValue SelectN_Small =
				DAG.getNode(ISD::SELECT, dl, ExpVT, ScaleDownTwice, IncN1, IncN0);
				SDValue SelectX_Small =
				DAG.getNode(ISD::SELECT, dl, VT, ScaleDownTwice, ScaleDown1, ScaleDown0);

				// Now combine the two out of range exponent handling cases with the base
				// case.
				SDValue NewX = DAG.getNode(
				ISD::SELECT, dl, VT, NGtMaxExp, SelectX_Big,
				DAG.getNode(ISD::SELECT, dl, VT, NLtMinExp, SelectX_Small, X));

				SDValue NewN = DAG.getNode(
				ISD::SELECT, dl, ExpVT, NGtMaxExp, SelectN_Big,
				DAG.getNode(ISD::SELECT, dl, ExpVT, NLtMinExp, SelectN_Small, N));

				SDValue BiasedN = DAG.getNode(ISD::ADD, dl, ExpVT, NewN, MaxExp, NSW);

				SDValue ExponentShiftAmt =
				DAG.getShiftAmountConstant(Precision - 1, ExpVT, dl);
				SDValue CastExpToValTy = DAG.getZExtOrTrunc(BiasedN, dl, AsIntVT);

				SDValue AsInt = DAG.getNode(ISD::SHL, dl, AsIntVT, CastExpToValTy,
				ExponentShiftAmt, NUW_NSW);
				SDValue AsFP = DAG.getNode(ISD::BITCAST, dl, VT, AsInt);
				return DAG.getNode(ISD::FMUL, dl, VT, NewX, AsFP);
				}

	/// This function is responsible for legalizing a			/// This function is responsible for legalizing a
	/// INT_TO_FP operation of the specified operand when the target requests that			/// INT_TO_FP operation of the specified operand when the target requests that
	/// we expand it. At this point, we know that the result and operand types are			/// we expand it. At this point, we know that the result and operand types are
	/// legal for the target.			/// legal for the target.
	SDValue SelectionDAGLegalize::ExpandLegalINT_TO_FP(SDNode *Node,			SDValue SelectionDAGLegalize::ExpandLegalINT_TO_FP(SDNode *Node,
	SDValue &Chain) {			SDValue &Chain) {
	bool isSigned = (Node->getOpcode() == ISD::STRICT_SINT_TO_FP \|\|			bool isSigned = (Node->getOpcode() == ISD::STRICT_SINT_TO_FP \|\|
	Node->getOpcode() == ISD::SINT_TO_FP);			Node->getOpcode() == ISD::SINT_TO_FP);
	▲ Show 20 Lines • Show All 921 Lines • ▼ Show 20 Lines
	SDVTList VTs = DAG.getVTList(VT, VT);			SDVTList VTs = DAG.getVTList(VT, VT);
	Tmp1 = DAG.getNode(ISD::FSINCOS, dl, VTs, Node->getOperand(0));			Tmp1 = DAG.getNode(ISD::FSINCOS, dl, VTs, Node->getOperand(0));
	if (Node->getOpcode() == ISD::FCOS)			if (Node->getOpcode() == ISD::FCOS)
	Tmp1 = Tmp1.getValue(1);			Tmp1 = Tmp1.getValue(1);
	Results.push_back(Tmp1);			Results.push_back(Tmp1);
	}			}
	break;			break;
	}			}
				case ISD::FLDEXP:
				case ISD::STRICT_FLDEXP: {
				EVT VT = Node->getValueType(0);
				RTLIB::Libcall LC = RTLIB::getLDEXP(VT);
				// Use the LibCall instead, it is very likely faster
				// FIXME: Use separate LibCall action.
				if (TLI.getLibcallName(LC))
				break;

				if (SDValue Expanded = expandLdexp(Node)) {
				Results.push_back(Expanded);
				if (Node->getOpcode() == ISD::STRICT_FLDEXP)
				Results.push_back(Expanded.getValue(1));
				}

				break;
				}
	case ISD::FMAD:			case ISD::FMAD:
	llvm_unreachable("Illegal fmad should never be formed");			llvm_unreachable("Illegal fmad should never be formed");

	case ISD::FP16_TO_FP:			case ISD::FP16_TO_FP:
	if (Node->getValueType(0) != MVT::f32) {			if (Node->getValueType(0) != MVT::f32) {
	// We can extend to types bigger than f32 in two steps without changing			// We can extend to types bigger than f32 in two steps without changing
	// the result. Since "f16 -> f32" is much more commonly available, give			// the result. Since "f16 -> f32" is much more commonly available, give
	// CodeGen the option of emitting that before resorting to a libcall.			// CodeGen the option of emitting that before resorting to a libcall.
	▲ Show 20 Lines • Show All 876 Lines • ▼ Show 20 Lines
	case ISD::FROUNDEVEN:			case ISD::FROUNDEVEN:
	case ISD::STRICT_FROUNDEVEN:			case ISD::STRICT_FROUNDEVEN:
	ExpandFPLibCall(Node, RTLIB::ROUNDEVEN_F32,			ExpandFPLibCall(Node, RTLIB::ROUNDEVEN_F32,
	RTLIB::ROUNDEVEN_F64,			RTLIB::ROUNDEVEN_F64,
	RTLIB::ROUNDEVEN_F80,			RTLIB::ROUNDEVEN_F80,
	RTLIB::ROUNDEVEN_F128,			RTLIB::ROUNDEVEN_F128,
	RTLIB::ROUNDEVEN_PPCF128, Results);			RTLIB::ROUNDEVEN_PPCF128, Results);
	break;			break;
				case ISD::FLDEXP:
				case ISD::STRICT_FLDEXP:
				ExpandFPLibCall(Node, RTLIB::LDEXP_F32, RTLIB::LDEXP_F64, RTLIB::LDEXP_F80,
				RTLIB::LDEXP_F128, RTLIB::LDEXP_PPCF128, Results);
				break;
	case ISD::FPOWI:			case ISD::FPOWI:
	case ISD::STRICT_FPOWI: {			case ISD::STRICT_FPOWI: {
	RTLIB::Libcall LC = RTLIB::getPOWI(Node->getSimpleValueType(0));			RTLIB::Libcall LC = RTLIB::getPOWI(Node->getSimpleValueType(0));
	assert(LC != RTLIB::UNKNOWN_LIBCALL && "Unexpected fpowi.");			assert(LC != RTLIB::UNKNOWN_LIBCALL && "Unexpected fpowi.");
	if (!TLI.getLibcallName(LC)) {			if (!TLI.getLibcallName(LC)) {
	// Some targets don't have a powi libcall; use pow instead.			// Some targets don't have a powi libcall; use pow instead.
	if (Node->isStrictFPOpcode()) {			if (Node->isStrictFPOpcode()) {
	SDValue Exponent =			SDValue Exponent =
	▲ Show 20 Lines • Show All 690 Lines • ▼ Show 20 Lines
	Tmp4 = DAG.getNode(Node->getOpcode(), dl, {NVT, MVT::Other},			Tmp4 = DAG.getNode(Node->getOpcode(), dl, {NVT, MVT::Other},
	{Tmp4, Tmp1, Tmp2, Tmp3});			{Tmp4, Tmp1, Tmp2, Tmp3});
	Tmp4 = DAG.getNode(ISD::STRICT_FP_ROUND, dl, {OVT, MVT::Other},			Tmp4 = DAG.getNode(ISD::STRICT_FP_ROUND, dl, {OVT, MVT::Other},
	{Tmp4.getValue(1), Tmp4, DAG.getIntPtrConstant(0, dl)});			{Tmp4.getValue(1), Tmp4, DAG.getIntPtrConstant(0, dl)});
	Results.push_back(Tmp4);			Results.push_back(Tmp4);
	Results.push_back(Tmp4.getValue(1));			Results.push_back(Tmp4.getValue(1));
	break;			break;
	case ISD::FCOPYSIGN:			case ISD::FCOPYSIGN:
				case ISD::FLDEXP:
	case ISD::FPOWI: {			case ISD::FPOWI: {
	Tmp1 = DAG.getNode(ISD::FP_EXTEND, dl, NVT, Node->getOperand(0));			Tmp1 = DAG.getNode(ISD::FP_EXTEND, dl, NVT, Node->getOperand(0));
	Tmp2 = Node->getOperand(1);			Tmp2 = Node->getOperand(1);
	Tmp3 = DAG.getNode(Node->getOpcode(), dl, NVT, Tmp1, Tmp2);			Tmp3 = DAG.getNode(Node->getOpcode(), dl, NVT, Tmp1, Tmp2);

	// fcopysign doesn't change anything but the sign bit, so			// fcopysign doesn't change anything but the sign bit, so
	// (fp_round (fcopysign (fpext a), b))			// (fp_round (fcopysign (fpext a), b))
	// is as precise as			// is as precise as
	▲ Show 20 Lines • Show All 305 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/LegalizeFloatTypes.cpp

Show First 20 Lines • Show All 104 Lines • ▼ Show 20 Lines	#endif
case ISD::STRICT_FP_EXTEND:		case ISD::STRICT_FP_EXTEND:
case ISD::FP_EXTEND: R = SoftenFloatRes_FP_EXTEND(N); break;		case ISD::FP_EXTEND: R = SoftenFloatRes_FP_EXTEND(N); break;
case ISD::STRICT_FP_ROUND:		case ISD::STRICT_FP_ROUND:
case ISD::FP_ROUND: R = SoftenFloatRes_FP_ROUND(N); break;		case ISD::FP_ROUND: R = SoftenFloatRes_FP_ROUND(N); break;
case ISD::FP16_TO_FP: R = SoftenFloatRes_FP16_TO_FP(N); break;		case ISD::FP16_TO_FP: R = SoftenFloatRes_FP16_TO_FP(N); break;
case ISD::STRICT_FPOW:		case ISD::STRICT_FPOW:
case ISD::FPOW: R = SoftenFloatRes_FPOW(N); break;		case ISD::FPOW: R = SoftenFloatRes_FPOW(N); break;
case ISD::STRICT_FPOWI:		case ISD::STRICT_FPOWI:
case ISD::FPOWI: R = SoftenFloatRes_FPOWI(N); break;		case ISD::FPOWI:
		case ISD::FLDEXP:
		case ISD::STRICT_FLDEXP: R = SoftenFloatRes_ExpOp(N); break;
case ISD::STRICT_FREM:		case ISD::STRICT_FREM:
case ISD::FREM: R = SoftenFloatRes_FREM(N); break;		case ISD::FREM: R = SoftenFloatRes_FREM(N); break;
case ISD::STRICT_FRINT:		case ISD::STRICT_FRINT:
case ISD::FRINT: R = SoftenFloatRes_FRINT(N); break;		case ISD::FRINT: R = SoftenFloatRes_FRINT(N); break;
case ISD::STRICT_FROUND:		case ISD::STRICT_FROUND:
case ISD::FROUND: R = SoftenFloatRes_FROUND(N); break;		case ISD::FROUND: R = SoftenFloatRes_FROUND(N); break;
case ISD::STRICT_FROUNDEVEN:		case ISD::STRICT_FROUNDEVEN:
case ISD::FROUNDEVEN: R = SoftenFloatRes_FROUNDEVEN(N); break;		case ISD::FROUNDEVEN: R = SoftenFloatRes_FROUNDEVEN(N); break;
▲ Show 20 Lines • Show All 455 Lines • ▼ Show 20 Lines	SDValue DAGTypeLegalizer::SoftenFloatRes_FPOW(SDNode *N) {
return SoftenFloatRes_Binary(N, GetFPLibCall(N->getValueType(0),		return SoftenFloatRes_Binary(N, GetFPLibCall(N->getValueType(0),
RTLIB::POW_F32,		RTLIB::POW_F32,
RTLIB::POW_F64,		RTLIB::POW_F64,
RTLIB::POW_F80,		RTLIB::POW_F80,
RTLIB::POW_F128,		RTLIB::POW_F128,
RTLIB::POW_PPCF128));		RTLIB::POW_PPCF128));
}		}

SDValue DAGTypeLegalizer::SoftenFloatRes_FPOWI(SDNode *N) {		SDValue DAGTypeLegalizer::SoftenFloatRes_ExpOp(SDNode *N) {
bool IsStrict = N->isStrictFPOpcode();		bool IsStrict = N->isStrictFPOpcode();
unsigned Offset = IsStrict ? 1 : 0;		unsigned Offset = IsStrict ? 1 : 0;
assert((N->getOperand(1 + Offset).getValueType() == MVT::i16 \|\|		assert((N->getOperand(1 + Offset).getValueType() == MVT::i16 \|\|
N->getOperand(1 + Offset).getValueType() == MVT::i32) &&		N->getOperand(1 + Offset).getValueType() == MVT::i32) &&
"Unsupported power type!");		"Unsupported power type!");
RTLIB::Libcall LC = RTLIB::getPOWI(N->getValueType(0));		bool IsPowI =
		N->getOpcode() == ISD::FPOWI \|\| N->getOpcode() == ISD::STRICT_FPOWI;

		RTLIB::Libcall LC = IsPowI ? RTLIB::getPOWI(N->getValueType(0))
		: RTLIB::getLDEXP(N->getValueType(0));
assert(LC != RTLIB::UNKNOWN_LIBCALL && "Unexpected fpowi.");		assert(LC != RTLIB::UNKNOWN_LIBCALL && "Unexpected fpowi.");
if (!TLI.getLibcallName(LC)) {		if (!TLI.getLibcallName(LC)) {
// Some targets don't have a powi libcall; use pow instead.		// Some targets don't have a powi libcall; use pow instead.
// FIXME: Implement this if some target needs it.		// FIXME: Implement this if some target needs it.
DAG.getContext()->emitError("Don't know how to soften fpowi to fpow");		DAG.getContext()->emitError("Don't know how to soften fpowi to fpow");
return DAG.getUNDEF(N->getValueType(0));		return DAG.getUNDEF(N->getValueType(0));
}		}

▲ Show 20 Lines • Show All 648 Lines • ▼ Show 20 Lines	#endif
case ISD::FNEARBYINT: ExpandFloatRes_FNEARBYINT(N, Lo, Hi); break;		case ISD::FNEARBYINT: ExpandFloatRes_FNEARBYINT(N, Lo, Hi); break;
case ISD::FNEG: ExpandFloatRes_FNEG(N, Lo, Hi); break;		case ISD::FNEG: ExpandFloatRes_FNEG(N, Lo, Hi); break;
case ISD::STRICT_FP_EXTEND:		case ISD::STRICT_FP_EXTEND:
case ISD::FP_EXTEND: ExpandFloatRes_FP_EXTEND(N, Lo, Hi); break;		case ISD::FP_EXTEND: ExpandFloatRes_FP_EXTEND(N, Lo, Hi); break;
case ISD::STRICT_FPOW:		case ISD::STRICT_FPOW:
case ISD::FPOW: ExpandFloatRes_FPOW(N, Lo, Hi); break;		case ISD::FPOW: ExpandFloatRes_FPOW(N, Lo, Hi); break;
case ISD::STRICT_FPOWI:		case ISD::STRICT_FPOWI:
case ISD::FPOWI: ExpandFloatRes_FPOWI(N, Lo, Hi); break;		case ISD::FPOWI: ExpandFloatRes_FPOWI(N, Lo, Hi); break;
		case ISD::FLDEXP:
		case ISD::STRICT_FLDEXP: ExpandFloatRes_FLDEXP(N, Lo, Hi); break;
case ISD::FREEZE: ExpandFloatRes_FREEZE(N, Lo, Hi); break;		case ISD::FREEZE: ExpandFloatRes_FREEZE(N, Lo, Hi); break;
case ISD::STRICT_FRINT:		case ISD::STRICT_FRINT:
case ISD::FRINT: ExpandFloatRes_FRINT(N, Lo, Hi); break;		case ISD::FRINT: ExpandFloatRes_FRINT(N, Lo, Hi); break;
case ISD::STRICT_FROUND:		case ISD::STRICT_FROUND:
case ISD::FROUND: ExpandFloatRes_FROUND(N, Lo, Hi); break;		case ISD::FROUND: ExpandFloatRes_FROUND(N, Lo, Hi); break;
case ISD::STRICT_FROUNDEVEN:		case ISD::STRICT_FROUNDEVEN:
case ISD::FROUNDEVEN: ExpandFloatRes_FROUNDEVEN(N, Lo, Hi); break;		case ISD::FROUNDEVEN: ExpandFloatRes_FROUNDEVEN(N, Lo, Hi); break;
case ISD::STRICT_FSIN:		case ISD::STRICT_FSIN:
▲ Show 20 Lines • Show All 279 Lines • ▼ Show 20 Lines	ExpandFloatRes_Binary(N, GetFPLibCall(N->getValueType(0),
RTLIB::POW_PPCF128), Lo, Hi);		RTLIB::POW_PPCF128), Lo, Hi);
}		}

void DAGTypeLegalizer::ExpandFloatRes_FPOWI(SDNode *N,		void DAGTypeLegalizer::ExpandFloatRes_FPOWI(SDNode *N,
SDValue &Lo, SDValue &Hi) {		SDValue &Lo, SDValue &Hi) {
ExpandFloatRes_Binary(N, RTLIB::getPOWI(N->getValueType(0)), Lo, Hi);		ExpandFloatRes_Binary(N, RTLIB::getPOWI(N->getValueType(0)), Lo, Hi);
}		}

		void DAGTypeLegalizer::ExpandFloatRes_FLDEXP(SDNode *N, SDValue &Lo,
		SDValue &Hi) {
		ExpandFloatRes_Binary(N, RTLIB::getLDEXP(N->getValueType(0)), Lo, Hi);
		}

void DAGTypeLegalizer::ExpandFloatRes_FREEZE(SDNode *N,		void DAGTypeLegalizer::ExpandFloatRes_FREEZE(SDNode *N,
SDValue &Lo, SDValue &Hi) {		SDValue &Lo, SDValue &Hi) {
assert(N->getValueType(0) == MVT::ppcf128 &&		assert(N->getValueType(0) == MVT::ppcf128 &&
"Logic only correct for ppcf128!");		"Logic only correct for ppcf128!");

SDLoc dl(N);		SDLoc dl(N);
GetExpandedFloat(N->getOperand(0), Lo, Hi);		GetExpandedFloat(N->getOperand(0), Lo, Hi);
Lo = DAG.getNode(ISD::FREEZE, dl, Lo.getValueType(), Lo);		Lo = DAG.getNode(ISD::FREEZE, dl, Lo.getValueType(), Lo);
▲ Show 20 Lines • Show All 725 Lines • ▼ Show 20 Lines	#endif
case ISD::FMUL:		case ISD::FMUL:
case ISD::FPOW:		case ISD::FPOW:
case ISD::FREM:		case ISD::FREM:
case ISD::FSUB: R = PromoteFloatRes_BinOp(N); break;		case ISD::FSUB: R = PromoteFloatRes_BinOp(N); break;

case ISD::FMA: // FMA is same as FMAD		case ISD::FMA: // FMA is same as FMAD
case ISD::FMAD: R = PromoteFloatRes_FMAD(N); break;		case ISD::FMAD: R = PromoteFloatRes_FMAD(N); break;

case ISD::FPOWI: R = PromoteFloatRes_FPOWI(N); break;		case ISD::FPOWI:
		case ISD::FLDEXP: R = PromoteFloatRes_ExpOp(N); break;

case ISD::FP_ROUND: R = PromoteFloatRes_FP_ROUND(N); break;		case ISD::FP_ROUND: R = PromoteFloatRes_FP_ROUND(N); break;
case ISD::LOAD: R = PromoteFloatRes_LOAD(N); break;		case ISD::LOAD: R = PromoteFloatRes_LOAD(N); break;
case ISD::SELECT: R = PromoteFloatRes_SELECT(N); break;		case ISD::SELECT: R = PromoteFloatRes_SELECT(N); break;
case ISD::SELECT_CC: R = PromoteFloatRes_SELECT_CC(N); break;		case ISD::SELECT_CC: R = PromoteFloatRes_SELECT_CC(N); break;

case ISD::SINT_TO_FP:		case ISD::SINT_TO_FP:
case ISD::UINT_TO_FP: R = PromoteFloatRes_XINT_TO_FP(N); break;		case ISD::UINT_TO_FP: R = PromoteFloatRes_XINT_TO_FP(N); break;
▲ Show 20 Lines • Show All 152 Lines • ▼ Show 20 Lines	SDValue DAGTypeLegalizer::PromoteFloatRes_FMAD(SDNode *N) {
SDValue Op0 = GetPromotedFloat(N->getOperand(0));		SDValue Op0 = GetPromotedFloat(N->getOperand(0));
SDValue Op1 = GetPromotedFloat(N->getOperand(1));		SDValue Op1 = GetPromotedFloat(N->getOperand(1));
SDValue Op2 = GetPromotedFloat(N->getOperand(2));		SDValue Op2 = GetPromotedFloat(N->getOperand(2));

return DAG.getNode(N->getOpcode(), SDLoc(N), NVT, Op0, Op1, Op2);		return DAG.getNode(N->getOpcode(), SDLoc(N), NVT, Op0, Op1, Op2);
}		}

// Promote the Float (first) operand and retain the Integer (second) operand		// Promote the Float (first) operand and retain the Integer (second) operand
SDValue DAGTypeLegalizer::PromoteFloatRes_FPOWI(SDNode *N) {		SDValue DAGTypeLegalizer::PromoteFloatRes_ExpOp(SDNode *N) {
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
EVT NVT = TLI.getTypeToTransformTo(*DAG.getContext(), VT);		EVT NVT = TLI.getTypeToTransformTo(*DAG.getContext(), VT);
SDValue Op0 = GetPromotedFloat(N->getOperand(0));		SDValue Op0 = GetPromotedFloat(N->getOperand(0));
SDValue Op1 = N->getOperand(1);		SDValue Op1 = N->getOperand(1);

return DAG.getNode(N->getOpcode(), SDLoc(N), NVT, Op0, Op1);		return DAG.getNode(N->getOpcode(), SDLoc(N), NVT, Op0, Op1);
}		}

▲ Show 20 Lines • Show All 180 Lines • ▼ Show 20 Lines	#endif
case ISD::FMUL:		case ISD::FMUL:
case ISD::FPOW:		case ISD::FPOW:
case ISD::FREM:		case ISD::FREM:
case ISD::FSUB: R = SoftPromoteHalfRes_BinOp(N); break;		case ISD::FSUB: R = SoftPromoteHalfRes_BinOp(N); break;

case ISD::FMA: // FMA is same as FMAD		case ISD::FMA: // FMA is same as FMAD
case ISD::FMAD: R = SoftPromoteHalfRes_FMAD(N); break;		case ISD::FMAD: R = SoftPromoteHalfRes_FMAD(N); break;

case ISD::FPOWI: R = SoftPromoteHalfRes_FPOWI(N); break;		case ISD::FPOWI:
		case ISD::FLDEXP: R = SoftPromoteHalfRes_ExpOp(N); break;

case ISD::LOAD: R = SoftPromoteHalfRes_LOAD(N); break;		case ISD::LOAD: R = SoftPromoteHalfRes_LOAD(N); break;
case ISD::SELECT: R = SoftPromoteHalfRes_SELECT(N); break;		case ISD::SELECT: R = SoftPromoteHalfRes_SELECT(N); break;
case ISD::SELECT_CC: R = SoftPromoteHalfRes_SELECT_CC(N); break;		case ISD::SELECT_CC: R = SoftPromoteHalfRes_SELECT_CC(N); break;
case ISD::SINT_TO_FP:		case ISD::SINT_TO_FP:
case ISD::UINT_TO_FP: R = SoftPromoteHalfRes_XINT_TO_FP(N); break;		case ISD::UINT_TO_FP: R = SoftPromoteHalfRes_XINT_TO_FP(N); break;
case ISD::UNDEF: R = SoftPromoteHalfRes_UNDEF(N); break;		case ISD::UNDEF: R = SoftPromoteHalfRes_UNDEF(N); break;
case ISD::ATOMIC_SWAP: R = BitcastToInt_ATOMIC_SWAP(N); break;		case ISD::ATOMIC_SWAP: R = BitcastToInt_ATOMIC_SWAP(N); break;
▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	SDValue DAGTypeLegalizer::SoftPromoteHalfRes_FMAD(SDNode *N) {
Op2 = DAG.getNode(PromotionOpcode, dl, NVT, Op2);		Op2 = DAG.getNode(PromotionOpcode, dl, NVT, Op2);

SDValue Res = DAG.getNode(N->getOpcode(), dl, NVT, Op0, Op1, Op2);		SDValue Res = DAG.getNode(N->getOpcode(), dl, NVT, Op0, Op1, Op2);

// Convert back to FP16 as an integer.		// Convert back to FP16 as an integer.
return DAG.getNode(GetPromotionOpcode(NVT, OVT), dl, MVT::i16, Res);		return DAG.getNode(GetPromotionOpcode(NVT, OVT), dl, MVT::i16, Res);
}		}

SDValue DAGTypeLegalizer::SoftPromoteHalfRes_FPOWI(SDNode *N) {		SDValue DAGTypeLegalizer::SoftPromoteHalfRes_ExpOp(SDNode *N) {
EVT OVT = N->getValueType(0);		EVT OVT = N->getValueType(0);
EVT NVT = TLI.getTypeToTransformTo(*DAG.getContext(), OVT);		EVT NVT = TLI.getTypeToTransformTo(*DAG.getContext(), OVT);
SDValue Op0 = GetSoftPromotedHalf(N->getOperand(0));		SDValue Op0 = GetSoftPromotedHalf(N->getOperand(0));
SDValue Op1 = N->getOperand(1);		SDValue Op1 = N->getOperand(1);
SDLoc dl(N);		SDLoc dl(N);

// Promote to the larger FP type.		// Promote to the larger FP type.
Op0 = DAG.getNode(GetPromotionOpcode(OVT, NVT), dl, NVT, Op0);		Op0 = DAG.getNode(GetPromotionOpcode(OVT, NVT), dl, NVT, Op0);
▲ Show 20 Lines • Show All 329 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/LegalizeIntegerTypes.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	case ISD::SMULFIX:			case ISD::SMULFIX:
	case ISD::SMULFIXSAT:			case ISD::SMULFIXSAT:
	case ISD::UMULFIX:			case ISD::UMULFIX:
	case ISD::UMULFIXSAT:			case ISD::UMULFIXSAT:
	case ISD::SDIVFIX:			case ISD::SDIVFIX:
	case ISD::SDIVFIXSAT:			case ISD::SDIVFIXSAT:
	case ISD::UDIVFIX:			case ISD::UDIVFIX:
	case ISD::UDIVFIXSAT: Res = PromoteIntOp_FIX(N); break;			case ISD::UDIVFIXSAT: Res = PromoteIntOp_FIX(N); break;

	case ISD::FPOWI:			case ISD::FPOWI:
	case ISD::STRICT_FPOWI: Res = PromoteIntOp_FPOWI(N); break;			case ISD::STRICT_FPOWI:
				case ISD::FLDEXP:
				case ISD::STRICT_FLDEXP: Res = PromoteIntOp_ExpOp(N); break;
	case ISD::VECREDUCE_ADD:			case ISD::VECREDUCE_ADD:
	case ISD::VECREDUCE_MUL:			case ISD::VECREDUCE_MUL:
	case ISD::VECREDUCE_AND:			case ISD::VECREDUCE_AND:
	case ISD::VECREDUCE_OR:			case ISD::VECREDUCE_OR:
	case ISD::VECREDUCE_XOR:			case ISD::VECREDUCE_XOR:
	case ISD::VECREDUCE_SMAX:			case ISD::VECREDUCE_SMAX:
	case ISD::VECREDUCE_SMIN:			case ISD::VECREDUCE_SMIN:
	case ISD::VECREDUCE_UMAX:			case ISD::VECREDUCE_UMAX:
	▲ Show 20 Lines • Show All 467 Lines • ▼ Show 20 Lines
	SDValue Op2 = ZExtPromotedInteger(N->getOperand(2));			SDValue Op2 = ZExtPromotedInteger(N->getOperand(2));
	SDValue Op3 = ZExtPromotedInteger(N->getOperand(3));			SDValue Op3 = ZExtPromotedInteger(N->getOperand(3));
	SDValue Op4 = ZExtPromotedInteger(N->getOperand(4));			SDValue Op4 = ZExtPromotedInteger(N->getOperand(4));
	return SDValue(DAG.UpdateNodeOperands(N, N->getOperand(0), N->getOperand(1),			return SDValue(DAG.UpdateNodeOperands(N, N->getOperand(0), N->getOperand(1),
	Op2, Op3, Op4),			Op2, Op3, Op4),
	0);			0);
	}			}

	SDValue DAGTypeLegalizer::PromoteIntOp_FPOWI(SDNode *N) {			SDValue DAGTypeLegalizer::PromoteIntOp_ExpOp(SDNode *N) {
	bool IsStrict = N->isStrictFPOpcode();			bool IsStrict = N->isStrictFPOpcode();
	SDValue Chain = IsStrict ? N->getOperand(0) : SDValue();			SDValue Chain = IsStrict ? N->getOperand(0) : SDValue();

	// The integer operand is the last operand in FPOWI (so the result and			bool IsPowI =
	// floating point operand is already type legalized).			N->getOpcode() == ISD::FPOWI \|\| N->getOpcode() == ISD::STRICT_FPOWI;

				// The integer operand is the last operand in FPOWI (or FLDEXP) (so the result
				// and floating point operand is already type legalized).
				RTLIB::Libcall LC = IsPowI ? RTLIB::getPOWI(N->getValueType(0))
				: RTLIB::getLDEXP(N->getValueType(0));

				if (LC == RTLIB::UNKNOWN_LIBCALL \|\| !TLI.getLibcallName(LC)) {
				SDValue Op = SExtPromotedInteger(N->getOperand(1));
				return SDValue(DAG.UpdateNodeOperands(N, N->getOperand(0), Op), 0);
				}

	// We can't just promote the exponent type in FPOWI, since we want to lower			// We can't just promote the exponent type in FPOWI, since we want to lower
	// the node to a libcall and we if we promote to a type larger than			// the node to a libcall and we if we promote to a type larger than
	// sizeof(int) the libcall might not be according to the targets ABI. Instead			// sizeof(int) the libcall might not be according to the targets ABI. Instead
	// we rewrite to a libcall here directly, letting makeLibCall handle promotion			// we rewrite to a libcall here directly, letting makeLibCall handle promotion
	// if the target accepts it according to shouldSignExtendTypeInLibCall.			// if the target accepts it according to shouldSignExtendTypeInLibCall.
	RTLIB::Libcall LC = RTLIB::getPOWI(N->getValueType(0));
	assert(LC != RTLIB::UNKNOWN_LIBCALL && "Unexpected fpowi.");
	if (!TLI.getLibcallName(LC)) {
	// Some targets don't have a powi libcall; use pow instead.
	// FIXME: Implement this if some target needs it.
	DAG.getContext()->emitError("Don't know how to promote fpowi to fpow");
	return DAG.getUNDEF(N->getValueType(0));
	}
	unsigned OpOffset = IsStrict ? 1 : 0;			unsigned OpOffset = IsStrict ? 1 : 0;
	// The exponent should fit in a sizeof(int) type for the libcall to be valid.			// The exponent should fit in a sizeof(int) type for the libcall to be valid.
	assert(DAG.getLibInfo().getIntSize() ==			assert(DAG.getLibInfo().getIntSize() ==
	N->getOperand(1 + OpOffset).getValueType().getSizeInBits() &&			N->getOperand(1 + OpOffset).getValueType().getSizeInBits() &&
	"POWI exponent should match with sizeof(int) when doing the libcall.");			"POWI exponent should match with sizeof(int) when doing the libcall.");
	TargetLowering::MakeLibCallOptions CallOptions;			TargetLowering::MakeLibCallOptions CallOptions;
	CallOptions.setSExt(true);			CallOptions.setSExt(true);
	SDValue Ops[2] = {N->getOperand(0 + OpOffset), N->getOperand(1 + OpOffset)};			SDValue Ops[2] = {N->getOperand(0 + OpOffset), N->getOperand(1 + OpOffset)};
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/LegalizeTypes.h

Show First 20 Lines • Show All 394 Lines • ▼ Show 20 Lines	private:
SDValue PromoteIntOp_MSTORE(MaskedStoreSDNode *N, unsigned OpNo);		SDValue PromoteIntOp_MSTORE(MaskedStoreSDNode *N, unsigned OpNo);
SDValue PromoteIntOp_MLOAD(MaskedLoadSDNode *N, unsigned OpNo);		SDValue PromoteIntOp_MLOAD(MaskedLoadSDNode *N, unsigned OpNo);
SDValue PromoteIntOp_MSCATTER(MaskedScatterSDNode *N, unsigned OpNo);		SDValue PromoteIntOp_MSCATTER(MaskedScatterSDNode *N, unsigned OpNo);
SDValue PromoteIntOp_MGATHER(MaskedGatherSDNode *N, unsigned OpNo);		SDValue PromoteIntOp_MGATHER(MaskedGatherSDNode *N, unsigned OpNo);
SDValue PromoteIntOp_ADDSUBO_CARRY(SDNode *N, unsigned OpNo);		SDValue PromoteIntOp_ADDSUBO_CARRY(SDNode *N, unsigned OpNo);
SDValue PromoteIntOp_FRAMERETURNADDR(SDNode *N);		SDValue PromoteIntOp_FRAMERETURNADDR(SDNode *N);
SDValue PromoteIntOp_PREFETCH(SDNode *N, unsigned OpNo);		SDValue PromoteIntOp_PREFETCH(SDNode *N, unsigned OpNo);
SDValue PromoteIntOp_FIX(SDNode *N);		SDValue PromoteIntOp_FIX(SDNode *N);
SDValue PromoteIntOp_FPOWI(SDNode *N);		SDValue PromoteIntOp_ExpOp(SDNode *N);
SDValue PromoteIntOp_VECREDUCE(SDNode *N);		SDValue PromoteIntOp_VECREDUCE(SDNode *N);
SDValue PromoteIntOp_VP_REDUCE(SDNode *N, unsigned OpNo);		SDValue PromoteIntOp_VP_REDUCE(SDNode *N, unsigned OpNo);
SDValue PromoteIntOp_SET_ROUNDING(SDNode *N);		SDValue PromoteIntOp_SET_ROUNDING(SDNode *N);
SDValue PromoteIntOp_STACKMAP(SDNode *N, unsigned OpNo);		SDValue PromoteIntOp_STACKMAP(SDNode *N, unsigned OpNo);
SDValue PromoteIntOp_PATCHPOINT(SDNode *N, unsigned OpNo);		SDValue PromoteIntOp_PATCHPOINT(SDNode *N, unsigned OpNo);
SDValue PromoteIntOp_VP_STRIDED(SDNode *N, unsigned OpNo);		SDValue PromoteIntOp_VP_STRIDED(SDNode *N, unsigned OpNo);

void PromoteSetCCOperands(SDValue &LHS,SDValue &RHS, ISD::CondCode Code);		void PromoteSetCCOperands(SDValue &LHS,SDValue &RHS, ISD::CondCode Code);
▲ Show 20 Lines • Show All 145 Lines • ▼ Show 20 Lines	private:
SDValue SoftenFloatRes_FMA(SDNode *N);		SDValue SoftenFloatRes_FMA(SDNode *N);
SDValue SoftenFloatRes_FMUL(SDNode *N);		SDValue SoftenFloatRes_FMUL(SDNode *N);
SDValue SoftenFloatRes_FNEARBYINT(SDNode *N);		SDValue SoftenFloatRes_FNEARBYINT(SDNode *N);
SDValue SoftenFloatRes_FNEG(SDNode *N);		SDValue SoftenFloatRes_FNEG(SDNode *N);
SDValue SoftenFloatRes_FP_EXTEND(SDNode *N);		SDValue SoftenFloatRes_FP_EXTEND(SDNode *N);
SDValue SoftenFloatRes_FP16_TO_FP(SDNode *N);		SDValue SoftenFloatRes_FP16_TO_FP(SDNode *N);
SDValue SoftenFloatRes_FP_ROUND(SDNode *N);		SDValue SoftenFloatRes_FP_ROUND(SDNode *N);
SDValue SoftenFloatRes_FPOW(SDNode *N);		SDValue SoftenFloatRes_FPOW(SDNode *N);
SDValue SoftenFloatRes_FPOWI(SDNode *N);		SDValue SoftenFloatRes_ExpOp(SDNode *N);
SDValue SoftenFloatRes_FREEZE(SDNode *N);		SDValue SoftenFloatRes_FREEZE(SDNode *N);
SDValue SoftenFloatRes_FREM(SDNode *N);		SDValue SoftenFloatRes_FREM(SDNode *N);
SDValue SoftenFloatRes_FRINT(SDNode *N);		SDValue SoftenFloatRes_FRINT(SDNode *N);
SDValue SoftenFloatRes_FROUND(SDNode *N);		SDValue SoftenFloatRes_FROUND(SDNode *N);
SDValue SoftenFloatRes_FROUNDEVEN(SDNode *N);		SDValue SoftenFloatRes_FROUNDEVEN(SDNode *N);
SDValue SoftenFloatRes_FSIN(SDNode *N);		SDValue SoftenFloatRes_FSIN(SDNode *N);
SDValue SoftenFloatRes_FSQRT(SDNode *N);		SDValue SoftenFloatRes_FSQRT(SDNode *N);
SDValue SoftenFloatRes_FSUB(SDNode *N);		SDValue SoftenFloatRes_FSUB(SDNode *N);
▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	private:
void ExpandFloatRes_FLOG10 (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FLOG10 (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FMA (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FMA (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FMUL (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FMUL (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FNEARBYINT(SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FNEARBYINT(SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FNEG (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FNEG (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FP_EXTEND (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FP_EXTEND (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FPOW (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FPOW (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FPOWI (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FPOWI (SDNode *N, SDValue &Lo, SDValue &Hi);
		void ExpandFloatRes_FLDEXP (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FREEZE (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FREEZE (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FREM (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FREM (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FRINT (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FRINT (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FROUND (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FROUND (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FROUNDEVEN(SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FROUNDEVEN(SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FSIN (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FSIN (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FSQRT (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FSQRT (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandFloatRes_FSUB (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandFloatRes_FSUB (SDNode *N, SDValue &Lo, SDValue &Hi);
Show All 33 Lines	private:

void PromoteFloatResult(SDNode *N, unsigned ResNo);		void PromoteFloatResult(SDNode *N, unsigned ResNo);
SDValue PromoteFloatRes_BITCAST(SDNode *N);		SDValue PromoteFloatRes_BITCAST(SDNode *N);
SDValue PromoteFloatRes_BinOp(SDNode *N);		SDValue PromoteFloatRes_BinOp(SDNode *N);
SDValue PromoteFloatRes_ConstantFP(SDNode *N);		SDValue PromoteFloatRes_ConstantFP(SDNode *N);
SDValue PromoteFloatRes_EXTRACT_VECTOR_ELT(SDNode *N);		SDValue PromoteFloatRes_EXTRACT_VECTOR_ELT(SDNode *N);
SDValue PromoteFloatRes_FCOPYSIGN(SDNode *N);		SDValue PromoteFloatRes_FCOPYSIGN(SDNode *N);
SDValue PromoteFloatRes_FMAD(SDNode *N);		SDValue PromoteFloatRes_FMAD(SDNode *N);
SDValue PromoteFloatRes_FPOWI(SDNode *N);		SDValue PromoteFloatRes_ExpOp(SDNode *N);
SDValue PromoteFloatRes_FP_ROUND(SDNode *N);		SDValue PromoteFloatRes_FP_ROUND(SDNode *N);
SDValue PromoteFloatRes_LOAD(SDNode *N);		SDValue PromoteFloatRes_LOAD(SDNode *N);
SDValue PromoteFloatRes_SELECT(SDNode *N);		SDValue PromoteFloatRes_SELECT(SDNode *N);
SDValue PromoteFloatRes_SELECT_CC(SDNode *N);		SDValue PromoteFloatRes_SELECT_CC(SDNode *N);
SDValue PromoteFloatRes_UnaryOp(SDNode *N);		SDValue PromoteFloatRes_UnaryOp(SDNode *N);
SDValue PromoteFloatRes_UNDEF(SDNode *N);		SDValue PromoteFloatRes_UNDEF(SDNode *N);
SDValue BitcastToInt_ATOMIC_SWAP(SDNode *N);		SDValue BitcastToInt_ATOMIC_SWAP(SDNode *N);
SDValue PromoteFloatRes_XINT_TO_FP(SDNode *N);		SDValue PromoteFloatRes_XINT_TO_FP(SDNode *N);
Show All 24 Lines	private:

void SoftPromoteHalfResult(SDNode *N, unsigned ResNo);		void SoftPromoteHalfResult(SDNode *N, unsigned ResNo);
SDValue SoftPromoteHalfRes_BinOp(SDNode *N);		SDValue SoftPromoteHalfRes_BinOp(SDNode *N);
SDValue SoftPromoteHalfRes_BITCAST(SDNode *N);		SDValue SoftPromoteHalfRes_BITCAST(SDNode *N);
SDValue SoftPromoteHalfRes_ConstantFP(SDNode *N);		SDValue SoftPromoteHalfRes_ConstantFP(SDNode *N);
SDValue SoftPromoteHalfRes_EXTRACT_VECTOR_ELT(SDNode *N);		SDValue SoftPromoteHalfRes_EXTRACT_VECTOR_ELT(SDNode *N);
SDValue SoftPromoteHalfRes_FCOPYSIGN(SDNode *N);		SDValue SoftPromoteHalfRes_FCOPYSIGN(SDNode *N);
SDValue SoftPromoteHalfRes_FMAD(SDNode *N);		SDValue SoftPromoteHalfRes_FMAD(SDNode *N);
SDValue SoftPromoteHalfRes_FPOWI(SDNode *N);		SDValue SoftPromoteHalfRes_ExpOp(SDNode *N);
SDValue SoftPromoteHalfRes_FP_ROUND(SDNode *N);		SDValue SoftPromoteHalfRes_FP_ROUND(SDNode *N);
SDValue SoftPromoteHalfRes_LOAD(SDNode *N);		SDValue SoftPromoteHalfRes_LOAD(SDNode *N);
SDValue SoftPromoteHalfRes_SELECT(SDNode *N);		SDValue SoftPromoteHalfRes_SELECT(SDNode *N);
SDValue SoftPromoteHalfRes_SELECT_CC(SDNode *N);		SDValue SoftPromoteHalfRes_SELECT_CC(SDNode *N);
SDValue SoftPromoteHalfRes_UnaryOp(SDNode *N);		SDValue SoftPromoteHalfRes_UnaryOp(SDNode *N);
SDValue SoftPromoteHalfRes_XINT_TO_FP(SDNode *N);		SDValue SoftPromoteHalfRes_XINT_TO_FP(SDNode *N);
SDValue SoftPromoteHalfRes_UNDEF(SDNode *N);		SDValue SoftPromoteHalfRes_UNDEF(SDNode *N);
SDValue SoftPromoteHalfRes_VECREDUCE(SDNode *N);		SDValue SoftPromoteHalfRes_VECREDUCE(SDNode *N);
Show All 36 Lines	private:
SDValue ScalarizeVecRes_OverflowOp(SDNode *N, unsigned ResNo);		SDValue ScalarizeVecRes_OverflowOp(SDNode *N, unsigned ResNo);
SDValue ScalarizeVecRes_InregOp(SDNode *N);		SDValue ScalarizeVecRes_InregOp(SDNode *N);
SDValue ScalarizeVecRes_VecInregOp(SDNode *N);		SDValue ScalarizeVecRes_VecInregOp(SDNode *N);

SDValue ScalarizeVecRes_BITCAST(SDNode *N);		SDValue ScalarizeVecRes_BITCAST(SDNode *N);
SDValue ScalarizeVecRes_BUILD_VECTOR(SDNode *N);		SDValue ScalarizeVecRes_BUILD_VECTOR(SDNode *N);
SDValue ScalarizeVecRes_EXTRACT_SUBVECTOR(SDNode *N);		SDValue ScalarizeVecRes_EXTRACT_SUBVECTOR(SDNode *N);
SDValue ScalarizeVecRes_FP_ROUND(SDNode *N);		SDValue ScalarizeVecRes_FP_ROUND(SDNode *N);
SDValue ScalarizeVecRes_FPOWI(SDNode *N);		SDValue ScalarizeVecRes_ExpOp(SDNode *N);
SDValue ScalarizeVecRes_INSERT_VECTOR_ELT(SDNode *N);		SDValue ScalarizeVecRes_INSERT_VECTOR_ELT(SDNode *N);
SDValue ScalarizeVecRes_LOAD(LoadSDNode *N);		SDValue ScalarizeVecRes_LOAD(LoadSDNode *N);
SDValue ScalarizeVecRes_SCALAR_TO_VECTOR(SDNode *N);		SDValue ScalarizeVecRes_SCALAR_TO_VECTOR(SDNode *N);
SDValue ScalarizeVecRes_VSELECT(SDNode *N);		SDValue ScalarizeVecRes_VSELECT(SDNode *N);
SDValue ScalarizeVecRes_SELECT(SDNode *N);		SDValue ScalarizeVecRes_SELECT(SDNode *N);
SDValue ScalarizeVecRes_SELECT_CC(SDNode *N);		SDValue ScalarizeVecRes_SELECT_CC(SDNode *N);
SDValue ScalarizeVecRes_SETCC(SDNode *N);		SDValue ScalarizeVecRes_SETCC(SDNode *N);
SDValue ScalarizeVecRes_UNDEF(SDNode *N);		SDValue ScalarizeVecRes_UNDEF(SDNode *N);
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines	private:

void SplitVecRes_FIX(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_FIX(SDNode *N, SDValue &Lo, SDValue &Hi);

void SplitVecRes_BITCAST(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_BITCAST(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_BUILD_VECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_BUILD_VECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_CONCAT_VECTORS(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_CONCAT_VECTORS(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_EXTRACT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_EXTRACT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_INSERT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_INSERT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_FPOWI(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_FPOp_MultiType(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_FCOPYSIGN(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_IS_FPCLASS(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_IS_FPCLASS(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_INSERT_VECTOR_ELT(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_INSERT_VECTOR_ELT(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_LOAD(LoadSDNode *LD, SDValue &Lo, SDValue &Hi);		void SplitVecRes_LOAD(LoadSDNode *LD, SDValue &Lo, SDValue &Hi);
void SplitVecRes_VP_LOAD(VPLoadSDNode *LD, SDValue &Lo, SDValue &Hi);		void SplitVecRes_VP_LOAD(VPLoadSDNode *LD, SDValue &Lo, SDValue &Hi);
void SplitVecRes_VP_STRIDED_LOAD(VPStridedLoadSDNode *SLD, SDValue &Lo,		void SplitVecRes_VP_STRIDED_LOAD(VPStridedLoadSDNode *SLD, SDValue &Lo,
SDValue &Hi);		SDValue &Hi);
void SplitVecRes_MLOAD(MaskedLoadSDNode *MLD, SDValue &Lo, SDValue &Hi);		void SplitVecRes_MLOAD(MaskedLoadSDNode *MLD, SDValue &Lo, SDValue &Hi);
void SplitVecRes_Gather(MemSDNode *VPGT, SDValue &Lo, SDValue &Hi,		void SplitVecRes_Gather(MemSDNode *VPGT, SDValue &Lo, SDValue &Hi,
Show All 28 Lines	private:
SDValue SplitVecOp_VP_STORE(VPStoreSDNode *N, unsigned OpNo);		SDValue SplitVecOp_VP_STORE(VPStoreSDNode *N, unsigned OpNo);
SDValue SplitVecOp_VP_STRIDED_STORE(VPStridedStoreSDNode *N, unsigned OpNo);		SDValue SplitVecOp_VP_STRIDED_STORE(VPStridedStoreSDNode *N, unsigned OpNo);
SDValue SplitVecOp_MSTORE(MaskedStoreSDNode *N, unsigned OpNo);		SDValue SplitVecOp_MSTORE(MaskedStoreSDNode *N, unsigned OpNo);
SDValue SplitVecOp_Scatter(MemSDNode *N, unsigned OpNo);		SDValue SplitVecOp_Scatter(MemSDNode *N, unsigned OpNo);
SDValue SplitVecOp_Gather(MemSDNode *MGT, unsigned OpNo);		SDValue SplitVecOp_Gather(MemSDNode *MGT, unsigned OpNo);
SDValue SplitVecOp_CONCAT_VECTORS(SDNode *N);		SDValue SplitVecOp_CONCAT_VECTORS(SDNode *N);
SDValue SplitVecOp_VSETCC(SDNode *N);		SDValue SplitVecOp_VSETCC(SDNode *N);
SDValue SplitVecOp_FP_ROUND(SDNode *N);		SDValue SplitVecOp_FP_ROUND(SDNode *N);
SDValue SplitVecOp_FCOPYSIGN(SDNode *N);		SDValue SplitVecOp_FPOpDifferentTypes(SDNode *N);
SDValue SplitVecOp_FP_TO_XINT_SAT(SDNode *N);		SDValue SplitVecOp_FP_TO_XINT_SAT(SDNode *N);

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// Vector Widening Support: LegalizeVectorTypes.cpp		// Vector Widening Support: LegalizeVectorTypes.cpp
//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//

/// Given a processed vector Op which was widened into a larger vector, this		/// Given a processed vector Op which was widened into a larger vector, this
/// method returns the larger vector. The elements of the returned vector		/// method returns the larger vector. The elements of the returned vector
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines	private:
SDValue WidenVecRes_BinaryWithExtraScalarOp(SDNode *N);		SDValue WidenVecRes_BinaryWithExtraScalarOp(SDNode *N);
SDValue WidenVecRes_StrictFP(SDNode *N);		SDValue WidenVecRes_StrictFP(SDNode *N);
SDValue WidenVecRes_OverflowOp(SDNode *N, unsigned ResNo);		SDValue WidenVecRes_OverflowOp(SDNode *N, unsigned ResNo);
SDValue WidenVecRes_Convert(SDNode *N);		SDValue WidenVecRes_Convert(SDNode *N);
SDValue WidenVecRes_Convert_StrictFP(SDNode *N);		SDValue WidenVecRes_Convert_StrictFP(SDNode *N);
SDValue WidenVecRes_FP_TO_XINT_SAT(SDNode *N);		SDValue WidenVecRes_FP_TO_XINT_SAT(SDNode *N);
SDValue WidenVecRes_FCOPYSIGN(SDNode *N);		SDValue WidenVecRes_FCOPYSIGN(SDNode *N);
SDValue WidenVecRes_IS_FPCLASS(SDNode *N);		SDValue WidenVecRes_IS_FPCLASS(SDNode *N);
SDValue WidenVecRes_POWI(SDNode *N);		SDValue WidenVecRes_ExpOp(SDNode *N);
SDValue WidenVecRes_Unary(SDNode *N);		SDValue WidenVecRes_Unary(SDNode *N);
SDValue WidenVecRes_InregOp(SDNode *N);		SDValue WidenVecRes_InregOp(SDNode *N);

// Widen Vector Operand.		// Widen Vector Operand.
bool WidenVectorOperand(SDNode *N, unsigned OpNo);		bool WidenVectorOperand(SDNode *N, unsigned OpNo);
SDValue WidenVecOp_BITCAST(SDNode *N);		SDValue WidenVecOp_BITCAST(SDNode *N);
SDValue WidenVecOp_CONCAT_VECTORS(SDNode *N);		SDValue WidenVecOp_CONCAT_VECTORS(SDNode *N);
SDValue WidenVecOp_EXTEND(SDNode *N);		SDValue WidenVecOp_EXTEND(SDNode *N);
Show All 13 Lines	private:

SDValue WidenVecOp_Convert(SDNode *N);		SDValue WidenVecOp_Convert(SDNode *N);
SDValue WidenVecOp_FP_TO_XINT_SAT(SDNode *N);		SDValue WidenVecOp_FP_TO_XINT_SAT(SDNode *N);
SDValue WidenVecOp_FCOPYSIGN(SDNode *N);		SDValue WidenVecOp_FCOPYSIGN(SDNode *N);
SDValue WidenVecOp_IS_FPCLASS(SDNode *N);		SDValue WidenVecOp_IS_FPCLASS(SDNode *N);
SDValue WidenVecOp_VECREDUCE(SDNode *N);		SDValue WidenVecOp_VECREDUCE(SDNode *N);
SDValue WidenVecOp_VECREDUCE_SEQ(SDNode *N);		SDValue WidenVecOp_VECREDUCE_SEQ(SDNode *N);
SDValue WidenVecOp_VP_REDUCE(SDNode *N);		SDValue WidenVecOp_VP_REDUCE(SDNode *N);
		SDValue WidenVecOp_ExpOp(SDNode *N);

/// Helper function to generate a set of operations to perform		/// Helper function to generate a set of operations to perform
/// a vector operation for a wider type.		/// a vector operation for a wider type.
///		///
SDValue UnrollVectorOp_StrictFP(SDNode *N, unsigned ResNE);		SDValue UnrollVectorOp_StrictFP(SDNode *N, unsigned ResNE);

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// Vector Widening Utilities Support: LegalizeVectorTypes.cpp		// Vector Widening Utilities Support: LegalizeVectorTypes.cpp
▲ Show 20 Lines • Show All 108 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp

Show First 20 Lines • Show All 371 Lines • ▼ Show 20 Lines	#include "llvm/IR/ConstrainedOps.def"
case ISD::FMINNUM_IEEE:		case ISD::FMINNUM_IEEE:
case ISD::FMAXNUM_IEEE:		case ISD::FMAXNUM_IEEE:
case ISD::FMINIMUM:		case ISD::FMINIMUM:
case ISD::FMAXIMUM:		case ISD::FMAXIMUM:
case ISD::FCOPYSIGN:		case ISD::FCOPYSIGN:
case ISD::FSQRT:		case ISD::FSQRT:
case ISD::FSIN:		case ISD::FSIN:
case ISD::FCOS:		case ISD::FCOS:
		case ISD::FLDEXP:
case ISD::FPOWI:		case ISD::FPOWI:
case ISD::FPOW:		case ISD::FPOW:
case ISD::FLOG:		case ISD::FLOG:
case ISD::FLOG2:		case ISD::FLOG2:
case ISD::FLOG10:		case ISD::FLOG10:
case ISD::FEXP:		case ISD::FEXP:
case ISD::FEXP2:		case ISD::FEXP2:
case ISD::FCEIL:		case ISD::FCEIL:
▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp

	Show First 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	report_fatal_error("Do not know how to scalarize the result of this "			report_fatal_error("Do not know how to scalarize the result of this "
	"operator!\n");			"operator!\n");

	case ISD::MERGE_VALUES: R = ScalarizeVecRes_MERGE_VALUES(N, ResNo);break;			case ISD::MERGE_VALUES: R = ScalarizeVecRes_MERGE_VALUES(N, ResNo);break;
	case ISD::BITCAST: R = ScalarizeVecRes_BITCAST(N); break;			case ISD::BITCAST: R = ScalarizeVecRes_BITCAST(N); break;
	case ISD::BUILD_VECTOR: R = ScalarizeVecRes_BUILD_VECTOR(N); break;			case ISD::BUILD_VECTOR: R = ScalarizeVecRes_BUILD_VECTOR(N); break;
	case ISD::EXTRACT_SUBVECTOR: R = ScalarizeVecRes_EXTRACT_SUBVECTOR(N); break;			case ISD::EXTRACT_SUBVECTOR: R = ScalarizeVecRes_EXTRACT_SUBVECTOR(N); break;
	case ISD::FP_ROUND: R = ScalarizeVecRes_FP_ROUND(N); break;			case ISD::FP_ROUND: R = ScalarizeVecRes_FP_ROUND(N); break;
	case ISD::FPOWI: R = ScalarizeVecRes_FPOWI(N); break;			case ISD::FPOWI: R = ScalarizeVecRes_ExpOp(N); break;
	case ISD::INSERT_VECTOR_ELT: R = ScalarizeVecRes_INSERT_VECTOR_ELT(N); break;			case ISD::INSERT_VECTOR_ELT: R = ScalarizeVecRes_INSERT_VECTOR_ELT(N); break;
	case ISD::LOAD: R = ScalarizeVecRes_LOAD(cast<LoadSDNode>(N));break;			case ISD::LOAD: R = ScalarizeVecRes_LOAD(cast<LoadSDNode>(N));break;
	case ISD::SCALAR_TO_VECTOR: R = ScalarizeVecRes_SCALAR_TO_VECTOR(N); break;			case ISD::SCALAR_TO_VECTOR: R = ScalarizeVecRes_SCALAR_TO_VECTOR(N); break;
	case ISD::SIGN_EXTEND_INREG: R = ScalarizeVecRes_InregOp(N); break;			case ISD::SIGN_EXTEND_INREG: R = ScalarizeVecRes_InregOp(N); break;
	case ISD::VSELECT: R = ScalarizeVecRes_VSELECT(N); break;			case ISD::VSELECT: R = ScalarizeVecRes_VSELECT(N); break;
	case ISD::SELECT: R = ScalarizeVecRes_SELECT(N); break;			case ISD::SELECT: R = ScalarizeVecRes_SELECT(N); break;
	case ISD::SELECT_CC: R = ScalarizeVecRes_SELECT_CC(N); break;			case ISD::SELECT_CC: R = ScalarizeVecRes_SELECT_CC(N); break;
	case ISD::SETCC: R = ScalarizeVecRes_SETCC(N); break;			case ISD::SETCC: R = ScalarizeVecRes_SETCC(N); break;
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	case ISD::FDIV:			case ISD::FDIV:
	case ISD::FMUL:			case ISD::FMUL:
	case ISD::FMINNUM:			case ISD::FMINNUM:
	case ISD::FMAXNUM:			case ISD::FMAXNUM:
	case ISD::FMINNUM_IEEE:			case ISD::FMINNUM_IEEE:
	case ISD::FMAXNUM_IEEE:			case ISD::FMAXNUM_IEEE:
	case ISD::FMINIMUM:			case ISD::FMINIMUM:
	case ISD::FMAXIMUM:			case ISD::FMAXIMUM:
				case ISD::FLDEXP:
	case ISD::SMIN:			case ISD::SMIN:
	case ISD::SMAX:			case ISD::SMAX:
	case ISD::UMIN:			case ISD::UMIN:
	case ISD::UMAX:			case ISD::UMAX:

	case ISD::SADDSAT:			case ISD::SADDSAT:
	case ISD::UADDSAT:			case ISD::UADDSAT:
	case ISD::SSUBSAT:			case ISD::SSUBSAT:
	▲ Show 20 Lines • Show All 206 Lines • ▼ Show 20 Lines
	Op = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, VT, Op,			Op = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, VT, Op,
	DAG.getVectorIdxConstant(0, DL));			DAG.getVectorIdxConstant(0, DL));
	}			}
	return DAG.getNode(ISD::FP_ROUND, DL,			return DAG.getNode(ISD::FP_ROUND, DL,
	N->getValueType(0).getVectorElementType(), Op,			N->getValueType(0).getVectorElementType(), Op,
	N->getOperand(1));			N->getOperand(1));
	}			}

	SDValue DAGTypeLegalizer::ScalarizeVecRes_FPOWI(SDNode *N) {			SDValue DAGTypeLegalizer::ScalarizeVecRes_ExpOp(SDNode *N) {
	SDValue Op = GetScalarizedVector(N->getOperand(0));			SDValue Op = GetScalarizedVector(N->getOperand(0));
	return DAG.getNode(ISD::FPOWI, SDLoc(N),			return DAG.getNode(N->getOpcode(), SDLoc(N), Op.getValueType(), Op,
	Op.getValueType(), Op, N->getOperand(1));			N->getOperand(1));
	}			}

	SDValue DAGTypeLegalizer::ScalarizeVecRes_INSERT_VECTOR_ELT(SDNode *N) {			SDValue DAGTypeLegalizer::ScalarizeVecRes_INSERT_VECTOR_ELT(SDNode *N) {
	// The value to insert may have a wider type than the vector element type,			// The value to insert may have a wider type than the vector element type,
	// so be sure to truncate it to the element type if necessary.			// so be sure to truncate it to the element type if necessary.
	SDValue Op = N->getOperand(1);			SDValue Op = N->getOperand(1);
	EVT EltVT = N->getValueType(0).getVectorElementType();			EVT EltVT = N->getValueType(0).getVectorElementType();
	if (Op.getValueType() != EltVT)			if (Op.getValueType() != EltVT)
	▲ Show 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	case ISD::VP_SELECT: SplitRes_Select(N, Lo, Hi); break;			case ISD::VP_SELECT: SplitRes_Select(N, Lo, Hi); break;
	case ISD::SELECT_CC: SplitRes_SELECT_CC(N, Lo, Hi); break;			case ISD::SELECT_CC: SplitRes_SELECT_CC(N, Lo, Hi); break;
	case ISD::UNDEF: SplitRes_UNDEF(N, Lo, Hi); break;			case ISD::UNDEF: SplitRes_UNDEF(N, Lo, Hi); break;
	case ISD::BITCAST: SplitVecRes_BITCAST(N, Lo, Hi); break;			case ISD::BITCAST: SplitVecRes_BITCAST(N, Lo, Hi); break;
	case ISD::BUILD_VECTOR: SplitVecRes_BUILD_VECTOR(N, Lo, Hi); break;			case ISD::BUILD_VECTOR: SplitVecRes_BUILD_VECTOR(N, Lo, Hi); break;
	case ISD::CONCAT_VECTORS: SplitVecRes_CONCAT_VECTORS(N, Lo, Hi); break;			case ISD::CONCAT_VECTORS: SplitVecRes_CONCAT_VECTORS(N, Lo, Hi); break;
	case ISD::EXTRACT_SUBVECTOR: SplitVecRes_EXTRACT_SUBVECTOR(N, Lo, Hi); break;			case ISD::EXTRACT_SUBVECTOR: SplitVecRes_EXTRACT_SUBVECTOR(N, Lo, Hi); break;
	case ISD::INSERT_SUBVECTOR: SplitVecRes_INSERT_SUBVECTOR(N, Lo, Hi); break;			case ISD::INSERT_SUBVECTOR: SplitVecRes_INSERT_SUBVECTOR(N, Lo, Hi); break;
	case ISD::FPOWI: SplitVecRes_FPOWI(N, Lo, Hi); break;			case ISD::FPOWI:
	case ISD::FCOPYSIGN: SplitVecRes_FCOPYSIGN(N, Lo, Hi); break;			case ISD::FLDEXP:
				case ISD::FCOPYSIGN: SplitVecRes_FPOp_MultiType(N, Lo, Hi); break;
	case ISD::IS_FPCLASS: SplitVecRes_IS_FPCLASS(N, Lo, Hi); break;			case ISD::IS_FPCLASS: SplitVecRes_IS_FPCLASS(N, Lo, Hi); break;
	case ISD::INSERT_VECTOR_ELT: SplitVecRes_INSERT_VECTOR_ELT(N, Lo, Hi); break;			case ISD::INSERT_VECTOR_ELT: SplitVecRes_INSERT_VECTOR_ELT(N, Lo, Hi); break;
	case ISD::SPLAT_VECTOR:			case ISD::SPLAT_VECTOR:
	case ISD::SCALAR_TO_VECTOR:			case ISD::SCALAR_TO_VECTOR:
	SplitVecRes_ScalarOp(N, Lo, Hi);			SplitVecRes_ScalarOp(N, Lo, Hi);
	break;			break;
	case ISD::STEP_VECTOR:			case ISD::STEP_VECTOR:
	SplitVecRes_STEP_VECTOR(N, Lo, Hi);			SplitVecRes_STEP_VECTOR(N, Lo, Hi);
	▲ Show 20 Lines • Show All 485 Lines • ▼ Show 20 Lines
	auto *Load = cast<LoadSDNode>(Lo);			auto *Load = cast<LoadSDNode>(Lo);
	MachinePointerInfo MPI = Load->getPointerInfo();			MachinePointerInfo MPI = Load->getPointerInfo();
	IncrementPointer(Load, LoVT, MPI, StackPtr);			IncrementPointer(Load, LoVT, MPI, StackPtr);

	// Load the Hi part from the stack slot.			// Load the Hi part from the stack slot.
	Hi = DAG.getLoad(Hi.getValueType(), dl, Store, StackPtr, MPI, SmallestAlign);			Hi = DAG.getLoad(Hi.getValueType(), dl, Store, StackPtr, MPI, SmallestAlign);
	}			}

	void DAGTypeLegalizer::SplitVecRes_FPOWI(SDNode *N, SDValue &Lo,			// Handle splitting an FP where the second operand does not match the first
	SDValue &Hi) {			// type. The second operand may be a scalar, or a vector that has exactly as
	SDLoc dl(N);			// many elements as the first
	GetSplitVector(N->getOperand(0), Lo, Hi);			void DAGTypeLegalizer::SplitVecRes_FPOp_MultiType(SDNode *N, SDValue &Lo,
	Lo = DAG.getNode(ISD::FPOWI, dl, Lo.getValueType(), Lo, N->getOperand(1));			SDValue &Hi) {
	Hi = DAG.getNode(ISD::FPOWI, dl, Hi.getValueType(), Hi, N->getOperand(1));
	}

	void DAGTypeLegalizer::SplitVecRes_FCOPYSIGN(SDNode *N, SDValue &Lo,
	SDValue &Hi) {
	SDValue LHSLo, LHSHi;			SDValue LHSLo, LHSHi;
	GetSplitVector(N->getOperand(0), LHSLo, LHSHi);			GetSplitVector(N->getOperand(0), LHSLo, LHSHi);
	SDLoc DL(N);			SDLoc DL(N);

	SDValue RHSLo, RHSHi;			SDValue RHSLo, RHSHi;
	SDValue RHS = N->getOperand(1);			SDValue RHS = N->getOperand(1);
	EVT RHSVT = RHS.getValueType();			EVT RHSVT = RHS.getValueType();
	if (getTypeAction(RHSVT) == TargetLowering::TypeSplitVector)			if (RHSVT.isVector()) {
	GetSplitVector(RHS, RHSLo, RHSHi);			if (getTypeAction(RHSVT) == TargetLowering::TypeSplitVector)
	else			GetSplitVector(RHS, RHSLo, RHSHi);
	std::tie(RHSLo, RHSHi) = DAG.SplitVector(RHS, SDLoc(RHS));			else
				std::tie(RHSLo, RHSHi) = DAG.SplitVector(RHS, SDLoc(RHS));

	Lo = DAG.getNode(ISD::FCOPYSIGN, DL, LHSLo.getValueType(), LHSLo, RHSLo);			Lo = DAG.getNode(N->getOpcode(), DL, LHSLo.getValueType(), LHSLo, RHSLo);
	Hi = DAG.getNode(ISD::FCOPYSIGN, DL, LHSHi.getValueType(), LHSHi, RHSHi);			Hi = DAG.getNode(N->getOpcode(), DL, LHSHi.getValueType(), LHSHi, RHSHi);
				} else {
				Lo = DAG.getNode(N->getOpcode(), DL, LHSLo.getValueType(), LHSLo, RHS);
				Hi = DAG.getNode(N->getOpcode(), DL, LHSHi.getValueType(), LHSHi, RHS);
				}
	}			}

	void DAGTypeLegalizer::SplitVecRes_IS_FPCLASS(SDNode *N, SDValue &Lo,			void DAGTypeLegalizer::SplitVecRes_IS_FPCLASS(SDNode *N, SDValue &Lo,
	SDValue &Hi) {			SDValue &Hi) {
	SDLoc DL(N);			SDLoc DL(N);
	SDValue ArgLo, ArgHi;			SDValue ArgLo, ArgHi;
	SDValue Test = N->getOperand(1);			SDValue Test = N->getOperand(1);
	SDValue FpValue = N->getOperand(0);			SDValue FpValue = N->getOperand(0);
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	case ISD::CONCAT_VECTORS: Res = SplitVecOp_CONCAT_VECTORS(N); break;			case ISD::CONCAT_VECTORS: Res = SplitVecOp_CONCAT_VECTORS(N); break;
	case ISD::VP_TRUNCATE:			case ISD::VP_TRUNCATE:
	case ISD::TRUNCATE:			case ISD::TRUNCATE:
	Res = SplitVecOp_TruncateHelper(N);			Res = SplitVecOp_TruncateHelper(N);
	break;			break;
	case ISD::STRICT_FP_ROUND:			case ISD::STRICT_FP_ROUND:
	case ISD::VP_FP_ROUND:			case ISD::VP_FP_ROUND:
	case ISD::FP_ROUND: Res = SplitVecOp_FP_ROUND(N); break;			case ISD::FP_ROUND: Res = SplitVecOp_FP_ROUND(N); break;
	case ISD::FCOPYSIGN: Res = SplitVecOp_FCOPYSIGN(N); break;			case ISD::FCOPYSIGN: Res = SplitVecOp_FPOpDifferentTypes(N); break;
	case ISD::STORE:			case ISD::STORE:
	Res = SplitVecOp_STORE(cast<StoreSDNode>(N), OpNo);			Res = SplitVecOp_STORE(cast<StoreSDNode>(N), OpNo);
	break;			break;
	case ISD::VP_STORE:			case ISD::VP_STORE:
	Res = SplitVecOp_VP_STORE(cast<VPStoreSDNode>(N), OpNo);			Res = SplitVecOp_VP_STORE(cast<VPStoreSDNode>(N), OpNo);
	break;			break;
	case ISD::EXPERIMENTAL_VP_STRIDED_STORE:			case ISD::EXPERIMENTAL_VP_STRIDED_STORE:
	Res = SplitVecOp_VP_STRIDED_STORE(cast<VPStridedStoreSDNode>(N), OpNo);			Res = SplitVecOp_VP_STRIDED_STORE(cast<VPStridedStoreSDNode>(N), OpNo);
	Show All 37 Lines
	case ISD::STRICT_FP_EXTEND:			case ISD::STRICT_FP_EXTEND:
	case ISD::FP_EXTEND:			case ISD::FP_EXTEND:
	case ISD::SIGN_EXTEND:			case ISD::SIGN_EXTEND:
	case ISD::ZERO_EXTEND:			case ISD::ZERO_EXTEND:
	case ISD::ANY_EXTEND:			case ISD::ANY_EXTEND:
	case ISD::FTRUNC:			case ISD::FTRUNC:
	Res = SplitVecOp_UnaryOp(N);			Res = SplitVecOp_UnaryOp(N);
	break;			break;
				case ISD::FLDEXP:
				Res = SplitVecOp_FPOpDifferentTypes(N);
				break;

	case ISD::ANY_EXTEND_VECTOR_INREG:			case ISD::ANY_EXTEND_VECTOR_INREG:
	case ISD::SIGN_EXTEND_VECTOR_INREG:			case ISD::SIGN_EXTEND_VECTOR_INREG:
	case ISD::ZERO_EXTEND_VECTOR_INREG:			case ISD::ZERO_EXTEND_VECTOR_INREG:
	Res = SplitVecOp_ExtVecInRegOp(N);			Res = SplitVecOp_ExtVecInRegOp(N);
	break;			break;

	case ISD::VECREDUCE_FADD:			case ISD::VECREDUCE_FADD:
	▲ Show 20 Lines • Show All 929 Lines • ▼ Show 20 Lines
	} else {			} else {
	Lo = DAG.getNode(ISD::FP_ROUND, DL, OutVT, Lo, N->getOperand(1));			Lo = DAG.getNode(ISD::FP_ROUND, DL, OutVT, Lo, N->getOperand(1));
	Hi = DAG.getNode(ISD::FP_ROUND, DL, OutVT, Hi, N->getOperand(1));			Hi = DAG.getNode(ISD::FP_ROUND, DL, OutVT, Hi, N->getOperand(1));
	}			}

	return DAG.getNode(ISD::CONCAT_VECTORS, DL, ResVT, Lo, Hi);			return DAG.getNode(ISD::CONCAT_VECTORS, DL, ResVT, Lo, Hi);
	}			}

	SDValue DAGTypeLegalizer::SplitVecOp_FCOPYSIGN(SDNode *N) {			// Split a vector type in an FP binary operation where the second operand has a
	// The result (and the first input) has a legal vector type, but the second			// different type from the first.
	// input needs splitting.			//
				// The result (and the first input) has a legal vector type, but the second
				// input needs splitting.
				SDValue DAGTypeLegalizer::SplitVecOp_FPOpDifferentTypes(SDNode *N) {
	SDLoc DL(N);			SDLoc DL(N);

	EVT LHSLoVT, LHSHiVT;			EVT LHSLoVT, LHSHiVT;
	std::tie(LHSLoVT, LHSHiVT) = DAG.GetSplitDestVTs(N->getValueType(0));			std::tie(LHSLoVT, LHSHiVT) = DAG.GetSplitDestVTs(N->getValueType(0));

	if (!isTypeLegal(LHSLoVT) \|\| !isTypeLegal(LHSHiVT))			if (!isTypeLegal(LHSLoVT) \|\| !isTypeLegal(LHSHiVT))
	return DAG.UnrollVectorOp(N, N->getValueType(0).getVectorNumElements());			return DAG.UnrollVectorOp(N, N->getValueType(0).getVectorNumElements());

	SDValue LHSLo, LHSHi;			SDValue LHSLo, LHSHi;
	std::tie(LHSLo, LHSHi) =			std::tie(LHSLo, LHSHi) =
	DAG.SplitVector(N->getOperand(0), DL, LHSLoVT, LHSHiVT);			DAG.SplitVector(N->getOperand(0), DL, LHSLoVT, LHSHiVT);

	SDValue RHSLo, RHSHi;			SDValue RHSLo, RHSHi;
	std::tie(RHSLo, RHSHi) = DAG.SplitVector(N->getOperand(1), DL);			std::tie(RHSLo, RHSHi) = DAG.SplitVector(N->getOperand(1), DL);

	SDValue Lo = DAG.getNode(ISD::FCOPYSIGN, DL, LHSLoVT, LHSLo, RHSLo);			SDValue Lo = DAG.getNode(N->getOpcode(), DL, LHSLoVT, LHSLo, RHSLo);
	SDValue Hi = DAG.getNode(ISD::FCOPYSIGN, DL, LHSHiVT, LHSHi, RHSHi);			SDValue Hi = DAG.getNode(N->getOpcode(), DL, LHSHiVT, LHSHi, RHSHi);

	return DAG.getNode(ISD::CONCAT_VECTORS, DL, N->getValueType(0), Lo, Hi);			return DAG.getNode(ISD::CONCAT_VECTORS, DL, N->getValueType(0), Lo, Hi);
	}			}

	SDValue DAGTypeLegalizer::SplitVecOp_FP_TO_XINT_SAT(SDNode *N) {			SDValue DAGTypeLegalizer::SplitVecOp_FP_TO_XINT_SAT(SDNode *N) {
	EVT ResVT = N->getValueType(0);			EVT ResVT = N->getValueType(0);
	SDValue Lo, Hi;			SDValue Lo, Hi;
	SDLoc dl(N);			SDLoc dl(N);
	▲ Show 20 Lines • Show All 193 Lines • ▼ Show 20 Lines
	case ISD::FCOPYSIGN:			case ISD::FCOPYSIGN:
	Res = WidenVecRes_FCOPYSIGN(N);			Res = WidenVecRes_FCOPYSIGN(N);
	break;			break;

	case ISD::IS_FPCLASS:			case ISD::IS_FPCLASS:
	Res = WidenVecRes_IS_FPCLASS(N);			Res = WidenVecRes_IS_FPCLASS(N);
	break;			break;

				case ISD::FLDEXP:
	case ISD::FPOWI:			case ISD::FPOWI:
	Res = WidenVecRes_POWI(N);			Res = WidenVecRes_ExpOp(N);
	break;			break;

	case ISD::ANY_EXTEND_VECTOR_INREG:			case ISD::ANY_EXTEND_VECTOR_INREG:
	case ISD::SIGN_EXTEND_VECTOR_INREG:			case ISD::SIGN_EXTEND_VECTOR_INREG:
	case ISD::ZERO_EXTEND_VECTOR_INREG:			case ISD::ZERO_EXTEND_VECTOR_INREG:
	Res = WidenVecRes_EXTEND_VECTOR_INREG(N);			Res = WidenVecRes_EXTEND_VECTOR_INREG(N);
	break;			break;

	▲ Show 20 Lines • Show All 340 Lines • ▼ Show 20 Lines

	// The Chain is the first operand.			// The Chain is the first operand.
	InOps.push_back(N->getOperand(0));			InOps.push_back(N->getOperand(0));

	// Now process the remaining operands.			// Now process the remaining operands.
	for (unsigned i = 1; i < NumOpers; ++i) {			for (unsigned i = 1; i < NumOpers; ++i) {
	SDValue Oper = N->getOperand(i);			SDValue Oper = N->getOperand(i);

	if (Oper.getValueType().isVector()) {			EVT OpVT = Oper.getValueType();
	assert(Oper.getValueType() == N->getValueType(0) &&			if (OpVT.isVector()) {
	"Invalid operand type to widen!");			if (getTypeAction(OpVT) == TargetLowering::TypeWidenVector)
	Oper = GetWidenedVector(Oper);			Oper = GetWidenedVector(Oper);
				else {
				EVT WideOpVT =
				EVT::getVectorVT(*DAG.getContext(), OpVT.getVectorElementType(),
				WidenVT.getVectorElementCount());
				Oper = DAG.getNode(ISD::INSERT_SUBVECTOR, dl, WideOpVT,
				DAG.getUNDEF(WideOpVT), Oper,
				DAG.getVectorIdxConstant(0, dl));
				}
	}			}

	InOps.push_back(Oper);			InOps.push_back(Oper);
	}			}

	// NumElts := greatest legal vector size (at most WidenVT)			// NumElts := greatest legal vector size (at most WidenVT)
	// while (orig. vector has unhandled elements) {			// while (orig. vector has unhandled elements) {
	// take munches of size NumElts from the beginning and add to ConcatOps			// take munches of size NumElts from the beginning and add to ConcatOps
	// NumElts := next smaller supported vector size or 1			// NumElts := next smaller supported vector size or 1
	// }			// }
	while (CurNumElts != 0) {			while (CurNumElts != 0) {
	while (CurNumElts >= NumElts) {			while (CurNumElts >= NumElts) {
	SmallVector<SDValue, 4> EOps;			SmallVector<SDValue, 4> EOps;

	for (unsigned i = 0; i < NumOpers; ++i) {			for (unsigned i = 0; i < NumOpers; ++i) {
	SDValue Op = InOps[i];			SDValue Op = InOps[i];

	if (Op.getValueType().isVector())			EVT OpVT = Op.getValueType();
	Op = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, VT, Op,			if (OpVT.isVector()) {
				EVT OpExtractVT =
				EVT::getVectorVT(*DAG.getContext(), OpVT.getVectorElementType(),
				VT.getVectorElementCount());
				Op = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, OpExtractVT, Op,
	DAG.getVectorIdxConstant(Idx, dl));			DAG.getVectorIdxConstant(Idx, dl));
				}

	EOps.push_back(Op);			EOps.push_back(Op);
	}			}

	EVT OperVT[] = {VT, MVT::Other};			EVT OperVT[] = {VT, MVT::Other};
	SDValue Oper = DAG.getNode(Opcode, dl, OperVT, EOps);			SDValue Oper = DAG.getNode(Opcode, dl, OperVT, EOps);
	ConcatOps[ConcatEnd++] = Oper;			ConcatOps[ConcatEnd++] = Oper;
	Chains.push_back(Oper.getValue(1));			Chains.push_back(Oper.getValue(1));
	Idx += NumElts;			Idx += NumElts;
	CurNumElts -= NumElts;			CurNumElts -= NumElts;
	}			}
	do {			do {
	NumElts = NumElts / 2;			NumElts = NumElts / 2;
	VT = EVT::getVectorVT(*DAG.getContext(), WidenEltVT, NumElts);			VT = EVT::getVectorVT(*DAG.getContext(), WidenEltVT, NumElts);
	} while (!TLI.isTypeLegal(VT) && NumElts != 1);			} while (!TLI.isTypeLegal(VT) && NumElts != 1);

	if (NumElts == 1) {			if (NumElts == 1) {
	for (unsigned i = 0; i != CurNumElts; ++i, ++Idx) {			for (unsigned i = 0; i != CurNumElts; ++i, ++Idx) {
	SmallVector<SDValue, 4> EOps;			SmallVector<SDValue, 4> EOps;

	for (unsigned i = 0; i < NumOpers; ++i) {			for (unsigned i = 0; i < NumOpers; ++i) {
	SDValue Op = InOps[i];			SDValue Op = InOps[i];

	if (Op.getValueType().isVector())			EVT OpVT = Op.getValueType();
	Op = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, WidenEltVT, Op,			if (OpVT.isVector())
				Op = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl,
				OpVT.getVectorElementType(), Op,
	DAG.getVectorIdxConstant(Idx, dl));			DAG.getVectorIdxConstant(Idx, dl));

	EOps.push_back(Op);			EOps.push_back(Op);
	}			}

	EVT WidenVT[] = {WidenEltVT, MVT::Other};			EVT WidenVT[] = {WidenEltVT, MVT::Other};
	SDValue Oper = DAG.getNode(Opcode, dl, WidenVT, EOps);			SDValue Oper = DAG.getNode(Opcode, dl, WidenVT, EOps);
	ConcatOps[ConcatEnd++] = Oper;			ConcatOps[ConcatEnd++] = Oper;
	▲ Show 20 Lines • Show All 292 Lines • ▼ Show 20 Lines
	EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));			EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
	if (getTypeAction(FpValue.getValueType()) != TargetLowering::TypeWidenVector)			if (getTypeAction(FpValue.getValueType()) != TargetLowering::TypeWidenVector)
	return DAG.UnrollVectorOp(N, WidenVT.getVectorNumElements());			return DAG.UnrollVectorOp(N, WidenVT.getVectorNumElements());
	SDValue Arg = GetWidenedVector(FpValue);			SDValue Arg = GetWidenedVector(FpValue);
	return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, {Arg, N->getOperand(1)},			return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, {Arg, N->getOperand(1)},
	N->getFlags());			N->getFlags());
	}			}

	SDValue DAGTypeLegalizer::WidenVecRes_POWI(SDNode *N) {			SDValue DAGTypeLegalizer::WidenVecRes_ExpOp(SDNode *N) {
	EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));			EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
	SDValue InOp = GetWidenedVector(N->getOperand(0));			SDValue InOp = GetWidenedVector(N->getOperand(0));
	SDValue ShOp = N->getOperand(1);			SDValue RHS = N->getOperand(1);
	return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp, ShOp);			SDValue ExpOp = RHS.getValueType().isVector() ? GetWidenedVector(RHS) : RHS;

				return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp, ExpOp);
	}			}

	SDValue DAGTypeLegalizer::WidenVecRes_Unary(SDNode *N) {			SDValue DAGTypeLegalizer::WidenVecRes_Unary(SDNode *N) {
	// Unary op widening.			// Unary op widening.
	EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));			EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
	SDValue InOp = GetWidenedVector(N->getOperand(0));			SDValue InOp = GetWidenedVector(N->getOperand(0));
	if (N->getNumOperands() == 1)			if (N->getNumOperands() == 1)
	return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp);			return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp);
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	case ISD::FEXP:			case ISD::FEXP:
	case ISD::FEXP2:			case ISD::FEXP2:
	case ISD::FTRUNC:			case ISD::FTRUNC:
	case ISD::FFLOOR:			case ISD::FFLOOR:
	case ISD::FCEIL:			case ISD::FCEIL:
	case ISD::FROUND:			case ISD::FROUND:
	case ISD::FROUNDEVEN:			case ISD::FROUNDEVEN:
	case ISD::FRINT:			case ISD::FRINT:
	case ISD::FNEARBYINT: {			case ISD::FNEARBYINT:
				case ISD::FLDEXP: {
	if (SNaN)			if (SNaN)
	return true;			return true;
	return isKnownNeverNaN(Op.getOperand(0), SNaN, Depth + 1);			return isKnownNeverNaN(Op.getOperand(0), SNaN, Depth + 1);
	}			}
	case ISD::FABS:			case ISD::FABS:
	case ISD::FNEG:			case ISD::FNEG:
	case ISD::FCOPYSIGN: {			case ISD::FCOPYSIGN: {
	return isKnownNeverNaN(Op.getOperand(0), SNaN, Depth + 1);			return isKnownNeverNaN(Op.getOperand(0), SNaN, Depth + 1);
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/SelectionDAGBuilder.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	getValue(I.getArgOperand(1)), Flags));			getValue(I.getArgOperand(1)), Flags));
	return;			return;
	case Intrinsic::copysign:			case Intrinsic::copysign:
	setValue(&I, DAG.getNode(ISD::FCOPYSIGN, sdl,			setValue(&I, DAG.getNode(ISD::FCOPYSIGN, sdl,
	getValue(I.getArgOperand(0)).getValueType(),			getValue(I.getArgOperand(0)).getValueType(),
	getValue(I.getArgOperand(0)),			getValue(I.getArgOperand(0)),
	getValue(I.getArgOperand(1)), Flags));			getValue(I.getArgOperand(1)), Flags));
	return;			return;
				case Intrinsic::ldexp:
				setValue(&I, DAG.getNode(ISD::FLDEXP, sdl,
				getValue(I.getArgOperand(0)).getValueType(),
				getValue(I.getArgOperand(0)),
				getValue(I.getArgOperand(1)), Flags));
				return;
	case Intrinsic::arithmetic_fence: {			case Intrinsic::arithmetic_fence: {
	setValue(&I, DAG.getNode(ISD::ARITH_FENCE, sdl,			setValue(&I, DAG.getNode(ISD::ARITH_FENCE, sdl,
	getValue(I.getArgOperand(0)).getValueType(),			getValue(I.getArgOperand(0)).getValueType(),
	getValue(I.getArgOperand(0)), Flags));			getValue(I.getArgOperand(0)), Flags));
	return;			return;
	}			}
	case Intrinsic::fma:			case Intrinsic::fma:
	setValue(&I, DAG.getNode(			setValue(&I, DAG.getNode(
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	return;			return;
	break;			break;
	case LibFunc_exp2:			case LibFunc_exp2:
	case LibFunc_exp2f:			case LibFunc_exp2f:
	case LibFunc_exp2l:			case LibFunc_exp2l:
	if (visitUnaryFloatCall(I, ISD::FEXP2))			if (visitUnaryFloatCall(I, ISD::FEXP2))
	return;			return;
	break;			break;
				case LibFunc_ldexp:
				case LibFunc_ldexpf:
				case LibFunc_ldexpl:
				if (visitBinaryFloatCall(I, ISD::FLDEXP))
				return;
				break;
	case LibFunc_memcmp:			case LibFunc_memcmp:
	if (visitMemCmpBCmpCall(I))			if (visitMemCmpBCmpCall(I))
	return;			return;
	break;			break;
	case LibFunc_mempcpy:			case LibFunc_mempcpy:
	if (visitMemPCpyCall(I))			if (visitMemPCpyCall(I))
	return;			return;
	break;			break;
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp

Show First 20 Lines • Show All 277 Lines • ▼ Show 20 Lines	#endif
case ISD::IS_FPCLASS: return "is_fpclass";		case ISD::IS_FPCLASS: return "is_fpclass";
case ISD::FPOW: return "fpow";		case ISD::FPOW: return "fpow";
case ISD::STRICT_FPOW: return "strict_fpow";		case ISD::STRICT_FPOW: return "strict_fpow";
case ISD::SMIN: return "smin";		case ISD::SMIN: return "smin";
case ISD::SMAX: return "smax";		case ISD::SMAX: return "smax";
case ISD::UMIN: return "umin";		case ISD::UMIN: return "umin";
case ISD::UMAX: return "umax";		case ISD::UMAX: return "umax";

		case ISD::FLDEXP: return "fldexp";
		case ISD::STRICT_FLDEXP: return "strict_fldexp";
case ISD::FPOWI: return "fpowi";		case ISD::FPOWI: return "fpowi";
case ISD::STRICT_FPOWI: return "strict_fpowi";		case ISD::STRICT_FPOWI: return "strict_fpowi";
case ISD::SETCC: return "setcc";		case ISD::SETCC: return "setcc";
case ISD::SETCCCARRY: return "setcccarry";		case ISD::SETCCCARRY: return "setcccarry";
case ISD::STRICT_FSETCC: return "strict_fsetcc";		case ISD::STRICT_FSETCC: return "strict_fsetcc";
case ISD::STRICT_FSETCCS: return "strict_fsetccs";		case ISD::STRICT_FSETCCS: return "strict_fsetccs";
case ISD::SELECT: return "select";		case ISD::SELECT: return "select";
case ISD::VSELECT: return "vselect";		case ISD::VSELECT: return "vselect";
▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/CodeGen/TargetLoweringBase.cpp

Show First 20 Lines • Show All 203 Lines • ▼ Show 20 Lines	#undef HANDLE_LIBCALL
if (TT.isPS()) {		if (TT.isPS()) {
setLibcallName(RTLIB::SINCOS_F32, "sincosf");		setLibcallName(RTLIB::SINCOS_F32, "sincosf");
setLibcallName(RTLIB::SINCOS_F64, "sincos");		setLibcallName(RTLIB::SINCOS_F64, "sincos");
}		}

if (TT.isOSOpenBSD()) {		if (TT.isOSOpenBSD()) {
setLibcallName(RTLIB::STACKPROTECTOR_CHECK_FAIL, nullptr);		setLibcallName(RTLIB::STACKPROTECTOR_CHECK_FAIL, nullptr);
}		}

		if (TT.isOSWindows() && !TT.isOSCygMing()) {
		setLibcallName(RTLIB::LDEXP_F32, nullptr);
		setLibcallName(RTLIB::LDEXP_F80, nullptr);
		setLibcallName(RTLIB::LDEXP_F128, nullptr);
		setLibcallName(RTLIB::LDEXP_PPCF128, nullptr);
		}
}		}

/// GetFPLibCall - Helper to return the right libcall for the given floating		/// GetFPLibCall - Helper to return the right libcall for the given floating
/// point type, or UNKNOWN_LIBCALL if there is none.		/// point type, or UNKNOWN_LIBCALL if there is none.
RTLIB::Libcall RTLIB::getFPLibCall(EVT VT,		RTLIB::Libcall RTLIB::getFPLibCall(EVT VT,
RTLIB::Libcall Call_F32,		RTLIB::Libcall Call_F32,
RTLIB::Libcall Call_F64,		RTLIB::Libcall Call_F64,
RTLIB::Libcall Call_F80,		RTLIB::Libcall Call_F80,
▲ Show 20 Lines • Show All 273 Lines • ▼ Show 20 Lines	RTLIB::Libcall RTLIB::getUINTTOFP(EVT OpVT, EVT RetVT) {
return UNKNOWN_LIBCALL;		return UNKNOWN_LIBCALL;
}		}

RTLIB::Libcall RTLIB::getPOWI(EVT RetVT) {		RTLIB::Libcall RTLIB::getPOWI(EVT RetVT) {
return getFPLibCall(RetVT, POWI_F32, POWI_F64, POWI_F80, POWI_F128,		return getFPLibCall(RetVT, POWI_F32, POWI_F64, POWI_F80, POWI_F128,
POWI_PPCF128);		POWI_PPCF128);
}		}

		RTLIB::Libcall RTLIB::getLDEXP(EVT RetVT) {
		return getFPLibCall(RetVT, LDEXP_F32, LDEXP_F64, LDEXP_F80, LDEXP_F128,
		LDEXP_PPCF128);
		}

RTLIB::Libcall RTLIB::getOUTLINE_ATOMIC(unsigned Opc, AtomicOrdering Order,		RTLIB::Libcall RTLIB::getOUTLINE_ATOMIC(unsigned Opc, AtomicOrdering Order,
MVT VT) {		MVT VT) {
unsigned ModeN, ModelN;		unsigned ModeN, ModelN;
switch (VT.SimpleTy) {		switch (VT.SimpleTy) {
case MVT::i8:		case MVT::i8:
ModeN = 0;		ModeN = 0;
break;		break;
case MVT::i16:		case MVT::i16:
▲ Show 20 Lines • Show All 331 Lines • ▼ Show 20 Lines	for (MVT VT : MVT::all_valuetypes()) {

// These default to Expand so they will be expanded to CTLZ/CTTZ by default.		// These default to Expand so they will be expanded to CTLZ/CTTZ by default.
setOperationAction({ISD::CTLZ_ZERO_UNDEF, ISD::CTTZ_ZERO_UNDEF}, VT,		setOperationAction({ISD::CTLZ_ZERO_UNDEF, ISD::CTTZ_ZERO_UNDEF}, VT,
Expand);		Expand);

setOperationAction({ISD::BITREVERSE, ISD::PARITY}, VT, Expand);		setOperationAction({ISD::BITREVERSE, ISD::PARITY}, VT, Expand);

// These library functions default to expand.		// These library functions default to expand.
setOperationAction({ISD::FROUND, ISD::FROUNDEVEN, ISD::FPOWI}, VT, Expand);		setOperationAction({ISD::FROUND, ISD::FROUNDEVEN, ISD::FPOWI, ISD::FLDEXP},
		VT, Expand);

// These operations default to expand for vector types.		// These operations default to expand for vector types.
if (VT.isVector())		if (VT.isVector())
setOperationAction({ISD::FCOPYSIGN, ISD::SIGN_EXTEND_INREG,		setOperationAction({ISD::FCOPYSIGN, ISD::SIGN_EXTEND_INREG,
ISD::ANY_EXTEND_VECTOR_INREG,		ISD::ANY_EXTEND_VECTOR_INREG,
ISD::SIGN_EXTEND_VECTOR_INREG,		ISD::SIGN_EXTEND_VECTOR_INREG,
ISD::ZERO_EXTEND_VECTOR_INREG, ISD::SPLAT_VECTOR},		ISD::ZERO_EXTEND_VECTOR_INREG, ISD::SPLAT_VECTOR},
VT, Expand);		VT, Expand);
▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUISelDAGToDAG.cpp

Show First 20 Lines • Show All 162 Lines • ▼ Show 20 Lines	bool AMDGPUDAGToDAGISel::fp16SrcZerosHighBits(unsigned Opc) const {
case ISD::FCEIL:		case ISD::FCEIL:
case ISD::FTRUNC:		case ISD::FTRUNC:
case ISD::FRINT:		case ISD::FRINT:
case ISD::FNEARBYINT:		case ISD::FNEARBYINT:
case ISD::FROUND:		case ISD::FROUND:
case ISD::FFLOOR:		case ISD::FFLOOR:
case ISD::FMINNUM:		case ISD::FMINNUM:
case ISD::FMAXNUM:		case ISD::FMAXNUM:
		case ISD::FLDEXP:
case AMDGPUISD::FRACT:		case AMDGPUISD::FRACT:
case AMDGPUISD::CLAMP:		case AMDGPUISD::CLAMP:
case AMDGPUISD::COS_HW:		case AMDGPUISD::COS_HW:
case AMDGPUISD::SIN_HW:		case AMDGPUISD::SIN_HW:
case AMDGPUISD::FMIN3:		case AMDGPUISD::FMIN3:
case AMDGPUISD::FMAX3:		case AMDGPUISD::FMAX3:
case AMDGPUISD::FMED3:		case AMDGPUISD::FMED3:
case AMDGPUISD::FMAD_FTZ:		case AMDGPUISD::FMAD_FTZ:
case AMDGPUISD::RCP:		case AMDGPUISD::RCP:
case AMDGPUISD::RSQ:		case AMDGPUISD::RSQ:
case AMDGPUISD::RCP_IFLAG:		case AMDGPUISD::RCP_IFLAG:
case AMDGPUISD::LDEXP:
// On gfx10, all 16-bit instructions preserve the high bits.		// On gfx10, all 16-bit instructions preserve the high bits.
return Subtarget->getGeneration() <= AMDGPUSubtarget::GFX9;		return Subtarget->getGeneration() <= AMDGPUSubtarget::GFX9;
case ISD::FP_ROUND:		case ISD::FP_ROUND:
// We may select fptrunc (fma/mad) to mad_mixlo, which does not zero the		// We may select fptrunc (fma/mad) to mad_mixlo, which does not zero the
// high bits on gfx9.		// high bits on gfx9.
// TODO: If we had the source node we could see if the source was fma/mad		// TODO: If we had the source node we could see if the source was fma/mad
return Subtarget->getGeneration() == AMDGPUSubtarget::VOLCANIC_ISLANDS;		return Subtarget->getGeneration() == AMDGPUSubtarget::VOLCANIC_ISLANDS;
case ISD::FMA:		case ISD::FMA:
▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.h

Show First 20 Lines • Show All 432 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
// RCP, RSQ - For f32, 1 ULP max error, no denormal handling.		// RCP, RSQ - For f32, 1 ULP max error, no denormal handling.
// For f64, max error 2^29 ULP, handles denormals.		// For f64, max error 2^29 ULP, handles denormals.
RCP,		RCP,
RSQ,		RSQ,
RCP_LEGACY,		RCP_LEGACY,
RCP_IFLAG,		RCP_IFLAG,
FMUL_LEGACY,		FMUL_LEGACY,
RSQ_CLAMP,		RSQ_CLAMP,
LDEXP,
FP_CLASS,		FP_CLASS,
DOT4,		DOT4,
CARRY,		CARRY,
BORROW,		BORROW,
BFE_U32, // Extract range of bits with zero extension to 32-bits.		BFE_U32, // Extract range of bits with zero extension to 32-bits.
BFE_I32, // Extract range of bits with sign extension to 32-bits.		BFE_I32, // Extract range of bits with sign extension to 32-bits.
BFI, // (src0 & src1) \| (~src0 & src2)		BFI, // (src0 & src1) \| (~src0 & src2)
BFM, // Insert a range of bits into a 32-bit word.		BFM, // Insert a range of bits into a 32-bit word.
▲ Show 20 Lines • Show All 115 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	SDValue FVal = DAG.getNode(Opc, SL, MVT::f32, Norm);			SDValue FVal = DAG.getNode(Opc, SL, MVT::f32, Norm);

	// Finally, need to scale back the converted floating number as the original			// Finally, need to scale back the converted floating number as the original
	// 64-bit integer is converted as a 32-bit one.			// 64-bit integer is converted as a 32-bit one.
	ShAmt = DAG.getNode(ISD::SUB, SL, MVT::i32, DAG.getConstant(32, SL, MVT::i32),			ShAmt = DAG.getNode(ISD::SUB, SL, MVT::i32, DAG.getConstant(32, SL, MVT::i32),
	ShAmt);			ShAmt);
	// On GCN, use LDEXP directly.			// On GCN, use LDEXP directly.
	if (Subtarget->isGCN())			if (Subtarget->isGCN())
	return DAG.getNode(AMDGPUISD::LDEXP, SL, MVT::f32, FVal, ShAmt);			return DAG.getNode(ISD::FLDEXP, SL, MVT::f32, FVal, ShAmt);

	// Otherwise, align 'ShAmt' to the exponent part and add it into the exponent			// Otherwise, align 'ShAmt' to the exponent part and add it into the exponent
	// part directly to emulate the multiplication of 2^ShAmt. That 8-bit			// part directly to emulate the multiplication of 2^ShAmt. That 8-bit
	// exponent is enough to avoid overflowing into the sign bit.			// exponent is enough to avoid overflowing into the sign bit.
	SDValue Exp = DAG.getNode(ISD::SHL, SL, MVT::i32, ShAmt,			SDValue Exp = DAG.getNode(ISD::SHL, SL, MVT::i32, ShAmt,
	DAG.getConstant(23, SL, MVT::i32));			DAG.getConstant(23, SL, MVT::i32));
	SDValue IVal =			SDValue IVal =
	DAG.getNode(ISD::ADD, SL, MVT::i32,			DAG.getNode(ISD::ADD, SL, MVT::i32,
	Show All 16 Lines
	SDValue Lo, Hi;			SDValue Lo, Hi;
	std::tie(Lo, Hi) = split64BitValue(Src, DAG);			std::tie(Lo, Hi) = split64BitValue(Src, DAG);

	SDValue CvtHi = DAG.getNode(Signed ? ISD::SINT_TO_FP : ISD::UINT_TO_FP,			SDValue CvtHi = DAG.getNode(Signed ? ISD::SINT_TO_FP : ISD::UINT_TO_FP,
	SL, MVT::f64, Hi);			SL, MVT::f64, Hi);

	SDValue CvtLo = DAG.getNode(ISD::UINT_TO_FP, SL, MVT::f64, Lo);			SDValue CvtLo = DAG.getNode(ISD::UINT_TO_FP, SL, MVT::f64, Lo);

	SDValue LdExp = DAG.getNode(AMDGPUISD::LDEXP, SL, MVT::f64, CvtHi,			SDValue LdExp = DAG.getNode(ISD::FLDEXP, SL, MVT::f64, CvtHi,
	DAG.getConstant(32, SL, MVT::i32));			DAG.getConstant(32, SL, MVT::i32));
	// TODO: Should this propagate fast-math-flags?			// TODO: Should this propagate fast-math-flags?
	return DAG.getNode(ISD::FADD, SL, MVT::f64, LdExp, CvtLo);			return DAG.getNode(ISD::FADD, SL, MVT::f64, LdExp, CvtLo);
	}			}

	SDValue AMDGPUTargetLowering::LowerUINT_TO_FP(SDValue Op,			SDValue AMDGPUTargetLowering::LowerUINT_TO_FP(SDValue Op,
	SelectionDAG &DAG) const {			SelectionDAG &DAG) const {
	// TODO: Factor out code common with LowerSINT_TO_FP.			// TODO: Factor out code common with LowerSINT_TO_FP.
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	NODE_NAME_CASE(DIV_FIXUP)			NODE_NAME_CASE(DIV_FIXUP)
	NODE_NAME_CASE(FMAD_FTZ)			NODE_NAME_CASE(FMAD_FTZ)
	NODE_NAME_CASE(RCP)			NODE_NAME_CASE(RCP)
	NODE_NAME_CASE(RSQ)			NODE_NAME_CASE(RSQ)
	NODE_NAME_CASE(RCP_LEGACY)			NODE_NAME_CASE(RCP_LEGACY)
	NODE_NAME_CASE(RCP_IFLAG)			NODE_NAME_CASE(RCP_IFLAG)
	NODE_NAME_CASE(FMUL_LEGACY)			NODE_NAME_CASE(FMUL_LEGACY)
	NODE_NAME_CASE(RSQ_CLAMP)			NODE_NAME_CASE(RSQ_CLAMP)
	NODE_NAME_CASE(LDEXP)
	NODE_NAME_CASE(FP_CLASS)			NODE_NAME_CASE(FP_CLASS)
	NODE_NAME_CASE(DOT4)			NODE_NAME_CASE(DOT4)
	NODE_NAME_CASE(CARRY)			NODE_NAME_CASE(CARRY)
	NODE_NAME_CASE(BORROW)			NODE_NAME_CASE(BORROW)
	NODE_NAME_CASE(BFE_U32)			NODE_NAME_CASE(BFE_U32)
	NODE_NAME_CASE(BFE_I32)			NODE_NAME_CASE(BFE_I32)
	NODE_NAME_CASE(BFI)			NODE_NAME_CASE(BFI)
	NODE_NAME_CASE(BFM)			NODE_NAME_CASE(BFM)
	▲ Show 20 Lines • Show All 390 Lines • ▼ Show 20 Lines
	case AMDGPUISD::RCP_LEGACY:			case AMDGPUISD::RCP_LEGACY:
	case AMDGPUISD::RSQ_CLAMP: {			case AMDGPUISD::RSQ_CLAMP: {
	if (SNaN)			if (SNaN)
	return true;			return true;

	// TODO: Need is known positive check.			// TODO: Need is known positive check.
	return false;			return false;
	}			}
	case AMDGPUISD::LDEXP:			case ISD::FLDEXP:
	case AMDGPUISD::FRACT: {			case AMDGPUISD::FRACT: {
	if (SNaN)			if (SNaN)
	return true;			return true;
	return DAG.isKnownNeverNaN(Op.getOperand(0), SNaN, Depth + 1);			return DAG.isKnownNeverNaN(Op.getOperand(0), SNaN, Depth + 1);
	}			}
	case AMDGPUISD::DIV_SCALE:			case AMDGPUISD::DIV_SCALE:
	case AMDGPUISD::DIV_FMAS:			case AMDGPUISD::DIV_FMAS:
	case AMDGPUISD::DIV_FIXUP:			case AMDGPUISD::DIV_FIXUP:
	▲ Show 20 Lines • Show All 101 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUInstrInfo.td

	Show All 12 Lines
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// AMDGPU DAG Profiles			// AMDGPU DAG Profiles
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	def AMDGPUDTIntTernaryOp : SDTypeProfile<1, 3, [			def AMDGPUDTIntTernaryOp : SDTypeProfile<1, 3, [
	SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisInt<0>, SDTCisInt<3>			SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisInt<0>, SDTCisInt<3>
	]>;			]>;

	def AMDGPULdExpOp : SDTypeProfile<1, 2,
	[SDTCisSameAs<0, 1>, SDTCisFP<0>, SDTCisInt<2>]
	>;

	def AMDGPUFPClassOp : SDTypeProfile<1, 2,			def AMDGPUFPClassOp : SDTypeProfile<1, 2,
	[SDTCisInt<0>, SDTCisFP<1>, SDTCisInt<2>]			[SDTCisInt<0>, SDTCisFP<1>, SDTCisInt<2>]
	>;			>;

	def AMDGPUFPPackOp : SDTypeProfile<1, 2,			def AMDGPUFPPackOp : SDTypeProfile<1, 2,
	[SDTCisFP<1>, SDTCisSameAs<1, 2>]			[SDTCisFP<1>, SDTCisSameAs<1, 2>]
	>;			>;

	▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines

	def AMDGPUrcp_legacy_impl : SDNode<"AMDGPUISD::RCP_LEGACY", SDTFPUnaryOp>;			def AMDGPUrcp_legacy_impl : SDNode<"AMDGPUISD::RCP_LEGACY", SDTFPUnaryOp>;

	def AMDGPUrcp_iflag : SDNode<"AMDGPUISD::RCP_IFLAG", SDTFPUnaryOp>;			def AMDGPUrcp_iflag : SDNode<"AMDGPUISD::RCP_IFLAG", SDTFPUnaryOp>;

	// out = 1.0 / sqrt(a) result clamped to +/- max_float.			// out = 1.0 / sqrt(a) result clamped to +/- max_float.
	def AMDGPUrsq_clamp_impl : SDNode<"AMDGPUISD::RSQ_CLAMP", SDTFPUnaryOp>;			def AMDGPUrsq_clamp_impl : SDNode<"AMDGPUISD::RSQ_CLAMP", SDTFPUnaryOp>;

	def AMDGPUldexp_impl : SDNode<"AMDGPUISD::LDEXP", AMDGPULdExpOp>;

	def AMDGPUpkrtz_f16_f32_impl : SDNode<"AMDGPUISD::CVT_PKRTZ_F16_F32", AMDGPUFPPackOp>;			def AMDGPUpkrtz_f16_f32_impl : SDNode<"AMDGPUISD::CVT_PKRTZ_F16_F32", AMDGPUFPPackOp>;
	def AMDGPUpknorm_i16_f32_impl : SDNode<"AMDGPUISD::CVT_PKNORM_I16_F32", AMDGPUFPPackOp>;			def AMDGPUpknorm_i16_f32_impl : SDNode<"AMDGPUISD::CVT_PKNORM_I16_F32", AMDGPUFPPackOp>;
	def AMDGPUpknorm_u16_f32_impl : SDNode<"AMDGPUISD::CVT_PKNORM_U16_F32", AMDGPUFPPackOp>;			def AMDGPUpknorm_u16_f32_impl : SDNode<"AMDGPUISD::CVT_PKNORM_U16_F32", AMDGPUFPPackOp>;
	def AMDGPUpk_i16_i32_impl : SDNode<"AMDGPUISD::CVT_PK_I16_I32", AMDGPUIntPackOp>;			def AMDGPUpk_i16_i32_impl : SDNode<"AMDGPUISD::CVT_PK_I16_I32", AMDGPUIntPackOp>;
	def AMDGPUpk_u16_u32_impl : SDNode<"AMDGPUISD::CVT_PK_U16_U32", AMDGPUIntPackOp>;			def AMDGPUpk_u16_u32_impl : SDNode<"AMDGPUISD::CVT_PK_U16_U32", AMDGPUIntPackOp>;
	def AMDGPUfp_to_f16 : SDNode<"AMDGPUISD::FP_TO_FP16" , SDTFPToIntOp>;			def AMDGPUfp_to_f16 : SDNode<"AMDGPUISD::FP_TO_FP16" , SDTFPToIntOp>;


	▲ Show 20 Lines • Show All 243 Lines • ▼ Show 20 Lines

	def AMDGPUsin : PatFrags<(ops node:$src), [(int_amdgcn_sin node:$src),			def AMDGPUsin : PatFrags<(ops node:$src), [(int_amdgcn_sin node:$src),
	(AMDGPUsin_impl node:$src)]>;			(AMDGPUsin_impl node:$src)]>;
	def AMDGPUcos : PatFrags<(ops node:$src), [(int_amdgcn_cos node:$src),			def AMDGPUcos : PatFrags<(ops node:$src), [(int_amdgcn_cos node:$src),
	(AMDGPUcos_impl node:$src)]>;			(AMDGPUcos_impl node:$src)]>;
	def AMDGPUfract : PatFrags<(ops node:$src), [(int_amdgcn_fract node:$src),			def AMDGPUfract : PatFrags<(ops node:$src), [(int_amdgcn_fract node:$src),
	(AMDGPUfract_impl node:$src)]>;			(AMDGPUfract_impl node:$src)]>;

	def AMDGPUldexp : PatFrags<(ops node:$src0, node:$src1),
	[(int_amdgcn_ldexp node:$src0, node:$src1),
	(AMDGPUldexp_impl node:$src0, node:$src1)]>;

	def AMDGPUfp_class : PatFrags<(ops node:$src0, node:$src1),			def AMDGPUfp_class : PatFrags<(ops node:$src0, node:$src1),
	[(int_amdgcn_class node:$src0, node:$src1),			[(int_amdgcn_class node:$src0, node:$src1),
	(AMDGPUfp_class_impl node:$src0, node:$src1)]>;			(AMDGPUfp_class_impl node:$src0, node:$src1)]>;

	def AMDGPUfmed3 : PatFrags<(ops node:$src0, node:$src1, node:$src2),			def AMDGPUfmed3 : PatFrags<(ops node:$src0, node:$src1, node:$src2),
	[(int_amdgcn_fmed3 node:$src0, node:$src1, node:$src2),			[(int_amdgcn_fmed3 node:$src0, node:$src1, node:$src2),
	(AMDGPUfmed3_impl node:$src0, node:$src1, node:$src2)]>;			(AMDGPUfmed3_impl node:$src0, node:$src1, node:$src2)]>;

	▲ Show 20 Lines • Show All 79 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	.scalarize(0)			.scalarize(0)
	.clampScalar(0, S16, S64);			.clampScalar(0, S16, S64);

	if (ST.has16BitInsts()) {			if (ST.has16BitInsts()) {
	getActionDefinitionsBuilder({G_FSQRT, G_FFLOOR})			getActionDefinitionsBuilder({G_FSQRT, G_FFLOOR})
	.legalFor({S32, S64, S16})			.legalFor({S32, S64, S16})
	.scalarize(0)			.scalarize(0)
	.clampScalar(0, S16, S64);			.clampScalar(0, S16, S64);

				getActionDefinitionsBuilder({G_FLDEXP, G_STRICT_FLDEXP})
				.legalFor({{S32, S32}, {S64, S32}, {S16, S16}})
				.scalarize(0)
				.maxScalarIf(typeIs(0, S16), 1, S16)
				.clampScalar(1, S32, S32)
				.lower();
	} else {			} else {
	getActionDefinitionsBuilder(G_FSQRT)			getActionDefinitionsBuilder(G_FSQRT)
	.legalFor({S32, S64})			.legalFor({S32, S64})
	.scalarize(0)			.scalarize(0)
	.clampScalar(0, S32, S64);			.clampScalar(0, S32, S64);

	if (ST.hasFractBug()) {			if (ST.hasFractBug()) {
	getActionDefinitionsBuilder(G_FFLOOR)			getActionDefinitionsBuilder(G_FFLOOR)
	.customFor({S64})			.customFor({S64})
	.legalFor({S32, S64})			.legalFor({S32, S64})
	.scalarize(0)			.scalarize(0)
	.clampScalar(0, S32, S64);			.clampScalar(0, S32, S64);
	} else {			} else {
	getActionDefinitionsBuilder(G_FFLOOR)			getActionDefinitionsBuilder(G_FFLOOR)
	.legalFor({S32, S64})			.legalFor({S32, S64})
	.scalarize(0)			.scalarize(0)
	.clampScalar(0, S32, S64);			.clampScalar(0, S32, S64);
	}			}

				getActionDefinitionsBuilder({G_FLDEXP, G_STRICT_FLDEXP})
				.legalFor({{S32, S32}, {S64, S32}})
				.scalarize(0)
				.clampScalar(0, S32, S64)
				.clampScalar(1, S32, S32)
				.lower();
	}			}

	getActionDefinitionsBuilder(G_FPTRUNC)			getActionDefinitionsBuilder(G_FPTRUNC)
	.legalFor({{S32, S64}, {S16, S32}})			.legalFor({{S32, S64}, {S16, S32}})
	.scalarize(0)			.scalarize(0)
	.lower();			.lower();

	getActionDefinitionsBuilder(G_FPEXT)			getActionDefinitionsBuilder(G_FPEXT)
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	auto Unmerge = B.buildUnmerge({S32, S32}, Src);			auto Unmerge = B.buildUnmerge({S32, S32}, Src);
	auto ThirtyTwo = B.buildConstant(S32, 32);			auto ThirtyTwo = B.buildConstant(S32, 32);

	if (MRI.getType(Dst) == S64) {			if (MRI.getType(Dst) == S64) {
	auto CvtHi = Signed ? B.buildSITOFP(S64, Unmerge.getReg(1))			auto CvtHi = Signed ? B.buildSITOFP(S64, Unmerge.getReg(1))
	: B.buildUITOFP(S64, Unmerge.getReg(1));			: B.buildUITOFP(S64, Unmerge.getReg(1));

	auto CvtLo = B.buildUITOFP(S64, Unmerge.getReg(0));			auto CvtLo = B.buildUITOFP(S64, Unmerge.getReg(0));
	auto LdExp = B.buildIntrinsic(Intrinsic::amdgcn_ldexp, {S64}, false)			auto LdExp = B.buildFLdexp(S64, CvtHi, ThirtyTwo);
	.addUse(CvtHi.getReg(0))
	.addUse(ThirtyTwo.getReg(0));

	// TODO: Should this propagate fast-math-flags?			// TODO: Should this propagate fast-math-flags?
	B.buildFAdd(Dst, LdExp, CvtLo);			B.buildFAdd(Dst, LdExp, CvtLo);
	MI.eraseFromParent();			MI.eraseFromParent();
	return true;			return true;
	}			}

	assert(MRI.getType(Dst) == S32);			assert(MRI.getType(Dst) == S32);
	Show All 14 Lines
	} else			} else
	ShAmt = B.buildCTLZ(S32, Unmerge.getReg(1));			ShAmt = B.buildCTLZ(S32, Unmerge.getReg(1));
	auto Norm = B.buildShl(S64, Src, ShAmt);			auto Norm = B.buildShl(S64, Src, ShAmt);
	auto Unmerge2 = B.buildUnmerge({S32, S32}, Norm);			auto Unmerge2 = B.buildUnmerge({S32, S32}, Norm);
	auto Adjust = B.buildUMin(S32, One, Unmerge2.getReg(0));			auto Adjust = B.buildUMin(S32, One, Unmerge2.getReg(0));
	auto Norm2 = B.buildOr(S32, Unmerge2.getReg(1), Adjust);			auto Norm2 = B.buildOr(S32, Unmerge2.getReg(1), Adjust);
	auto FVal = Signed ? B.buildSITOFP(S32, Norm2) : B.buildUITOFP(S32, Norm2);			auto FVal = Signed ? B.buildSITOFP(S32, Norm2) : B.buildUITOFP(S32, Norm2);
	auto Scale = B.buildSub(S32, ThirtyTwo, ShAmt);			auto Scale = B.buildSub(S32, ThirtyTwo, ShAmt);
	B.buildIntrinsic(Intrinsic::amdgcn_ldexp, ArrayRef<Register>{Dst},			B.buildFLdexp(Dst, FVal, Scale);
	/HasSideEffects=/false)
	.addUse(FVal.getReg(0))
	.addUse(Scale.getReg(0));
	MI.eraseFromParent();			MI.eraseFromParent();
	return true;			return true;
	}			}

	// TODO: Copied from DAG implementation. Verify logic and document how this			// TODO: Copied from DAG implementation. Verify logic and document how this
	// actually works.			// actually works.
	bool AMDGPULegalizerInfo::legalizeFPTOI(MachineInstr &MI,			bool AMDGPULegalizerInfo::legalizeFPTOI(MachineInstr &MI,
	MachineRegisterInfo &MRI,			MachineRegisterInfo &MRI,
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	case AMDGPU::G_FCEIL:			case AMDGPU::G_FCEIL:
	case AMDGPU::G_FRINT:			case AMDGPU::G_FRINT:
	case AMDGPU::G_SITOFP:			case AMDGPU::G_SITOFP:
	case AMDGPU::G_UITOFP:			case AMDGPU::G_UITOFP:
	case AMDGPU::G_FPTRUNC:			case AMDGPU::G_FPTRUNC:
	case AMDGPU::G_FPEXT:			case AMDGPU::G_FPEXT:
	case AMDGPU::G_FEXP2:			case AMDGPU::G_FEXP2:
	case AMDGPU::G_FLOG2:			case AMDGPU::G_FLOG2:
				case AMDGPU::G_FLDEXP:
	case AMDGPU::G_FMINNUM:			case AMDGPU::G_FMINNUM:
	case AMDGPU::G_FMAXNUM:			case AMDGPU::G_FMAXNUM:
	case AMDGPU::G_FMINNUM_IEEE:			case AMDGPU::G_FMINNUM_IEEE:
	case AMDGPU::G_FMAXNUM_IEEE:			case AMDGPU::G_FMAXNUM_IEEE:
	case AMDGPU::G_FCANONICALIZE:			case AMDGPU::G_FCANONICALIZE:
	case AMDGPU::G_INTRINSIC_TRUNC:			case AMDGPU::G_INTRINSIC_TRUNC:
	case AMDGPU::G_STRICT_FADD:			case AMDGPU::G_STRICT_FADD:
	case AMDGPU::G_STRICT_FSUB:			case AMDGPU::G_STRICT_FSUB:
	case AMDGPU::G_STRICT_FMUL:			case AMDGPU::G_STRICT_FMUL:
	case AMDGPU::G_STRICT_FMA:			case AMDGPU::G_STRICT_FMA:
				case AMDGPU::G_STRICT_FLDEXP:
	case AMDGPU::G_BSWAP: // TODO: Somehow expand for scalar?			case AMDGPU::G_BSWAP: // TODO: Somehow expand for scalar?
	case AMDGPU::G_FSHR: // TODO: Expand for scalar			case AMDGPU::G_FSHR: // TODO: Expand for scalar
	case AMDGPU::G_AMDGPU_FMIN_LEGACY:			case AMDGPU::G_AMDGPU_FMIN_LEGACY:
	case AMDGPU::G_AMDGPU_FMAX_LEGACY:			case AMDGPU::G_AMDGPU_FMAX_LEGACY:
	case AMDGPU::G_AMDGPU_RCP_IFLAG:			case AMDGPU::G_AMDGPU_RCP_IFLAG:
	case AMDGPU::G_AMDGPU_CVT_F32_UBYTE0:			case AMDGPU::G_AMDGPU_CVT_F32_UBYTE0:
	case AMDGPU::G_AMDGPU_CVT_F32_UBYTE1:			case AMDGPU::G_AMDGPU_CVT_F32_UBYTE1:
	case AMDGPU::G_AMDGPU_CVT_F32_UBYTE2:			case AMDGPU::G_AMDGPU_CVT_F32_UBYTE2:
	▲ Show 20 Lines • Show All 447 Lines • ▼ Show 20 Lines
	case Intrinsic::amdgcn_rcp:			case Intrinsic::amdgcn_rcp:
	case Intrinsic::amdgcn_rcp_legacy:			case Intrinsic::amdgcn_rcp_legacy:
	case Intrinsic::amdgcn_sqrt:			case Intrinsic::amdgcn_sqrt:
	case Intrinsic::amdgcn_rsq:			case Intrinsic::amdgcn_rsq:
	case Intrinsic::amdgcn_rsq_legacy:			case Intrinsic::amdgcn_rsq_legacy:
	case Intrinsic::amdgcn_rsq_clamp:			case Intrinsic::amdgcn_rsq_clamp:
	case Intrinsic::amdgcn_fmul_legacy:			case Intrinsic::amdgcn_fmul_legacy:
	case Intrinsic::amdgcn_fma_legacy:			case Intrinsic::amdgcn_fma_legacy:
	case Intrinsic::amdgcn_ldexp:
	case Intrinsic::amdgcn_frexp_mant:			case Intrinsic::amdgcn_frexp_mant:
	case Intrinsic::amdgcn_frexp_exp:			case Intrinsic::amdgcn_frexp_exp:
	case Intrinsic::amdgcn_fract:			case Intrinsic::amdgcn_fract:
	case Intrinsic::amdgcn_cvt_pkrtz:			case Intrinsic::amdgcn_cvt_pkrtz:
	case Intrinsic::amdgcn_cvt_pknorm_i16:			case Intrinsic::amdgcn_cvt_pknorm_i16:
	case Intrinsic::amdgcn_cvt_pknorm_u16:			case Intrinsic::amdgcn_cvt_pknorm_u16:
	case Intrinsic::amdgcn_cvt_pk_i16:			case Intrinsic::amdgcn_cvt_pk_i16:
	case Intrinsic::amdgcn_cvt_pk_u16:			case Intrinsic::amdgcn_cvt_pk_u16:
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIISelLowering.h

Show First 20 Lines • Show All 135 Lines • ▼ Show 20 Lines	private:

SDValue convertArgType(		SDValue convertArgType(
SelectionDAG &DAG, EVT VT, EVT MemVT, const SDLoc &SL, SDValue Val,		SelectionDAG &DAG, EVT VT, EVT MemVT, const SDLoc &SL, SDValue Val,
bool Signed, const ISD::InputArg *Arg = nullptr) const;		bool Signed, const ISD::InputArg *Arg = nullptr) const;

/// Custom lowering for ISD::FP_ROUND for MVT::f16.		/// Custom lowering for ISD::FP_ROUND for MVT::f16.
SDValue lowerFP_ROUND(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFP_ROUND(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFMINNUM_FMAXNUM(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFMINNUM_FMAXNUM(SDValue Op, SelectionDAG &DAG) const;
		SDValue lowerFLDEXP(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerXMULO(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerXMULO(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerXMUL_LOHI(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerXMUL_LOHI(SDValue Op, SelectionDAG &DAG) const;

SDValue getSegmentAperture(unsigned AS, const SDLoc &DL,		SDValue getSegmentAperture(unsigned AS, const SDLoc &DL,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;

SDValue lowerADDRSPACECAST(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerADDRSPACECAST(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerINSERT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerINSERT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;
▲ Show 20 Lines • Show All 403 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIISelLowering.cpp

	Show First 20 Lines • Show All 464 Lines • ▼ Show 20 Lines

	if (Subtarget->haveRoundOpsF64())			if (Subtarget->haveRoundOpsF64())
	setOperationAction({ISD::FTRUNC, ISD::FCEIL, ISD::FRINT}, MVT::f64, Legal);			setOperationAction({ISD::FTRUNC, ISD::FCEIL, ISD::FRINT}, MVT::f64, Legal);
	else			else
	setOperationAction({ISD::FCEIL, ISD::FTRUNC, ISD::FRINT, ISD::FFLOOR},			setOperationAction({ISD::FCEIL, ISD::FTRUNC, ISD::FRINT, ISD::FFLOOR},
	MVT::f64, Custom);			MVT::f64, Custom);

	setOperationAction(ISD::FFLOOR, MVT::f64, Legal);			setOperationAction(ISD::FFLOOR, MVT::f64, Legal);
				setOperationAction({ISD::FLDEXP, ISD::STRICT_FLDEXP}, {MVT::f32, MVT::f64},
				Legal);

	setOperationAction({ISD::FSIN, ISD::FCOS, ISD::FDIV}, MVT::f32, Custom);			setOperationAction({ISD::FSIN, ISD::FCOS, ISD::FDIV}, MVT::f32, Custom);
	setOperationAction(ISD::FDIV, MVT::f64, Custom);			setOperationAction(ISD::FDIV, MVT::f64, Custom);

	setOperationAction(ISD::BF16_TO_FP, {MVT::i16, MVT::f32, MVT::f64}, Expand);			setOperationAction(ISD::BF16_TO_FP, {MVT::i16, MVT::f32, MVT::f64}, Expand);
	setOperationAction(ISD::FP_TO_BF16, {MVT::i16, MVT::f32, MVT::f64}, Expand);			setOperationAction(ISD::FP_TO_BF16, {MVT::i16, MVT::f32, MVT::f64}, Expand);

	if (Subtarget->has16BitInsts()) {			if (Subtarget->has16BitInsts()) {
	Show All 40 Lines
	setOperationAction({ISD::SINT_TO_FP, ISD::UINT_TO_FP}, MVT::i16, Custom);			setOperationAction({ISD::SINT_TO_FP, ISD::UINT_TO_FP}, MVT::i16, Custom);

	setOperationAction(			setOperationAction(
	{ISD::FP_TO_SINT, ISD::FP_TO_UINT, ISD::SINT_TO_FP, ISD::UINT_TO_FP},			{ISD::FP_TO_SINT, ISD::FP_TO_UINT, ISD::SINT_TO_FP, ISD::UINT_TO_FP},
	MVT::f16, Promote);			MVT::f16, Promote);

	// F16 - VOP2 Actions.			// F16 - VOP2 Actions.
	setOperationAction({ISD::BR_CC, ISD::SELECT_CC}, MVT::f16, Expand);			setOperationAction({ISD::BR_CC, ISD::SELECT_CC}, MVT::f16, Expand);
				setOperationAction({ISD::FLDEXP, ISD::STRICT_FLDEXP}, MVT::f16, Custom);
	setOperationAction(ISD::FDIV, MVT::f16, Custom);			setOperationAction(ISD::FDIV, MVT::f16, Custom);

	// F16 - VOP3 Actions.			// F16 - VOP3 Actions.
	setOperationAction(ISD::FMA, MVT::f16, Legal);			setOperationAction(ISD::FMA, MVT::f16, Legal);
	if (STI.hasMadF16())			if (STI.hasMadF16())
	setOperationAction(ISD::FMAD, MVT::f16, Legal);			setOperationAction(ISD::FMAD, MVT::f16, Legal);

	for (MVT VT : {MVT::v2i16, MVT::v2f16, MVT::v4i16, MVT::v4f16, MVT::v8i16,			for (MVT VT : {MVT::v2i16, MVT::v2f16, MVT::v4i16, MVT::v4f16, MVT::v8i16,
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	case ISD::FABS:			case ISD::FABS:
	case ISD::FNEG:			case ISD::FNEG:
	case ISD::FCANONICALIZE:			case ISD::FCANONICALIZE:
	case ISD::BSWAP:			case ISD::BSWAP:
	return splitUnaryVectorOp(Op, DAG);			return splitUnaryVectorOp(Op, DAG);
	case ISD::FMINNUM:			case ISD::FMINNUM:
	case ISD::FMAXNUM:			case ISD::FMAXNUM:
	return lowerFMINNUM_FMAXNUM(Op, DAG);			return lowerFMINNUM_FMAXNUM(Op, DAG);
				case ISD::FLDEXP:
				case ISD::STRICT_FLDEXP:
				return lowerFLDEXP(Op, DAG);
	case ISD::FMA:			case ISD::FMA:
	return splitTernaryVectorOp(Op, DAG);			return splitTernaryVectorOp(Op, DAG);
	case ISD::FP_TO_SINT:			case ISD::FP_TO_SINT:
	case ISD::FP_TO_UINT:			case ISD::FP_TO_UINT:
	return LowerFP_TO_INT(Op, DAG);			return LowerFP_TO_INT(Op, DAG);
	case ISD::SHL:			case ISD::SHL:
	case ISD::SRA:			case ISD::SRA:
	case ISD::SRL:			case ISD::SRL:
	▲ Show 20 Lines • Show All 602 Lines • ▼ Show 20 Lines
	if (IsIEEEMode)			if (IsIEEEMode)
	return expandFMINNUM_FMAXNUM(Op.getNode(), DAG);			return expandFMINNUM_FMAXNUM(Op.getNode(), DAG);

	if (VT == MVT::v4f16 \|\| VT == MVT::v8f16 \|\| VT == MVT::v16f16)			if (VT == MVT::v4f16 \|\| VT == MVT::v8f16 \|\| VT == MVT::v16f16)
	return splitBinaryVectorOp(Op, DAG);			return splitBinaryVectorOp(Op, DAG);
	return Op;			return Op;
	}			}

				SDValue SITargetLowering::lowerFLDEXP(SDValue Op, SelectionDAG &DAG) const {
				bool IsStrict = Op.getOpcode() == ISD::STRICT_FLDEXP;
				EVT VT = Op.getValueType();
				assert(VT == MVT::f16);

				SDValue Exp = Op.getOperand(IsStrict ? 2 : 1);
				EVT ExpVT = Exp.getValueType();
				if (ExpVT == MVT::i16)
				return Op;

				SDLoc DL(Op);

				// Correct the exponent type for f16 to i16.
				// Clamp the range of the exponent to the instruction's range.

				// TODO: This should be a generic narrowing legalization, and can easily be
				// for GlobalISel.

				SDValue MinExp = DAG.getConstant(minIntN(16), DL, ExpVT);
				SDValue ClampMin = DAG.getNode(ISD::SMAX, DL, ExpVT, Exp, MinExp);

				SDValue MaxExp = DAG.getConstant(maxIntN(16), DL, ExpVT);
				SDValue Clamp = DAG.getNode(ISD::SMIN, DL, ExpVT, ClampMin, MaxExp);

				SDValue TruncExp = DAG.getNode(ISD::TRUNCATE, DL, MVT::i16, Clamp);

				if (IsStrict) {
				return DAG.getNode(ISD::STRICT_FLDEXP, DL, {VT, MVT::Other},
				{Op.getOperand(0), Op.getOperand(1), TruncExp});
				}

				return DAG.getNode(ISD::FLDEXP, DL, VT, Op.getOperand(0), TruncExp);
				}

	SDValue SITargetLowering::lowerXMULO(SDValue Op, SelectionDAG &DAG) const {			SDValue SITargetLowering::lowerXMULO(SDValue Op, SelectionDAG &DAG) const {
	EVT VT = Op.getValueType();			EVT VT = Op.getValueType();
	SDLoc SL(Op);			SDLoc SL(Op);
	SDValue LHS = Op.getOperand(0);			SDValue LHS = Op.getOperand(0);
	SDValue RHS = Op.getOperand(1);			SDValue RHS = Op.getOperand(1);
	bool isSigned = Op.getOpcode() == ISD::SMULO;			bool isSigned = Op.getOpcode() == ISD::SMULO;

	if (ConstantSDNode *RHSC = isConstOrConstSplat(RHS)) {			if (ConstantSDNode *RHSC = isConstOrConstSplat(RHS)) {
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines

	case Intrinsic::amdgcn_log_clamp: {			case Intrinsic::amdgcn_log_clamp: {
	if (Subtarget->getGeneration() < AMDGPUSubtarget::VOLCANIC_ISLANDS)			if (Subtarget->getGeneration() < AMDGPUSubtarget::VOLCANIC_ISLANDS)
	return SDValue();			return SDValue();

	return emitRemovedIntrinsicError(DAG, DL, VT);			return emitRemovedIntrinsicError(DAG, DL, VT);
	}			}
	case Intrinsic::amdgcn_ldexp:			case Intrinsic::amdgcn_ldexp:
	return DAG.getNode(AMDGPUISD::LDEXP, DL, VT,			return DAG.getNode(ISD::FLDEXP, DL, VT, Op.getOperand(1), Op.getOperand(2));
	Op.getOperand(1), Op.getOperand(2));

	case Intrinsic::amdgcn_fract:			case Intrinsic::amdgcn_fract:
	return DAG.getNode(AMDGPUISD::FRACT, DL, VT, Op.getOperand(1));			return DAG.getNode(AMDGPUISD::FRACT, DL, VT, Op.getOperand(1));

	case Intrinsic::amdgcn_class:			case Intrinsic::amdgcn_class:
	return DAG.getNode(AMDGPUISD::FP_CLASS, DL, VT,			return DAG.getNode(AMDGPUISD::FP_CLASS, DL, VT,
	Op.getOperand(1), Op.getOperand(2));			Op.getOperand(1), Op.getOperand(2));
	case Intrinsic::amdgcn_div_fmas:			case Intrinsic::amdgcn_div_fmas:
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	case ISD::FFLOOR:			case ISD::FFLOOR:
	case ISD::FMA:			case ISD::FMA:
	case ISD::FMAD:			case ISD::FMAD:
	case ISD::FSQRT:			case ISD::FSQRT:
	case ISD::FDIV:			case ISD::FDIV:
	case ISD::FREM:			case ISD::FREM:
	case ISD::FP_ROUND:			case ISD::FP_ROUND:
	case ISD::FP_EXTEND:			case ISD::FP_EXTEND:
				case ISD::FLDEXP:
	case AMDGPUISD::FMUL_LEGACY:			case AMDGPUISD::FMUL_LEGACY:
	case AMDGPUISD::FMAD_FTZ:			case AMDGPUISD::FMAD_FTZ:
	case AMDGPUISD::RCP:			case AMDGPUISD::RCP:
	case AMDGPUISD::RSQ:			case AMDGPUISD::RSQ:
	case AMDGPUISD::RSQ_CLAMP:			case AMDGPUISD::RSQ_CLAMP:
	case AMDGPUISD::RCP_LEGACY:			case AMDGPUISD::RCP_LEGACY:
	case AMDGPUISD::RCP_IFLAG:			case AMDGPUISD::RCP_IFLAG:
	case AMDGPUISD::DIV_SCALE:			case AMDGPUISD::DIV_SCALE:
	case AMDGPUISD::DIV_FMAS:			case AMDGPUISD::DIV_FMAS:
	case AMDGPUISD::DIV_FIXUP:			case AMDGPUISD::DIV_FIXUP:
	case AMDGPUISD::FRACT:			case AMDGPUISD::FRACT:
	case AMDGPUISD::LDEXP:
	case AMDGPUISD::CVT_PKRTZ_F16_F32:			case AMDGPUISD::CVT_PKRTZ_F16_F32:
	case AMDGPUISD::CVT_F32_UBYTE0:			case AMDGPUISD::CVT_F32_UBYTE0:
	case AMDGPUISD::CVT_F32_UBYTE1:			case AMDGPUISD::CVT_F32_UBYTE1:
	case AMDGPUISD::CVT_F32_UBYTE2:			case AMDGPUISD::CVT_F32_UBYTE2:
	case AMDGPUISD::CVT_F32_UBYTE3:			case AMDGPUISD::CVT_F32_UBYTE3:
	return true;			return true;

	// It can/will be lowered or combined as a bit operation.			// It can/will be lowered or combined as a bit operation.
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines
	case ISD::SIGN_EXTEND_INREG:			case ISD::SIGN_EXTEND_INREG:
	return performSignExtendInRegCombine(N , DCI);			return performSignExtendInRegCombine(N , DCI);
	case AMDGPUISD::FP_CLASS:			case AMDGPUISD::FP_CLASS:
	return performClassCombine(N, DCI);			return performClassCombine(N, DCI);
	case ISD::FCANONICALIZE:			case ISD::FCANONICALIZE:
	return performFCanonicalizeCombine(N, DCI);			return performFCanonicalizeCombine(N, DCI);
	case AMDGPUISD::RCP:			case AMDGPUISD::RCP:
	return performRcpCombine(N, DCI);			return performRcpCombine(N, DCI);
				case ISD::FLDEXP:
	case AMDGPUISD::FRACT:			case AMDGPUISD::FRACT:
	case AMDGPUISD::RSQ:			case AMDGPUISD::RSQ:
	case AMDGPUISD::RCP_LEGACY:			case AMDGPUISD::RCP_LEGACY:
	case AMDGPUISD::RCP_IFLAG:			case AMDGPUISD::RCP_IFLAG:
	case AMDGPUISD::RSQ_CLAMP:			case AMDGPUISD::RSQ_CLAMP: {
	case AMDGPUISD::LDEXP: {
	// FIXME: This is probably wrong. If src is an sNaN, it won't be quieted			// FIXME: This is probably wrong. If src is an sNaN, it won't be quieted
	SDValue Src = N->getOperand(0);			SDValue Src = N->getOperand(0);
	if (Src.isUndef())			if (Src.isUndef())
	return Src;			return Src;
	break;			break;
	}			}
	case ISD::SINT_TO_FP:			case ISD::SINT_TO_FP:
	case ISD::UINT_TO_FP:			case ISD::UINT_TO_FP:
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/VOP2Instructions.td

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines

	let isReMaterializable = 1 in {			let isReMaterializable = 1 in {
	defm V_BFM_B32 : VOP2Inst <"v_bfm_b32", VOP_I32_I32_I32>;			defm V_BFM_B32 : VOP2Inst <"v_bfm_b32", VOP_I32_I32_I32>;
	defm V_BCNT_U32_B32 : VOP2Inst <"v_bcnt_u32_b32", VOP_I32_I32_I32, add_ctpop>;			defm V_BCNT_U32_B32 : VOP2Inst <"v_bcnt_u32_b32", VOP_I32_I32_I32, add_ctpop>;
	let IsNeverUniform = 1 in {			let IsNeverUniform = 1 in {
	defm V_MBCNT_LO_U32_B32 : VOP2Inst <"v_mbcnt_lo_u32_b32", VOP_I32_I32_I32, int_amdgcn_mbcnt_lo>;			defm V_MBCNT_LO_U32_B32 : VOP2Inst <"v_mbcnt_lo_u32_b32", VOP_I32_I32_I32, int_amdgcn_mbcnt_lo>;
	defm V_MBCNT_HI_U32_B32 : VOP2Inst <"v_mbcnt_hi_u32_b32", VOP_I32_I32_I32, int_amdgcn_mbcnt_hi>;			defm V_MBCNT_HI_U32_B32 : VOP2Inst <"v_mbcnt_hi_u32_b32", VOP_I32_I32_I32, int_amdgcn_mbcnt_hi>;
	} // End IsNeverUniform = 1			} // End IsNeverUniform = 1
	defm V_LDEXP_F32 : VOP2Inst <"v_ldexp_f32", VOP_F32_F32_I32, AMDGPUldexp>;			defm V_LDEXP_F32 : VOP2Inst <"v_ldexp_f32", VOP_F32_F32_I32, any_fldexp>;

	let ReadsModeReg = 0, mayRaiseFPException = 0 in {			let ReadsModeReg = 0, mayRaiseFPException = 0 in {
	defm V_CVT_PKNORM_I16_F32 : VOP2Inst <"v_cvt_pknorm_i16_f32", VOP_V2I16_F32_F32, AMDGPUpknorm_i16_f32>;			defm V_CVT_PKNORM_I16_F32 : VOP2Inst <"v_cvt_pknorm_i16_f32", VOP_V2I16_F32_F32, AMDGPUpknorm_i16_f32>;
	defm V_CVT_PKNORM_U16_F32 : VOP2Inst <"v_cvt_pknorm_u16_f32", VOP_V2I16_F32_F32, AMDGPUpknorm_u16_f32>;			defm V_CVT_PKNORM_U16_F32 : VOP2Inst <"v_cvt_pknorm_u16_f32", VOP_V2I16_F32_F32, AMDGPUpknorm_u16_f32>;
	}			}

	defm V_CVT_PKRTZ_F16_F32 : VOP2Inst <"v_cvt_pkrtz_f16_f32", VOP_V2F16_F32_F32, AMDGPUpkrtz_f16_f32>;			defm V_CVT_PKRTZ_F16_F32 : VOP2Inst <"v_cvt_pkrtz_f16_f32", VOP_V2F16_F32_F32, AMDGPUpkrtz_f16_f32>;
	defm V_CVT_PK_U16_U32 : VOP2Inst <"v_cvt_pk_u16_u32", VOP_V2I16_I32_I32, AMDGPUpk_u16_u32>;			defm V_CVT_PK_U16_U32 : VOP2Inst <"v_cvt_pk_u16_u32", VOP_V2I16_I32_I32, AMDGPUpk_u16_u32>;
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	def : divergent_i64_BinOp <and, V_AND_B32_e64>;			def : divergent_i64_BinOp <and, V_AND_B32_e64>;
	def : divergent_i64_BinOp <or, V_OR_B32_e64>;			def : divergent_i64_BinOp <or, V_OR_B32_e64>;
	def : divergent_i64_BinOp <xor, V_XOR_B32_e64>;			def : divergent_i64_BinOp <xor, V_XOR_B32_e64>;

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// 16-Bit Operand Instructions			// 16-Bit Operand Instructions
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	def LDEXP_F16_VOPProfile_True16 : VOPProfile_True16<VOP_F16_F16_I32> {			def LDEXP_F16_VOPProfile_True16 : VOPProfile_True16<VOP_F16_F16_I16> {
	// The ldexp.f16 intrinsic expects a i32 src1 operand, though the hardware			// The ldexp.f16 intrinsic expects a i32 src1 operand, though the hardware
	// encoding treats src1 as an f16			// encoding treats src1 as an f16
	let Src1RC32 = RegisterOperand<VGPR_32_Lo128>;			let Src1RC32 = RegisterOperand<VGPR_32_Lo128>;
	let Src1DPP = VGPR_32_Lo128;			let Src1DPP = VGPR_32_Lo128;
	let Src1ModDPP = IntT16VRegInputMods;			let Src1ModDPP = IntT16VRegInputMods;
	}			}

	let isReMaterializable = 1 in {			let isReMaterializable = 1 in {
	let FPDPRounding = 1 in {			let FPDPRounding = 1 in {
	let SubtargetPredicate = NotHasTrue16BitInsts, OtherPredicates = [Has16BitInsts] in			let SubtargetPredicate = NotHasTrue16BitInsts, OtherPredicates = [Has16BitInsts] in
	defm V_LDEXP_F16 : VOP2Inst <"v_ldexp_f16", VOP_F16_F16_I32, AMDGPUldexp>;			defm V_LDEXP_F16 : VOP2Inst <"v_ldexp_f16", VOP_F16_F16_I16, any_fldexp>;
	let SubtargetPredicate = HasTrue16BitInsts in			let SubtargetPredicate = HasTrue16BitInsts in
	defm V_LDEXP_F16_t16 : VOP2Inst <"v_ldexp_f16_t16", LDEXP_F16_VOPProfile_True16, AMDGPUldexp>;			defm V_LDEXP_F16_t16 : VOP2Inst <"v_ldexp_f16_t16", LDEXP_F16_VOPProfile_True16, any_fldexp>;
	} // End FPDPRounding = 1			} // End FPDPRounding = 1
	// FIXME VOP3 Only instructions. NFC using VOPProfile_True16 for these until a planned change to use a new register class for VOP3 encoded True16 instuctions			// FIXME VOP3 Only instructions. NFC using VOPProfile_True16 for these until a planned change to use a new register class for VOP3 encoded True16 instuctions
	defm V_LSHLREV_B16 : VOP2Inst_e64_t16 <"v_lshlrev_b16", VOP_I16_I16_I16, clshl_rev_16>;			defm V_LSHLREV_B16 : VOP2Inst_e64_t16 <"v_lshlrev_b16", VOP_I16_I16_I16, clshl_rev_16>;
	defm V_LSHRREV_B16 : VOP2Inst_e64_t16 <"v_lshrrev_b16", VOP_I16_I16_I16, clshr_rev_16>;			defm V_LSHRREV_B16 : VOP2Inst_e64_t16 <"v_lshrrev_b16", VOP_I16_I16_I16, clshr_rev_16>;
	defm V_ASHRREV_I16 : VOP2Inst_e64_t16 <"v_ashrrev_i16", VOP_I16_I16_I16, cashr_rev_16>;			defm V_ASHRREV_I16 : VOP2Inst_e64_t16 <"v_ashrrev_i16", VOP_I16_I16_I16, cashr_rev_16>;
	let isCommutable = 1 in {			let isCommutable = 1 in {
	let FPDPRounding = 1 in {			let FPDPRounding = 1 in {
	defm V_ADD_F16 : VOP2Inst_t16 <"v_add_f16", VOP_F16_F16_F16, any_fadd>;			defm V_ADD_F16 : VOP2Inst_t16 <"v_add_f16", VOP_F16_F16_F16, any_fadd>;
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/VOP3Instructions.td

Show First 20 Lines • Show All 213 Lines • ▼ Show 20 Lines	let isCommutable = 1 in {
defm V_SAD_U32 : VOP3Inst <"v_sad_u32", VOP3_Profile<VOP_I32_I32_I32_I32, VOP3_CLAMP>>;		defm V_SAD_U32 : VOP3Inst <"v_sad_u32", VOP3_Profile<VOP_I32_I32_I32_I32, VOP3_CLAMP>>;
} // End isCommutable = 1		} // End isCommutable = 1
defm V_CVT_PK_U8_F32 : VOP3Inst<"v_cvt_pk_u8_f32", VOP3_Profile<VOP_I32_F32_I32_I32>, int_amdgcn_cvt_pk_u8_f32>;		defm V_CVT_PK_U8_F32 : VOP3Inst<"v_cvt_pk_u8_f32", VOP3_Profile<VOP_I32_F32_I32_I32>, int_amdgcn_cvt_pk_u8_f32>;

defm V_DIV_FIXUP_F32 : VOP3Inst <"v_div_fixup_f32", DIV_FIXUP_F32_PROF, AMDGPUdiv_fixup>;		defm V_DIV_FIXUP_F32 : VOP3Inst <"v_div_fixup_f32", DIV_FIXUP_F32_PROF, AMDGPUdiv_fixup>;

let SchedRW = [WriteDoubleAdd], FPDPRounding = 1 in {		let SchedRW = [WriteDoubleAdd], FPDPRounding = 1 in {
defm V_DIV_FIXUP_F64 : VOP3Inst <"v_div_fixup_f64", VOP3_Profile<VOP_F64_F64_F64_F64>, AMDGPUdiv_fixup>;		defm V_DIV_FIXUP_F64 : VOP3Inst <"v_div_fixup_f64", VOP3_Profile<VOP_F64_F64_F64_F64>, AMDGPUdiv_fixup>;
defm V_LDEXP_F64 : VOP3Inst <"v_ldexp_f64", VOP3_Profile<VOP_F64_F64_I32>, AMDGPUldexp>;		defm V_LDEXP_F64 : VOP3Inst <"v_ldexp_f64", VOP3_Profile<VOP_F64_F64_I32>, any_fldexp>;
} // End SchedRW = [WriteDoubleAdd], FPDPRounding = 1		} // End SchedRW = [WriteDoubleAdd], FPDPRounding = 1
} // End isReMaterializable = 1		} // End isReMaterializable = 1


let mayRaiseFPException = 0 in { // Seems suspicious but manual doesn't say it does.		let mayRaiseFPException = 0 in { // Seems suspicious but manual doesn't say it does.
let SchedRW = [WriteFloatFMA, WriteSALU] in		let SchedRW = [WriteFloatFMA, WriteSALU] in
defm V_DIV_SCALE_F32 : VOP3Inst_Pseudo_Wrapper <"v_div_scale_f32", VOP3b_F32_I1_F32_F32_F32> ;		defm V_DIV_SCALE_F32 : VOP3Inst_Pseudo_Wrapper <"v_div_scale_f32", VOP3b_F32_I1_F32_F32_F32> ;

▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/Hexagon/HexagonISelLowering.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	ISD::AND, ISD::OR, ISD::XOR, ISD::ROTL, ISD::ROTR,			ISD::AND, ISD::OR, ISD::XOR, ISD::ROTL, ISD::ROTR,
	ISD::CTPOP, ISD::CTLZ, ISD::CTTZ, ISD::BSWAP, ISD::BITREVERSE,			ISD::CTPOP, ISD::CTLZ, ISD::CTTZ, ISD::BSWAP, ISD::BITREVERSE,
	// Floating point arithmetic/math functions:			// Floating point arithmetic/math functions:
	ISD::FADD, ISD::FSUB, ISD::FMUL, ISD::FMA, ISD::FDIV,			ISD::FADD, ISD::FSUB, ISD::FMUL, ISD::FMA, ISD::FDIV,
	ISD::FREM, ISD::FNEG, ISD::FABS, ISD::FSQRT, ISD::FSIN,			ISD::FREM, ISD::FNEG, ISD::FABS, ISD::FSQRT, ISD::FSIN,
	ISD::FCOS, ISD::FPOW, ISD::FLOG, ISD::FLOG2,			ISD::FCOS, ISD::FPOW, ISD::FLOG, ISD::FLOG2,
	ISD::FLOG10, ISD::FEXP, ISD::FEXP2, ISD::FCEIL, ISD::FTRUNC,			ISD::FLOG10, ISD::FEXP, ISD::FEXP2, ISD::FCEIL, ISD::FTRUNC,
	ISD::FRINT, ISD::FNEARBYINT, ISD::FROUND, ISD::FFLOOR,			ISD::FRINT, ISD::FNEARBYINT, ISD::FROUND, ISD::FFLOOR,
	ISD::FMINNUM, ISD::FMAXNUM, ISD::FSINCOS,			ISD::FMINNUM, ISD::FMAXNUM, ISD::FSINCOS, ISD::FLDEXP,
	// Misc:			// Misc:
	ISD::BR_CC, ISD::SELECT_CC, ISD::ConstantPool,			ISD::BR_CC, ISD::SELECT_CC, ISD::ConstantPool,
	// Vector:			// Vector:
	ISD::BUILD_VECTOR, ISD::SCALAR_TO_VECTOR,			ISD::BUILD_VECTOR, ISD::SCALAR_TO_VECTOR,
	ISD::EXTRACT_VECTOR_ELT, ISD::INSERT_VECTOR_ELT,			ISD::EXTRACT_VECTOR_ELT, ISD::INSERT_VECTOR_ELT,
	ISD::EXTRACT_SUBVECTOR, ISD::INSERT_SUBVECTOR,			ISD::EXTRACT_SUBVECTOR, ISD::INSERT_SUBVECTOR,
	ISD::CONCAT_VECTORS, ISD::VECTOR_SHUFFLE,			ISD::CONCAT_VECTORS, ISD::VECTOR_SHUFFLE,
	ISD::SPLAT_VECTOR,			ISD::SPLAT_VECTOR,
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	setOperationAction(ISD::FEXP2, VT, Expand);			setOperationAction(ISD::FEXP2, VT, Expand);
	setOperationAction(ISD::FSIN, VT, Expand);			setOperationAction(ISD::FSIN, VT, Expand);
	setOperationAction(ISD::FCOS, VT, Expand);			setOperationAction(ISD::FCOS, VT, Expand);
	setOperationAction(ISD::FABS, VT, Expand);			setOperationAction(ISD::FABS, VT, Expand);
	setOperationAction(ISD::FFLOOR, VT, Expand);			setOperationAction(ISD::FFLOOR, VT, Expand);
	setOperationAction(ISD::FCEIL, VT, Expand);			setOperationAction(ISD::FCEIL, VT, Expand);
	setOperationAction(ISD::FTRUNC, VT, Expand);			setOperationAction(ISD::FTRUNC, VT, Expand);
	setOperationAction(ISD::FRINT, VT, Expand);			setOperationAction(ISD::FRINT, VT, Expand);
				setOperationAction(ISD::FLDEXP, VT, Expand);
	setOperationAction(ISD::FNEARBYINT, VT, Expand);			setOperationAction(ISD::FNEARBYINT, VT, Expand);
	setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Expand);			setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Expand);
	setOperationAction(ISD::INSERT_VECTOR_ELT, VT, Expand);			setOperationAction(ISD::INSERT_VECTOR_ELT, VT, Expand);
	setOperationAction(ISD::BUILD_VECTOR, VT, Expand);			setOperationAction(ISD::BUILD_VECTOR, VT, Expand);
	setOperationAction(ISD::MULHU, VT, Expand);			setOperationAction(ISD::MULHU, VT, Expand);
	setOperationAction(ISD::MULHS, VT, Expand);			setOperationAction(ISD::MULHS, VT, Expand);
	setOperationAction(ISD::UMUL_LOHI, VT, Expand);			setOperationAction(ISD::UMUL_LOHI, VT, Expand);
	setOperationAction(ISD::SMUL_LOHI, VT, Expand);			setOperationAction(ISD::SMUL_LOHI, VT, Expand);
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86ISelLowering.cpp

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	setOperationAction(ISD::FRINT, VT, Action);			setOperationAction(ISD::FRINT, VT, Action);
	setOperationAction(ISD::BR_CC, VT, Action);			setOperationAction(ISD::BR_CC, VT, Action);
	setOperationAction(ISD::SETCC, VT, Action);			setOperationAction(ISD::SETCC, VT, Action);
	setOperationAction(ISD::SELECT, VT, Custom);			setOperationAction(ISD::SELECT, VT, Custom);
	setOperationAction(ISD::SELECT_CC, VT, Action);			setOperationAction(ISD::SELECT_CC, VT, Action);
	setOperationAction(ISD::FROUND, VT, Action);			setOperationAction(ISD::FROUND, VT, Action);
	setOperationAction(ISD::FROUNDEVEN, VT, Action);			setOperationAction(ISD::FROUNDEVEN, VT, Action);
	setOperationAction(ISD::FTRUNC, VT, Action);			setOperationAction(ISD::FTRUNC, VT, Action);
				setOperationAction(ISD::FLDEXP, VT, Action);
	};			};

	if (!Subtarget.useSoftFloat() && Subtarget.hasSSE2()) {			if (!Subtarget.useSoftFloat() && Subtarget.hasSSE2()) {
	// f16, f32 and f64 use SSE.			// f16, f32 and f64 use SSE.
	// Set up the FP register classes.			// Set up the FP register classes.
	addRegisterClass(MVT::f16, Subtarget.hasAVX512() ? &X86::FR16XRegClass			addRegisterClass(MVT::f16, Subtarget.hasAVX512() ? &X86::FR16XRegClass
	: &X86::FR16RegClass);			: &X86::FR16RegClass);
	addRegisterClass(MVT::f32, Subtarget.hasAVX512() ? &X86::FR32XRegClass			addRegisterClass(MVT::f32, Subtarget.hasAVX512() ? &X86::FR32XRegClass
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	setOperationAction(ISD::STRICT_FDIV, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FDIV, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FMA, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FMA, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FMINNUM, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FMINNUM, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FMAXNUM, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FMAXNUM, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FMINIMUM, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FMINIMUM, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FMAXIMUM, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FMAXIMUM, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FSQRT, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FSQRT, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FPOW, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FPOW, MVT::f16, Promote);
				setOperationAction(ISD::STRICT_FLDEXP, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FLOG, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FLOG, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FLOG2, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FLOG2, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FLOG10, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FLOG10, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FEXP, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FEXP, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FEXP2, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FEXP2, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FCEIL, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FCEIL, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FFLOOR, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FFLOOR, MVT::f16, Promote);
	setOperationAction(ISD::STRICT_FNEARBYINT, MVT::f16, Promote);			setOperationAction(ISD::STRICT_FNEARBYINT, MVT::f16, Promote);
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/GlobalISel/legalizer-info-validation.mir

	Show First 20 Lines • Show All 464 Lines • ▼ Show 20 Lines
	# DEBUG-NEXT: G_FLOG2 (opcode {{[0-9]+}}): 1 type index, 0 imm indices			# DEBUG-NEXT: G_FLOG2 (opcode {{[0-9]+}}): 1 type index, 0 imm indices
	# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}			# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}
	# DEBUG-NEXT: .. the first uncovered type index: 1, OK			# DEBUG-NEXT: .. the first uncovered type index: 1, OK
	# DEBUG-NEXT: .. the first uncovered imm index: 0, OK			# DEBUG-NEXT: .. the first uncovered imm index: 0, OK
	# DEBUG-NEXT: G_FLOG10 (opcode {{[0-9]+}}): 1 type index, 0 imm indices			# DEBUG-NEXT: G_FLOG10 (opcode {{[0-9]+}}): 1 type index, 0 imm indices
	# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}			# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}
	# DEBUG-NEXT: .. the first uncovered type index: 1, OK			# DEBUG-NEXT: .. the first uncovered type index: 1, OK
	# DEBUG-NEXT: .. the first uncovered imm index: 0, OK			# DEBUG-NEXT: .. the first uncovered imm index: 0, OK
				# DEBUG-NEXT: G_FLDEXP (opcode {{[0-9]+}}): 2 type indices, 0 imm indices
				# DEBUG-NEXT:.. type index coverage check SKIPPED: no rules defined
				# DEBUG-NEXT:.. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_FNEG (opcode {{[0-9]+}}): 1 type index, 0 imm indices			# DEBUG-NEXT: G_FNEG (opcode {{[0-9]+}}): 1 type index, 0 imm indices
	# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}			# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}
	# DEBUG-NEXT: .. the first uncovered type index: 1, OK			# DEBUG-NEXT: .. the first uncovered type index: 1, OK
	# DEBUG-NEXT: .. the first uncovered imm index: 0, OK			# DEBUG-NEXT: .. the first uncovered imm index: 0, OK
	# DEBUG-NEXT: G_FPEXT (opcode {{[0-9]+}}): 2 type indices, 0 imm indices			# DEBUG-NEXT: G_FPEXT (opcode {{[0-9]+}}): 2 type indices, 0 imm indices
	# DEBUG-NEXT: .. the first uncovered type index: 2, OK			# DEBUG-NEXT: .. the first uncovered type index: 2, OK
	# DEBUG-NEXT: .. the first uncovered imm index: 0, OK			# DEBUG-NEXT: .. the first uncovered imm index: 0, OK
	# DEBUG-NEXT: G_FPTRUNC (opcode {{[0-9]+}}): 2 type indices, 0 imm indices			# DEBUG-NEXT: G_FPTRUNC (opcode {{[0-9]+}}): 2 type indices, 0 imm indices
	▲ Show 20 Lines • Show All 167 Lines • ▼ Show 20 Lines
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_STRICT_FMA (opcode {{[0-9]+}}): 1 type index, 0 imm indices			# DEBUG-NEXT: G_STRICT_FMA (opcode {{[0-9]+}}): 1 type index, 0 imm indices
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_STRICT_FSQRT (opcode {{[0-9]+}}): 1 type index, 0 imm indices			# DEBUG-NEXT: G_STRICT_FSQRT (opcode {{[0-9]+}}): 1 type index, 0 imm indices
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
				# DEBUG-NEXT: G_STRICT_FLDEXP (opcode {{[0-9]+}}): 2 type indices, 0 imm indices
				# DEBUG-NEXT:.. type index coverage check SKIPPED: no rules defined
				# DEBUG-NEXT:.. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_READ_REGISTER (opcode {{[0-9]+}}): 1 type index, 0 imm indices			# DEBUG-NEXT: G_READ_REGISTER (opcode {{[0-9]+}}): 1 type index, 0 imm indices
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_WRITE_REGISTER (opcode {{[0-9]+}}): 1 type index, 0 imm indices			# DEBUG-NEXT: G_WRITE_REGISTER (opcode {{[0-9]+}}): 1 type index, 0 imm indices
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_MEMCPY (opcode {{[0-9]+}}): 3 type indices, 1 imm index			# DEBUG-NEXT: G_MEMCPY (opcode {{[0-9]+}}): 3 type indices, 1 imm index
	# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}			# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}
	▲ Show 20 Lines • Show All 77 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.ldexp.mir

This file was deleted.

	# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	# RUN: llc -march=amdgcn -mcpu=tahiti -run-pass=instruction-select -verify-machineinstrs %s -o - \| FileCheck -check-prefix=GCN %s

	---
	name: ldexp_s32_vsv
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $sgpr0, $vgpr0
	; GCN-LABEL: name: ldexp_s32_vsv
	; GCN: liveins: $sgpr0, $vgpr0
	; GCN-NEXT: {{ $}}
	; GCN-NEXT: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
	; GCN-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
	; GCN-NEXT: %2:vgpr_32 = nofpexcept V_LDEXP_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN-NEXT: S_ENDPGM 0, implicit %2
	%0:sgpr(s32) = COPY $sgpr0
	%1:vgpr(s32) = COPY $vgpr0
	%2:vgpr(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %0, %1
	S_ENDPGM 0, implicit %2
	...

	---
	name: ldexp_s32_vvs
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $sgpr0, $vgpr0
	; GCN-LABEL: name: ldexp_s32_vvs
	; GCN: liveins: $sgpr0, $vgpr0
	; GCN-NEXT: {{ $}}
	; GCN-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
	; GCN-NEXT: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
	; GCN-NEXT: %2:vgpr_32 = nofpexcept V_LDEXP_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN-NEXT: S_ENDPGM 0, implicit %2
	%0:vgpr(s32) = COPY $vgpr0
	%1:sgpr(s32) = COPY $sgpr0
	%2:vgpr(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %0, %1
	S_ENDPGM 0, implicit %2
	...

	---
	name: ldexp_s32_vvv
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $vgpr0, $vgpr1
	; GCN-LABEL: name: ldexp_s32_vvv
	; GCN: liveins: $vgpr0, $vgpr1
	; GCN-NEXT: {{ $}}
	; GCN-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
	; GCN-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
	; GCN-NEXT: %2:vgpr_32 = nofpexcept V_LDEXP_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN-NEXT: S_ENDPGM 0, implicit %2
	%0:vgpr(s32) = COPY $vgpr0
	%1:vgpr(s32) = COPY $vgpr1
	%2:vgpr(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %0, %1
	S_ENDPGM 0, implicit %2
	...

	---
	name: ldexp_s64_vsv
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $sgpr0_sgpr1, $vgpr0
	; GCN-LABEL: name: ldexp_s64_vsv
	; GCN: liveins: $sgpr0_sgpr1, $vgpr0
	; GCN-NEXT: {{ $}}
	; GCN-NEXT: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
	; GCN-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
	; GCN-NEXT: %2:vreg_64 = nofpexcept V_LDEXP_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN-NEXT: S_ENDPGM 0, implicit %2
	%0:sgpr(s64) = COPY $sgpr0_sgpr1
	%1:vgpr(s32) = COPY $vgpr0
	%2:vgpr(s64) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %0, %1
	S_ENDPGM 0, implicit %2
	...

	---
	name: ldexp_s64_vvs
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $sgpr0_sgpr1, $vgpr0
	; GCN-LABEL: name: ldexp_s64_vvs
	; GCN: liveins: $sgpr0_sgpr1, $vgpr0
	; GCN-NEXT: {{ $}}
	; GCN-NEXT: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
	; GCN-NEXT: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
	; GCN-NEXT: %2:vreg_64 = nofpexcept V_LDEXP_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN-NEXT: S_ENDPGM 0, implicit %2
	%0:vgpr(s64) = COPY $vgpr0_vgpr1
	%1:sgpr(s32) = COPY $sgpr0
	%2:vgpr(s64) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %0, %1
	S_ENDPGM 0, implicit %2
	...

	---
	name: ldexp_s64_vvv
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $vgpr0_vgpr1, $vgpr2
	; GCN-LABEL: name: ldexp_s64_vvv
	; GCN: liveins: $vgpr0_vgpr1, $vgpr2
	; GCN-NEXT: {{ $}}
	; GCN-NEXT: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
	; GCN-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
	; GCN-NEXT: %2:vreg_64 = nofpexcept V_LDEXP_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN-NEXT: S_ENDPGM 0, implicit %2
	%0:vgpr(s64) = COPY $vgpr0_vgpr1
	%1:vgpr(s32) = COPY $vgpr2
	%2:vgpr(s64) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %0, %1
	S_ENDPGM 0, implicit %2
	...

llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.ldexp.s16.mir

This file was deleted.

	# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	# RUN: llc -march=amdgcn -mcpu=fiji -run-pass=instruction-select -verify-machineinstrs %s -o - \| FileCheck -check-prefix=GCN %s
	# RUN: llc -march=amdgcn -mcpu=tahiti -run-pass=instruction-select -verify-machineinstrs -global-isel-abort=2 -pass-remarks-missed='gisel*' %s -o /dev/null 2>&1 \| FileCheck -check-prefix=SI-ERR %s

	# SI-ERR: remark: <unknown>:0:0: cannot select: %3:vgpr(s16) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %2:sgpr(s16), %1:vgpr(s32) (in function: ldexp_s16_vsv)
	# SI-ERR-NEXT: remark: <unknown>:0:0: cannot select: %3:vgpr(s16) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %2:vgpr(s16), %1:sgpr(s32) (in function: ldexp_s16_vvs)
	# SI-ERR-NEXT: remark: <unknown>:0:0: cannot select: %3:vgpr(s16) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %2:vgpr(s16), %1:vgpr(s32) (in function: ldexp_s16_vvv)

	---
	name: ldexp_s16_vsv
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $sgpr0, $vgpr0
	; GCN-LABEL: name: ldexp_s16_vsv
	; GCN: liveins: $sgpr0, $vgpr0
	; GCN: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
	; GCN: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
	; GCN: %3:vgpr_32 = nofpexcept V_LDEXP_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN: S_ENDPGM 0, implicit %3
	%0:sgpr(s32) = COPY $sgpr0
	%1:vgpr(s32) = COPY $vgpr0
	%2:sgpr(s16) = G_TRUNC %0
	%3:vgpr(s16) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %2, %1
	S_ENDPGM 0, implicit %3
	...

	---
	name: ldexp_s16_vvs
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $sgpr0, $vgpr0
	; GCN-LABEL: name: ldexp_s16_vvs
	; GCN: liveins: $sgpr0, $vgpr0
	; GCN: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
	; GCN: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
	; GCN: %3:vgpr_32 = nofpexcept V_LDEXP_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN: S_ENDPGM 0, implicit %3
	%0:vgpr(s32) = COPY $vgpr0
	%1:sgpr(s32) = COPY $sgpr0
	%2:vgpr(s16) = G_TRUNC %0
	%3:vgpr(s16) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %2, %1
	S_ENDPGM 0, implicit %3
	...

	---
	name: ldexp_s16_vvv
	legalized: true
	regBankSelected: true
	tracksRegLiveness: true

	body: \|
	bb.0:
	liveins: $vgpr0, $vgpr1
	; GCN-LABEL: name: ldexp_s16_vvv
	; GCN: liveins: $vgpr0, $vgpr1
	; GCN: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
	; GCN: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
	; GCN: %3:vgpr_32 = nofpexcept V_LDEXP_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, 0, implicit $mode, implicit $exec
	; GCN: S_ENDPGM 0, implicit %3
	%0:vgpr(s32) = COPY $vgpr0
	%1:vgpr(s32) = COPY $vgpr1
	%2:vgpr(s16) = G_TRUNC %0
	%3:vgpr(s16) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), %2, %1
	S_ENDPGM 0, implicit %3
	...

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-sitofp.mir

Show First 20 Lines • Show All 126 Lines • ▼ Show 20 Lines	bb.0:
; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]		; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]		; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP]], [[SUB1]](s32)
; GFX6-NEXT: $vgpr0 = COPY [[INT1]](s32)		; GFX6-NEXT: $vgpr0 = COPY [[FLDEXP]](s32)
; GFX8-LABEL: name: test_sitofp_s64_to_s32		; GFX8-LABEL: name: test_sitofp_s64_to_s32
; GFX8: liveins: $vgpr0_vgpr1		; GFX8: liveins: $vgpr0_vgpr1
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31		; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX8-NEXT: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX8-NEXT: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX8-NEXT: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)		; GFX8-NEXT: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX8-NEXT: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]		; GFX8-NEXT: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]		; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]		; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP]], [[SUB1]](s32)
; GFX8-NEXT: $vgpr0 = COPY [[INT1]](s32)		; GFX8-NEXT: $vgpr0 = COPY [[FLDEXP]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s32) = G_SITOFP %0		%1:_(s32) = G_SITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

---		---
name: test_sitofp_s64_to_s64		name: test_sitofp_s64_to_s64
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_sitofp_s64_to_s64		; GFX6-LABEL: name: test_sitofp_s64_to_s64
; GFX6: liveins: $vgpr0_vgpr1		; GFX6: liveins: $vgpr0_vgpr1
; GFX6-NEXT: {{ $}}		; GFX6-NEXT: {{ $}}
; GFX6-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX6-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX6-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s64) = G_SITOFP [[UV1]](s32)		; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s64) = G_SITOFP [[UV1]](s32)
; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s64) = G_UITOFP [[UV]](s32)		; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s64) = G_UITOFP [[UV]](s32)
; GFX6-NEXT: [[INT:%[0-9]+]]:_(s64) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s64), [[C]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s64) = G_FLDEXP [[SITOFP]], [[C]](s32)
; GFX6-NEXT: [[FADD:%[0-9]+]]:_(s64) = G_FADD [[INT]], [[UITOFP]]		; GFX6-NEXT: [[FADD:%[0-9]+]]:_(s64) = G_FADD [[FLDEXP]], [[UITOFP]]
; GFX6-NEXT: $vgpr0_vgpr1 = COPY [[FADD]](s64)		; GFX6-NEXT: $vgpr0_vgpr1 = COPY [[FADD]](s64)
; GFX8-LABEL: name: test_sitofp_s64_to_s64		; GFX8-LABEL: name: test_sitofp_s64_to_s64
; GFX8: liveins: $vgpr0_vgpr1		; GFX8: liveins: $vgpr0_vgpr1
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s64) = G_SITOFP [[UV1]](s32)		; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s64) = G_SITOFP [[UV1]](s32)
; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s64) = G_UITOFP [[UV]](s32)		; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s64) = G_UITOFP [[UV]](s32)
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s64) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s64), [[C]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s64) = G_FLDEXP [[SITOFP]], [[C]](s32)
; GFX8-NEXT: [[FADD:%[0-9]+]]:_(s64) = G_FADD [[INT]], [[UITOFP]]		; GFX8-NEXT: [[FADD:%[0-9]+]]:_(s64) = G_FADD [[FLDEXP]], [[UITOFP]]
; GFX8-NEXT: $vgpr0_vgpr1 = COPY [[FADD]](s64)		; GFX8-NEXT: $vgpr0_vgpr1 = COPY [[FADD]](s64)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s64) = G_SITOFP %0		%1:_(s64) = G_SITOFP %0
$vgpr0_vgpr1 = COPY %1		$vgpr0_vgpr1 = COPY %1
...		...

---		---
name: test_sitofp_s16_to_s16		name: test_sitofp_s16_to_s16
▲ Show 20 Lines • Show All 272 Lines • ▼ Show 20 Lines	bb.0:
; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]		; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]		; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[SEXT_INREG]], [[UMIN]](s32)		; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[SEXT_INREG]], [[UMIN]](s32)
; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP]], [[SUB1]](s32)
; GFX6-NEXT: $vgpr0 = COPY [[INT1]](s32)		; GFX6-NEXT: $vgpr0 = COPY [[FLDEXP]](s32)
; GFX8-LABEL: name: test_sitofp_s33_to_s32		; GFX8-LABEL: name: test_sitofp_s33_to_s32
; GFX8: liveins: $vgpr0_vgpr1		; GFX8: liveins: $vgpr0_vgpr1
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8-NEXT: [[SEXT_INREG:%[0-9]+]]:_(s64) = G_SEXT_INREG [[COPY]], 33		; GFX8-NEXT: [[SEXT_INREG:%[0-9]+]]:_(s64) = G_SEXT_INREG [[COPY]], 33
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SEXT_INREG]](s64)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SEXT_INREG]](s64)
; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31		; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX8-NEXT: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX8-NEXT: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX8-NEXT: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)		; GFX8-NEXT: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX8-NEXT: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]		; GFX8-NEXT: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]		; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]		; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[SEXT_INREG]], [[UMIN]](s32)		; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[SEXT_INREG]], [[UMIN]](s32)
; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP]], [[SUB1]](s32)
; GFX8-NEXT: $vgpr0 = COPY [[INT1]](s32)		; GFX8-NEXT: $vgpr0 = COPY [[FLDEXP]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s33) = G_TRUNC %0		%1:_(s33) = G_TRUNC %0
%2:_(s32) = G_SITOFP %1		%2:_(s32) = G_SITOFP %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: test_sitofp_s64_to_s16		name: test_sitofp_s64_to_s16
Show All 16 Lines	bb.0:
; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]		; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]		; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP]], [[SUB1]](s32)
; GFX6-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX6-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP]](s32)
; GFX6-NEXT: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX6-NEXT: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX6-NEXT: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX6-NEXT: $vgpr0 = COPY [[ANYEXT]](s32)
; GFX8-LABEL: name: test_sitofp_s64_to_s16		; GFX8-LABEL: name: test_sitofp_s64_to_s16
; GFX8: liveins: $vgpr0_vgpr1		; GFX8: liveins: $vgpr0_vgpr1
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31		; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 31
; GFX8-NEXT: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]		; GFX8-NEXT: [[XOR:%[0-9]+]]:_(s32) = G_XOR [[UV]], [[UV1]]
; GFX8-NEXT: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)		; GFX8-NEXT: [[ASHR:%[0-9]+]]:_(s32) = G_ASHR [[XOR]], [[C2]](s32)
; GFX8-NEXT: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]		; GFX8-NEXT: [[ADD:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR]]
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)		; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV1]](s32)
; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]		; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]		; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP]], [[SUB1]](s32)
; GFX8-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX8-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP]](s32)
; GFX8-NEXT: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX8-NEXT: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX8-NEXT: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX8-NEXT: $vgpr0 = COPY [[ANYEXT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s16) = G_SITOFP %0		%1:_(s16) = G_SITOFP %0
%2:_(s32) = G_ANYEXT %1		%2:_(s32) = G_ANYEXT %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

Show All 19 Lines	bb.0:
; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]		; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]		; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)		; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX6-NEXT: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6-NEXT: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]		; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]
; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]		; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]
; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX6-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP]], [[SUB1]](s32)
; GFX6-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX6-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP]](s32)
; GFX6-NEXT: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX6-NEXT: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX6-NEXT: [[XOR1:%[0-9]+]]:_(s32) = G_XOR [[UV6]], [[UV7]]		; GFX6-NEXT: [[XOR1:%[0-9]+]]:_(s32) = G_XOR [[UV6]], [[UV7]]
; GFX6-NEXT: [[ASHR1:%[0-9]+]]:_(s32) = G_ASHR [[XOR1]], [[C2]](s32)		; GFX6-NEXT: [[ASHR1:%[0-9]+]]:_(s32) = G_ASHR [[XOR1]], [[C2]](s32)
; GFX6-NEXT: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR1]]		; GFX6-NEXT: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR1]]
; GFX6-NEXT: [[INT2:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV7]](s32)		; GFX6-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV7]](s32)
; GFX6-NEXT: [[SUB2:%[0-9]+]]:_(s32) = G_SUB [[INT2]], [[C1]]		; GFX6-NEXT: [[SUB2:%[0-9]+]]:_(s32) = G_SUB [[INT1]], [[C1]]
; GFX6-NEXT: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[SUB2]], [[ADD1]]		; GFX6-NEXT: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[SUB2]], [[ADD1]]
; GFX6-NEXT: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)		; GFX6-NEXT: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)
; GFX6-NEXT: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX6-NEXT: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX6-NEXT: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]		; GFX6-NEXT: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]
; GFX6-NEXT: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]		; GFX6-NEXT: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]
; GFX6-NEXT: [[SITOFP1:%[0-9]+]]:_(s32) = G_SITOFP [[OR1]](s32)		; GFX6-NEXT: [[SITOFP1:%[0-9]+]]:_(s32) = G_SITOFP [[OR1]](s32)
; GFX6-NEXT: [[SUB3:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]		; GFX6-NEXT: [[SUB3:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]
; GFX6-NEXT: [[INT3:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP1]](s32), [[SUB3]](s32)		; GFX6-NEXT: [[FLDEXP1:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP1]], [[SUB3]](s32)
; GFX6-NEXT: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT3]](s32)		; GFX6-NEXT: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP1]](s32)
; GFX6-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX6-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX6-NEXT: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX6-NEXT: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX6-NEXT: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX6-NEXT: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX6-NEXT: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)		; GFX6-NEXT: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)
; GFX6-NEXT: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX6-NEXT: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX6-NEXT: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX6-NEXT: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX6-NEXT: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX6-NEXT: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16		; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16
Show All 12 Lines	bb.0:
; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]		; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[INT]], [[C1]]
; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]		; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[SUB]], [[ADD]]
; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)		; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX8-NEXT: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8-NEXT: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]		; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]
; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]		; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]
; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)		; GFX8-NEXT: [[SITOFP:%[0-9]+]]:_(s32) = G_SITOFP [[OR]](s32)
; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP]](s32), [[SUB1]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP]], [[SUB1]](s32)
; GFX8-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX8-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP]](s32)
; GFX8-NEXT: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX8-NEXT: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX8-NEXT: [[XOR1:%[0-9]+]]:_(s32) = G_XOR [[UV6]], [[UV7]]		; GFX8-NEXT: [[XOR1:%[0-9]+]]:_(s32) = G_XOR [[UV6]], [[UV7]]
; GFX8-NEXT: [[ASHR1:%[0-9]+]]:_(s32) = G_ASHR [[XOR1]], [[C2]](s32)		; GFX8-NEXT: [[ASHR1:%[0-9]+]]:_(s32) = G_ASHR [[XOR1]], [[C2]](s32)
; GFX8-NEXT: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR1]]		; GFX8-NEXT: [[ADD1:%[0-9]+]]:_(s32) = G_ADD [[C]], [[ASHR1]]
; GFX8-NEXT: [[INT2:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV7]](s32)		; GFX8-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.sffbh), [[UV7]](s32)
; GFX8-NEXT: [[SUB2:%[0-9]+]]:_(s32) = G_SUB [[INT2]], [[C1]]		; GFX8-NEXT: [[SUB2:%[0-9]+]]:_(s32) = G_SUB [[INT1]], [[C1]]
; GFX8-NEXT: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[SUB2]], [[ADD1]]		; GFX8-NEXT: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[SUB2]], [[ADD1]]
; GFX8-NEXT: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)		; GFX8-NEXT: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)
; GFX8-NEXT: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX8-NEXT: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX8-NEXT: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]		; GFX8-NEXT: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]
; GFX8-NEXT: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]		; GFX8-NEXT: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]
; GFX8-NEXT: [[SITOFP1:%[0-9]+]]:_(s32) = G_SITOFP [[OR1]](s32)		; GFX8-NEXT: [[SITOFP1:%[0-9]+]]:_(s32) = G_SITOFP [[OR1]](s32)
; GFX8-NEXT: [[SUB3:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]		; GFX8-NEXT: [[SUB3:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]
; GFX8-NEXT: [[INT3:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[SITOFP1]](s32), [[SUB3]](s32)		; GFX8-NEXT: [[FLDEXP1:%[0-9]+]]:_(s32) = G_FLDEXP [[SITOFP1]], [[SUB3]](s32)
; GFX8-NEXT: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT3]](s32)		; GFX8-NEXT: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP1]](s32)
; GFX8-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX8-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX8-NEXT: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX8-NEXT: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX8-NEXT: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX8-NEXT: [[C3:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX8-NEXT: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)		; GFX8-NEXT: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C3]](s32)
; GFX8-NEXT: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX8-NEXT: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX8-NEXT: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX8-NEXT: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX8-NEXT: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX8-NEXT: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
%1:_(<2 x s16>) = G_SITOFP %0		%1:_(<2 x s16>) = G_SITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-uitofp.mir

Show First 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	bb.0:
; GFX6-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX6-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP]], [[SUB]](s32)
; GFX6-NEXT: $vgpr0 = COPY [[INT]](s32)		; GFX6-NEXT: $vgpr0 = COPY [[FLDEXP]](s32)
; GFX8-LABEL: name: test_uitofp_s64_to_s32		; GFX8-LABEL: name: test_uitofp_s64_to_s32
; GFX8: liveins: $vgpr0_vgpr1		; GFX8: liveins: $vgpr0_vgpr1
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX8-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP]], [[SUB]](s32)
; GFX8-NEXT: $vgpr0 = COPY [[INT]](s32)		; GFX8-NEXT: $vgpr0 = COPY [[FLDEXP]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s32) = G_UITOFP %0		%1:_(s32) = G_UITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

---		---
name: test_uitofp_s64_to_s64		name: test_uitofp_s64_to_s64
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0_vgpr1		liveins: $vgpr0_vgpr1

; GFX6-LABEL: name: test_uitofp_s64_to_s64		; GFX6-LABEL: name: test_uitofp_s64_to_s64
; GFX6: liveins: $vgpr0_vgpr1		; GFX6: liveins: $vgpr0_vgpr1
; GFX6-NEXT: {{ $}}		; GFX6-NEXT: {{ $}}
; GFX6-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX6-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX6-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX6-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX6-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX6-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s64) = G_UITOFP [[UV1]](s32)		; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s64) = G_UITOFP [[UV1]](s32)
; GFX6-NEXT: [[UITOFP1:%[0-9]+]]:_(s64) = G_UITOFP [[UV]](s32)		; GFX6-NEXT: [[UITOFP1:%[0-9]+]]:_(s64) = G_UITOFP [[UV]](s32)
; GFX6-NEXT: [[INT:%[0-9]+]]:_(s64) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s64), [[C]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s64) = G_FLDEXP [[UITOFP]], [[C]](s32)
; GFX6-NEXT: [[FADD:%[0-9]+]]:_(s64) = G_FADD [[INT]], [[UITOFP1]]		; GFX6-NEXT: [[FADD:%[0-9]+]]:_(s64) = G_FADD [[FLDEXP]], [[UITOFP1]]
; GFX6-NEXT: $vgpr0_vgpr1 = COPY [[FADD]](s64)		; GFX6-NEXT: $vgpr0_vgpr1 = COPY [[FADD]](s64)
; GFX8-LABEL: name: test_uitofp_s64_to_s64		; GFX8-LABEL: name: test_uitofp_s64_to_s64
; GFX8: liveins: $vgpr0_vgpr1		; GFX8: liveins: $vgpr0_vgpr1
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s64) = G_UITOFP [[UV1]](s32)		; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s64) = G_UITOFP [[UV1]](s32)
; GFX8-NEXT: [[UITOFP1:%[0-9]+]]:_(s64) = G_UITOFP [[UV]](s32)		; GFX8-NEXT: [[UITOFP1:%[0-9]+]]:_(s64) = G_UITOFP [[UV]](s32)
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s64) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s64), [[C]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s64) = G_FLDEXP [[UITOFP]], [[C]](s32)
; GFX8-NEXT: [[FADD:%[0-9]+]]:_(s64) = G_FADD [[INT]], [[UITOFP1]]		; GFX8-NEXT: [[FADD:%[0-9]+]]:_(s64) = G_FADD [[FLDEXP]], [[UITOFP1]]
; GFX8-NEXT: $vgpr0_vgpr1 = COPY [[FADD]](s64)		; GFX8-NEXT: $vgpr0_vgpr1 = COPY [[FADD]](s64)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s64) = G_UITOFP %0		%1:_(s64) = G_UITOFP %0
$vgpr0_vgpr1 = COPY %1		$vgpr0_vgpr1 = COPY %1
...		...

---		---
name: test_uitofp_s16_to_s16		name: test_uitofp_s16_to_s16
▲ Show 20 Lines • Show All 279 Lines • ▼ Show 20 Lines	bb.0:
; GFX6-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX6-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]		; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)		; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)
; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C2]], [[UV2]]		; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C2]], [[UV2]]
; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]		; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]
; GFX6-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP]], [[SUB]](s32)
; GFX6-NEXT: $vgpr0 = COPY [[INT]](s32)		; GFX6-NEXT: $vgpr0 = COPY [[FLDEXP]](s32)
; GFX8-LABEL: name: test_uitofp_s33_to_s32		; GFX8-LABEL: name: test_uitofp_s33_to_s32
; GFX8: liveins: $vgpr0_vgpr1		; GFX8: liveins: $vgpr0_vgpr1
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8-NEXT: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591		; GFX8-NEXT: [[C:%[0-9]+]]:_(s64) = G_CONSTANT i64 8589934591
; GFX8-NEXT: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY]], [[C]]		; GFX8-NEXT: [[AND:%[0-9]+]]:_(s64) = G_AND [[COPY]], [[C]]
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[AND]](s64)
; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX8-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]		; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C1]]
; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)		; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[AND]], [[UMIN]](s32)
; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C2]], [[UV2]]		; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C2]], [[UV2]]
; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]		; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C1]], [[UMIN]]
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP]], [[SUB]](s32)
; GFX8-NEXT: $vgpr0 = COPY [[INT]](s32)		; GFX8-NEXT: $vgpr0 = COPY [[FLDEXP]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s33) = G_TRUNC %0		%1:_(s33) = G_TRUNC %0
%2:_(s32) = G_UITOFP %1		%2:_(s32) = G_UITOFP %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

---		---
name: test_uitofp_s64_to_s16		name: test_uitofp_s64_to_s16
Show All 11 Lines	bb.0:
; GFX6-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX6-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP]], [[SUB]](s32)
; GFX6-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX6-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP]](s32)
; GFX6-NEXT: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX6-NEXT: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX6-NEXT: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX6-NEXT: $vgpr0 = COPY [[ANYEXT]](s32)
; GFX8-LABEL: name: test_uitofp_s64_to_s16		; GFX8-LABEL: name: test_uitofp_s64_to_s16
; GFX8: liveins: $vgpr0_vgpr1		; GFX8: liveins: $vgpr0_vgpr1
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(s64) = COPY $vgpr0_vgpr1
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s32), [[UV1:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[COPY]](s64)
; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)		; GFX8-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV1]](s32)
; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)		; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[COPY]], [[UMIN]](s32)
; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]		; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV2]]
; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]		; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV3]], [[UMIN1]]
; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP]], [[SUB]](s32)
; GFX8-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX8-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP]](s32)
; GFX8-NEXT: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)		; GFX8-NEXT: [[ANYEXT:%[0-9]+]]:_(s32) = G_ANYEXT [[FPTRUNC]](s16)
; GFX8-NEXT: $vgpr0 = COPY [[ANYEXT]](s32)		; GFX8-NEXT: $vgpr0 = COPY [[ANYEXT]](s32)
%0:_(s64) = COPY $vgpr0_vgpr1		%0:_(s64) = COPY $vgpr0_vgpr1
%1:_(s16) = G_UITOFP %0		%1:_(s16) = G_UITOFP %0
%2:_(s32) = G_ANYEXT %1		%2:_(s32) = G_ANYEXT %1
$vgpr0 = COPY %2		$vgpr0 = COPY %2
...		...

Show All 14 Lines	bb.0:
; GFX6-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)		; GFX6-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)
; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX6-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)		; GFX6-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX6-NEXT: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX6-NEXT: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]		; GFX6-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]
; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]		; GFX6-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]
; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX6-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX6-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX6-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX6-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP]], [[SUB]](s32)
; GFX6-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX6-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP]](s32)
; GFX6-NEXT: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX6-NEXT: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX6-NEXT: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)		; GFX6-NEXT: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)
; GFX6-NEXT: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]		; GFX6-NEXT: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]
; GFX6-NEXT: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)		; GFX6-NEXT: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)
; GFX6-NEXT: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX6-NEXT: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX6-NEXT: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]		; GFX6-NEXT: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]
; GFX6-NEXT: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]		; GFX6-NEXT: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]
; GFX6-NEXT: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)		; GFX6-NEXT: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)
; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]		; GFX6-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]
; GFX6-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)		; GFX6-NEXT: [[FLDEXP1:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP1]], [[SUB1]](s32)
; GFX6-NEXT: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX6-NEXT: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP1]](s32)
; GFX6-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX6-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX6-NEXT: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX6-NEXT: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX6-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX6-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX6-NEXT: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C2]](s32)		; GFX6-NEXT: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C2]](s32)
; GFX6-NEXT: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX6-NEXT: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX6-NEXT: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX6-NEXT: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX6-NEXT: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX6-NEXT: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16		; GFX8-LABEL: name: test_sitofp_v2s64_to_v2s16
; GFX8: liveins: $vgpr0_vgpr1_vgpr2_vgpr3		; GFX8: liveins: $vgpr0_vgpr1_vgpr2_vgpr3
; GFX8-NEXT: {{ $}}		; GFX8-NEXT: {{ $}}
; GFX8-NEXT: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		; GFX8-NEXT: [[COPY:%[0-9]+]]:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
; GFX8-NEXT: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)		; GFX8-NEXT: [[UV:%[0-9]+]]:_(s64), [[UV1:%[0-9]+]]:_(s64) = G_UNMERGE_VALUES [[COPY]](<2 x s64>)
; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)		; GFX8-NEXT: [[UV2:%[0-9]+]]:_(s32), [[UV3:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV]](s64)
; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32		; GFX8-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 32
; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1		; GFX8-NEXT: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 1
; GFX8-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)		; GFX8-NEXT: [[AMDGPU_FFBH_U32_:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV3]](s32)
; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]		; GFX8-NEXT: [[UMIN:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_]], [[C]]
; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)		; GFX8-NEXT: [[SHL:%[0-9]+]]:_(s64) = G_SHL [[UV]], [[UMIN]](s32)
; GFX8-NEXT: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)		; GFX8-NEXT: [[UV4:%[0-9]+]]:_(s32), [[UV5:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL]](s64)
; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]		; GFX8-NEXT: [[UMIN1:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV4]]
; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]		; GFX8-NEXT: [[OR:%[0-9]+]]:_(s32) = G_OR [[UV5]], [[UMIN1]]
; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)		; GFX8-NEXT: [[UITOFP:%[0-9]+]]:_(s32) = G_UITOFP [[OR]](s32)
; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]		; GFX8-NEXT: [[SUB:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN]]
; GFX8-NEXT: [[INT:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP]](s32), [[SUB]](s32)		; GFX8-NEXT: [[FLDEXP:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP]], [[SUB]](s32)
; GFX8-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT]](s32)		; GFX8-NEXT: [[FPTRUNC:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP]](s32)
; GFX8-NEXT: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)		; GFX8-NEXT: [[UV6:%[0-9]+]]:_(s32), [[UV7:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[UV1]](s64)
; GFX8-NEXT: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)		; GFX8-NEXT: [[AMDGPU_FFBH_U32_1:%[0-9]+]]:_(s32) = G_AMDGPU_FFBH_U32 [[UV7]](s32)
; GFX8-NEXT: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]		; GFX8-NEXT: [[UMIN2:%[0-9]+]]:_(s32) = G_UMIN [[AMDGPU_FFBH_U32_1]], [[C]]
; GFX8-NEXT: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)		; GFX8-NEXT: [[SHL1:%[0-9]+]]:_(s64) = G_SHL [[UV1]], [[UMIN2]](s32)
; GFX8-NEXT: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)		; GFX8-NEXT: [[UV8:%[0-9]+]]:_(s32), [[UV9:%[0-9]+]]:_(s32) = G_UNMERGE_VALUES [[SHL1]](s64)
; GFX8-NEXT: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]		; GFX8-NEXT: [[UMIN3:%[0-9]+]]:_(s32) = G_UMIN [[C1]], [[UV8]]
; GFX8-NEXT: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]		; GFX8-NEXT: [[OR1:%[0-9]+]]:_(s32) = G_OR [[UV9]], [[UMIN3]]
; GFX8-NEXT: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)		; GFX8-NEXT: [[UITOFP1:%[0-9]+]]:_(s32) = G_UITOFP [[OR1]](s32)
; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]		; GFX8-NEXT: [[SUB1:%[0-9]+]]:_(s32) = G_SUB [[C]], [[UMIN2]]
; GFX8-NEXT: [[INT1:%[0-9]+]]:_(s32) = G_INTRINSIC intrinsic(@llvm.amdgcn.ldexp), [[UITOFP1]](s32), [[SUB1]](s32)		; GFX8-NEXT: [[FLDEXP1:%[0-9]+]]:_(s32) = G_FLDEXP [[UITOFP1]], [[SUB1]](s32)
; GFX8-NEXT: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[INT1]](s32)		; GFX8-NEXT: [[FPTRUNC1:%[0-9]+]]:_(s16) = G_FPTRUNC [[FLDEXP1]](s32)
; GFX8-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)		; GFX8-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC]](s16)
; GFX8-NEXT: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)		; GFX8-NEXT: [[ZEXT1:%[0-9]+]]:_(s32) = G_ZEXT [[FPTRUNC1]](s16)
; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 16		; GFX8-NEXT: [[C2:%[0-9]+]]:_(s32) = G_CONSTANT i32 16
; GFX8-NEXT: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C2]](s32)		; GFX8-NEXT: [[SHL2:%[0-9]+]]:_(s32) = G_SHL [[ZEXT1]], [[C2]](s32)
; GFX8-NEXT: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]		; GFX8-NEXT: [[OR2:%[0-9]+]]:_(s32) = G_OR [[ZEXT]], [[SHL2]]
; GFX8-NEXT: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)		; GFX8-NEXT: [[BITCAST:%[0-9]+]]:_(<2 x s16>) = G_BITCAST [[OR2]](s32)
; GFX8-NEXT: $vgpr0 = COPY [[BITCAST]](<2 x s16>)		; GFX8-NEXT: $vgpr0 = COPY [[BITCAST]](<2 x s16>)
%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3		%0:_(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
%1:_(<2 x s16>) = G_UITOFP %0		%1:_(<2 x s16>) = G_UITOFP %0
$vgpr0 = COPY %1		$vgpr0 = COPY %1
...		...

llvm/test/CodeGen/AMDGPU/llvm.ldexp.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=tahiti < %s \| FileCheck -check-prefixes=GCN,GFX6,GFX6-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=tonga < %s \| FileCheck -check-prefixes=GCN,GFX8,GFX8-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=gfx900 < %s \| FileCheck -check-prefixes=GCN,GFX9,GFX9-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=gfx1100 < %s \| FileCheck -check-prefixes=GCN,GFX11,GFX11-SDAG %s

				Joe_NashUnsubmitted Done Reply Inline Actions Typo GFX1 Joe_Nash: Typo GFX1
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=tahiti < %s \| FileCheck -check-prefixes=GCN,GFX6,GFX6-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=tonga < %s \| FileCheck -check-prefixes=GCN,GFX8,GFX8-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=gfx900 < %s \| FileCheck -check-prefixes=GCN,GFX9,GFX9-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=gfx1100 < %s \| FileCheck -check-prefixes=GCN,GFX11,GFX11-GISEL %s

				define float @test_ldexp_f32_i32(ptr addrspace(1) %out, float %a, i32 %b) {
				; GFX6-LABEL: test_ldexp_f32_i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f32_e32 v0, v2, v3
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_f32_i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f32 v0, v2, v3
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_f32_i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f32 v0, v2, v3
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_f32_i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f32 v0, v2, v3
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call float @llvm.ldexp.f32.i32(float %a, i32 %b)
				ret float %result
				}

				define <2 x float> @test_ldexp_v2f32_v2i32(ptr addrspace(1) %out, <2 x float> %a, <2 x i32> %b) {
				; GFX6-LABEL: test_ldexp_v2f32_v2i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f32_e32 v0, v2, v4
				; GFX6-NEXT: v_ldexp_f32_e32 v1, v3, v5
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_v2f32_v2i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f32 v0, v2, v4
				; GFX8-NEXT: v_ldexp_f32 v1, v3, v5
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_v2f32_v2i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f32 v0, v2, v4
				; GFX9-NEXT: v_ldexp_f32 v1, v3, v5
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v2f32_v2i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f32 v0, v2, v4
				; GFX11-NEXT: v_ldexp_f32 v1, v3, v5
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float> %a, <2 x i32> %b)
				ret <2 x float> %result
				}

				define <3 x float> @test_ldexp_v3f32_v3i32(ptr addrspace(1) %out, <3 x float> %a, <3 x i32> %b) {
				; GFX6-LABEL: test_ldexp_v3f32_v3i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f32_e32 v0, v2, v5
				; GFX6-NEXT: v_ldexp_f32_e32 v1, v3, v6
				; GFX6-NEXT: v_ldexp_f32_e32 v2, v4, v7
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_v3f32_v3i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f32 v0, v2, v5
				; GFX8-NEXT: v_ldexp_f32 v1, v3, v6
				; GFX8-NEXT: v_ldexp_f32 v2, v4, v7
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_v3f32_v3i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f32 v0, v2, v5
				; GFX9-NEXT: v_ldexp_f32 v1, v3, v6
				; GFX9-NEXT: v_ldexp_f32 v2, v4, v7
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v3f32_v3i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f32 v0, v2, v5
				; GFX11-NEXT: v_ldexp_f32 v1, v3, v6
				; GFX11-NEXT: v_ldexp_f32 v2, v4, v7
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call <3 x float> @llvm.ldexp.v3f32.v3i32(<3 x float> %a, <3 x i32> %b)
				ret <3 x float> %result
				}

				define <4 x float> @test_ldexp_v4f32_v4i32(ptr addrspace(1) %out, <4 x float> %a, <4 x i32> %b) {
				; GFX6-LABEL: test_ldexp_v4f32_v4i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f32_e32 v0, v2, v6
				; GFX6-NEXT: v_ldexp_f32_e32 v1, v3, v7
				; GFX6-NEXT: v_ldexp_f32_e32 v2, v4, v8
				; GFX6-NEXT: v_ldexp_f32_e32 v3, v5, v9
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_v4f32_v4i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f32 v0, v2, v6
				; GFX8-NEXT: v_ldexp_f32 v1, v3, v7
				; GFX8-NEXT: v_ldexp_f32 v2, v4, v8
				; GFX8-NEXT: v_ldexp_f32 v3, v5, v9
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_v4f32_v4i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f32 v0, v2, v6
				; GFX9-NEXT: v_ldexp_f32 v1, v3, v7
				; GFX9-NEXT: v_ldexp_f32 v2, v4, v8
				; GFX9-NEXT: v_ldexp_f32 v3, v5, v9
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v4f32_v4i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f32 v0, v2, v6
				; GFX11-NEXT: v_ldexp_f32 v1, v3, v7
				; GFX11-NEXT: v_ldexp_f32 v2, v4, v8
				; GFX11-NEXT: v_ldexp_f32 v3, v5, v9
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call <4 x float> @llvm.ldexp.v4f32.v4i32(<4 x float> %a, <4 x i32> %b)
				ret <4 x float> %result
				}

				define double @test_ldexp_f64_i32(double %a, i32 %b) {
				; GFX6-LABEL: test_ldexp_f64_i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f64 v[0:1], v[0:1], v2
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_f64_i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f64 v[0:1], v[0:1], v2
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_f64_i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f64 v[0:1], v[0:1], v2
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_f64_i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f64 v[0:1], v[0:1], v2
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call double @llvm.ldexp.f64.i32(double %a, i32 %b)
				ret double %result
				}

				define <2 x double> @test_ldexp_v2f64_v2i32(<2 x double> %a, <2 x i32> %b) {
				; GFX6-LABEL: test_ldexp_v2f64_v2i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f64 v[0:1], v[0:1], v4
				; GFX6-NEXT: v_ldexp_f64 v[2:3], v[2:3], v5
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_v2f64_v2i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f64 v[0:1], v[0:1], v4
				; GFX8-NEXT: v_ldexp_f64 v[2:3], v[2:3], v5
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_v2f64_v2i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f64 v[0:1], v[0:1], v4
				; GFX9-NEXT: v_ldexp_f64 v[2:3], v[2:3], v5
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v2f64_v2i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f64 v[0:1], v[0:1], v4
				; GFX11-NEXT: v_ldexp_f64 v[2:3], v[2:3], v5
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call <2 x double> @llvm.ldexp.v2f64.v2i32(<2 x double> %a, <2 x i32> %b)
				ret <2 x double> %result
				}

				; Broken for DAG
				; define float @test_ldexp_f32_i16(float %a, i16 %b) {
				; %result = call float @llvm.ldexp.f32.i16(float %a, i16 %b)
				; ret float %result
				; }

				; FIXME: Should be able to truncate to i32
				; define float @test_ldexp_f32_i64(float %a, i64 %b) {
				; %result = call float @llvm.ldexp.f32.i64(float %a, i64 %b)
				; ret float %result
				; }

				; define <2 x float> @test_ldexp_v2f32_v2i16(<2 x float> %a, <2 x i16> %b) {
				; %result = call <2 x float> @llvm.ldexp.v2f32.v2i16(<2 x float> %a, <2 x i16> %b)
				; ret <2 x float> %result
				; }

				; FIXME: Should be able to truncate to i32
				; define <2 x float> @test_ldexp_v2f32_v2i64(<2 x float> %a, <2 x i64> %b) {
				; %result = call <2 x float> @llvm.ldexp.v2f32.v2i64(<2 x float> %a, <2 x i64> %b)
				; ret <2 x float> %result
				; }

				define half @test_ldexp_f16_i8(half %a, i8 %b) {
				; GFX6-SDAG-LABEL: test_ldexp_f16_i8:
				; GFX6-SDAG: ; %bb.0:
				; GFX6-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-SDAG-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-SDAG-NEXT: v_bfe_i32 v1, v1, 0, 8
				; GFX6-SDAG-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v0, v0, v1
				; GFX6-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-SDAG-LABEL: test_ldexp_f16_i8:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: v_ldexp_f16_sdwa v0, v0, sext(v1) dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_0
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_f16_i8:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: v_ldexp_f16_sdwa v0, v0, sext(v1) dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_0
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-SDAG-LABEL: test_ldexp_f16_i8:
				; GFX11-SDAG: ; %bb.0:
				foadUnsubmitted Not Done Reply Inline Actions This doesn't quite work because the instruction truncates v1 to 16 bits, so if you wanted ldexp(1.0, 0x10000) aka +inf you'll actually get ldexp(1.0, 0) aka 1.0. foad: This doesn't quite work because the instruction truncates v1 to 16 bits, so if you wanted ldexp…
				arsenmAuthorUnsubmitted Done Reply Inline Actions Ugh, the library does have clamp code for this. The tablegen definition claims this is VOP_F16_F16_I32 though arsenm: Ugh, the library does have clamp code for this. The tablegen definition claims this is…
				; GFX11-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-SDAG-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-SDAG-NEXT: v_bfe_i32 v1, v1, 0, 8
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX6-GISEL-LABEL: test_ldexp_f16_i8:
				; GFX6-GISEL: ; %bb.0:
				; GFX6-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-GISEL-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-GISEL-NEXT: v_bfe_i32 v1, v1, 0, 8
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v0, v0, v1
				; GFX6-GISEL-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_f16_i8:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_bfe_i32 v1, v1, 0, 8
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v2, 0xffff8000
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v3, 0x7fff
				; GFX8-GISEL-NEXT: v_med3_i32 v1, v1, v2, v3
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_f16_i8:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_bfe_i32 v1, v1, 0, 8
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v2, 0xffff8000
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v3, 0x7fff
				; GFX9-GISEL-NEXT: v_med3_i32 v1, v1, v2, v3
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-GISEL-LABEL: test_ldexp_f16_i8:
				; GFX11-GISEL: ; %bb.0:
				; GFX11-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-GISEL-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-GISEL-NEXT: v_bfe_i32 v1, v1, 0, 8
				; GFX11-GISEL-NEXT: v_mov_b32_e32 v2, 0x7fff
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX11-GISEL-NEXT: v_med3_i32 v1, 0xffff8000, v1, v2
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call half @llvm.ldexp.f16.i8(half %a, i8 %b)
				ret half %result
				}

				define half @test_ldexp_f16_i16(half %a, i16 %b) {
				; GFX6-SDAG-LABEL: test_ldexp_f16_i16:
				; GFX6-SDAG: ; %bb.0:
				; GFX6-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-SDAG-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-SDAG-NEXT: v_bfe_i32 v1, v1, 0, 16
				; GFX6-SDAG-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v0, v0, v1
				; GFX6-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_f16_i16:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_f16_i16:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_f16_i16:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX6-GISEL-LABEL: test_ldexp_f16_i16:
				; GFX6-GISEL: ; %bb.0:
				; GFX6-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-GISEL-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-GISEL-NEXT: v_bfe_i32 v1, v1, 0, 16
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v0, v0, v1
				; GFX6-GISEL-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call half @llvm.ldexp.f16.i16(half %a, i16 %b)
				ret half %result
				}

				define half @test_ldexp_f16_i32(half %a, i32 %b) {
				; GFX6-SDAG-LABEL: test_ldexp_f16_i32:
				; GFX6-SDAG: ; %bb.0:
				; GFX6-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-SDAG-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-SDAG-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v0, v0, v1
				; GFX6-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-SDAG-LABEL: test_ldexp_f16_i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v2, 0x7fff
				; GFX8-SDAG-NEXT: v_med3_i32 v1, v1, s4, v2
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_f16_i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v2, 0x7fff
				; GFX9-SDAG-NEXT: v_med3_i32 v1, v1, s4, v2
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-SDAG-LABEL: test_ldexp_f16_i32:
				; GFX11-SDAG: ; %bb.0:
				; GFX11-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-SDAG-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-SDAG-NEXT: s_movk_i32 s0, 0x8000
				; GFX11-SDAG-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX11-SDAG-NEXT: v_med3_i32 v1, v1, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX6-GISEL-LABEL: test_ldexp_f16_i32:
				; GFX6-GISEL: ; %bb.0:
				; GFX6-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-GISEL-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v0, v0, v1
				; GFX6-GISEL-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_f16_i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v2, 0xffff8000
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v3, 0x7fff
				; GFX8-GISEL-NEXT: v_med3_i32 v1, v1, v2, v3
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_f16_i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v2, 0xffff8000
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v3, 0x7fff
				; GFX9-GISEL-NEXT: v_med3_i32 v1, v1, v2, v3
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-GISEL-LABEL: test_ldexp_f16_i32:
				; GFX11-GISEL: ; %bb.0:
				; GFX11-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-GISEL-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-GISEL-NEXT: v_mov_b32_e32 v2, 0x7fff
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX11-GISEL-NEXT: v_med3_i32 v1, 0xffff8000, v1, v2
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call half @llvm.ldexp.f16.i32(half %a, i32 %b)
				ret half %result
				}

				define <2 x half> @test_ldexp_v2f16_v2i32(<2 x half> %a, <2 x i32> %b) {
				; GFX6-SDAG-LABEL: test_ldexp_v2f16_v2i32:
				; GFX6-SDAG: ; %bb.0:
				; GFX6-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-SDAG-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-SDAG-NEXT: v_cvt_f16_f32_e32 v1, v1
				; GFX6-SDAG-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-SDAG-NEXT: v_cvt_f32_f16_e32 v1, v1
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v0, v0, v2
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v1, v1, v3
				; GFX6-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-SDAG-LABEL: test_ldexp_v2f16_v2i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v3, 0x7fff
				; GFX8-SDAG-NEXT: v_med3_i32 v2, v2, s4, v3
				; GFX8-SDAG-NEXT: v_med3_i32 v1, v1, s4, v3
				; GFX8-SDAG-NEXT: v_ldexp_f16_sdwa v2, v0, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX8-SDAG-NEXT: v_or_b32_e32 v0, v0, v2
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_v2f16_v2i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v3, 0x7fff
				; GFX9-SDAG-NEXT: v_med3_i32 v2, v2, s4, v3
				; GFX9-SDAG-NEXT: v_med3_i32 v1, v1, s4, v3
				; GFX9-SDAG-NEXT: v_ldexp_f16_sdwa v2, v0, v2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX9-SDAG-NEXT: v_pack_b32_f16 v0, v0, v2
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-SDAG-LABEL: test_ldexp_v2f16_v2i32:
				; GFX11-SDAG: ; %bb.0:
				; GFX11-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-SDAG-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-SDAG-NEXT: s_movk_i32 s0, 0x8000
				; GFX11-SDAG-NEXT: v_lshrrev_b32_e32 v3, 16, v0
				; GFX11-SDAG-NEXT: v_med3_i32 v2, v2, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_med3_i32 v1, v1, s0, 0x7fff
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v2, v3, v2
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX11-SDAG-NEXT: v_pack_b32_f16 v0, v0, v2
				; GFX11-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX6-GISEL-LABEL: test_ldexp_v2f16_v2i32:
				; GFX6-GISEL: ; %bb.0:
				; GFX6-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-GISEL-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-GISEL-NEXT: v_cvt_f32_f16_e32 v1, v1
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v0, v0, v2
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v1, v1, v3
				; GFX6-GISEL-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-GISEL-NEXT: v_cvt_f16_f32_e32 v1, v1
				; GFX6-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_v2f16_v2i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v3, 0xffff8000
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v4, 0x7fff
				; GFX8-GISEL-NEXT: v_med3_i32 v1, v1, v3, v4
				; GFX8-GISEL-NEXT: v_med3_i32 v2, v2, v3, v4
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v1, v0, v1
				; GFX8-GISEL-NEXT: v_ldexp_f16_sdwa v0, v0, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-GISEL-NEXT: v_or_b32_e32 v0, v1, v0
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_v2f16_v2i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v3, 0xffff8000
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v4, 0x7fff
				; GFX9-GISEL-NEXT: v_med3_i32 v1, v1, v3, v4
				; GFX9-GISEL-NEXT: v_med3_i32 v2, v2, v3, v4
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v1, v0, v1
				; GFX9-GISEL-NEXT: v_ldexp_f16_sdwa v0, v0, v2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-GISEL-NEXT: v_lshl_or_b32 v0, v0, 16, v1
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-GISEL-LABEL: test_ldexp_v2f16_v2i32:
				; GFX11-GISEL: ; %bb.0:
				; GFX11-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-GISEL-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-GISEL-NEXT: v_mov_b32_e32 v3, 0x7fff
				; GFX11-GISEL-NEXT: v_lshrrev_b32_e32 v4, 16, v0
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
				; GFX11-GISEL-NEXT: v_med3_i32 v1, 0xffff8000, v1, v3
				; GFX11-GISEL-NEXT: v_med3_i32 v2, 0xffff8000, v2, v3
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v1, v4, v2
				; GFX11-GISEL-NEXT: v_and_b32_e32 v0, 0xffff, v0
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX11-GISEL-NEXT: v_lshl_or_b32 v0, v1, 16, v0
				; GFX11-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call <2 x half> @llvm.ldexp.v2f16.v2i32(<2 x half> %a, <2 x i32> %b)
				ret <2 x half> %result
				}

				define <2 x half> @test_ldexp_v2f16_v2i16(<2 x half> %a, <2 x i16> %b) {
				; GFX6-SDAG-LABEL: test_ldexp_v2f16_v2i16:
				; GFX6-SDAG: ; %bb.0:
				; GFX6-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-SDAG-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-SDAG-NEXT: v_cvt_f16_f32_e32 v1, v1
				; GFX6-SDAG-NEXT: v_bfe_i32 v3, v3, 0, 16
				; GFX6-SDAG-NEXT: v_bfe_i32 v2, v2, 0, 16
				; GFX6-SDAG-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-SDAG-NEXT: v_cvt_f32_f16_e32 v1, v1
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v0, v0, v2
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v1, v1, v3
				; GFX6-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-SDAG-LABEL: test_ldexp_v2f16_v2i16:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: v_ldexp_f16_sdwa v2, v0, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX8-SDAG-NEXT: v_or_b32_e32 v0, v0, v2
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_v2f16_v2i16:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: v_ldexp_f16_sdwa v2, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX9-SDAG-NEXT: v_pack_b32_f16 v0, v0, v2
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-SDAG-LABEL: test_ldexp_v2f16_v2i16:
				; GFX11-SDAG: ; %bb.0:
				; GFX11-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-SDAG-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-SDAG-NEXT: v_lshrrev_b32_e32 v2, 16, v1
				; GFX11-SDAG-NEXT: v_lshrrev_b32_e32 v3, 16, v0
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v2, v3, v2
				; GFX11-SDAG-NEXT: v_pack_b32_f16 v0, v0, v2
				; GFX11-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX6-GISEL-LABEL: test_ldexp_v2f16_v2i16:
				; GFX6-GISEL: ; %bb.0:
				; GFX6-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-GISEL-NEXT: v_cvt_f32_f16_e32 v0, v0
				; GFX6-GISEL-NEXT: v_cvt_f32_f16_e32 v1, v1
				; GFX6-GISEL-NEXT: v_bfe_i32 v2, v2, 0, 16
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v0, v0, v2
				; GFX6-GISEL-NEXT: v_bfe_i32 v2, v3, 0, 16
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v1, v1, v2
				; GFX6-GISEL-NEXT: v_cvt_f16_f32_e32 v0, v0
				; GFX6-GISEL-NEXT: v_cvt_f16_f32_e32 v1, v1
				; GFX6-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_v2f16_v2i16:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v2, v0, v1
				; GFX8-GISEL-NEXT: v_ldexp_f16_sdwa v0, v0, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
				; GFX8-GISEL-NEXT: v_or_b32_e32 v0, v2, v0
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_v2f16_v2i16:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v2, v0, v1
				; GFX9-GISEL-NEXT: v_ldexp_f16_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
				; GFX9-GISEL-NEXT: v_lshl_or_b32 v0, v0, 16, v2
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-GISEL-LABEL: test_ldexp_v2f16_v2i16:
				; GFX11-GISEL: ; %bb.0:
				; GFX11-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-GISEL-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-GISEL-NEXT: v_lshrrev_b32_e32 v2, 16, v0
				; GFX11-GISEL-NEXT: v_lshrrev_b32_e32 v3, 16, v1
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v0, v0, v1
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v1, v2, v3
				; GFX11-GISEL-NEXT: v_and_b32_e32 v0, 0xffff, v0
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX11-GISEL-NEXT: v_lshl_or_b32 v0, v1, 16, v0
				; GFX11-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call <2 x half> @llvm.ldexp.v2f16.v2i16(<2 x half> %a, <2 x i16> %b)
				ret <2 x half> %result
				}

				declare float @llvm.ldexp.f32.i32(float, i32) #0
				declare float @llvm.ldexp.f32.i16(float, i16) #0
				declare float @llvm.ldexp.f32.i64(float, i64) #0
				declare half @llvm.ldexp.f16.i8(half, i8) #0
				declare half @llvm.ldexp.f16.i16(half, i16) #0
				declare half @llvm.ldexp.f16.i32(half, i32) #0
				declare <2 x half> @llvm.ldexp.v2f16.v2i16(<2 x half>, <2 x i16>) #0
				declare <2 x half> @llvm.ldexp.v2f16.v2i32(<2 x half>, <2 x i32>) #0
				declare <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float>, <2 x i32>) #0
				declare <2 x float> @llvm.ldexp.v2f32.v2i16(<2 x float>, <2 x i16>) #0
				declare <2 x float> @llvm.ldexp.v2f32.v2i64(<2 x float>, <2 x i64>) #0
				declare <3 x float> @llvm.ldexp.v3f32.v3i32(<3 x float>, <3 x i32>) #0
				declare <4 x float> @llvm.ldexp.v4f32.v4i32(<4 x float>, <4 x i32>) #0
				declare double @llvm.ldexp.f64.i32(double, i32) #0
				declare <2 x double> @llvm.ldexp.v2f64.v2i32(<2 x double>, <2 x i32>) #0

				attributes #0 = { nounwind readnone }
				;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
				; GCN: {{.*}}

llvm/test/CodeGen/AMDGPU/strict_ldexp.f16.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; FIXME: Enable f16 promotion
				; XUN: llc -global-isel=0 -march=amdgcn -mcpu=tahiti < %s \| FileCheck -check-prefixes=GCN,GFX6,GFX6-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=tonga < %s \| FileCheck -check-prefixes=GCN,GFX8,GFX8-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=gfx900 < %s \| FileCheck -check-prefixes=GCN,GFX9,GFX9-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=gfx1100 < %s \| FileCheck -check-prefixes=GCN,GFX11,GFX11-SDAG %s

				; XUN: llc -global-isel=1 -march=amdgcn -mcpu=tahiti < %s \| FileCheck -check-prefixes=GCN,GFX6,GFX6-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=tonga < %s \| FileCheck -check-prefixes=GCN,GFX8,GFX8-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=gfx900 < %s \| FileCheck -check-prefixes=GCN,GFX9,GFX9-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=gfx1100 < %s \| FileCheck -check-prefixes=GCN,GFX11,GFX11-GISEL %s

				; define half @test_ldexp_f16_i16(ptr addrspace(1) %out, half %a, i16 %b) #0 {
				; %result = call half @llvm.experimental.constrained.ldexp.f16.i16(half %a, i16 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				; ret half %result
				; }

				define half @test_ldexp_f16_i32(ptr addrspace(1) %out, half %a, i32 %b) #0 {
				; GFX8-SDAG-LABEL: test_ldexp_f16_i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX8-SDAG-NEXT: v_med3_i32 v0, v3, s4, v0
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_f16_i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX9-SDAG-NEXT: v_med3_i32 v0, v3, s4, v0
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-SDAG-LABEL: test_ldexp_f16_i32:
				; GFX11-SDAG: ; %bb.0:
				; GFX11-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-SDAG-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-SDAG-NEXT: s_movk_i32 s0, 0x8000
				; GFX11-SDAG-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX11-SDAG-NEXT: v_med3_i32 v0, v3, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX11-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_f16_i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v0, 0xffff8000
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX8-GISEL-NEXT: v_med3_i32 v0, v3, v0, v1
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_f16_i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v0, 0xffff8000
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX9-GISEL-NEXT: v_med3_i32 v0, v3, v0, v1
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-GISEL-LABEL: test_ldexp_f16_i32:
				; GFX11-GISEL: ; %bb.0:
				; GFX11-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-GISEL-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-GISEL-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX11-GISEL-NEXT: v_med3_i32 v0, 0xffff8000, v3, v0
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX11-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call half @llvm.experimental.constrained.ldexp.f16.i32(half %a, i32 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret half %result
				}

				; define <2 x half> @test_ldexp_v2f16_v2i16(ptr addrspace(1) %out, <2 x half> %a, <2 x i16> %b) #0 {
				; %result = call <2 x half> @llvm.experimental.constrained.ldexp.v2f16.v2i16(<2 x half> %a, <2 x i16> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				; ret <2 x half> %result
				; }

				define <2 x half> @test_ldexp_v2f16_v2i32(ptr addrspace(1) %out, <2 x half> %a, <2 x i32> %b) #0 {
				; GFX8-SDAG-LABEL: test_ldexp_v2f16_v2i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX8-SDAG-NEXT: v_med3_i32 v1, v3, s4, v0
				; GFX8-SDAG-NEXT: v_med3_i32 v0, v4, s4, v0
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v1, v2, v1
				; GFX8-SDAG-NEXT: v_ldexp_f16_sdwa v0, v2, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-SDAG-NEXT: v_or_b32_e32 v0, v1, v0
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_v2f16_v2i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX9-SDAG-NEXT: v_med3_i32 v1, v3, s4, v0
				; GFX9-SDAG-NEXT: v_med3_i32 v0, v4, s4, v0
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v1, v2, v1
				; GFX9-SDAG-NEXT: v_ldexp_f16_sdwa v0, v2, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-SDAG-NEXT: s_mov_b32 s4, 0x5040100
				; GFX9-SDAG-NEXT: v_perm_b32 v0, v0, v1, s4
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-SDAG-LABEL: test_ldexp_v2f16_v2i32:
				; GFX11-SDAG: ; %bb.0:
				; GFX11-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-SDAG-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-SDAG-NEXT: s_movk_i32 s0, 0x8000
				; GFX11-SDAG-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_3)
				; GFX11-SDAG-NEXT: v_med3_i32 v0, v3, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_med3_i32 v1, v4, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_lshrrev_b32_e32 v3, 16, v2
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v1, v3, v1
				; GFX11-SDAG-NEXT: v_perm_b32 v0, v1, v0, 0x5040100
				; GFX11-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_v2f16_v2i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v0, 0xffff8000
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX8-GISEL-NEXT: v_med3_i32 v3, v3, v0, v1
				; GFX8-GISEL-NEXT: v_med3_i32 v0, v4, v0, v1
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v3, v2, v3
				; GFX8-GISEL-NEXT: v_ldexp_f16_sdwa v0, v2, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-GISEL-NEXT: v_or_b32_e32 v0, v3, v0
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_v2f16_v2i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v0, 0xffff8000
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX9-GISEL-NEXT: v_med3_i32 v3, v3, v0, v1
				; GFX9-GISEL-NEXT: v_med3_i32 v0, v4, v0, v1
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v3, v2, v3
				; GFX9-GISEL-NEXT: v_ldexp_f16_sdwa v0, v2, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-GISEL-NEXT: v_lshl_or_b32 v0, v0, 16, v3
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-GISEL-LABEL: test_ldexp_v2f16_v2i32:
				; GFX11-GISEL: ; %bb.0:
				; GFX11-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-GISEL-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-GISEL-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_3)
				; GFX11-GISEL-NEXT: v_med3_i32 v1, 0xffff8000, v3, v0
				; GFX11-GISEL-NEXT: v_lshrrev_b32_e32 v3, 16, v2
				; GFX11-GISEL-NEXT: v_med3_i32 v0, 0xffff8000, v4, v0
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v1, v2, v1
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v0, v3, v0
				; GFX11-GISEL-NEXT: v_and_b32_e32 v1, 0xffff, v1
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1)
				; GFX11-GISEL-NEXT: v_lshl_or_b32 v0, v0, 16, v1
				; GFX11-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call <2 x half> @llvm.experimental.constrained.ldexp.v2f16.v2i32(<2 x half> %a, <2 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <2 x half> %result
				}

				define <3 x half> @test_ldexp_v3f16_v3i32(ptr addrspace(1) %out, <3 x half> %a, <3 x i32> %b) #0 {
				; GFX8-SDAG-LABEL: test_ldexp_v3f16_v3i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX8-SDAG-NEXT: v_med3_i32 v0, v4, s4, v1
				; GFX8-SDAG-NEXT: v_med3_i32 v4, v5, s4, v1
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX8-SDAG-NEXT: v_ldexp_f16_sdwa v2, v2, v4 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-SDAG-NEXT: v_med3_i32 v1, v6, s4, v1
				; GFX8-SDAG-NEXT: v_or_b32_e32 v0, v0, v2
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v1, v3, v1
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_v3f16_v3i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX9-SDAG-NEXT: v_med3_i32 v0, v4, s4, v1
				; GFX9-SDAG-NEXT: v_med3_i32 v4, v5, s4, v1
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX9-SDAG-NEXT: v_ldexp_f16_sdwa v2, v2, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-SDAG-NEXT: s_mov_b32 s5, 0x5040100
				; GFX9-SDAG-NEXT: v_med3_i32 v1, v6, s4, v1
				; GFX9-SDAG-NEXT: v_perm_b32 v0, v2, v0, s5
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v1, v3, v1
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-SDAG-LABEL: test_ldexp_v3f16_v3i32:
				; GFX11-SDAG: ; %bb.0:
				; GFX11-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-SDAG-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-SDAG-NEXT: s_movk_i32 s0, 0x8000
				; GFX11-SDAG-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_3)
				; GFX11-SDAG-NEXT: v_med3_i32 v0, v4, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_med3_i32 v1, v5, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_lshrrev_b32_e32 v4, 16, v2
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX11-SDAG-NEXT: v_med3_i32 v2, v6, s0, 0x7fff
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v1, v4, v1
				; GFX11-SDAG-NEXT: v_perm_b32 v0, v1, v0, 0x5040100
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_3)
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v1, v3, v2
				; GFX11-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_v3f16_v3i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v0, 0xffff8000
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX8-GISEL-NEXT: v_med3_i32 v4, v4, v0, v1
				; GFX8-GISEL-NEXT: v_med3_i32 v5, v5, v0, v1
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v4, v2, v4
				; GFX8-GISEL-NEXT: v_ldexp_f16_sdwa v2, v2, v5 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-GISEL-NEXT: v_med3_i32 v0, v6, v0, v1
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v1, v3, v0
				; GFX8-GISEL-NEXT: v_or_b32_e32 v0, v4, v2
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_v3f16_v3i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v0, 0xffff8000
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX9-GISEL-NEXT: v_med3_i32 v4, v4, v0, v1
				; GFX9-GISEL-NEXT: v_med3_i32 v5, v5, v0, v1
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v4, v2, v4
				; GFX9-GISEL-NEXT: v_ldexp_f16_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-GISEL-NEXT: v_med3_i32 v0, v6, v0, v1
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v1, v3, v0
				; GFX9-GISEL-NEXT: v_lshl_or_b32 v0, v2, 16, v4
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-GISEL-LABEL: test_ldexp_v3f16_v3i32:
				; GFX11-GISEL: ; %bb.0:
				; GFX11-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-GISEL-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-GISEL-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_3)
				; GFX11-GISEL-NEXT: v_med3_i32 v1, 0xffff8000, v4, v0
				; GFX11-GISEL-NEXT: v_lshrrev_b32_e32 v4, 16, v2
				; GFX11-GISEL-NEXT: v_med3_i32 v5, 0xffff8000, v5, v0
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v1, v2, v1
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_1) \| instid1(VALU_DEP_3)
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v2, v4, v5
				; GFX11-GISEL-NEXT: v_med3_i32 v4, 0xffff8000, v6, v0
				; GFX11-GISEL-NEXT: v_and_b32_e32 v1, 0xffff, v1
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_3)
				; GFX11-GISEL-NEXT: v_lshl_or_b32 v0, v2, 16, v1
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v1, v3, v4
				; GFX11-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call <3 x half> @llvm.experimental.constrained.ldexp.v3f16.v3i32(<3 x half> %a, <3 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <3 x half> %result
				}

				define <4 x half> @test_ldexp_v4f16_v4i32(ptr addrspace(1) %out, <4 x half> %a, <4 x i32> %b) #0 {
				; GFX8-SDAG-LABEL: test_ldexp_v4f16_v4i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX8-SDAG-NEXT: v_med3_i32 v1, v7, s4, v0
				; GFX8-SDAG-NEXT: v_med3_i32 v6, v6, s4, v0
				; GFX8-SDAG-NEXT: v_med3_i32 v5, v5, s4, v0
				; GFX8-SDAG-NEXT: v_med3_i32 v0, v4, s4, v0
				; GFX8-SDAG-NEXT: v_ldexp_f16_sdwa v1, v3, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v3, v3, v6
				; GFX8-SDAG-NEXT: v_ldexp_f16_sdwa v5, v2, v5 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v0
				; GFX8-SDAG-NEXT: v_or_b32_e32 v0, v0, v5
				; GFX8-SDAG-NEXT: v_or_b32_e32 v1, v3, v1
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_v4f16_v4i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: s_movk_i32 s4, 0x8000
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX9-SDAG-NEXT: v_med3_i32 v1, v6, s4, v0
				; GFX9-SDAG-NEXT: v_med3_i32 v6, v7, s4, v0
				; GFX9-SDAG-NEXT: v_med3_i32 v4, v4, s4, v0
				; GFX9-SDAG-NEXT: v_med3_i32 v0, v5, s4, v0
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v1, v3, v1
				; GFX9-SDAG-NEXT: v_ldexp_f16_sdwa v3, v3, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-SDAG-NEXT: v_ldexp_f16_e32 v4, v2, v4
				; GFX9-SDAG-NEXT: v_ldexp_f16_sdwa v0, v2, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-SDAG-NEXT: s_mov_b32 s4, 0x5040100
				; GFX9-SDAG-NEXT: v_perm_b32 v0, v0, v4, s4
				; GFX9-SDAG-NEXT: v_perm_b32 v1, v3, v1, s4
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-SDAG-LABEL: test_ldexp_v4f16_v4i32:
				; GFX11-SDAG: ; %bb.0:
				; GFX11-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-SDAG-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-SDAG-NEXT: s_movk_i32 s0, 0x8000
				; GFX11-SDAG-NEXT: s_delay_alu instid0(SALU_CYCLE_1)
				; GFX11-SDAG-NEXT: v_med3_i32 v0, v6, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_med3_i32 v1, v7, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_med3_i32 v4, v4, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_med3_i32 v5, v5, s0, 0x7fff
				; GFX11-SDAG-NEXT: v_lshrrev_b32_e32 v6, 16, v2
				; GFX11-SDAG-NEXT: v_lshrrev_b32_e32 v7, 16, v3
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v3, v3, v0
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v0, v2, v4
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_4) \| instskip(NEXT) \| instid1(VALU_DEP_4)
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v2, v6, v5
				; GFX11-SDAG-NEXT: v_ldexp_f16_e32 v1, v7, v1
				; GFX11-SDAG-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX11-SDAG-NEXT: v_perm_b32 v0, v2, v0, 0x5040100
				; GFX11-SDAG-NEXT: v_perm_b32 v1, v1, v3, 0x5040100
				; GFX11-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_v4f16_v4i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v0, 0xffff8000
				; GFX8-GISEL-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX8-GISEL-NEXT: v_med3_i32 v4, v4, v0, v1
				; GFX8-GISEL-NEXT: v_med3_i32 v5, v5, v0, v1
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v4, v2, v4
				; GFX8-GISEL-NEXT: v_ldexp_f16_sdwa v2, v2, v5 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-GISEL-NEXT: v_med3_i32 v5, v6, v0, v1
				; GFX8-GISEL-NEXT: v_med3_i32 v0, v7, v0, v1
				; GFX8-GISEL-NEXT: v_ldexp_f16_e32 v5, v3, v5
				; GFX8-GISEL-NEXT: v_ldexp_f16_sdwa v1, v3, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX8-GISEL-NEXT: v_or_b32_e32 v0, v4, v2
				; GFX8-GISEL-NEXT: v_or_b32_e32 v1, v5, v1
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_v4f16_v4i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v0, 0xffff8000
				; GFX9-GISEL-NEXT: v_mov_b32_e32 v1, 0x7fff
				; GFX9-GISEL-NEXT: v_med3_i32 v4, v4, v0, v1
				; GFX9-GISEL-NEXT: v_med3_i32 v5, v5, v0, v1
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v4, v2, v4
				; GFX9-GISEL-NEXT: v_ldexp_f16_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-GISEL-NEXT: v_med3_i32 v5, v6, v0, v1
				; GFX9-GISEL-NEXT: v_med3_i32 v0, v7, v0, v1
				; GFX9-GISEL-NEXT: v_ldexp_f16_e32 v5, v3, v5
				; GFX9-GISEL-NEXT: v_ldexp_f16_sdwa v1, v3, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
				; GFX9-GISEL-NEXT: v_lshl_or_b32 v0, v2, 16, v4
				; GFX9-GISEL-NEXT: v_lshl_or_b32 v1, v1, 16, v5
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-GISEL-LABEL: test_ldexp_v4f16_v4i32:
				; GFX11-GISEL: ; %bb.0:
				; GFX11-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-GISEL-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-GISEL-NEXT: v_mov_b32_e32 v0, 0x7fff
				; GFX11-GISEL-NEXT: v_lshrrev_b32_e32 v1, 16, v2
				; GFX11-GISEL-NEXT: v_lshrrev_b32_e32 v8, 16, v3
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(SKIP_3) \| instid1(VALU_DEP_4)
				; GFX11-GISEL-NEXT: v_med3_i32 v4, 0xffff8000, v4, v0
				; GFX11-GISEL-NEXT: v_med3_i32 v6, 0xffff8000, v6, v0
				; GFX11-GISEL-NEXT: v_med3_i32 v5, 0xffff8000, v5, v0
				; GFX11-GISEL-NEXT: v_med3_i32 v0, 0xffff8000, v7, v0
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v2, v2, v4
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_4) \| instskip(NEXT) \| instid1(VALU_DEP_4)
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v3, v3, v6
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v1, v1, v5
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_4) \| instskip(NEXT) \| instid1(VALU_DEP_4)
				; GFX11-GISEL-NEXT: v_ldexp_f16_e32 v4, v8, v0
				; GFX11-GISEL-NEXT: v_and_b32_e32 v0, 0xffff, v2
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_4) \| instskip(NEXT) \| instid1(VALU_DEP_2)
				; GFX11-GISEL-NEXT: v_and_b32_e32 v2, 0xffff, v3
				; GFX11-GISEL-NEXT: v_lshl_or_b32 v0, v1, 16, v0
				; GFX11-GISEL-NEXT: s_delay_alu instid0(VALU_DEP_2)
				; GFX11-GISEL-NEXT: v_lshl_or_b32 v1, v4, 16, v2
				; GFX11-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call <4 x half> @llvm.experimental.constrained.ldexp.v4f16.v4i32(<4 x half> %a, <4 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <4 x half> %result
				}

				declare half @llvm.experimental.constrained.ldexp.f16.i16(half, i16, metadata, metadata) #1
				declare half @llvm.experimental.constrained.ldexp.f16.i32(half, i32, metadata, metadata) #1
				declare <2 x half> @llvm.experimental.constrained.ldexp.v2f16.v2i16(<2 x half>, <2 x i16>, metadata, metadata) #1
				declare <2 x half> @llvm.experimental.constrained.ldexp.v2f16.v2i32(<2 x half>, <2 x i32>, metadata, metadata) #1
				declare <3 x half> @llvm.experimental.constrained.ldexp.v3f16.v3i32(<3 x half>, <3 x i32>, metadata, metadata) #1
				declare <4 x half> @llvm.experimental.constrained.ldexp.v4f16.v4i32(<4 x half>, <4 x i32>, metadata, metadata) #1

				attributes #0 = { strictfp }
				attributes #1 = { nocallback nofree nosync nounwind willreturn memory(inaccessiblemem: readwrite) }
				;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
				; GCN: {{.*}}
				; GFX11: {{.*}}
				; GFX8: {{.*}}
				; GFX9: {{.*}}

llvm/test/CodeGen/AMDGPU/strict_ldexp.f32.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=tahiti < %s \| FileCheck -check-prefixes=GCN,GFX6,GFX6-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=tonga < %s \| FileCheck -check-prefixes=GCN,GFX8,GFX8-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=gfx900 < %s \| FileCheck -check-prefixes=GCN,GFX9,GFX9-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=gfx1100 < %s \| FileCheck -check-prefixes=GCN,GFX11,GFX11-SDAG %s

				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=tahiti < %s \| FileCheck -check-prefixes=GCN,GFX6,GFX6-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=tonga < %s \| FileCheck -check-prefixes=GCN,GFX8,GFX8-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=gfx900 < %s \| FileCheck -check-prefixes=GCN,GFX9,GFX9-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=gfx1100 < %s \| FileCheck -check-prefixes=GCN,GFX11,GFX11-GISEL %s

				; define float @test_ldexp_f32_i16(ptr addrspace(1) %out, float %a, i16 %b) #0 {
				; %result = call float @llvm.experimental.constrained.ldexp.f32.i16(float %a, i16 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				; ret float %result
				; }

				define float @test_ldexp_f32_i32(ptr addrspace(1) %out, float %a, i32 %b) #0 {
				; GFX6-LABEL: test_ldexp_f32_i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f32_e32 v0, v2, v3
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_f32_i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f32 v0, v2, v3
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_f32_i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f32 v0, v2, v3
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_f32_i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f32 v0, v2, v3
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call float @llvm.experimental.constrained.ldexp.f32.i32(float %a, i32 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret float %result
				}

				; define <2 x float> @test_ldexp_v2f32_v2i16(ptr addrspace(1) %out, <2 x float> %a, <2 x i16> %b) #0 {
				; %result = call <2 x float> @llvm.experimental.constrained.ldexp.v2f32.v2i16(<2 x float> %a, <2 x i16> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				; ret <2 x float> %result
				; }

				define <2 x float> @test_ldexp_v2f32_v2i32(ptr addrspace(1) %out, <2 x float> %a, <2 x i32> %b) #0 {
				; GFX6-SDAG-LABEL: test_ldexp_v2f32_v2i32:
				; GFX6-SDAG: ; %bb.0:
				; GFX6-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v1, v3, v5
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v0, v2, v4
				; GFX6-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-SDAG-LABEL: test_ldexp_v2f32_v2i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: v_ldexp_f32 v1, v3, v5
				; GFX8-SDAG-NEXT: v_ldexp_f32 v0, v2, v4
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_v2f32_v2i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: v_ldexp_f32 v1, v3, v5
				; GFX9-SDAG-NEXT: v_ldexp_f32 v0, v2, v4
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v2f32_v2i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f32 v0, v2, v4
				; GFX11-NEXT: v_ldexp_f32 v1, v3, v5
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX6-GISEL-LABEL: test_ldexp_v2f32_v2i32:
				; GFX6-GISEL: ; %bb.0:
				; GFX6-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v0, v2, v4
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v1, v3, v5
				; GFX6-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_v2f32_v2i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_ldexp_f32 v0, v2, v4
				; GFX8-GISEL-NEXT: v_ldexp_f32 v1, v3, v5
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_v2f32_v2i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_ldexp_f32 v0, v2, v4
				; GFX9-GISEL-NEXT: v_ldexp_f32 v1, v3, v5
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call <2 x float> @llvm.experimental.constrained.ldexp.v2f32.v2i32(<2 x float> %a, <2 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <2 x float> %result
				}

				define <3 x float> @test_ldexp_v3f32_v3i32(ptr addrspace(1) %out, <3 x float> %a, <3 x i32> %b) #0 {
				; GFX6-SDAG-LABEL: test_ldexp_v3f32_v3i32:
				; GFX6-SDAG: ; %bb.0:
				; GFX6-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v4, v4, v7
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v1, v3, v6
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v0, v2, v5
				; GFX6-SDAG-NEXT: v_mov_b32_e32 v2, v4
				; GFX6-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-SDAG-LABEL: test_ldexp_v3f32_v3i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: v_ldexp_f32 v4, v4, v7
				; GFX8-SDAG-NEXT: v_ldexp_f32 v1, v3, v6
				; GFX8-SDAG-NEXT: v_ldexp_f32 v0, v2, v5
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v2, v4
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_v3f32_v3i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: v_ldexp_f32 v4, v4, v7
				; GFX9-SDAG-NEXT: v_ldexp_f32 v1, v3, v6
				; GFX9-SDAG-NEXT: v_ldexp_f32 v0, v2, v5
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v2, v4
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v3f32_v3i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f32 v0, v2, v5
				; GFX11-NEXT: v_ldexp_f32 v1, v3, v6
				; GFX11-NEXT: v_ldexp_f32 v2, v4, v7
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX6-GISEL-LABEL: test_ldexp_v3f32_v3i32:
				; GFX6-GISEL: ; %bb.0:
				; GFX6-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v0, v2, v5
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v1, v3, v6
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v2, v4, v7
				; GFX6-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_v3f32_v3i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_ldexp_f32 v0, v2, v5
				; GFX8-GISEL-NEXT: v_ldexp_f32 v1, v3, v6
				; GFX8-GISEL-NEXT: v_ldexp_f32 v2, v4, v7
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_v3f32_v3i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_ldexp_f32 v0, v2, v5
				; GFX9-GISEL-NEXT: v_ldexp_f32 v1, v3, v6
				; GFX9-GISEL-NEXT: v_ldexp_f32 v2, v4, v7
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call <3 x float> @llvm.experimental.constrained.ldexp.v3f32.v3i32(<3 x float> %a, <3 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <3 x float> %result
				}

				define <4 x float> @test_ldexp_v4f32_v4i32(ptr addrspace(1) %out, <4 x float> %a, <4 x i32> %b) #0 {
				; GFX6-SDAG-LABEL: test_ldexp_v4f32_v4i32:
				; GFX6-SDAG: ; %bb.0:
				; GFX6-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v5, v5, v9
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v4, v4, v8
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v1, v3, v7
				; GFX6-SDAG-NEXT: v_ldexp_f32_e32 v0, v2, v6
				; GFX6-SDAG-NEXT: v_mov_b32_e32 v2, v4
				; GFX6-SDAG-NEXT: v_mov_b32_e32 v3, v5
				; GFX6-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-SDAG-LABEL: test_ldexp_v4f32_v4i32:
				; GFX8-SDAG: ; %bb.0:
				; GFX8-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-SDAG-NEXT: v_ldexp_f32 v5, v5, v9
				; GFX8-SDAG-NEXT: v_ldexp_f32 v4, v4, v8
				; GFX8-SDAG-NEXT: v_ldexp_f32 v1, v3, v7
				; GFX8-SDAG-NEXT: v_ldexp_f32 v0, v2, v6
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v2, v4
				; GFX8-SDAG-NEXT: v_mov_b32_e32 v3, v5
				; GFX8-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-SDAG-LABEL: test_ldexp_v4f32_v4i32:
				; GFX9-SDAG: ; %bb.0:
				; GFX9-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-SDAG-NEXT: v_ldexp_f32 v5, v5, v9
				; GFX9-SDAG-NEXT: v_ldexp_f32 v4, v4, v8
				; GFX9-SDAG-NEXT: v_ldexp_f32 v1, v3, v7
				; GFX9-SDAG-NEXT: v_ldexp_f32 v0, v2, v6
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v2, v4
				; GFX9-SDAG-NEXT: v_mov_b32_e32 v3, v5
				; GFX9-SDAG-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v4f32_v4i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f32 v0, v2, v6
				; GFX11-NEXT: v_ldexp_f32 v1, v3, v7
				; GFX11-NEXT: v_ldexp_f32 v2, v4, v8
				; GFX11-NEXT: v_ldexp_f32 v3, v5, v9
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX6-GISEL-LABEL: test_ldexp_v4f32_v4i32:
				; GFX6-GISEL: ; %bb.0:
				; GFX6-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v0, v2, v6
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v1, v3, v7
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v2, v4, v8
				; GFX6-GISEL-NEXT: v_ldexp_f32_e32 v3, v5, v9
				; GFX6-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-GISEL-LABEL: test_ldexp_v4f32_v4i32:
				; GFX8-GISEL: ; %bb.0:
				; GFX8-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-GISEL-NEXT: v_ldexp_f32 v0, v2, v6
				; GFX8-GISEL-NEXT: v_ldexp_f32 v1, v3, v7
				; GFX8-GISEL-NEXT: v_ldexp_f32 v2, v4, v8
				; GFX8-GISEL-NEXT: v_ldexp_f32 v3, v5, v9
				; GFX8-GISEL-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-GISEL-LABEL: test_ldexp_v4f32_v4i32:
				; GFX9-GISEL: ; %bb.0:
				; GFX9-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-GISEL-NEXT: v_ldexp_f32 v0, v2, v6
				; GFX9-GISEL-NEXT: v_ldexp_f32 v1, v3, v7
				; GFX9-GISEL-NEXT: v_ldexp_f32 v2, v4, v8
				; GFX9-GISEL-NEXT: v_ldexp_f32 v3, v5, v9
				; GFX9-GISEL-NEXT: s_setpc_b64 s[30:31]
				%result = call <4 x float> @llvm.experimental.constrained.ldexp.v4f32.v4i32(<4 x float> %a, <4 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <4 x float> %result
				}

				declare float @llvm.experimental.constrained.ldexp.f32.i16(float, i16, metadata, metadata) #1
				declare float @llvm.experimental.constrained.ldexp.f32.i32(float, i32, metadata, metadata) #1
				declare <2 x float> @llvm.experimental.constrained.ldexp.v2f32.v2i16(<2 x float>, <2 x i16>, metadata, metadata) #1
				declare <2 x float> @llvm.experimental.constrained.ldexp.v2f32.v2i32(<2 x float>, <2 x i32>, metadata, metadata) #1
				declare <3 x float> @llvm.experimental.constrained.ldexp.v3f32.v3i32(<3 x float>, <3 x i32>, metadata, metadata) #1
				declare <4 x float> @llvm.experimental.constrained.ldexp.v4f32.v4i32(<4 x float>, <4 x i32>, metadata, metadata) #1

				attributes #0 = { strictfp }
				attributes #1 = { nocallback nofree nosync nounwind willreturn memory(inaccessiblemem: readwrite) }
				;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
				; GCN: {{.*}}
				; GFX11-GISEL: {{.*}}
				; GFX11-SDAG: {{.*}}

llvm/test/CodeGen/AMDGPU/strict_ldexp.f64.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=tahiti < %s \| FileCheck -check-prefixes=GCN,GFX6,GFX6-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=tonga < %s \| FileCheck -check-prefixes=GCN,GFX8,GFX8-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=gfx900 < %s \| FileCheck -check-prefixes=GCN,GFX9,GFX9-SDAG %s
				; RUN: llc -global-isel=0 -march=amdgcn -mcpu=gfx1100 < %s \| FileCheck -check-prefixes=GCN,GFX11,GFX11-SDAG %s

				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=tahiti < %s \| FileCheck -check-prefixes=GCN,GFX6,GFX6-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=tonga < %s \| FileCheck -check-prefixes=GCN,GFX8,GFX8-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=gfx900 < %s \| FileCheck -check-prefixes=GCN,GFX9,GFX9-GISEL %s
				; RUN: llc -global-isel=1 -march=amdgcn -mcpu=gfx1100 < %s \| FileCheck -check-prefixes=GCN,GFX11,GFX11-GISEL %s

				; define double @test_ldexp_f64_i16(ptr addrspace(1) %out, double %a, i16 %b) #0 {
				; %result = call double @llvm.experimental.constrained.ldexp.f64.i16(double %a, i16 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				; ret double %result
				; }

				define double @test_ldexp_f64_i32(ptr addrspace(1) %out, double %a, i32 %b) #0 {
				; GFX6-LABEL: test_ldexp_f64_i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f64 v[0:1], v[2:3], v4
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_f64_i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f64 v[0:1], v[2:3], v4
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_f64_i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f64 v[0:1], v[2:3], v4
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_f64_i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f64 v[0:1], v[2:3], v4
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call double @llvm.experimental.constrained.ldexp.f64.i32(double %a, i32 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret double %result
				}

				; define <2 x double> @test_ldexp_v2f64_v2i16(ptr addrspace(1) %out, <2 x double> %a, <2 x i16> %b) #0 {
				; %result = call <2 x double> @llvm.experimental.constrained.ldexp.v2f64.v2i16(<2 x double> %a, <2 x i16> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				; ret <2 x double> %result
				; }

				define <2 x double> @test_ldexp_v2f64_v2i32(ptr addrspace(1) %out, <2 x double> %a, <2 x i32> %b) #0 {
				; GFX6-LABEL: test_ldexp_v2f64_v2i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f64 v[0:1], v[2:3], v6
				; GFX6-NEXT: v_ldexp_f64 v[2:3], v[4:5], v7
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_v2f64_v2i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f64 v[0:1], v[2:3], v6
				; GFX8-NEXT: v_ldexp_f64 v[2:3], v[4:5], v7
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_v2f64_v2i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f64 v[0:1], v[2:3], v6
				; GFX9-NEXT: v_ldexp_f64 v[2:3], v[4:5], v7
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v2f64_v2i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f64 v[0:1], v[2:3], v6
				; GFX11-NEXT: v_ldexp_f64 v[2:3], v[4:5], v7
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call <2 x double> @llvm.experimental.constrained.ldexp.v2f64.v2i32(<2 x double> %a, <2 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <2 x double> %result
				}

				define <3 x double> @test_ldexp_v3f64_v3i32(ptr addrspace(1) %out, <3 x double> %a, <3 x i32> %b) #0 {
				; GFX6-LABEL: test_ldexp_v3f64_v3i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f64 v[0:1], v[2:3], v8
				; GFX6-NEXT: v_ldexp_f64 v[2:3], v[4:5], v9
				; GFX6-NEXT: v_ldexp_f64 v[4:5], v[6:7], v10
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_v3f64_v3i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f64 v[0:1], v[2:3], v8
				; GFX8-NEXT: v_ldexp_f64 v[2:3], v[4:5], v9
				; GFX8-NEXT: v_ldexp_f64 v[4:5], v[6:7], v10
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_v3f64_v3i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f64 v[0:1], v[2:3], v8
				; GFX9-NEXT: v_ldexp_f64 v[2:3], v[4:5], v9
				; GFX9-NEXT: v_ldexp_f64 v[4:5], v[6:7], v10
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v3f64_v3i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f64 v[0:1], v[2:3], v8
				; GFX11-NEXT: v_ldexp_f64 v[2:3], v[4:5], v9
				; GFX11-NEXT: v_ldexp_f64 v[4:5], v[6:7], v10
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call <3 x double> @llvm.experimental.constrained.ldexp.v3f64.v3i32(<3 x double> %a, <3 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <3 x double> %result
				}

				define <4 x double> @test_ldexp_v4f64_v4i32(ptr addrspace(1) %out, <4 x double> %a, <4 x i32> %b) #0 {
				; GFX6-LABEL: test_ldexp_v4f64_v4i32:
				; GFX6: ; %bb.0:
				; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX6-NEXT: v_ldexp_f64 v[0:1], v[2:3], v10
				; GFX6-NEXT: v_ldexp_f64 v[2:3], v[4:5], v11
				; GFX6-NEXT: v_ldexp_f64 v[4:5], v[6:7], v12
				; GFX6-NEXT: v_ldexp_f64 v[6:7], v[8:9], v13
				; GFX6-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX8-LABEL: test_ldexp_v4f64_v4i32:
				; GFX8: ; %bb.0:
				; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX8-NEXT: v_ldexp_f64 v[0:1], v[2:3], v10
				; GFX8-NEXT: v_ldexp_f64 v[2:3], v[4:5], v11
				; GFX8-NEXT: v_ldexp_f64 v[4:5], v[6:7], v12
				; GFX8-NEXT: v_ldexp_f64 v[6:7], v[8:9], v13
				; GFX8-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX9-LABEL: test_ldexp_v4f64_v4i32:
				; GFX9: ; %bb.0:
				; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX9-NEXT: v_ldexp_f64 v[0:1], v[2:3], v10
				; GFX9-NEXT: v_ldexp_f64 v[2:3], v[4:5], v11
				; GFX9-NEXT: v_ldexp_f64 v[4:5], v[6:7], v12
				; GFX9-NEXT: v_ldexp_f64 v[6:7], v[8:9], v13
				; GFX9-NEXT: s_setpc_b64 s[30:31]
				;
				; GFX11-LABEL: test_ldexp_v4f64_v4i32:
				; GFX11: ; %bb.0:
				; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; GFX11-NEXT: s_waitcnt_vscnt null, 0x0
				; GFX11-NEXT: v_ldexp_f64 v[0:1], v[2:3], v10
				; GFX11-NEXT: v_ldexp_f64 v[2:3], v[4:5], v11
				; GFX11-NEXT: v_ldexp_f64 v[4:5], v[6:7], v12
				; GFX11-NEXT: v_ldexp_f64 v[6:7], v[8:9], v13
				; GFX11-NEXT: s_setpc_b64 s[30:31]
				%result = call <4 x double> @llvm.experimental.constrained.ldexp.v4f64.v4i32(<4 x double> %a, <4 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <4 x double> %result
				}

				declare double @llvm.experimental.constrained.ldexp.f64.i16(double, i16, metadata, metadata) #1
				declare double @llvm.experimental.constrained.ldexp.f64.i32(double, i32, metadata, metadata) #1
				declare <2 x double> @llvm.experimental.constrained.ldexp.v2f64.v2i16(<2 x double>, <2 x i16>, metadata, metadata) #1
				declare <2 x double> @llvm.experimental.constrained.ldexp.v2f64.v2i32(<2 x double>, <2 x i32>, metadata, metadata) #1
				declare <3 x double> @llvm.experimental.constrained.ldexp.v3f64.v3i32(<3 x double>, <3 x i32>, metadata, metadata) #1
				declare <4 x double> @llvm.experimental.constrained.ldexp.v4f64.v4i32(<4 x double>, <4 x i32>, metadata, metadata) #1

				attributes #0 = { strictfp }
				attributes #1 = { nocallback nofree nosync nounwind willreturn memory(inaccessiblemem: readwrite) }
				;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
				; GCN: {{.*}}
				; GFX11-GISEL: {{.*}}
				; GFX11-SDAG: {{.*}}
				; GFX6-GISEL: {{.*}}
				; GFX6-SDAG: {{.*}}
				; GFX8-GISEL: {{.*}}
				; GFX8-SDAG: {{.*}}
				; GFX9-GISEL: {{.*}}
				; GFX9-SDAG: {{.*}}

llvm/test/CodeGen/Mips/ldexp.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple=mips-- -mattr=+soft-float < %s \| FileCheck -check-prefix=SOFT %s

				define float @ldexp_f32(i8 zeroext %x) {
				; SOFT-LABEL: ldexp_f32:
				; SOFT: # %bb.0:
				; SOFT-NEXT: addiu $sp, $sp, -24
				; SOFT-NEXT: .cfi_def_cfa_offset 24
				; SOFT-NEXT: sw $ra, 20($sp) # 4-byte Folded Spill
				; SOFT-NEXT: .cfi_offset 31, -4
				; SOFT-NEXT: move $5, $4
				; SOFT-NEXT: jal ldexpf
				; SOFT-NEXT: lui $4, 16256
				; SOFT-NEXT: lw $ra, 20($sp) # 4-byte Folded Reload
				; SOFT-NEXT: jr $ra
				; SOFT-NEXT: addiu $sp, $sp, 24
				%zext = zext i8 %x to i32
				%ldexp = call float @llvm.ldexp.f32.i32(float 1.000000e+00, i32 %zext)
				ret float %ldexp
				}

				define double @ldexp_f64(i8 zeroext %x) {
				; SOFT-LABEL: ldexp_f64:
				; SOFT: # %bb.0:
				; SOFT-NEXT: addiu $sp, $sp, -24
				; SOFT-NEXT: .cfi_def_cfa_offset 24
				; SOFT-NEXT: sw $ra, 20($sp) # 4-byte Folded Spill
				; SOFT-NEXT: .cfi_offset 31, -4
				; SOFT-NEXT: move $6, $4
				; SOFT-NEXT: lui $4, 16368
				; SOFT-NEXT: jal ldexp
				; SOFT-NEXT: addiu $5, $zero, 0
				; SOFT-NEXT: lw $ra, 20($sp) # 4-byte Folded Reload
				; SOFT-NEXT: jr $ra
				; SOFT-NEXT: addiu $sp, $sp, 24
				%zext = zext i8 %x to i32
				%ldexp = call double @llvm.ldexp.f64.i32(double 1.000000e+00, i32 %zext)
				ret double %ldexp
				}

				define <2 x float> @ldexp_v2f32(<2 x float> %val, <2 x i32> %exp) {
				; SOFT-LABEL: ldexp_v2f32:
				; SOFT: # %bb.0:
				; SOFT-NEXT: addiu $sp, $sp, -32
				; SOFT-NEXT: .cfi_def_cfa_offset 32
				; SOFT-NEXT: sw $ra, 28($sp) # 4-byte Folded Spill
				; SOFT-NEXT: sw $17, 24($sp) # 4-byte Folded Spill
				; SOFT-NEXT: sw $16, 20($sp) # 4-byte Folded Spill
				; SOFT-NEXT: .cfi_offset 31, -4
				; SOFT-NEXT: .cfi_offset 17, -8
				; SOFT-NEXT: .cfi_offset 16, -12
				; SOFT-NEXT: move $16, $6
				; SOFT-NEXT: move $17, $4
				; SOFT-NEXT: lw $5, 52($sp)
				; SOFT-NEXT: jal ldexpf
				; SOFT-NEXT: move $4, $7
				; SOFT-NEXT: lw $5, 48($sp)
				; SOFT-NEXT: sw $2, 4($17)
				; SOFT-NEXT: jal ldexpf
				; SOFT-NEXT: move $4, $16
				; SOFT-NEXT: sw $2, 0($17)
				; SOFT-NEXT: lw $16, 20($sp) # 4-byte Folded Reload
				; SOFT-NEXT: lw $17, 24($sp) # 4-byte Folded Reload
				; SOFT-NEXT: lw $ra, 28($sp) # 4-byte Folded Reload
				; SOFT-NEXT: jr $ra
				; SOFT-NEXT: addiu $sp, $sp, 32
				%1 = call <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float> %val, <2 x i32> %exp)
				ret <2 x float> %1
				}

				define <4 x float> @ldexp_v4f32(<4 x float> %val, <4 x i32> %exp) {
				; SOFT-LABEL: ldexp_v4f32:
				; SOFT: # %bb.0:
				; SOFT-NEXT: addiu $sp, $sp, -40
				; SOFT-NEXT: .cfi_def_cfa_offset 40
				; SOFT-NEXT: sw $ra, 36($sp) # 4-byte Folded Spill
				; SOFT-NEXT: sw $20, 32($sp) # 4-byte Folded Spill
				; SOFT-NEXT: sw $19, 28($sp) # 4-byte Folded Spill
				; SOFT-NEXT: sw $18, 24($sp) # 4-byte Folded Spill
				; SOFT-NEXT: sw $17, 20($sp) # 4-byte Folded Spill
				; SOFT-NEXT: sw $16, 16($sp) # 4-byte Folded Spill
				; SOFT-NEXT: .cfi_offset 31, -4
				; SOFT-NEXT: .cfi_offset 20, -8
				; SOFT-NEXT: .cfi_offset 19, -12
				; SOFT-NEXT: .cfi_offset 18, -16
				; SOFT-NEXT: .cfi_offset 17, -20
				; SOFT-NEXT: .cfi_offset 16, -24
				; SOFT-NEXT: move $16, $7
				; SOFT-NEXT: move $18, $4
				; SOFT-NEXT: lw $4, 60($sp)
				; SOFT-NEXT: lw $5, 76($sp)
				; SOFT-NEXT: jal ldexpf
				; SOFT-NEXT: move $17, $6
				; SOFT-NEXT: lw $19, 64($sp)
				; SOFT-NEXT: lw $20, 68($sp)
				; SOFT-NEXT: lw $5, 72($sp)
				; SOFT-NEXT: lw $4, 56($sp)
				; SOFT-NEXT: jal ldexpf
				; SOFT-NEXT: sw $2, 12($18)
				; SOFT-NEXT: sw $2, 8($18)
				; SOFT-NEXT: move $4, $16
				; SOFT-NEXT: jal ldexpf
				; SOFT-NEXT: move $5, $20
				; SOFT-NEXT: sw $2, 4($18)
				; SOFT-NEXT: move $4, $17
				; SOFT-NEXT: jal ldexpf
				; SOFT-NEXT: move $5, $19
				; SOFT-NEXT: sw $2, 0($18)
				; SOFT-NEXT: lw $16, 16($sp) # 4-byte Folded Reload
				; SOFT-NEXT: lw $17, 20($sp) # 4-byte Folded Reload
				; SOFT-NEXT: lw $18, 24($sp) # 4-byte Folded Reload
				; SOFT-NEXT: lw $19, 28($sp) # 4-byte Folded Reload
				; SOFT-NEXT: lw $20, 32($sp) # 4-byte Folded Reload
				; SOFT-NEXT: lw $ra, 36($sp) # 4-byte Folded Reload
				; SOFT-NEXT: jr $ra
				; SOFT-NEXT: addiu $sp, $sp, 40
				%1 = call <4 x float> @llvm.ldexp.v4f32.v4i32(<4 x float> %val, <4 x i32> %exp)
				ret <4 x float> %1
				}

				define half @ldexp_f16(half %arg0, i32 %arg1) {
				; SOFT-LABEL: ldexp_f16:
				; SOFT: # %bb.0:
				; SOFT-NEXT: addiu $sp, $sp, -24
				; SOFT-NEXT: .cfi_def_cfa_offset 24
				; SOFT-NEXT: sw $ra, 20($sp) # 4-byte Folded Spill
				; SOFT-NEXT: sw $16, 16($sp) # 4-byte Folded Spill
				; SOFT-NEXT: .cfi_offset 31, -4
				; SOFT-NEXT: .cfi_offset 16, -8
				; SOFT-NEXT: move $16, $5
				; SOFT-NEXT: jal __gnu_h2f_ieee
				; SOFT-NEXT: andi $4, $4, 65535
				; SOFT-NEXT: move $4, $2
				; SOFT-NEXT: jal ldexpf
				; SOFT-NEXT: move $5, $16
				; SOFT-NEXT: jal __gnu_f2h_ieee
				; SOFT-NEXT: move $4, $2
				; SOFT-NEXT: lw $16, 16($sp) # 4-byte Folded Reload
				; SOFT-NEXT: lw $ra, 20($sp) # 4-byte Folded Reload
				; SOFT-NEXT: jr $ra
				; SOFT-NEXT: addiu $sp, $sp, 24
				%ldexp = call half @llvm.ldexp.f16.i32(half %arg0, i32 %arg1)
				ret half %ldexp
				}

				define x86_fp80 @ldexp_f80(x86_fp80 %arg0, i32 %arg1) {
				; SOFT-LABEL: ldexp_f80:
				; SOFT: # %bb.0:
				; SOFT-NEXT: addiu $sp, $sp, -24
				; SOFT-NEXT: .cfi_def_cfa_offset 24
				; SOFT-NEXT: sw $ra, 20($sp) # 4-byte Folded Spill
				; SOFT-NEXT: .cfi_offset 31, -4
				; SOFT-NEXT: jal ldexpl
				; SOFT-NEXT: andi $4, $4, 65535
				; SOFT-NEXT: move $4, $2
				; SOFT-NEXT: addiu $2, $zero, 0
				; SOFT-NEXT: lw $ra, 20($sp) # 4-byte Folded Reload
				; SOFT-NEXT: jr $ra
				; SOFT-NEXT: addiu $sp, $sp, 24
				%ldexp = call x86_fp80 @llvm.ldexp.f80.i32(x86_fp80 %arg0, i32 %arg1)
				ret x86_fp80 %ldexp
				}


				declare double @llvm.ldexp.f64.i32(double, i32) #0
				declare float @llvm.ldexp.f32.i32(float, i32) #0
				declare <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float>, <2 x i32>) #0
				declare <4 x float> @llvm.ldexp.v4f32.v4i32(<4 x float>, <4 x i32>) #0
				declare x86_fp80 @llvm.ldexp.f80.i32(x86_fp80, i32)
				declare half @llvm.ldexp.f16.i32(half, i32) #0

				attributes #0 = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }

llvm/test/CodeGen/PowerPC/ldexp-libcall.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mcpu=pwr9 -mtriple=powerpc64le-unknown-unknown \
				; RUN: -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names < %s \| FileCheck %s

				define float @call_ldexpf(float %a, i32 %b) {
				; CHECK-LABEL: call_ldexpf:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -32(r1)
				; CHECK-NEXT: std r0, 48(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 32
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: clrldi r4, r4, 32
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: addi r1, r1, 32
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%result = call float @ldexpf(float %a, i32 %b)
				ret float %result
				}

				define double @call_ldexp(double %a, i32 %b) {
				; CHECK-LABEL: call_ldexp:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -32(r1)
				; CHECK-NEXT: std r0, 48(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 32
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: clrldi r4, r4, 32
				; CHECK-NEXT: bl ldexp
				; CHECK-NEXT: nop
				; CHECK-NEXT: addi r1, r1, 32
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%result = call double @ldexp(double %a, i32 %b)
				ret double %result
				}

				define ppc_fp128 @call_ldexpl(ppc_fp128 %a, i32 %b) {
				; CHECK-LABEL: call_ldexpl:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -32(r1)
				; CHECK-NEXT: std r0, 48(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 32
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: clrldi r5, r5, 32
				; CHECK-NEXT: bl ldexpl
				; CHECK-NEXT: nop
				; CHECK-NEXT: addi r1, r1, 32
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%result = call ppc_fp128 @ldexpl(ppc_fp128 %a, i32 %b)
				ret ppc_fp128 %result
				}

				declare float @ldexpf(float %a, i32 %b) #0
				declare double @ldexp(double %a, i32 %b) #0
				declare ppc_fp128 @ldexpl(ppc_fp128 %a, i32 %b) #0

				attributes #0 = { nounwind readonly }

llvm/test/CodeGen/PowerPC/ldexp.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mcpu=pwr9 -mtriple=powerpc64le-unknown-unknown \
				; RUN: -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names < %s \| FileCheck %s

				define float @ldexp_f32(i8 zeroext %x) {
				; CHECK-LABEL: ldexp_f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -32(r1)
				; CHECK-NEXT: std r0, 48(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 32
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: vspltisw v2, 1
				; CHECK-NEXT: mr r4, r3
				; CHECK-NEXT: xvcvsxwdp vs1, v2
				; CHECK-NEXT: # kill: def $f1 killed $f1 killed $vsl1
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: addi r1, r1, 32
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%zext = zext i8 %x to i32
				%ldexp = call float @llvm.ldexp.f32.i32(float 1.000000e+00, i32 %zext)
				ret float %ldexp
				}

				define double @ldexp_f64(i8 zeroext %x) {
				; CHECK-LABEL: ldexp_f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -32(r1)
				; CHECK-NEXT: std r0, 48(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 32
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: vspltisw v2, 1
				; CHECK-NEXT: mr r4, r3
				; CHECK-NEXT: xvcvsxwdp vs1, v2
				; CHECK-NEXT: # kill: def $f1 killed $f1 killed $vsl1
				; CHECK-NEXT: bl ldexp
				; CHECK-NEXT: nop
				; CHECK-NEXT: addi r1, r1, 32
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%zext = zext i8 %x to i32
				%ldexp = call double @llvm.ldexp.f64.i32(double 1.000000e+00, i32 %zext)
				ret double %ldexp
				}

				define <2 x float> @ldexp_v2f32(<2 x float> %val, <2 x i32> %exp) {
				; CHECK-LABEL: ldexp_v2f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -96(r1)
				; CHECK-NEXT: std r0, 112(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 96
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: .cfi_offset v28, -64
				; CHECK-NEXT: .cfi_offset v29, -48
				; CHECK-NEXT: .cfi_offset v30, -32
				; CHECK-NEXT: .cfi_offset v31, -16
				; CHECK-NEXT: li r3, 12
				; CHECK-NEXT: xscvspdpn f1, v2
				; CHECK-NEXT: stxv v28, 32(r1) # 16-byte Folded Spill
				; CHECK-NEXT: stxv v29, 48(r1) # 16-byte Folded Spill
				; CHECK-NEXT: stxv v30, 64(r1) # 16-byte Folded Spill
				; CHECK-NEXT: stxv v31, 80(r1) # 16-byte Folded Spill
				; CHECK-NEXT: vmr v31, v3
				; CHECK-NEXT: vmr v30, v2
				; CHECK-NEXT: vextuwrx r4, r3, v3
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: xxswapd vs0, v30
				; CHECK-NEXT: li r3, 4
				; CHECK-NEXT: xscpsgndp v29, f1, f1
				; CHECK-NEXT: xscvspdpn f1, vs0
				; CHECK-NEXT: vextuwrx r4, r3, v31
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; CHECK-NEXT: xxmrghd vs0, v29, vs1
				; CHECK-NEXT: li r3, 0
				; CHECK-NEXT: vextuwrx r4, r3, v31
				; CHECK-NEXT: xvcvdpsp v28, vs0
				; CHECK-NEXT: xxsldwi vs0, v30, v30, 3
				; CHECK-NEXT: xscvspdpn f1, vs0
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: xxsldwi vs0, v30, v30, 1
				; CHECK-NEXT: xscpsgndp v29, f1, f1
				; CHECK-NEXT: mfvsrwz r4, v31
				; CHECK-NEXT: xscvspdpn f1, vs0
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; CHECK-NEXT: xxmrghd vs0, vs1, v29
				; CHECK-NEXT: lxv v31, 80(r1) # 16-byte Folded Reload
				; CHECK-NEXT: lxv v30, 64(r1) # 16-byte Folded Reload
				; CHECK-NEXT: lxv v29, 48(r1) # 16-byte Folded Reload
				; CHECK-NEXT: xvcvdpsp v2, vs0
				; CHECK-NEXT: vmrgew v2, v28, v2
				; CHECK-NEXT: lxv v28, 32(r1) # 16-byte Folded Reload
				; CHECK-NEXT: addi r1, r1, 96
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%1 = call <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float> %val, <2 x i32> %exp)
				ret <2 x float> %1
				}

				define <4 x float> @ldexp_v4f32(<4 x float> %val, <4 x i32> %exp) {
				; CHECK-LABEL: ldexp_v4f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -96(r1)
				; CHECK-NEXT: std r0, 112(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 96
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: .cfi_offset v28, -64
				; CHECK-NEXT: .cfi_offset v29, -48
				; CHECK-NEXT: .cfi_offset v30, -32
				; CHECK-NEXT: .cfi_offset v31, -16
				; CHECK-NEXT: li r3, 12
				; CHECK-NEXT: xscvspdpn f1, v2
				; CHECK-NEXT: stxv v28, 32(r1) # 16-byte Folded Spill
				; CHECK-NEXT: stxv v29, 48(r1) # 16-byte Folded Spill
				; CHECK-NEXT: stxv v30, 64(r1) # 16-byte Folded Spill
				; CHECK-NEXT: stxv v31, 80(r1) # 16-byte Folded Spill
				; CHECK-NEXT: vmr v31, v3
				; CHECK-NEXT: vmr v30, v2
				; CHECK-NEXT: vextuwrx r4, r3, v3
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: xxswapd vs0, v30
				; CHECK-NEXT: li r3, 4
				; CHECK-NEXT: xscpsgndp v29, f1, f1
				; CHECK-NEXT: xscvspdpn f1, vs0
				; CHECK-NEXT: vextuwrx r4, r3, v31
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; CHECK-NEXT: xxmrghd vs0, v29, vs1
				; CHECK-NEXT: li r3, 0
				; CHECK-NEXT: vextuwrx r4, r3, v31
				; CHECK-NEXT: xvcvdpsp v28, vs0
				; CHECK-NEXT: xxsldwi vs0, v30, v30, 3
				; CHECK-NEXT: xscvspdpn f1, vs0
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: xxsldwi vs0, v30, v30, 1
				; CHECK-NEXT: xscpsgndp v29, f1, f1
				; CHECK-NEXT: mfvsrwz r4, v31
				; CHECK-NEXT: xscvspdpn f1, vs0
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; CHECK-NEXT: xxmrghd vs0, vs1, v29
				; CHECK-NEXT: lxv v31, 80(r1) # 16-byte Folded Reload
				; CHECK-NEXT: lxv v30, 64(r1) # 16-byte Folded Reload
				; CHECK-NEXT: lxv v29, 48(r1) # 16-byte Folded Reload
				; CHECK-NEXT: xvcvdpsp v2, vs0
				; CHECK-NEXT: vmrgew v2, v28, v2
				; CHECK-NEXT: lxv v28, 32(r1) # 16-byte Folded Reload
				; CHECK-NEXT: addi r1, r1, 96
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%1 = call <4 x float> @llvm.ldexp.v4f32.v4i32(<4 x float> %val, <4 x i32> %exp)
				ret <4 x float> %1
				}

				define half @ldexp_f16(half %arg0, i32 %arg1) {
				; CHECK-LABEL: ldexp_f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -32(r1)
				; CHECK-NEXT: std r0, 48(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 32
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: xscvdphp f0, f1
				; CHECK-NEXT: clrldi r4, r4, 32
				; CHECK-NEXT: mffprwz r3, f0
				; CHECK-NEXT: clrlwi r3, r3, 16
				; CHECK-NEXT: mtfprwz f0, r3
				; CHECK-NEXT: xscvhpdp f1, f0
				; CHECK-NEXT: bl ldexpf
				; CHECK-NEXT: nop
				; CHECK-NEXT: addi r1, r1, 32
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%ldexp = call half @llvm.ldexp.f16.i32(half %arg0, i32 %arg1)
				ret half %ldexp
				}

				define ppc_fp128 @ldexp_fp128(ppc_fp128 %arg0, i32 %arg1) {
				; CHECK-LABEL: ldexp_fp128:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mflr r0
				; CHECK-NEXT: stdu r1, -32(r1)
				; CHECK-NEXT: std r0, 48(r1)
				; CHECK-NEXT: .cfi_def_cfa_offset 32
				; CHECK-NEXT: .cfi_offset lr, 16
				; CHECK-NEXT: clrldi r5, r5, 32
				; CHECK-NEXT: bl ldexpl
				; CHECK-NEXT: nop
				; CHECK-NEXT: addi r1, r1, 32
				; CHECK-NEXT: ld r0, 16(r1)
				; CHECK-NEXT: mtlr r0
				; CHECK-NEXT: blr
				%ldexp = call ppc_fp128 @llvm.ldexp.ppcf128.i32(ppc_fp128 %arg0, i32 %arg1)
				ret ppc_fp128 %ldexp
				}

				declare double @llvm.ldexp.f64.i32(double, i32) #0
				declare float @llvm.ldexp.f32.i32(float, i32) #0
				declare <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float>, <2 x i32>) #0
				declare <4 x float> @llvm.ldexp.v4f32.v4i32(<4 x float>, <4 x i32>) #0
				declare half @llvm.ldexp.f16.i32(half, i32) #0
				declare ppc_fp128 @llvm.ldexp.ppcf128.i32(ppc_fp128, i32) #0

				attributes #0 = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }

llvm/test/CodeGen/X86/ldexp-f80.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple=x86_64-unknown-unknown < %s \| FileCheck -check-prefixes=X64 %s
				; FIXME: Expansion without libcall
				; XUN: llc -mtriple=i386-pc-win32 < %s \| FileCheck -check-prefix=WIN32 %s

				define x86_fp80 @ldexp_f80(x86_fp80 %arg0, i32 %arg1) {
				; X64-LABEL: ldexp_f80:
				; X64: # %bb.0:
				; X64-NEXT: subq $24, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 32
				; X64-NEXT: fldt {{[0-9]+}}(%rsp)
				; X64-NEXT: fstpt (%rsp)
				; X64-NEXT: callq ldexpl@PLT
				; X64-NEXT: addq $24, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 8
				; X64-NEXT: retq
				%ldexp = call x86_fp80 @llvm.ldexp.f80.i32(x86_fp80 %arg0, i32 %arg1)
				ret x86_fp80 %ldexp
				}

				define x86_fp80 @test_strict_ldexp_f80_i32(ptr addrspace(1) %out, x86_fp80 %a, i32 %b) #2 {
				; X64-LABEL: test_strict_ldexp_f80_i32:
				; X64: # %bb.0:
				; X64-NEXT: subq $24, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 32
				; X64-NEXT: movl %esi, %edi
				; X64-NEXT: fldt {{[0-9]+}}(%rsp)
				; X64-NEXT: fstpt (%rsp)
				; X64-NEXT: wait
				; X64-NEXT: callq ldexpl@PLT
				; X64-NEXT: addq $24, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 8
				; X64-NEXT: retq
				%result = call x86_fp80 @llvm.experimental.constrained.ldexp.f80.i32(x86_fp80 %a, i32 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret x86_fp80 %result
				}

				declare x86_fp80 @llvm.ldexp.f80.i32(x86_fp80, i32)
				declare x86_fp80 @llvm.experimental.constrained.ldexp.f80.i32(x86_fp80, i32, metadata, metadata) #1

				attributes #0 = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }
				attributes #1 = { nocallback nofree nosync nounwind willreturn memory(inaccessiblemem: readwrite) }
				attributes #2 = { strictfp }

llvm/test/CodeGen/X86/ldexp-libcall.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s
				; RUN: llc < %s -mtriple=i386-pc-win32 \| FileCheck %s -check-prefix=CHECK-WIN

				define float @call_ldexpf(float %a, i32 %b) {
				; CHECK-LABEL: call_ldexpf:
				; CHECK: # %bb.0:
				; CHECK-NEXT: jmp ldexpf@PLT # TAILCALL
				;
				; CHECK-WIN-LABEL: call_ldexpf:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: subl $8, %esp
				; CHECK-WIN-NEXT: flds {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: movl {{[0-9]+}}(%esp), %eax
				; CHECK-WIN-NEXT: movl %eax, {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstps (%esp)
				; CHECK-WIN-NEXT: calll _ldexpf
				; CHECK-WIN-NEXT: addl $8, %esp
				; CHECK-WIN-NEXT: retl
				%result = call float @ldexpf(float %a, i32 %b)
				ret float %result
				}

				define double @call_ldexp(double %a, i32 %b) {
				; CHECK-LABEL: call_ldexp:
				; CHECK: # %bb.0:
				; CHECK-NEXT: jmp ldexp@PLT # TAILCALL
				;
				; CHECK-WIN-LABEL: call_ldexp:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: subl $12, %esp
				; CHECK-WIN-NEXT: fldl {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: movl {{[0-9]+}}(%esp), %eax
				; CHECK-WIN-NEXT: movl %eax, {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstpl (%esp)
				; CHECK-WIN-NEXT: calll _ldexp
				; CHECK-WIN-NEXT: addl $12, %esp
				; CHECK-WIN-NEXT: retl
				%result = call double @ldexp(double %a, i32 %b)
				ret double %result
				}

				define x86_fp80 @call_ldexpl(x86_fp80 %a, i32 %b) {
				; CHECK-LABEL: call_ldexpl:
				; CHECK: # %bb.0:
				; CHECK-NEXT: subq $24, %rsp
				; CHECK-NEXT: .cfi_def_cfa_offset 32
				; CHECK-NEXT: fldt {{[0-9]+}}(%rsp)
				; CHECK-NEXT: fstpt (%rsp)
				; CHECK-NEXT: callq ldexpl@PLT
				; CHECK-NEXT: addq $24, %rsp
				; CHECK-NEXT: .cfi_def_cfa_offset 8
				; CHECK-NEXT: retq
				;
				; CHECK-WIN-LABEL: call_ldexpl:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: pushl %ebp
				; CHECK-WIN-NEXT: movl %esp, %ebp
				; CHECK-WIN-NEXT: andl $-16, %esp
				; CHECK-WIN-NEXT: subl $48, %esp
				; CHECK-WIN-NEXT: fldt 8(%ebp)
				; CHECK-WIN-NEXT: movl 24(%ebp), %eax
				; CHECK-WIN-NEXT: movl %eax, {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstpt (%esp)
				; CHECK-WIN-NEXT: calll _ldexpl
				; CHECK-WIN-NEXT: movl %ebp, %esp
				; CHECK-WIN-NEXT: popl %ebp
				; CHECK-WIN-NEXT: retl
				%result = call x86_fp80 @ldexpl(x86_fp80 %a, i32 %b)
				ret x86_fp80 %result
				}

				declare float @ldexpf(float %a, i32 %b) #0
				declare double @ldexp(double %a, i32 %b) #0
				declare x86_fp80 @ldexpl(x86_fp80 %a, i32 %b) #0

				attributes #0 = { nounwind readonly }

llvm/test/CodeGen/X86/ldexp-not-readonly.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s
				; RUN: llc < %s -mtriple=i386-pc-win32 \| FileCheck %s -check-prefix=CHECK-WIN

				define float @call_ldexpf(float %a, i32 %b) {
				; CHECK-LABEL: call_ldexpf:
				; CHECK: # %bb.0:
				; CHECK-NEXT: pushq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: callq ldexpf@PLT
				; CHECK-NEXT: popq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 8
				; CHECK-NEXT: retq
				;
				; CHECK-WIN-LABEL: call_ldexpf:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: subl $8, %esp
				; CHECK-WIN-NEXT: flds {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: movl {{[0-9]+}}(%esp), %eax
				; CHECK-WIN-NEXT: movl %eax, {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstps (%esp)
				; CHECK-WIN-NEXT: calll _ldexpf
				; CHECK-WIN-NEXT: addl $8, %esp
				; CHECK-WIN-NEXT: retl
				%result = call float @ldexpf(float %a, i32 %b)
				ret float %result
				}

				define double @call_ldexp(double %a, i32 %b) {
				; CHECK-LABEL: call_ldexp:
				; CHECK: # %bb.0:
				; CHECK-NEXT: pushq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: callq ldexp@PLT
				; CHECK-NEXT: popq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 8
				; CHECK-NEXT: retq
				;
				; CHECK-WIN-LABEL: call_ldexp:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: subl $12, %esp
				; CHECK-WIN-NEXT: fldl {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: movl {{[0-9]+}}(%esp), %eax
				; CHECK-WIN-NEXT: movl %eax, {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstpl (%esp)
				; CHECK-WIN-NEXT: calll _ldexp
				; CHECK-WIN-NEXT: addl $12, %esp
				; CHECK-WIN-NEXT: retl
				%result = call double @ldexp(double %a, i32 %b)
				ret double %result
				}

				declare float @ldexpf(float %a, i32 %b)
				declare double @ldexp(double %a, i32 %b)

llvm/test/CodeGen/X86/ldexp-strict.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple=x86_64-unknown-unknown < %s \| FileCheck -check-prefixes=X64 %s
				; XUN: llc -mtriple=i386-pc-win32 < %s \| FileCheck -check-prefix=WIN32 %s
				; FIXME: Expansion support without libcalls

				; FIXME: Implement f16->f32 promotion for strictfp
				; define half @test_strict_ldexp_f16_i32(ptr addrspace(1) %out, half %a, i32 %b) #2 {
				; %result = call half @llvm.experimental.constrained.ldexp.f16.i32(half %a, i32 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				; ret half %result
				; }

				define float @test_strict_ldexp_f32_i32(ptr addrspace(1) %out, float %a, i32 %b) #2 {
				; X64-LABEL: test_strict_ldexp_f32_i32:
				; X64: # %bb.0:
				; X64-NEXT: pushq %rax
				; X64-NEXT: .cfi_def_cfa_offset 16
				; X64-NEXT: movl %esi, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: popq %rax
				; X64-NEXT: .cfi_def_cfa_offset 8
				; X64-NEXT: retq
				%result = call float @llvm.experimental.constrained.ldexp.f32.i32(float %a, i32 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret float %result
				}

				define double @test_strict_ldexp_f64_i32(ptr addrspace(1) %out, double %a, i32 %b) #2 {
				; X64-LABEL: test_strict_ldexp_f64_i32:
				; X64: # %bb.0:
				; X64-NEXT: pushq %rax
				; X64-NEXT: .cfi_def_cfa_offset 16
				; X64-NEXT: movl %esi, %edi
				; X64-NEXT: callq ldexp@PLT
				; X64-NEXT: popq %rax
				; X64-NEXT: .cfi_def_cfa_offset 8
				; X64-NEXT: retq
				%result = call double @llvm.experimental.constrained.ldexp.f64.i32(double %a, i32 %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret double %result
				}


				define <2 x float> @test_strict_ldexp_v2f32_v2i32(ptr addrspace(1) %out, <2 x float> %a, <2 x i32> %b) #2 {
				; X64-LABEL: test_strict_ldexp_v2f32_v2i32:
				; X64: # %bb.0:
				; X64-NEXT: subq $56, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 64
				; X64-NEXT: movdqa %xmm1, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
				; X64-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
				; X64-NEXT: movd %xmm1, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: movaps %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
				; X64-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
				; X64-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,1,1]
				; X64-NEXT: pshufd $85, {{[-0-9]+}}(%r{{[sb]}}p), %xmm1 # 16-byte Folded Reload
				; X64-NEXT: # xmm1 = mem[1,1,1,1]
				; X64-NEXT: movd %xmm1, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm1 # 16-byte Reload
				; X64-NEXT: unpcklps {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
				; X64-NEXT: movaps %xmm1, %xmm0
				; X64-NEXT: addq $56, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 8
				; X64-NEXT: retq
				%result = call <2 x float> @llvm.experimental.constrained.ldexp.v2f32.v2i32(<2 x float> %a, <2 x i32> %b, metadata !"round.dynamic", metadata !"fpexcept.strict")
				ret <2 x float> %result
				}

				declare half @llvm.experimental.constrained.ldexp.f16.i32(half, i32, metadata, metadata) #1
				declare float @llvm.experimental.constrained.ldexp.f32.i32(float, i32, metadata, metadata) #1
				declare double @llvm.experimental.constrained.ldexp.f64.i32(double, i32, metadata, metadata) #1
				declare x86_fp80 @llvm.experimental.constrained.ldexp.f80.i32(x86_fp80, i32, metadata, metadata) #1
				declare <2 x float> @llvm.experimental.constrained.ldexp.v2f32.v2i32(<2 x float>, <2 x i32>, metadata, metadata) #1

				attributes #0 = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }
				attributes #1 = { nocallback nofree nosync nounwind willreturn memory(inaccessiblemem: readwrite) }
				attributes #2 = { strictfp }

llvm/test/CodeGen/X86/ldexp-wrong-signature.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s
				; RUN: llc < %s -mtriple=i386-pc-win32 \| FileCheck %s -check-prefix=CHECK-WIN

				define float @ldexpf_too_many_args(float %a, i32 %b, i32 %c) {
				; CHECK-LABEL: ldexpf_too_many_args:
				; CHECK: # %bb.0:
				; CHECK-NEXT: pushq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: callq ldexpf@PLT
				; CHECK-NEXT: popq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 8
				; CHECK-NEXT: retq
				;
				; CHECK-WIN-LABEL: ldexpf_too_many_args:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: subl $12, %esp
				; CHECK-WIN-NEXT: flds {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: movl {{[0-9]+}}(%esp), %eax
				; CHECK-WIN-NEXT: movl {{[0-9]+}}(%esp), %ecx
				; CHECK-WIN-NEXT: movl %ecx, {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: movl %eax, {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstps (%esp)
				; CHECK-WIN-NEXT: calll _ldexpf
				; CHECK-WIN-NEXT: addl $12, %esp
				; CHECK-WIN-NEXT: retl
				%result = call float @ldexpf(float %a, i32 %b, i32 %c) #0
				ret float %result
				}

				define float @ldexp_wrong_fp_type(float %a, i32 %b) {
				; CHECK-LABEL: ldexp_wrong_fp_type:
				; CHECK: # %bb.0:
				; CHECK-NEXT: pushq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: callq ldexp@PLT
				; CHECK-NEXT: popq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 8
				; CHECK-NEXT: retq
				;
				; CHECK-WIN-LABEL: ldexp_wrong_fp_type:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: subl $8, %esp
				; CHECK-WIN-NEXT: flds {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: movl {{[0-9]+}}(%esp), %eax
				; CHECK-WIN-NEXT: movl %eax, {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstps (%esp)
				; CHECK-WIN-NEXT: calll _ldexp
				; CHECK-WIN-NEXT: addl $8, %esp
				; CHECK-WIN-NEXT: retl
				%result = call float @ldexp(float %a, i32 %b) #0
				ret float %result
				}

				declare float @ldexpf(float, i32, i32) #0
				declare float @ldexp(float, i32) #0

				attributes #0 = { nounwind readnone }

llvm/test/CodeGen/X86/ldexp-wrong-signature2.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s
				; RUN: llc < %s -mtriple=i386-pc-win32 \| FileCheck %s -check-prefix=CHECK-WIN

				define i32 @ldexpf_not_fp(i32 %a, i32 %b) {
				; CHECK-LABEL: ldexpf_not_fp:
				; CHECK: # %bb.0:
				; CHECK-NEXT: pushq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: callq ldexpf@PLT
				; CHECK-NEXT: popq %rcx
				; CHECK-NEXT: .cfi_def_cfa_offset 8
				; CHECK-NEXT: retq
				;
				; CHECK-WIN-LABEL: ldexpf_not_fp:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: pushl {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: pushl {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: calll _ldexpf
				; CHECK-WIN-NEXT: addl $8, %esp
				; CHECK-WIN-NEXT: retl
				%result = call i32 @ldexpf(i32 %a, i32 %b) #0
				ret i32 %result
				}

				define float @ldexp_not_int(float %a, float %b) {
				; CHECK-LABEL: ldexp_not_int:
				; CHECK: # %bb.0:
				; CHECK-NEXT: pushq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: callq ldexp@PLT
				; CHECK-NEXT: popq %rax
				; CHECK-NEXT: .cfi_def_cfa_offset 8
				; CHECK-NEXT: retq
				;
				; CHECK-WIN-LABEL: ldexp_not_int:
				; CHECK-WIN: # %bb.0:
				; CHECK-WIN-NEXT: subl $8, %esp
				; CHECK-WIN-NEXT: flds {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: flds {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstps {{[0-9]+}}(%esp)
				; CHECK-WIN-NEXT: fstps (%esp)
				; CHECK-WIN-NEXT: calll _ldexp
				; CHECK-WIN-NEXT: addl $8, %esp
				; CHECK-WIN-NEXT: retl
				%result = call float @ldexp(float %a, float %b) #0
				ret float %result
				}

				declare i32 @ldexpf(i32, i32) #0
				declare float @ldexp(float, float) #0

				attributes #0 = { nounwind readnone }

llvm/test/CodeGen/X86/ldexp.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple=x86_64-unknown-unknown < %s \| FileCheck -check-prefixes=X64 %s
				; RUN: llc -mtriple=i386-pc-win32 < %s \| FileCheck -check-prefix=WIN32 %s

				define float @ldexp_f32(i8 zeroext %x) {
				; X64-LABEL: ldexp_f32:
				; X64: # %bb.0:
				; X64-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; X64-NEXT: jmp ldexpf@PLT # TAILCALL
				;
				; WIN32-LABEL: ldexp_f32:
				; WIN32: # %bb.0:
				; WIN32-NEXT: pushl %eax
				; WIN32-NEXT: movzbl {{[0-9]+}}(%esp), %ecx
				; WIN32-NEXT: cmpl $381, %ecx # imm = 0x17D
				; WIN32-NEXT: movl %ecx, %eax
				; WIN32-NEXT: jl LBB0_2
				; WIN32-NEXT: # %bb.1:
				; WIN32-NEXT: movl $381, %eax # imm = 0x17D
				; WIN32-NEXT: LBB0_2:
				; WIN32-NEXT: addl $-254, %eax
				; WIN32-NEXT: leal -127(%ecx), %edx
				; WIN32-NEXT: cmpl $255, %ecx
				; WIN32-NEXT: jae LBB0_4
				; WIN32-NEXT: # %bb.3:
				; WIN32-NEXT: movl %edx, %eax
				; WIN32-NEXT: LBB0_4:
				; WIN32-NEXT: flds __real@7f800000
				; WIN32-NEXT: flds __real@7f000000
				; WIN32-NEXT: jae LBB0_6
				; WIN32-NEXT: # %bb.5:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB0_6:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: cmpl $-329, %ecx # imm = 0xFEB7
				; WIN32-NEXT: movl %ecx, %edx
				; WIN32-NEXT: jge LBB0_8
				; WIN32-NEXT: # %bb.7:
				; WIN32-NEXT: movl $-330, %edx # imm = 0xFEB6
				; WIN32-NEXT: LBB0_8:
				; WIN32-NEXT: cmpl $-228, %ecx
				; WIN32-NEXT: fldz
				; WIN32-NEXT: flds __real@0c800000
				; WIN32-NEXT: jb LBB0_9
				; WIN32-NEXT: # %bb.10:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: leal 102(%ecx), %edx
				; WIN32-NEXT: cmpl $-126, %ecx
				; WIN32-NEXT: jge LBB0_12
				; WIN32-NEXT: jmp LBB0_13
				; WIN32-NEXT: LBB0_9:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: addl $204, %edx
				; WIN32-NEXT: cmpl $-126, %ecx
				; WIN32-NEXT: jl LBB0_13
				; WIN32-NEXT: LBB0_12:
				; WIN32-NEXT: movl %ecx, %edx
				; WIN32-NEXT: LBB0_13:
				; WIN32-NEXT: fld1
				; WIN32-NEXT: jl LBB0_15
				; WIN32-NEXT: # %bb.14:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB0_15:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: cmpl $127, %ecx
				; WIN32-NEXT: jg LBB0_17
				; WIN32-NEXT: # %bb.16:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: movl %edx, %eax
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB0_17:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: shll $23, %eax
				; WIN32-NEXT: addl $1065353216, %eax # imm = 0x3F800000
				; WIN32-NEXT: movl %eax, (%esp)
				; WIN32-NEXT: fmuls (%esp)
				; WIN32-NEXT: popl %eax
				; WIN32-NEXT: retl
				%zext = zext i8 %x to i32
				%ldexp = call float @llvm.ldexp.f32.i32(float 1.000000e+00, i32 %zext)
				ret float %ldexp
				}

				define double @ldexp_f64(i8 zeroext %x) {
				; X64-LABEL: ldexp_f64:
				; X64: # %bb.0:
				; X64-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
				; X64-NEXT: jmp ldexp@PLT # TAILCALL
				;
				; WIN32-LABEL: ldexp_f64:
				; WIN32: # %bb.0:
				; WIN32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
				; WIN32-NEXT: pushl %eax
				; WIN32-NEXT: pushl $1072693248 # imm = 0x3FF00000
				; WIN32-NEXT: pushl $0
				; WIN32-NEXT: calll _ldexp
				; WIN32-NEXT: addl $12, %esp
				; WIN32-NEXT: retl
				%zext = zext i8 %x to i32
				%ldexp = call double @llvm.ldexp.f64.i32(double 1.000000e+00, i32 %zext)
				ret double %ldexp
				}

				define <2 x float> @ldexp_v2f32(<2 x float> %val, <2 x i32> %exp) {
				; X64-LABEL: ldexp_v2f32:
				; X64: # %bb.0:
				; X64-NEXT: subq $72, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 80
				; X64-NEXT: movdqa %xmm1, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
				; X64-NEXT: movaps %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
				; X64-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,3,3,3]
				; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm1[3,3,3,3]
				; X64-NEXT: movd %xmm2, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; X64-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
				; X64-NEXT: pshufd $238, {{[-0-9]+}}(%r{{[sb]}}p), %xmm1 # 16-byte Folded Reload
				; X64-NEXT: # xmm1 = mem[2,3,2,3]
				; X64-NEXT: movd %xmm1, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: unpcklps (%rsp), %xmm0 # 16-byte Folded Reload
				; X64-NEXT: # xmm0 = xmm0[0],mem[0],xmm0[1],mem[1]
				; X64-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
				; X64-NEXT: movdqa {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; X64-NEXT: movd %xmm0, %edi
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: movaps %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; X64-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,1,1]
				; X64-NEXT: pshufd $85, {{[-0-9]+}}(%r{{[sb]}}p), %xmm1 # 16-byte Folded Reload
				; X64-NEXT: # xmm1 = mem[1,1,1,1]
				; X64-NEXT: movd %xmm1, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm1 # 16-byte Reload
				; X64-NEXT: unpcklps {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
				; X64-NEXT: unpcklpd (%rsp), %xmm1 # 16-byte Folded Reload
				; X64-NEXT: # xmm1 = xmm1[0],mem[0]
				; X64-NEXT: movaps %xmm1, %xmm0
				; X64-NEXT: addq $72, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 8
				; X64-NEXT: retq
				;
				; WIN32-LABEL: ldexp_v2f32:
				; WIN32: # %bb.0:
				; WIN32-NEXT: pushl %edi
				; WIN32-NEXT: pushl %esi
				; WIN32-NEXT: subl $8, %esp
				; WIN32-NEXT: flds {{[0-9]+}}(%esp)
				; WIN32-NEXT: movl {{[0-9]+}}(%esp), %eax
				; WIN32-NEXT: cmpl $-329, %eax # imm = 0xFEB7
				; WIN32-NEXT: movl %eax, %edx
				; WIN32-NEXT: jge LBB2_2
				; WIN32-NEXT: # %bb.1:
				; WIN32-NEXT: movl $-330, %edx # imm = 0xFEB6
				; WIN32-NEXT: LBB2_2:
				; WIN32-NEXT: addl $204, %edx
				; WIN32-NEXT: leal 102(%eax), %ecx
				; WIN32-NEXT: cmpl $-228, %eax
				; WIN32-NEXT: jb LBB2_4
				; WIN32-NEXT: # %bb.3:
				; WIN32-NEXT: movl %ecx, %edx
				; WIN32-NEXT: LBB2_4:
				; WIN32-NEXT: flds __real@0c800000
				; WIN32-NEXT: fld %st(1)
				; WIN32-NEXT: fmul %st(1), %st
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(2), %st
				; WIN32-NEXT: jb LBB2_6
				; WIN32-NEXT: # %bb.5:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: LBB2_6:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: cmpl $-126, %eax
				; WIN32-NEXT: jl LBB2_8
				; WIN32-NEXT: # %bb.7:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: fld %st(1)
				; WIN32-NEXT: movl %eax, %edx
				; WIN32-NEXT: LBB2_8:
				; WIN32-NEXT: cmpl $381, %eax # imm = 0x17D
				; WIN32-NEXT: movl %eax, %esi
				; WIN32-NEXT: jl LBB2_10
				; WIN32-NEXT: # %bb.9:
				; WIN32-NEXT: movl $381, %esi # imm = 0x17D
				; WIN32-NEXT: LBB2_10:
				; WIN32-NEXT: flds __real@7f000000
				; WIN32-NEXT: fmul %st, %st(3)
				; WIN32-NEXT: fld %st(3)
				; WIN32-NEXT: fmul %st(1), %st
				; WIN32-NEXT: leal -127(%eax), %ecx
				; WIN32-NEXT: cmpl $255, %eax
				; WIN32-NEXT: jae LBB2_11
				; WIN32-NEXT: # %bb.12:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: jmp LBB2_13
				; WIN32-NEXT: LBB2_11:
				; WIN32-NEXT: fstp %st(4)
				; WIN32-NEXT: addl $-254, %esi
				; WIN32-NEXT: movl %esi, %ecx
				; WIN32-NEXT: LBB2_13:
				; WIN32-NEXT: cmpl $127, %eax
				; WIN32-NEXT: flds {{[0-9]+}}(%esp)
				; WIN32-NEXT: movl {{[0-9]+}}(%esp), %esi
				; WIN32-NEXT: jg LBB2_15
				; WIN32-NEXT: # %bb.14:
				; WIN32-NEXT: movl %edx, %ecx
				; WIN32-NEXT: LBB2_15:
				; WIN32-NEXT: cmpl $381, %esi # imm = 0x17D
				; WIN32-NEXT: movl %esi, %edx
				; WIN32-NEXT: jl LBB2_17
				; WIN32-NEXT: # %bb.16:
				; WIN32-NEXT: movl $381, %edx # imm = 0x17D
				; WIN32-NEXT: LBB2_17:
				; WIN32-NEXT: addl $-254, %edx
				; WIN32-NEXT: leal -127(%esi), %edi
				; WIN32-NEXT: cmpl $255, %esi
				; WIN32-NEXT: jae LBB2_19
				; WIN32-NEXT: # %bb.18:
				; WIN32-NEXT: movl %edi, %edx
				; WIN32-NEXT: LBB2_19:
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(2), %st
				; WIN32-NEXT: fmul %st, %st(2)
				; WIN32-NEXT: jae LBB2_21
				; WIN32-NEXT: # %bb.20:
				; WIN32-NEXT: fstp %st(2)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB2_21:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: cmpl $-329, %esi # imm = 0xFEB7
				; WIN32-NEXT: movl %esi, %edi
				; WIN32-NEXT: jge LBB2_23
				; WIN32-NEXT: # %bb.22:
				; WIN32-NEXT: movl $-330, %edi # imm = 0xFEB6
				; WIN32-NEXT: LBB2_23:
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(4), %st
				; WIN32-NEXT: fmul %st, %st(4)
				; WIN32-NEXT: cmpl $-228, %esi
				; WIN32-NEXT: jb LBB2_24
				; WIN32-NEXT: # %bb.25:
				; WIN32-NEXT: fstp %st(4)
				; WIN32-NEXT: leal 102(%esi), %edi
				; WIN32-NEXT: cmpl $-126, %esi
				; WIN32-NEXT: jge LBB2_27
				; WIN32-NEXT: jmp LBB2_28
				; WIN32-NEXT: LBB2_24:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: addl $204, %edi
				; WIN32-NEXT: cmpl $-126, %esi
				; WIN32-NEXT: jl LBB2_28
				; WIN32-NEXT: LBB2_27:
				; WIN32-NEXT: fstp %st(3)
				; WIN32-NEXT: movl %esi, %edi
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB2_28:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: cmpl $127, %esi
				; WIN32-NEXT: jg LBB2_30
				; WIN32-NEXT: # %bb.29:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: movl %edi, %edx
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(2)
				; WIN32-NEXT: LBB2_30:
				; WIN32-NEXT: fstp %st(2)
				; WIN32-NEXT: cmpl $127, %eax
				; WIN32-NEXT: jg LBB2_32
				; WIN32-NEXT: # %bb.31:
				; WIN32-NEXT: fstp %st(2)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB2_32:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: shll $23, %ecx
				; WIN32-NEXT: addl $1065353216, %ecx # imm = 0x3F800000
				; WIN32-NEXT: movl %ecx, (%esp)
				; WIN32-NEXT: shll $23, %edx
				; WIN32-NEXT: addl $1065353216, %edx # imm = 0x3F800000
				; WIN32-NEXT: movl %edx, {{[0-9]+}}(%esp)
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: fmuls (%esp)
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: fmuls {{[0-9]+}}(%esp)
				; WIN32-NEXT: addl $8, %esp
				; WIN32-NEXT: popl %esi
				; WIN32-NEXT: popl %edi
				; WIN32-NEXT: retl
				%1 = call <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float> %val, <2 x i32> %exp)
				ret <2 x float> %1
				}

				define <4 x float> @ldexp_v4f32(<4 x float> %val, <4 x i32> %exp) {
				; X64-LABEL: ldexp_v4f32:
				; X64: # %bb.0:
				; X64-NEXT: subq $72, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 80
				; X64-NEXT: movdqa %xmm1, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
				; X64-NEXT: movaps %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
				; X64-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,3,3,3]
				; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm1[3,3,3,3]
				; X64-NEXT: movd %xmm2, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; X64-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
				; X64-NEXT: pshufd $238, {{[-0-9]+}}(%r{{[sb]}}p), %xmm1 # 16-byte Folded Reload
				; X64-NEXT: # xmm1 = mem[2,3,2,3]
				; X64-NEXT: movd %xmm1, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: unpcklps (%rsp), %xmm0 # 16-byte Folded Reload
				; X64-NEXT: # xmm0 = xmm0[0],mem[0],xmm0[1],mem[1]
				; X64-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
				; X64-NEXT: movdqa {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; X64-NEXT: movd %xmm0, %edi
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: movaps %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; X64-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,1,1]
				; X64-NEXT: pshufd $85, {{[-0-9]+}}(%r{{[sb]}}p), %xmm1 # 16-byte Folded Reload
				; X64-NEXT: # xmm1 = mem[1,1,1,1]
				; X64-NEXT: movd %xmm1, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: movaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm1 # 16-byte Reload
				; X64-NEXT: unpcklps {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
				; X64-NEXT: unpcklpd (%rsp), %xmm1 # 16-byte Folded Reload
				; X64-NEXT: # xmm1 = xmm1[0],mem[0]
				; X64-NEXT: movaps %xmm1, %xmm0
				; X64-NEXT: addq $72, %rsp
				; X64-NEXT: .cfi_def_cfa_offset 8
				; X64-NEXT: retq
				;
				; WIN32-LABEL: ldexp_v4f32:
				; WIN32: # %bb.0:
				; WIN32-NEXT: pushl %ebp
				; WIN32-NEXT: pushl %ebx
				; WIN32-NEXT: pushl %edi
				; WIN32-NEXT: pushl %esi
				; WIN32-NEXT: subl $32, %esp
				; WIN32-NEXT: flds {{[0-9]+}}(%esp)
				; WIN32-NEXT: movl {{[0-9]+}}(%esp), %ecx
				; WIN32-NEXT: flds {{[0-9]+}}(%esp)
				; WIN32-NEXT: flds __real@7f000000
				; WIN32-NEXT: fld %st(1)
				; WIN32-NEXT: fmul %st(1), %st
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(2), %st
				; WIN32-NEXT: cmpl $255, %ecx
				; WIN32-NEXT: jae LBB3_2
				; WIN32-NEXT: # %bb.1:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: LBB3_2:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: cmpl $-329, %ecx # imm = 0xFEB7
				; WIN32-NEXT: movl %ecx, %esi
				; WIN32-NEXT: jge LBB3_4
				; WIN32-NEXT: # %bb.3:
				; WIN32-NEXT: movl $-330, %esi # imm = 0xFEB6
				; WIN32-NEXT: LBB3_4:
				; WIN32-NEXT: addl $204, %esi
				; WIN32-NEXT: leal 102(%ecx), %eax
				; WIN32-NEXT: cmpl $-228, %ecx
				; WIN32-NEXT: jb LBB3_6
				; WIN32-NEXT: # %bb.5:
				; WIN32-NEXT: movl %eax, %esi
				; WIN32-NEXT: LBB3_6:
				; WIN32-NEXT: flds __real@0c800000
				; WIN32-NEXT: fld %st(3)
				; WIN32-NEXT: fmul %st(1), %st
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(2), %st
				; WIN32-NEXT: jb LBB3_8
				; WIN32-NEXT: # %bb.7:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: LBB3_8:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: cmpl $-126, %ecx
				; WIN32-NEXT: jl LBB3_10
				; WIN32-NEXT: # %bb.9:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(4)
				; WIN32-NEXT: LBB3_10:
				; WIN32-NEXT: fstp %st(4)
				; WIN32-NEXT: movl {{[0-9]+}}(%esp), %edi
				; WIN32-NEXT: movl %ecx, %edx
				; WIN32-NEXT: subl $127, %edx
				; WIN32-NEXT: jg LBB3_12
				; WIN32-NEXT: # %bb.11:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(3)
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: LBB3_12:
				; WIN32-NEXT: fstp %st(3)
				; WIN32-NEXT: fld %st(3)
				; WIN32-NEXT: fmul %st(2), %st
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(3), %st
				; WIN32-NEXT: cmpl $255, %edi
				; WIN32-NEXT: jae LBB3_14
				; WIN32-NEXT: # %bb.13:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: LBB3_14:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: fstps {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Folded Spill
				; WIN32-NEXT: cmpl $-329, %edi # imm = 0xFEB7
				; WIN32-NEXT: movl %edi, %eax
				; WIN32-NEXT: jge LBB3_16
				; WIN32-NEXT: # %bb.15:
				; WIN32-NEXT: movl $-330, %eax # imm = 0xFEB6
				; WIN32-NEXT: LBB3_16:
				; WIN32-NEXT: fld %st(3)
				; WIN32-NEXT: fmul %st(3), %st
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(4), %st
				; WIN32-NEXT: cmpl $-228, %edi
				; WIN32-NEXT: jb LBB3_17
				; WIN32-NEXT: # %bb.18:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: leal 102(%edi), %eax
				; WIN32-NEXT: cmpl $-126, %edi
				; WIN32-NEXT: jge LBB3_20
				; WIN32-NEXT: jmp LBB3_21
				; WIN32-NEXT: LBB3_17:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: addl $204, %eax
				; WIN32-NEXT: cmpl $-126, %edi
				; WIN32-NEXT: jl LBB3_21
				; WIN32-NEXT: LBB3_20:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: movl %edi, %eax
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(4)
				; WIN32-NEXT: LBB3_21:
				; WIN32-NEXT: fstp %st(4)
				; WIN32-NEXT: movl %eax, (%esp) # 4-byte Spill
				; WIN32-NEXT: movl %edi, %ebx
				; WIN32-NEXT: subl $127, %ebx
				; WIN32-NEXT: jg LBB3_23
				; WIN32-NEXT: # %bb.22:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(3)
				; WIN32-NEXT: LBB3_23:
				; WIN32-NEXT: fstp %st(3)
				; WIN32-NEXT: cmpl $381, %edi # imm = 0x17D
				; WIN32-NEXT: movl %edi, %eax
				; WIN32-NEXT: jge LBB3_24
				; WIN32-NEXT: # %bb.25:
				; WIN32-NEXT: cmpl $255, %edi
				; WIN32-NEXT: jae LBB3_26
				; WIN32-NEXT: LBB3_27:
				; WIN32-NEXT: cmpl $-126, %ecx
				; WIN32-NEXT: jl LBB3_29
				; WIN32-NEXT: LBB3_28:
				; WIN32-NEXT: movl %ecx, %esi
				; WIN32-NEXT: LBB3_29:
				; WIN32-NEXT: cmpl $381, %ecx # imm = 0x17D
				; WIN32-NEXT: movl %ecx, %eax
				; WIN32-NEXT: jl LBB3_31
				; WIN32-NEXT: # %bb.30:
				; WIN32-NEXT: movl $381, %eax # imm = 0x17D
				; WIN32-NEXT: LBB3_31:
				; WIN32-NEXT: cmpl $255, %ecx
				; WIN32-NEXT: flds {{[0-9]+}}(%esp)
				; WIN32-NEXT: movl {{[0-9]+}}(%esp), %ebp
				; WIN32-NEXT: jb LBB3_33
				; WIN32-NEXT: # %bb.32:
				; WIN32-NEXT: addl $-254, %eax
				; WIN32-NEXT: movl %eax, %edx
				; WIN32-NEXT: LBB3_33:
				; WIN32-NEXT: fxch %st(3)
				; WIN32-NEXT: fstps {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Folded Spill
				; WIN32-NEXT: movl %esi, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
				; WIN32-NEXT: cmpl $381, %ebp # imm = 0x17D
				; WIN32-NEXT: movl %ebp, %eax
				; WIN32-NEXT: jl LBB3_35
				; WIN32-NEXT: # %bb.34:
				; WIN32-NEXT: movl $381, %eax # imm = 0x17D
				; WIN32-NEXT: LBB3_35:
				; WIN32-NEXT: fld %st(2)
				; WIN32-NEXT: fmul %st(1), %st
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(2), %st
				; WIN32-NEXT: leal -127(%ebp), %edi
				; WIN32-NEXT: cmpl $255, %ebp
				; WIN32-NEXT: jae LBB3_36
				; WIN32-NEXT: # %bb.37:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: jmp LBB3_38
				; WIN32-NEXT: LBB3_24:
				; WIN32-NEXT: movl $381, %eax # imm = 0x17D
				; WIN32-NEXT: cmpl $255, %edi
				; WIN32-NEXT: jb LBB3_27
				; WIN32-NEXT: LBB3_26:
				; WIN32-NEXT: addl $-254, %eax
				; WIN32-NEXT: movl %eax, %ebx
				; WIN32-NEXT: cmpl $-126, %ecx
				; WIN32-NEXT: jge LBB3_28
				; WIN32-NEXT: jmp LBB3_29
				; WIN32-NEXT: LBB3_36:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: addl $-254, %eax
				; WIN32-NEXT: movl %eax, %edi
				; WIN32-NEXT: LBB3_38:
				; WIN32-NEXT: cmpl $-329, %ebp # imm = 0xFEB7
				; WIN32-NEXT: movl %ebp, %ecx
				; WIN32-NEXT: jge LBB3_40
				; WIN32-NEXT: # %bb.39:
				; WIN32-NEXT: movl $-330, %ecx # imm = 0xFEB6
				; WIN32-NEXT: LBB3_40:
				; WIN32-NEXT: addl $204, %ecx
				; WIN32-NEXT: leal 102(%ebp), %eax
				; WIN32-NEXT: cmpl $-228, %ebp
				; WIN32-NEXT: jb LBB3_42
				; WIN32-NEXT: # %bb.41:
				; WIN32-NEXT: movl %eax, %ecx
				; WIN32-NEXT: LBB3_42:
				; WIN32-NEXT: fld %st(3)
				; WIN32-NEXT: fmul %st(3), %st
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(4), %st
				; WIN32-NEXT: jb LBB3_44
				; WIN32-NEXT: # %bb.43:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: LBB3_44:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: cmpl $-126, %ebp
				; WIN32-NEXT: jl LBB3_46
				; WIN32-NEXT: # %bb.45:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: movl %ebp, %ecx
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(4)
				; WIN32-NEXT: LBB3_46:
				; WIN32-NEXT: fstp %st(4)
				; WIN32-NEXT: cmpl $127, %ebp
				; WIN32-NEXT: flds {{[0-9]+}}(%esp)
				; WIN32-NEXT: movl {{[0-9]+}}(%esp), %esi
				; WIN32-NEXT: jg LBB3_48
				; WIN32-NEXT: # %bb.47:
				; WIN32-NEXT: movl %ecx, %edi
				; WIN32-NEXT: LBB3_48:
				; WIN32-NEXT: cmpl $381, %esi # imm = 0x17D
				; WIN32-NEXT: movl %esi, %ecx
				; WIN32-NEXT: jl LBB3_50
				; WIN32-NEXT: # %bb.49:
				; WIN32-NEXT: movl $381, %ecx # imm = 0x17D
				; WIN32-NEXT: LBB3_50:
				; WIN32-NEXT: addl $-254, %ecx
				; WIN32-NEXT: leal -127(%esi), %eax
				; WIN32-NEXT: cmpl $255, %esi
				; WIN32-NEXT: jae LBB3_52
				; WIN32-NEXT: # %bb.51:
				; WIN32-NEXT: movl %eax, %ecx
				; WIN32-NEXT: LBB3_52:
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(3), %st
				; WIN32-NEXT: fmul %st, %st(3)
				; WIN32-NEXT: jae LBB3_54
				; WIN32-NEXT: # %bb.53:
				; WIN32-NEXT: fstp %st(3)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB3_54:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: cmpl $-329, %esi # imm = 0xFEB7
				; WIN32-NEXT: movl %esi, %eax
				; WIN32-NEXT: jge LBB3_56
				; WIN32-NEXT: # %bb.55:
				; WIN32-NEXT: movl $-330, %eax # imm = 0xFEB6
				; WIN32-NEXT: LBB3_56:
				; WIN32-NEXT: fld %st(0)
				; WIN32-NEXT: fmul %st(4), %st
				; WIN32-NEXT: fmul %st, %st(4)
				; WIN32-NEXT: cmpl $-228, %esi
				; WIN32-NEXT: jb LBB3_57
				; WIN32-NEXT: # %bb.58:
				; WIN32-NEXT: fstp %st(4)
				; WIN32-NEXT: leal 102(%esi), %eax
				; WIN32-NEXT: cmpl $-126, %esi
				; WIN32-NEXT: jge LBB3_60
				; WIN32-NEXT: jmp LBB3_61
				; WIN32-NEXT: LBB3_57:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: addl $204, %eax
				; WIN32-NEXT: cmpl $-126, %esi
				; WIN32-NEXT: jl LBB3_61
				; WIN32-NEXT: LBB3_60:
				; WIN32-NEXT: fstp %st(3)
				; WIN32-NEXT: movl %esi, %eax
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB3_61:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: cmpl $127, %esi
				; WIN32-NEXT: jg LBB3_63
				; WIN32-NEXT: # %bb.62:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: movl %eax, %ecx
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(2)
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: LBB3_63:
				; WIN32-NEXT: fstp %st(2)
				; WIN32-NEXT: cmpl $127, {{[0-9]+}}(%esp)
				; WIN32-NEXT: jg LBB3_65
				; WIN32-NEXT: # %bb.64:
				; WIN32-NEXT: movl (%esp), %ebx # 4-byte Reload
				; WIN32-NEXT: LBB3_65:
				; WIN32-NEXT: cmpl $127, {{[0-9]+}}(%esp)
				; WIN32-NEXT: flds {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Folded Reload
				; WIN32-NEXT: jg LBB3_67
				; WIN32-NEXT: # %bb.66:
				; WIN32-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %edx # 4-byte Reload
				; WIN32-NEXT: LBB3_67:
				; WIN32-NEXT: cmpl $127, %ebp
				; WIN32-NEXT: movl {{[0-9]+}}(%esp), %eax
				; WIN32-NEXT: jg LBB3_69
				; WIN32-NEXT: # %bb.68:
				; WIN32-NEXT: fstp %st(2)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(3)
				; WIN32-NEXT: fxch %st(2)
				; WIN32-NEXT: LBB3_69:
				; WIN32-NEXT: fstp %st(3)
				; WIN32-NEXT: shll $23, %edi
				; WIN32-NEXT: addl $1065353216, %edi # imm = 0x3F800000
				; WIN32-NEXT: movl %edi, {{[0-9]+}}(%esp)
				; WIN32-NEXT: shll $23, %ecx
				; WIN32-NEXT: addl $1065353216, %ecx # imm = 0x3F800000
				; WIN32-NEXT: movl %ecx, {{[0-9]+}}(%esp)
				; WIN32-NEXT: shll $23, %ebx
				; WIN32-NEXT: addl $1065353216, %ebx # imm = 0x3F800000
				; WIN32-NEXT: movl %ebx, {{[0-9]+}}(%esp)
				; WIN32-NEXT: shll $23, %edx
				; WIN32-NEXT: addl $1065353216, %edx # imm = 0x3F800000
				; WIN32-NEXT: movl %edx, {{[0-9]+}}(%esp)
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: fmuls {{[0-9]+}}(%esp)
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: fmuls {{[0-9]+}}(%esp)
				; WIN32-NEXT: flds {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Folded Reload
				; WIN32-NEXT: fmuls {{[0-9]+}}(%esp)
				; WIN32-NEXT: fxch %st(3)
				; WIN32-NEXT: fmuls {{[0-9]+}}(%esp)
				; WIN32-NEXT: fstps 12(%eax)
				; WIN32-NEXT: fxch %st(2)
				; WIN32-NEXT: fstps 8(%eax)
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: fstps 4(%eax)
				; WIN32-NEXT: fstps (%eax)
				; WIN32-NEXT: addl $32, %esp
				; WIN32-NEXT: popl %esi
				; WIN32-NEXT: popl %edi
				; WIN32-NEXT: popl %ebx
				; WIN32-NEXT: popl %ebp
				; WIN32-NEXT: retl
				%1 = call <4 x float> @llvm.ldexp.v4f32.v4i32(<4 x float> %val, <4 x i32> %exp)
				ret <4 x float> %1
				}

				define half @ldexp_f16(half %arg0, i32 %arg1) {
				; X64-LABEL: ldexp_f16:
				; X64: # %bb.0:
				; X64-NEXT: pushq %rbx
				; X64-NEXT: .cfi_def_cfa_offset 16
				; X64-NEXT: .cfi_offset %rbx, -16
				; X64-NEXT: movl %edi, %ebx
				; X64-NEXT: callq __extendhfsf2@PLT
				; X64-NEXT: movl %ebx, %edi
				; X64-NEXT: callq ldexpf@PLT
				; X64-NEXT: callq __truncsfhf2@PLT
				; X64-NEXT: popq %rbx
				; X64-NEXT: .cfi_def_cfa_offset 8
				; X64-NEXT: retq
				;
				; WIN32-LABEL: ldexp_f16:
				; WIN32: # %bb.0:
				; WIN32-NEXT: pushl %edi
				; WIN32-NEXT: pushl %esi
				; WIN32-NEXT: subl $8, %esp
				; WIN32-NEXT: movl {{[0-9]+}}(%esp), %edi
				; WIN32-NEXT: movzwl {{[0-9]+}}(%esp), %eax
				; WIN32-NEXT: movl %eax, (%esp)
				; WIN32-NEXT: cmpl $381, %edi # imm = 0x17D
				; WIN32-NEXT: movl %edi, %esi
				; WIN32-NEXT: jl LBB4_2
				; WIN32-NEXT: # %bb.1:
				; WIN32-NEXT: movl $381, %esi # imm = 0x17D
				; WIN32-NEXT: LBB4_2:
				; WIN32-NEXT: addl $-254, %esi
				; WIN32-NEXT: calll ___gnu_h2f_ieee
				; WIN32-NEXT: leal -127(%edi), %eax
				; WIN32-NEXT: cmpl $255, %edi
				; WIN32-NEXT: jae LBB4_4
				; WIN32-NEXT: # %bb.3:
				; WIN32-NEXT: movl %eax, %esi
				; WIN32-NEXT: LBB4_4:
				; WIN32-NEXT: flds __real@7f000000
				; WIN32-NEXT: fld %st(1)
				; WIN32-NEXT: fmul %st(1), %st
				; WIN32-NEXT: fmul %st, %st(1)
				; WIN32-NEXT: jae LBB4_6
				; WIN32-NEXT: # %bb.5:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: fldz
				; WIN32-NEXT: LBB4_6:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: cmpl $-329, %edi # imm = 0xFEB7
				; WIN32-NEXT: movl %edi, %eax
				; WIN32-NEXT: jge LBB4_8
				; WIN32-NEXT: # %bb.7:
				; WIN32-NEXT: movl $-330, %eax # imm = 0xFEB6
				; WIN32-NEXT: LBB4_8:
				; WIN32-NEXT: flds __real@0c800000
				; WIN32-NEXT: fld %st(2)
				; WIN32-NEXT: fmul %st(1), %st
				; WIN32-NEXT: fmul %st, %st(1)
				; WIN32-NEXT: cmpl $-228, %edi
				; WIN32-NEXT: jb LBB4_9
				; WIN32-NEXT: # %bb.10:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: leal 102(%edi), %eax
				; WIN32-NEXT: cmpl $-126, %edi
				; WIN32-NEXT: jge LBB4_12
				; WIN32-NEXT: jmp LBB4_13
				; WIN32-NEXT: LBB4_9:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: addl $204, %eax
				; WIN32-NEXT: cmpl $-126, %edi
				; WIN32-NEXT: jl LBB4_13
				; WIN32-NEXT: LBB4_12:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: movl %edi, %eax
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(2)
				; WIN32-NEXT: LBB4_13:
				; WIN32-NEXT: fstp %st(2)
				; WIN32-NEXT: cmpl $127, %edi
				; WIN32-NEXT: jg LBB4_15
				; WIN32-NEXT: # %bb.14:
				; WIN32-NEXT: fstp %st(0)
				; WIN32-NEXT: movl %eax, %esi
				; WIN32-NEXT: fldz
				; WIN32-NEXT: fxch %st(1)
				; WIN32-NEXT: LBB4_15:
				; WIN32-NEXT: fstp %st(1)
				; WIN32-NEXT: shll $23, %esi
				; WIN32-NEXT: addl $1065353216, %esi # imm = 0x3F800000
				; WIN32-NEXT: movl %esi, {{[0-9]+}}(%esp)
				; WIN32-NEXT: fmuls {{[0-9]+}}(%esp)
				; WIN32-NEXT: fstps (%esp)
				; WIN32-NEXT: calll ___gnu_f2h_ieee
				; WIN32-NEXT: addl $8, %esp
				; WIN32-NEXT: popl %esi
				; WIN32-NEXT: popl %edi
				; WIN32-NEXT: retl
				%ldexp = call half @llvm.ldexp.f16.i32(half %arg0, i32 %arg1)
				ret half %ldexp
				}

				declare double @llvm.ldexp.f64.i32(double, i32) #0
				declare float @llvm.ldexp.f32.i32(float, i32) #0
				declare <2 x float> @llvm.ldexp.v2f32.v2i32(<2 x float>, <2 x i32>) #0
				declare <4 x float> @llvm.ldexp.v4f32.v4i32(<4 x float>, <4 x i32>) #0
				declare half @llvm.ldexp.f16.i32(half, i32) #0

				attributes #0 = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }
				attributes #1 = { nocallback nofree nosync nounwind willreturn memory(inaccessiblemem: readwrite) }

llvm/test/MC/AMDGPU/gfx10_asm_vop2.s

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0xff,0x00,0x00]			// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0xff,0x00,0x00]

	v_ldexp_f16_e64 v5, v1, 0			v_ldexp_f16_e64 v5, v1, 0
	// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0x01,0x01,0x00]			// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0x01,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, -1			v_ldexp_f16_e64 v5, v1, -1
	// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0x83,0x01,0x00]			// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0x83,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, 0.5			v_ldexp_f16_e64 v5, v1, 0x3800
	// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0xe1,0x01,0x00]			// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0xff,0x01,0x00,0x00,0x38,0x00,0x00]

	v_ldexp_f16_e64 v5, v1, -4.0			v_ldexp_f16_e64 v5, v1, -4.0
				foadUnsubmitted Not Done Reply Inline Actions The assembler now rejects these as invalid literals. Looks like it is still accepting -4.0 here? foad: > The assembler now rejects these as invalid literals. Looks like it is still accepting -4.0…
				arsenmAuthorUnsubmitted Done Reply Inline Actions It's being accepted as a 32-bit literal, which is valid on gfx10 arsenm: It's being accepted as a 32-bit literal, which is valid on gfx10
	// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0xef,0x01,0x00]			// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0xff,0x01,0x00,0x00,0xc4,0x00,0x00]

	v_ldexp_f16_e64 v5, -v1, v2			v_ldexp_f16_e64 v5, -v1, v2
	// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0x05,0x02,0x20]			// GFX10: encoding: [0x05,0x00,0x3b,0xd5,0x01,0x05,0x02,0x20]

	v_ldexp_f16_e64 v5, \|v1\|, v2			v_ldexp_f16_e64 v5, \|v1\|, v2
	// GFX10: encoding: [0x05,0x01,0x3b,0xd5,0x01,0x05,0x02,0x00]			// GFX10: encoding: [0x05,0x01,0x3b,0xd5,0x01,0x05,0x02,0x00]

	v_ldexp_f16_e64 v5, v1, v2 clamp			v_ldexp_f16_e64 v5, v1, v2 clamp
	▲ Show 20 Lines • Show All 241 Lines • Show Last 20 Lines

llvm/test/MC/AMDGPU/gfx11_asm_vop3_from_vop2.s

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines

	v_ldexp_f16_e64 v5, vcc_hi, 0xfe0b			v_ldexp_f16_e64 v5, vcc_hi, 0xfe0b
	// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x6b,0xfe,0x01,0x00,0x0b,0xfe,0x00,0x00]			// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x6b,0xfe,0x01,0x00,0x0b,0xfe,0x00,0x00]

	v_ldexp_f16_e64 v5, ttmp15, src_scc			v_ldexp_f16_e64 v5, ttmp15, src_scc
	// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x7b,0xfa,0x01,0x00]			// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x7b,0xfa,0x01,0x00]

	v_ldexp_f16_e64 v5, m0, 0.5			v_ldexp_f16_e64 v5, m0, 0.5
	// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x7d,0xe0,0x01,0x00]			// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x7d,0xfe,0x01,0x00,0x00,0x38,0x00,0x00]

	v_ldexp_f16_e64 v5, exec_lo, -1			v_ldexp_f16_e64 v5, exec_lo, -1
	// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x7e,0x82,0x01,0x00]			// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x7e,0x82,0x01,0x00]

	v_ldexp_f16_e64 v5, exec_hi, null			v_ldexp_f16_e64 v5, exec_hi, null
	// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x7f,0xf8,0x00,0x00]			// GFX11: encoding: [0x05,0x00,0x3b,0xd5,0x7f,0xf8,0x00,0x00]

	v_ldexp_f16_e64 v5, null, exec_lo			v_ldexp_f16_e64 v5, null, exec_lo
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/test/MC/AMDGPU/gfx8_asm_vop3.s

	// RUN: llvm-mc -arch=amdgcn -mcpu=tonga -show-encoding %s \| FileCheck %s			// RUN: not llvm-mc -arch=amdgcn -mcpu=tonga -show-encoding %s \| FileCheck %s
				// RUN: not llvm-mc -arch=amdgcn -mcpu=tonga -show-encoding -filetype=null 2>&1 %s \| FileCheck -check-prefix=ERR --implicit-check-not=error %s

	v_interp_p1_f32_e64 v5, v2, attr0.x			v_interp_p1_f32_e64 v5, v2, attr0.x
	// CHECK: [0x05,0x00,0x70,0xd2,0x00,0x04,0x02,0x00]			// CHECK: [0x05,0x00,0x70,0xd2,0x00,0x04,0x02,0x00]

	v_interp_p1_f32_e64 v255, v2, attr0.x			v_interp_p1_f32_e64 v255, v2, attr0.x
	// CHECK: [0xff,0x00,0x70,0xd2,0x00,0x04,0x02,0x00]			// CHECK: [0xff,0x00,0x70,0xd2,0x00,0x04,0x02,0x00]

	v_interp_p1_f32_e64 v5, v2, attr1.x			v_interp_p1_f32_e64 v5, v2, attr1.x
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines

	v_ldexp_f16_e64 v5, v1, 0			v_ldexp_f16_e64 v5, v1, 0
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00]			// CHECK: [0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, -1			v_ldexp_f16_e64 v5, v1, -1
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00]			// CHECK: [0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, 0.5			v_ldexp_f16_e64 v5, v1, 0.5
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xe1,0x01,0x00]			// ERR: [[@LINE-1]]:25: error: literal operands are not supported

	v_ldexp_f16_e64 v5, v1, -4.0			v_ldexp_f16_e64 v5, v1, -4.0
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xef,0x01,0x00]			// ERR: [[@LINE-1]]:25: error: literal operands are not supported

	v_ldexp_f16_e64 v5, v1, src_vccz			v_ldexp_f16_e64 v5, v1, src_vccz
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xf7,0x01,0x00]			// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xf7,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, src_execz			v_ldexp_f16_e64 v5, v1, src_execz
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xf9,0x01,0x00]			// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xf9,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, src_scc			v_ldexp_f16_e64 v5, v1, src_scc
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/test/MC/AMDGPU/gfx9_asm_vop3.s

	// RUN: llvm-mc -arch=amdgcn -mcpu=gfx900 -show-encoding %s \| FileCheck %s			// RUN: not llvm-mc -arch=amdgcn -mcpu=gfx900 -show-encoding %s \| FileCheck %s
				// RUN: not llvm-mc -arch=amdgcn -mcpu=gfx900 -show-encoding 2>&1 %s \| FileCheck -check-prefix=ERR --implicit-check-not=error %s

	v_interp_p1_f32_e64 v5, v2, attr0.x			v_interp_p1_f32_e64 v5, v2, attr0.x
	// CHECK: [0x05,0x00,0x70,0xd2,0x00,0x04,0x02,0x00]			// CHECK: [0x05,0x00,0x70,0xd2,0x00,0x04,0x02,0x00]

	v_interp_p1_f32_e64 v255, v2, attr0.x			v_interp_p1_f32_e64 v255, v2, attr0.x
	// CHECK: [0xff,0x00,0x70,0xd2,0x00,0x04,0x02,0x00]			// CHECK: [0xff,0x00,0x70,0xd2,0x00,0x04,0x02,0x00]

	v_interp_p1_f32_e64 v5, v2, attr1.x			v_interp_p1_f32_e64 v5, v2, attr1.x
	▲ Show 20 Lines • Show All 1,184 Lines • ▼ Show 20 Lines

	v_ldexp_f16_e64 v5, v1, 0			v_ldexp_f16_e64 v5, v1, 0
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00]			// CHECK: [0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, -1			v_ldexp_f16_e64 v5, v1, -1
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00]			// CHECK: [0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, 0.5			v_ldexp_f16_e64 v5, v1, 0.5
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xe1,0x01,0x00]			// ERR: [[@LINE-1]]:25: error: literal operands are not supported

	v_ldexp_f16_e64 v5, v1, -4.0			v_ldexp_f16_e64 v5, v1, -4.0
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xef,0x01,0x00]			// ERR: [[@LINE-1]]:25: error: literal operands are not supported

	v_ldexp_f16_e64 v5, v1, src_vccz			v_ldexp_f16_e64 v5, v1, src_vccz
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xf7,0x01,0x00]			// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xf7,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, src_execz			v_ldexp_f16_e64 v5, v1, src_execz
	// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xf9,0x01,0x00]			// CHECK: [0x05,0x00,0x33,0xd1,0x01,0xf9,0x01,0x00]

	v_ldexp_f16_e64 v5, v1, src_scc			v_ldexp_f16_e64 v5, v1, src_scc
	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/test/MC/Disassembler/AMDGPU/gfx10_vop3.txt

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	0x05,0x00,0x3b,0xd5,0x01,0x04,0x02,0x00			0x05,0x00,0x3b,0xd5,0x01,0x04,0x02,0x00

	# GFX10: v_ldexp_f16_e64 v5, s101, v2 ; encoding: [0x05,0x00,0x3b,0xd5,0x65,0x04,0x02,0x00]			# GFX10: v_ldexp_f16_e64 v5, s101, v2 ; encoding: [0x05,0x00,0x3b,0xd5,0x65,0x04,0x02,0x00]
	0x05,0x00,0x3b,0xd5,0x65,0x04,0x02,0x00			0x05,0x00,0x3b,0xd5,0x65,0x04,0x02,0x00

	# GFX10: v_ldexp_f16_e64 v5, v1, -1 ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0x83,0x01,0x00]			# GFX10: v_ldexp_f16_e64 v5, v1, -1 ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0x83,0x01,0x00]
	0x05,0x00,0x3b,0xd5,0x01,0x83,0x01,0x00			0x05,0x00,0x3b,0xd5,0x01,0x83,0x01,0x00

	# GFX10: v_ldexp_f16_e64 v5, v1, -4.0 ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0xef,0x01,0x00]			# GFX10: v_ldexp_f16_e64 v5, v1, 0xc400 ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0xff,0x01,0x00,0x00,0xc4,0x00,0x00]
				foadUnsubmitted Not Done Reply Inline Actions What caused this change in the assembler/disassembler behaviour? It looks like it has broken round-tripping, since the "encoding" output is longer than the input. foad: What caused this change in the assembler/disassembler behaviour? It looks like it has broken…
				arsenmAuthorUnsubmitted Done Reply Inline Actions The exp operand was incorrectly marked as i32 when it's really i16. The inline immediate values are then different arsenm: The exp operand was incorrectly marked as i32 when it's really i16. The inline immediate values…
				Joe_NashUnsubmitted Not Done Reply Inline Actions I believe that operand should be f16. We still want to be able to assemble inline fp constants. From a semantic point of view, these are i16 constants, but from an encoding point of view they are f16. In the True16 support downstream I have been treating that argument as f16. If you want it to be i16 yet still support inline fp constants, we need to effectively revert 5f5f566b265db00f577ead268400d99f34ba9cdd Joe_Nash: I believe that operand should be f16. We still want to be able to assemble inline fp constants.
				arsenmAuthorUnsubmitted Done Reply Inline Actions It is an i16 operand. In the broken hardware handling of the f16 inline immediates, +- 0.5/1.0/2.0/4.0 are all effectively aliases for 0. The assembler now rejects these as invalid literals. I don't really understand the disassembler's handling of this invalid case arsenm: It is an i16 operand. In the broken hardware handling of the f16 inline immediates, +- 0.5/1.
	0x05,0x00,0x3b,0xd5,0x01,0xef,0x01,0x00			0x05,0x00,0x3b,0xd5,0x01,0xef,0x01,0x00

	# GFX10: v_ldexp_f16_e64 v5, v1, 0 ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0x01,0x01,0x00]			# GFX10: v_ldexp_f16_e64 v5, v1, 0 ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0x01,0x01,0x00]
	0x05,0x00,0x3b,0xd5,0x01,0x01,0x01,0x00			0x05,0x00,0x3b,0xd5,0x01,0x01,0x01,0x00

	# GFX10: v_ldexp_f16_e64 v5, v1, 0.5 ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0xe1,0x01,0x00]			# GFX10: v_ldexp_f16_e64 v5, v1, 0x3800 ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0xff,0x01,0x00,0x00,0x38,0x00,0x00]
	0x05,0x00,0x3b,0xd5,0x01,0xe1,0x01,0x00			0x05,0x00,0x3b,0xd5,0x01,0xe1,0x01,0x00

	# GFX10: v_ldexp_f16_e64 v5, v1, exec_hi ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0xff,0x00,0x00]			# GFX10: v_ldexp_f16_e64 v5, v1, exec_hi ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0xff,0x00,0x00]
	0x05,0x00,0x3b,0xd5,0x01,0xff,0x00,0x00			0x05,0x00,0x3b,0xd5,0x01,0xff,0x00,0x00

	# GFX10: v_ldexp_f16_e64 v5, v1, exec_lo ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0xfd,0x00,0x00]			# GFX10: v_ldexp_f16_e64 v5, v1, exec_lo ; encoding: [0x05,0x00,0x3b,0xd5,0x01,0xfd,0x00,0x00]
	0x05,0x00,0x3b,0xd5,0x01,0xfd,0x00,0x00			0x05,0x00,0x3b,0xd5,0x01,0xfd,0x00,0x00

	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/test/MC/Disassembler/AMDGPU/gfx11_dasm_vop3_from_vop2.txt

	Show First 20 Lines • Show All 537 Lines • ▼ Show 20 Lines
	0x05,0x00,0x3b,0xd5,0x6a,0xf6,0x00,0x00			0x05,0x00,0x3b,0xd5,0x6a,0xf6,0x00,0x00

	# GFX11: v_ldexp_f16_e64 v5, vcc_hi, 0xfe0b ; encoding: [0x05,0x00,0x3b,0xd5,0x6b,0xfe,0x01,0x00,0x0b,0xfe,0x00,0x00]			# GFX11: v_ldexp_f16_e64 v5, vcc_hi, 0xfe0b ; encoding: [0x05,0x00,0x3b,0xd5,0x6b,0xfe,0x01,0x00,0x0b,0xfe,0x00,0x00]
	0x05,0x00,0x3b,0xd5,0x6b,0xfe,0x01,0x00,0x0b,0xfe,0x00,0x00			0x05,0x00,0x3b,0xd5,0x6b,0xfe,0x01,0x00,0x0b,0xfe,0x00,0x00

	# GFX11: v_ldexp_f16_e64 v5, ttmp15, src_scc ; encoding: [0x05,0x00,0x3b,0xd5,0x7b,0xfa,0x01,0x00]			# GFX11: v_ldexp_f16_e64 v5, ttmp15, src_scc ; encoding: [0x05,0x00,0x3b,0xd5,0x7b,0xfa,0x01,0x00]
	0x05,0x00,0x3b,0xd5,0x7b,0xfa,0x01,0x00			0x05,0x00,0x3b,0xd5,0x7b,0xfa,0x01,0x00

	# GFX11: v_ldexp_f16_e64 v5, m0, 0.5 ; encoding: [0x05,0x00,0x3b,0xd5,0x7d,0xe0,0x01,0x00]			# GFX11: v_ldexp_f16_e64 v5, m0, 0x3800 ; encoding: [0x05,0x00,0x3b,0xd5,0x7d,0xfe,0x01,0x00,0x00,0x38,0x00,0x00]
	0x05,0x00,0x3b,0xd5,0x7d,0xe0,0x01,0x00			0x05,0x00,0x3b,0xd5,0x7d,0xe0,0x01,0x00

	# GFX11: v_ldexp_f16_e64 v5, exec_lo, -1 ; encoding: [0x05,0x00,0x3b,0xd5,0x7e,0x82,0x01,0x00]			# GFX11: v_ldexp_f16_e64 v5, exec_lo, -1 ; encoding: [0x05,0x00,0x3b,0xd5,0x7e,0x82,0x01,0x00]
	0x05,0x00,0x3b,0xd5,0x7e,0x82,0x01,0x00			0x05,0x00,0x3b,0xd5,0x7e,0x82,0x01,0x00

	# GFX11: v_ldexp_f16_e64 v5, exec_hi, null ; encoding: [0x05,0x00,0x3b,0xd5,0x7f,0xf8,0x00,0x00]			# GFX11: v_ldexp_f16_e64 v5, exec_hi, null ; encoding: [0x05,0x00,0x3b,0xd5,0x7f,0xf8,0x00,0x00]
	0x05,0x00,0x3b,0xd5,0x7f,0xf8,0x00,0x00			0x05,0x00,0x3b,0xd5,0x7f,0xf8,0x00,0x00

	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/test/MC/Disassembler/AMDGPU/gfx8_vop3.txt

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	0x05,0x00,0x33,0xd1,0x01,0xff,0x00,0x00			0x05,0x00,0x33,0xd1,0x01,0xff,0x00,0x00

	# CHECK: v_ldexp_f16_e64 v5, v1, 0 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00]			# CHECK: v_ldexp_f16_e64 v5, v1, 0 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00]
	0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00			0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00

	# CHECK: v_ldexp_f16_e64 v5, v1, -1 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00]			# CHECK: v_ldexp_f16_e64 v5, v1, -1 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00]
	0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00			0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00

	# CHECK: v_ldexp_f16_e64 v5, v1, 0.5 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0xe1,0x01,0x00]			# CHECK: v_ldexp_f16_e64 v5, v1, 0x3800 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0xff,0x01,0x00]
	0x05,0x00,0x33,0xd1,0x01,0xe1,0x01,0x00			0x05,0x00,0x33,0xd1,0x01,0xe1,0x01,0x00

	# CHECK: v_ldexp_f16_e64 v5, v1, -4.0 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0xef,0x01,0x00]			# CHECK: v_ldexp_f16_e64 v5, v1, 0xc400 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0xff,0x01,0x00]
	0x05,0x00,0x33,0xd1,0x01,0xef,0x01,0x00			0x05,0x00,0x33,0xd1,0x01,0xef,0x01,0x00

	# CHECK: v_ldexp_f16_e64 v5, -v1, v2 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x05,0x02,0x20]			# CHECK: v_ldexp_f16_e64 v5, -v1, v2 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x05,0x02,0x20]
	0x05,0x00,0x33,0xd1,0x01,0x05,0x02,0x20			0x05,0x00,0x33,0xd1,0x01,0x05,0x02,0x20

	# CHECK: v_ldexp_f16_e64 v5, \|v1\|, v2 ; encoding: [0x05,0x01,0x33,0xd1,0x01,0x05,0x02,0x00]			# CHECK: v_ldexp_f16_e64 v5, \|v1\|, v2 ; encoding: [0x05,0x01,0x33,0xd1,0x01,0x05,0x02,0x00]
	0x05,0x01,0x33,0xd1,0x01,0x05,0x02,0x00			0x05,0x01,0x33,0xd1,0x01,0x05,0x02,0x00

	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/test/MC/Disassembler/AMDGPU/gfx9_vop3.txt

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	0x05,0x00,0x33,0xd1,0x01,0xff,0x00,0x00			0x05,0x00,0x33,0xd1,0x01,0xff,0x00,0x00

	# CHECK: v_ldexp_f16_e64 v5, v1, 0 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00]			# CHECK: v_ldexp_f16_e64 v5, v1, 0 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00]
	0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00			0x05,0x00,0x33,0xd1,0x01,0x01,0x01,0x00

	# CHECK: v_ldexp_f16_e64 v5, v1, -1 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00]			# CHECK: v_ldexp_f16_e64 v5, v1, -1 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00]
	0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00			0x05,0x00,0x33,0xd1,0x01,0x83,0x01,0x00

	# CHECK: v_ldexp_f16_e64 v5, v1, 0.5 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0xe1,0x01,0x00]			# CHECK: v_ldexp_f16_e64 v5, v1, 0x3800 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0xff,0x01,0x00]
	0x05,0x00,0x33,0xd1,0x01,0xe1,0x01,0x00			0x05,0x00,0x33,0xd1,0x01,0xe1,0x01,0x00

	# CHECK: v_ldexp_f16_e64 v5, v1, -4.0 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0xef,0x01,0x00]			# CHECK: v_ldexp_f16_e64 v5, v1, 0xc400 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0xff,0x01,0x00]
	0x05,0x00,0x33,0xd1,0x01,0xef,0x01,0x00			0x05,0x00,0x33,0xd1,0x01,0xef,0x01,0x00

	# CHECK: v_ldexp_f16_e64 v5, -v1, v2 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x05,0x02,0x20]			# CHECK: v_ldexp_f16_e64 v5, -v1, v2 ; encoding: [0x05,0x00,0x33,0xd1,0x01,0x05,0x02,0x20]
	0x05,0x00,0x33,0xd1,0x01,0x05,0x02,0x20			0x05,0x00,0x33,0xd1,0x01,0x05,0x02,0x20

	# CHECK: v_ldexp_f16_e64 v5, \|v1\|, v2 ; encoding: [0x05,0x01,0x33,0xd1,0x01,0x05,0x02,0x00]			# CHECK: v_ldexp_f16_e64 v5, \|v1\|, v2 ; encoding: [0x05,0x01,0x33,0xd1,0x01,0x05,0x02,0x00]
	0x05,0x01,0x33,0xd1,0x01,0x05,0x02,0x00			0x05,0x01,0x33,0xd1,0x01,0x05,0x02,0x00

	▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines

llvm/test/Transforms/SpeculativeExecution/spec-calls.ll

Show First 20 Lines • Show All 296 Lines • ▼ Show 20 Lines	a:
%reduce = call float @llvm.vector.reduce.fmin.v2f32(<2 x float> %x)		%reduce = call float @llvm.vector.reduce.fmin.v2f32(<2 x float> %x)
br label %b		br label %b

b:		b:
ret void		ret void
}		}

declare float @llvm.vector.reduce.fmin.v2f32(<2 x float>)		declare float @llvm.vector.reduce.fmin.v2f32(<2 x float>)

		; CHECK-LABEL: @ifThen_ldexp(
		; CHECK: %ldexp = call float @llvm.ldexp.f32.i32(float %x, i32 %y)
		; CHECK-NEXT: br i1 true
		define void @ifThen_ldexp(float %x, i32 %y) {
		br i1 true, label %a, label %b

		a:
		%ldexp = call float @llvm.ldexp.f32.i32(float %x, i32 %y)
		br label %b

		b:
		ret void
		}

		declare float @llvm.ldexp.f32.i32(float, i32)

This is an archive of the discontinued LLVM Phabricator instance.

IR: Add llvm.ldexp and llvm.experimental.constrained.ldexp intrinsicsClosedPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 525794

clang/lib/CodeGen/CGBuiltin.cpp

clang/test/CodeGenOpenCL/builtins-amdgcn-vi.cl

clang/test/CodeGenOpenCL/builtins-amdgcn.cl

llvm/docs/LangRef.rst

llvm/docs/ReleaseNotes.rst

llvm/include/llvm/Analysis/TargetLibraryInfo.h

llvm/include/llvm/CodeGen/GlobalISel/LegalizerHelper.h

llvm/include/llvm/CodeGen/GlobalISel/MachineIRBuilder.h

llvm/include/llvm/CodeGen/ISDOpcodes.h

llvm/include/llvm/CodeGen/RuntimeLibcalls.h

llvm/include/llvm/IR/ConstrainedOps.def

llvm/include/llvm/IR/Intrinsics.td

llvm/include/llvm/IR/RuntimeLibcalls.def

llvm/include/llvm/Support/TargetOpcodes.def

llvm/include/llvm/Target/GenericOpcodes.td

llvm/include/llvm/Target/GlobalISel/SelectionDAGCompat.td

llvm/include/llvm/Target/TargetSelectionDAG.td

llvm/lib/CodeGen/GlobalISel/IRTranslator.cpp

llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp

llvm/lib/CodeGen/SelectionDAG/LegalizeDAG.cpp

llvm/lib/CodeGen/SelectionDAG/LegalizeFloatTypes.cpp

llvm/lib/CodeGen/SelectionDAG/LegalizeIntegerTypes.cpp

llvm/lib/CodeGen/SelectionDAG/LegalizeTypes.h

llvm/lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp

llvm/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp

llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp

llvm/lib/CodeGen/SelectionDAG/SelectionDAGBuilder.cpp

llvm/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp

llvm/lib/CodeGen/TargetLoweringBase.cpp

llvm/lib/Target/AMDGPU/AMDGPUISelDAGToDAG.cpp

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.h

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp

llvm/lib/Target/AMDGPU/AMDGPUInstrInfo.td

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.cpp

llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp

llvm/lib/Target/AMDGPU/SIISelLowering.h

llvm/lib/Target/AMDGPU/SIISelLowering.cpp

llvm/lib/Target/AMDGPU/VOP2Instructions.td

llvm/lib/Target/AMDGPU/VOP3Instructions.td

llvm/lib/Target/Hexagon/HexagonISelLowering.cpp

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/AArch64/GlobalISel/legalizer-info-validation.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.ldexp.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.ldexp.s16.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-sitofp.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-uitofp.mir

llvm/test/CodeGen/AMDGPU/llvm.ldexp.ll

llvm/test/CodeGen/AMDGPU/strict_ldexp.f16.ll

llvm/test/CodeGen/AMDGPU/strict_ldexp.f32.ll

llvm/test/CodeGen/AMDGPU/strict_ldexp.f64.ll

llvm/test/CodeGen/Mips/ldexp.ll

llvm/test/CodeGen/PowerPC/ldexp-libcall.ll

llvm/test/CodeGen/PowerPC/ldexp.ll

llvm/test/CodeGen/X86/ldexp-f80.ll

llvm/test/CodeGen/X86/ldexp-libcall.ll

llvm/test/CodeGen/X86/ldexp-not-readonly.ll

llvm/test/CodeGen/X86/ldexp-strict.ll

llvm/test/CodeGen/X86/ldexp-wrong-signature.ll

llvm/test/CodeGen/X86/ldexp-wrong-signature2.ll

llvm/test/CodeGen/X86/ldexp.ll

llvm/test/MC/AMDGPU/gfx10_asm_vop2.s

llvm/test/MC/AMDGPU/gfx11_asm_vop3_from_vop2.s

llvm/test/MC/AMDGPU/gfx8_asm_vop3.s

llvm/test/MC/AMDGPU/gfx9_asm_vop3.s

llvm/test/MC/Disassembler/AMDGPU/gfx10_vop3.txt

llvm/test/MC/Disassembler/AMDGPU/gfx11_dasm_vop3_from_vop2.txt

llvm/test/MC/Disassembler/AMDGPU/gfx8_vop3.txt

llvm/test/MC/Disassembler/AMDGPU/gfx9_vop3.txt

llvm/test/Transforms/SpeculativeExecution/spec-calls.ll

IR: Add llvm.ldexp and llvm.experimental.constrained.ldexp intrinsics
ClosedPublic