This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/CodeGen/
-
CodeGen/
1
MachineScheduler.cpp
-
test/CodeGen/
-
CodeGen/
-
AArch64/
-
arm64-zero-cycle-zeroing.ll
-
AMDGPU/
-
bswap.ll
-
byval-frame-setup.ll
-
call-argument-types.ll
-
chain-hi-to-lo.ll
-
copy-illegal-type.ll
-
cvt_f32_ubyte.ll
-
fcmp.f16.ll
-
fneg-combines.ll
-
global-saddr.ll
-
global_smrd.ll
-
idiv-licm.ll
-
idot2.ll
-
idot4s.ll
-
idot4u.ll
-
idot8s.ll
-
idot8u.ll
-
insert_vector_elt.v2i16.ll
-
llvm.amdgcn.buffer.atomic.ll
-
llvm.amdgcn.struct.buffer.atomic.ll
-
llvm.amdgcn.ubfe.ll
-
llvm.fma.f16.ll
-
llvm.maxnum.f16.ll
-
llvm.minnum.f16.ll
-
lshr.v2i16.ll
-
max.i16.ll
-
mul24-pass-ordering.ll
-
promote-constOffset-to-imm.ll
-
saddo.ll
-
salu-to-valu.ll
-
sched-assert-dead-def-subreg-use-other-subreg.mir
-
sdiv.ll
-
sdwa-peephole.ll
-
select.f16.ll
-
shift-i64-opts.ll
-
shl.ll
-
shl.v2i16.ll
-
shrink-add-sub-constant.ll
-
si-triv-disjoint-mem-access.ll
-
sign_extend.ll
-
sub.v2i16.ll
-
trunc-combine.ll
-
v_madak_f16.ll
-
widen-smrd-loads.ll
-
PowerPC/
-
PR33671.ll
-
botheightreduce.mir
-
dform-adjust.ll
-
extract-and-store.ll
-
f128-aggregates.ll
-
f128-conv.ll
-
f128-passByValue.ll
-
float-load-store-pair.ll
-
load-shuffle-and-shuffle-store.ll
-
loop-instr-form-prepare.ll
-
machine-pre.ll
-
mi-peephole-splat.ll
-
ppcf128-constrained-fp-intrinsics.ll
-
pre-inc-disable.ll
-
remove-redundant-load-imm.ll
-
scalar_vector_test_2.ll
-
scalar_vector_test_4.ll
-
sms-cpy-1.ll
-
sms-grp-order.ll
-
sms-phi-3.ll
-
sms-simple.ll
-
srem-vector-lkk.ll
-
topdepthreduce-postra.mir
-
uint-to-fp-v4i32.ll
-
unaligned-addressing-mode.ll
-
urem-vector-lkk.ll
-
vavg.ll
-
vec-bswap.ll
-
vec_conv_fp32_to_i16_elts.ll
-
vec_conv_fp32_to_i64_elts.ll
-
vec_conv_fp32_to_i8_elts.ll
-
vec_conv_fp64_to_i16_elts.ll
-
vec_conv_fp64_to_i32_elts.ll
-
vec_conv_fp64_to_i8_elts.ll
-
vec_conv_i16_to_fp32_elts.ll
-
vec_conv_i16_to_fp64_elts.ll
-
vec_conv_i32_to_fp64_elts.ll
-
vec_conv_i64_to_fp32_elts.ll
-
vec_conv_i8_to_fp32_elts.ll
-
vec_conv_i8_to_fp64_elts.ll
-
vector-constrained-fp-intrinsics.ll
-
X86/
-
testb-je-fusion.ll
-
topdepthreduce-postra.mir

Differential D72392

[MachineScheduler] Fix the TopDepth/BotHeightReduce latency heuristics
ClosedPublic

Authored by foad on Jan 8 2020, 3:50 AM.

Download Raw Diff

Details

Reviewers

atrick
MatzeB
t.p.northover
arsenm
hfinkel
craig.topper
fhahn

Commits

rG62fd7f767c41: [MachineScheduler] Fix the TopDepth/BotHeightReduce latency heuristics

Summary

tryLatency compares two sched candidates. For the top zone it prefers
the one with lesser depth, but only if that depth is greater than the
total latency of the instructions we've already scheduled -- otherwise
its latency would be hidden and there would be no stall.

Unfortunately it only tests the depth of one of the candidates. This can
lead to situations where the TopDepthReduce heuristic does not kick in,
but a lower priority heuristic chooses the other candidate, whose depth
*is* greater than the already scheduled latency, which causes a stall.

The fix is to apply the heuristic if the depth of *either* candidate is
greater than the already scheduled latency.

All this also applies to the BotHeightReduce heuristic in the bottom
zone.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

foad created this revision.Jan 8 2020, 3:50 AM

Herald added a project: Restricted Project. · View Herald TranscriptJan 8 2020, 3:50 AM

Herald added subscribers: herhut, asbirlea, jsji and 8 others. · View Herald Transcript

Unit tests: pass. 61306 tests passed, 0 failed and 736 were skipped.

clang-tidy: fail. Please fix clang-tidy findings.

clang-format: pass.

Build artifacts: diff.json, clang-tidy.txt, clang-format.patch, CMakeCache.txt, console-log.txt, test-results.xml

Herald added a subscriber: • wuzish. · View Herald TranscriptJan 8 2020, 4:00 AM

Harbormaster failed remote builds in B43497: Diff 236792!Jan 8 2020, 4:00 AM

There's a lot of small test changes (expected), but IMO I would be good to have an isolated test only tests the new behavior and shows an improvement (probably best as MIR machine-scheduler only test).

Also, do you have any performance/codesize numbers for impacted targets?

The diff in llvm/test/CodeGen/AArch64/arm64-zero-cycle-zeroing.ll is:

        adrp    x8, .LCPI0_0
-       ldr     h0, [x8, :lo12:.LCPI0_0]
        movi    v1.2d, #0000000000000000
        movi    v2.2d, #0000000000000000
+       ldr     h0, [x8, :lo12:.LCPI0_0]
        movi    v3.2d, #0000000000000000

The scheduler prefers not to put the ldr immediately after the adrp because of the register dependency on x8 with latency 1.

The diff in llvm/test/CodeGen/X86/testb-je-fusion.ll is:

        movl    %edi, %eax
-       addl    $-512, %eax             # imm = 0xFE00
        movb    $1, (%rsi)
+       addl    $-512, %eax             # imm = 0xFE00
        je      .LBB2_2
...
        movl    %edi, %eax
-       decl    %eax
        movb    $1, (%rsi)
+       decl    %eax
        je      .LBB3_2

The scheduler prefers not to put the addl/decl immediately after the first movl because of the register dependency on eax with latency 1.

In D72392#1811691, @fhahn wrote:

Also, do you have any performance/codesize numbers for impacted targets?

I did some performance testing of graphics shaders on the AMDGPU target. Out of ~350 shaders the average performance changed by less than 0.01%, only 5 shaders changed by more than 1%, and the biggest swings were -4%/+3%. So I think there is no significant overall trend.

I would welcome any help with performance testing on AArch64/PowerPC/X86.

In D72392#1811735, @foad wrote:
The diff in llvm/test/CodeGen/X86/testb-je-fusion.ll is:
        movl    %edi, %eax
-       addl    $-512, %eax             # imm = 0xFE00
        movb    $1, (%rsi)
+       addl    $-512, %eax             # imm = 0xFE00
        je      .LBB2_2
...
        movl    %edi, %eax
-       decl    %eax
        movb    $1, (%rsi)
+       decl    %eax
        je      .LBB3_2
The scheduler prefers not to put the addl/decl immediately after the first movl because of the register dependency on eax with latency 1.

Great. My main point about the tests was that I think it would be good to have a dedicated small test that just checks on rod the improved cases, with a clear explanation, to guard against regressions by other scheduler changes with a lot of test changes

New tests for this specific fix:
test/CodeGen/PowerPC/botheightreduce.mir
test/CodeGen/PowerPC/topdepthreduce-postra.mir
test/CodeGen/X86/topdepthreduce-postra.mir

Unit tests: pass. 61747 tests passed, 0 failed and 780 were skipped.

clang-tidy: pass.

clang-format: pass.

Build artifacts: diff.json, clang-tidy.txt, clang-format.patch, CMakeCache.txt, console-log.txt, test-results.xml

Harbormaster completed remote builds in B43682: Diff 237332.Jan 10 2020, 8:12 AM

Rebase.

foad added a reviewer: fhahn.Jan 15 2020, 3:59 AM

Unit tests: pass. 61887 tests passed, 0 failed and 782 were skipped.

clang-tidy: unknown.

clang-format: pass.

Build artifacts: diff.json, clang-format.patch, CMakeCache.txt, console-log.txt, test-results.xml

Harbormaster completed remote builds in B44031: Diff 238215.Jan 15 2020, 4:38 AM

Ping!

Herald added a subscriber: kerbowa. · View Herald TranscriptJan 29 2020, 8:32 AM

rampitec added a subscriber: rampitec.Feb 3 2020, 5:34 PM

foad added a child revision: D73957: [AMDGPU] getMemOperandsWithOffset: add vaddr operand for stack access BUF instructions.Feb 4 2020, 5:31 AM

Ping! @fhahn do you have any further comments?

Ping!

Ping.

arsenm accepted this revision.Jul 16 2020, 8:56 AM

This revision is now accepted and ready to land.Jul 16 2020, 8:56 AM

Looks reasonable, thanks for adding the MIR test as well. Sorry for the delay, it dropped off my radar.

llvm/lib/CodeGen/MachineScheduler.cpp
2685	It might be good to add a comment here explaining what we are checking here. (same as below).

Closed by commit rG62fd7f767c41: [MachineScheduler] Fix the TopDepth/BotHeightReduce latency heuristics (authored by foad). · Explain WhyJul 17 2020, 3:02 AM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

lib/

CodeGen/

MachineScheduler.cpp

6 lines

test/

CodeGen/

AArch64/

arm64-zero-cycle-zeroing.ll

8 lines

AMDGPU/

bswap.ll

22 lines

byval-frame-setup.ll

10 lines

call-argument-types.ll

10 lines

14 lines

54 lines

25 lines

4 lines

6 lines

4 lines

4 lines

118 lines

28 lines

106 lines

156 lines

306 lines

92 lines

insert_vector_elt.v2i16.ll

24 lines

llvm.amdgcn.buffer.atomic.ll

3 lines

llvm.amdgcn.struct.buffer.atomic.ll

6 lines

22 lines

12 lines

112 lines

112 lines

42 lines

56 lines

mul24-pass-ordering.ll

30 lines

promote-constOffset-to-imm.ll

12 lines

saddo.ll

188 lines

salu-to-valu.ll

14 lines

sched-assert-dead-def-subreg-use-other-subreg.mir

2 lines

281 lines

2 lines

320 lines

4 lines

68 lines

32 lines

shrink-add-sub-constant.ll

64 lines

si-triv-disjoint-mem-access.ll

4 lines

40 lines

12 lines

8 lines

34 lines

182 lines

PowerPC/

2 lines

92 lines

12 lines

20 lines

8 lines

4 lines

8 lines

float-load-store-pair.ll

18 lines

load-shuffle-and-shuffle-store.ll

6 lines

loop-instr-form-prepare.ll

68 lines

machine-pre.ll

4 lines

mi-peephole-splat.ll

4 lines

ppcf128-constrained-fp-intrinsics.ll

2 lines

pre-inc-disable.ll

64 lines

remove-redundant-load-imm.ll

2 lines

scalar_vector_test_2.ll

4 lines

scalar_vector_test_4.ll

18 lines

16 lines

2 lines

2 lines

8 lines

136 lines

topdepthreduce-postra.mir

18 lines

uint-to-fp-v4i32.ll

4 lines

unaligned-addressing-mode.ll

6 lines

urem-vector-lkk.ll

96 lines

vavg.ll

2 lines

vec-bswap.ll

3 lines

vec_conv_fp32_to_i16_elts.ll

272 lines

vec_conv_fp32_to_i64_elts.ll

208 lines

vec_conv_fp32_to_i8_elts.ll

172 lines

vec_conv_fp64_to_i16_elts.ll

256 lines

vec_conv_fp64_to_i32_elts.ll

64 lines

vec_conv_fp64_to_i8_elts.ll

140 lines

vec_conv_i16_to_fp32_elts.ll

24 lines

vec_conv_i16_to_fp64_elts.ll

80 lines

vec_conv_i32_to_fp64_elts.ll

24 lines

vec_conv_i64_to_fp32_elts.ll

96 lines

vec_conv_i8_to_fp32_elts.ll

32 lines

vec_conv_i8_to_fp64_elts.ll

38 lines

vector-constrained-fp-intrinsics.ll

212 lines

X86/

testb-je-fusion.ll

8 lines

topdepthreduce-postra.mir

16 lines

Diff 238215

llvm/lib/CodeGen/MachineScheduler.cpp

Show First 20 Lines • Show All 2,676 Lines • ▼ Show 20 Lines	bool tryGreater(int TryVal, int CandVal,
}		}
return false;		return false;
}		}

bool tryLatency(GenericSchedulerBase::SchedCandidate &TryCand,		bool tryLatency(GenericSchedulerBase::SchedCandidate &TryCand,
GenericSchedulerBase::SchedCandidate &Cand,		GenericSchedulerBase::SchedCandidate &Cand,
SchedBoundary &Zone) {		SchedBoundary &Zone) {
if (Zone.isTop()) {		if (Zone.isTop()) {
if (Cand.SU->getDepth() > Zone.getScheduledLatency()) {		if (std::max(TryCand.SU->getDepth(), Cand.SU->getDepth()) >
		fhahnUnsubmitted Not Done Reply Inline Actions It might be good to add a comment here explaining what we are checking here. (same as below). fhahn: It might be good to add a comment here explaining what we are checking here. (same as below).
		Zone.getScheduledLatency()) {
if (tryLess(TryCand.SU->getDepth(), Cand.SU->getDepth(),		if (tryLess(TryCand.SU->getDepth(), Cand.SU->getDepth(),
TryCand, Cand, GenericSchedulerBase::TopDepthReduce))		TryCand, Cand, GenericSchedulerBase::TopDepthReduce))
return true;		return true;
}		}
if (tryGreater(TryCand.SU->getHeight(), Cand.SU->getHeight(),		if (tryGreater(TryCand.SU->getHeight(), Cand.SU->getHeight(),
TryCand, Cand, GenericSchedulerBase::TopPathReduce))		TryCand, Cand, GenericSchedulerBase::TopPathReduce))
return true;		return true;
} else {		} else {
if (Cand.SU->getHeight() > Zone.getScheduledLatency()) {		if (std::max(TryCand.SU->getHeight(), Cand.SU->getHeight()) >
		Zone.getScheduledLatency()) {
if (tryLess(TryCand.SU->getHeight(), Cand.SU->getHeight(),		if (tryLess(TryCand.SU->getHeight(), Cand.SU->getHeight(),
TryCand, Cand, GenericSchedulerBase::BotHeightReduce))		TryCand, Cand, GenericSchedulerBase::BotHeightReduce))
return true;		return true;
}		}
if (tryGreater(TryCand.SU->getDepth(), Cand.SU->getDepth(),		if (tryGreater(TryCand.SU->getDepth(), Cand.SU->getDepth(),
TryCand, Cand, GenericSchedulerBase::BotPathReduce))		TryCand, Cand, GenericSchedulerBase::BotPathReduce))
return true;		return true;
}		}
▲ Show 20 Lines • Show All 1,058 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/arm64-zero-cycle-zeroing.ll

	Show All 21 Lines
	; NONEFP: ldr h0,{{.*}}			; NONEFP: ldr h0,{{.*}}
	; NONEFP: fmov s1, wzr			; NONEFP: fmov s1, wzr
	; NONEFP: fmov d2, xzr			; NONEFP: fmov d2, xzr
	; NONEFP: movi{{(.16b)?}} v3{{(.2d)?}}, #0			; NONEFP: movi{{(.16b)?}} v3{{(.2d)?}}, #0
	; NONE16: fmov h0, wzr			; NONE16: fmov h0, wzr
	; NONE16: fmov s1, wzr			; NONE16: fmov s1, wzr
	; NONE16: fmov d2, xzr			; NONE16: fmov d2, xzr
	; NONE16: movi{{(.16b)?}} v3{{(.2d)?}}, #0			; NONE16: movi{{(.16b)?}} v3{{(.2d)?}}, #0
	; ZEROFP: ldr h0,{{.*}}			; ZEROFP-DAG: ldr h0,{{.*}}
	; ZEROFP: movi v{{[0-3]+}}.2d, #0			; ZEROFP-DAG: movi v{{[0-3]+}}.2d, #0
	; ZEROFP: movi v{{[0-3]+}}.2d, #0			; ZEROFP-DAG: movi v{{[0-3]+}}.2d, #0
	; ZEROFP: movi v{{[0-3]+}}.2d, #0			; ZEROFP-DAG: movi v{{[0-3]+}}.2d, #0
	; ZERO16: movi v{{[0-3]+}}.2d, #0			; ZERO16: movi v{{[0-3]+}}.2d, #0
	; ZERO16: movi v{{[0-3]+}}.2d, #0			; ZERO16: movi v{{[0-3]+}}.2d, #0
	; ZERO16: movi v{{[0-3]+}}.2d, #0			; ZERO16: movi v{{[0-3]+}}.2d, #0
	; ZERO16: movi v{{[0-3]+}}.2d, #0			; ZERO16: movi v{{[0-3]+}}.2d, #0
	tail call void @bar(half 0.000000e+00, float 0.000000e+00, double 0.000000e+00, <2 x double> <double 0.000000e+00, double 0.000000e+00>) nounwind			tail call void @bar(half 0.000000e+00, float 0.000000e+00, double 0.000000e+00, <2 x double> <double 0.000000e+00, double 0.000000e+00>) nounwind
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 190 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/bswap.ll

	Show All 23 Lines
	; SI-NEXT: v_alignbit_b32 v1, s4, s4, 24			; SI-NEXT: v_alignbit_b32 v1, s4, s4, 24
	; SI-NEXT: s_mov_b32 s4, 0xff00ff			; SI-NEXT: s_mov_b32 s4, 0xff00ff
	; SI-NEXT: v_bfi_b32 v0, s4, v1, v0			; SI-NEXT: v_bfi_b32 v0, s4, v1, v0
	; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: test_bswap_i32:			; VI-LABEL: test_bswap_i32:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s7, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s6, -1
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s0, s4			; VI-NEXT: s_load_dword s2, s[2:3], 0x0
	; VI-NEXT: s_load_dword s4, s[6:7], 0x0			; VI-NEXT: s_mov_b32 s4, s0
	; VI-NEXT: s_mov_b32 s1, s5			; VI-NEXT: s_mov_b32 s0, 0xff00ff
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_mov_b32 s5, s1
	; VI-NEXT: v_alignbit_b32 v0, s4, s4, 8			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_alignbit_b32 v1, s4, s4, 24			; VI-NEXT: v_alignbit_b32 v0, s2, s2, 8
	; VI-NEXT: s_mov_b32 s4, 0xff00ff			; VI-NEXT: v_alignbit_b32 v1, s2, s2, 24
	; VI-NEXT: v_bfi_b32 v0, s4, v1, v0			; VI-NEXT: v_bfi_b32 v0, s0, v1, v0
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	%val = load i32, i32 addrspace(1)* %in, align 4			%val = load i32, i32 addrspace(1)* %in, align 4
	%bswap = call i32 @llvm.bswap.i32(i32 %val) nounwind readnone			%bswap = call i32 @llvm.bswap.i32(i32 %val) nounwind readnone
	store i32 %bswap, i32 addrspace(1)* %out, align 4			store i32 %bswap, i32 addrspace(1)* %out, align 4
	ret void			ret void
	}			}

	define amdgpu_kernel void @test_bswap_v2i32(<2 x i32> addrspace(1)* %out, <2 x i32> addrspace(1)* %in) nounwind {			define amdgpu_kernel void @test_bswap_v2i32(<2 x i32> addrspace(1)* %out, <2 x i32> addrspace(1)* %in) nounwind {
	▲ Show 20 Lines • Show All 695 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/byval-frame-setup.ll

	Show First 20 Lines • Show All 259 Lines • ▼ Show 20 Lines
	; GCN: buffer_store_dword [[NINE]], off, s[0:3], s33 offset:8			; GCN: buffer_store_dword [[NINE]], off, s[0:3], s33 offset:8
	; GCN: v_mov_b32_e32 [[THIRTEEN:v[0-9]+]], 13			; GCN: v_mov_b32_e32 [[THIRTEEN:v[0-9]+]], 13
	; GCN: buffer_store_dword [[THIRTEEN]], off, s[0:3], s33 offset:24			; GCN: buffer_store_dword [[THIRTEEN]], off, s[0:3], s33 offset:24


	; GCN-NOT: s_add_u32 s32, s32, 0x800			; GCN-NOT: s_add_u32 s32, s32, 0x800
	; GCN-DAG: s_add_u32 s32, s33, 0xc00{{$}}			; GCN-DAG: s_add_u32 s32, s33, 0xc00{{$}}

	; GCN: buffer_load_dword [[LOAD0:v[0-9]+]], off, s[0:3], s33 offset:8			; GCN-DAG: buffer_load_dword [[LOAD0:v[0-9]+]], off, s[0:3], s33 offset:8
	; GCN: buffer_load_dword [[LOAD1:v[0-9]+]], off, s[0:3], s33 offset:12			; GCN-DAG: buffer_load_dword [[LOAD1:v[0-9]+]], off, s[0:3], s33 offset:12
	; GCN: buffer_load_dword [[LOAD2:v[0-9]+]], off, s[0:3], s33 offset:16			; GCN-DAG: buffer_load_dword [[LOAD2:v[0-9]+]], off, s[0:3], s33 offset:16
	; GCN: buffer_load_dword [[LOAD3:v[0-9]+]], off, s[0:3], s33 offset:20			; GCN-DAG: buffer_load_dword [[LOAD3:v[0-9]+]], off, s[0:3], s33 offset:20

	; GCN: buffer_store_dword [[LOAD3]], off, s[0:3], s32 offset:12			; GCN: buffer_store_dword [[LOAD3]], off, s[0:3], s32 offset:12
	; GCN: buffer_store_dword [[LOAD2]], off, s[0:3], s32 offset:8			; GCN: buffer_store_dword [[LOAD2]], off, s[0:3], s32 offset:8
	; GCN: buffer_store_dword [[LOAD1]], off, s[0:3], s32 offset:4			; GCN: buffer_store_dword [[LOAD1]], off, s[0:3], s32 offset:4
	; GCN: buffer_store_dword [[LOAD0]], off, s[0:3], s32{{$}}			; GCN: buffer_store_dword [[LOAD0]], off, s[0:3], s32{{$}}


	; GCN-DAG: buffer_load_dword [[LOAD4:v[0-9]+]], off, s[0:3], s33 offset:24			; GCN-DAG: buffer_load_dword [[LOAD4:v[0-9]+]], off, s[0:3], s33 offset:24
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; GCN-DAG: buffer_store_dword [[LOAD2]], off, s[0:3], s32 offset:8			; GCN-DAG: buffer_store_dword [[LOAD2]], off, s[0:3], s32 offset:8
	; GCN-DAG: buffer_store_dword [[LOAD3]], off, s[0:3], s32 offset:12			; GCN-DAG: buffer_store_dword [[LOAD3]], off, s[0:3], s32 offset:12

	; GCN: buffer_load_dword [[LOAD4:v[0-9]+]], off, s[0:3], s34 offset:16			; GCN: buffer_load_dword [[LOAD4:v[0-9]+]], off, s[0:3], s34 offset:16
	; GCN: buffer_load_dword [[LOAD5:v[0-9]+]], off, s[0:3], s34 offset:20			; GCN: buffer_load_dword [[LOAD5:v[0-9]+]], off, s[0:3], s34 offset:20
	; GCN: buffer_load_dword [[LOAD6:v[0-9]+]], off, s[0:3], s34 offset:24			; GCN: buffer_load_dword [[LOAD6:v[0-9]+]], off, s[0:3], s34 offset:24
	; GCN: buffer_load_dword [[LOAD7:v[0-9]+]], off, s[0:3], s34 offset:28			; GCN: buffer_load_dword [[LOAD7:v[0-9]+]], off, s[0:3], s34 offset:28

	; GCN: s_waitcnt vmcnt(0)			; GCN: s_waitcnt vmcnt
	; GCN-DAG: buffer_store_dword [[LOAD4]], off, s[0:3], s32 offset:16			; GCN-DAG: buffer_store_dword [[LOAD4]], off, s[0:3], s32 offset:16
	; GCN-DAG: buffer_store_dword [[LOAD5]], off, s[0:3], s32 offset:20			; GCN-DAG: buffer_store_dword [[LOAD5]], off, s[0:3], s32 offset:20
	; GCN-DAG: buffer_store_dword [[LOAD6]], off, s[0:3], s32 offset:24			; GCN-DAG: buffer_store_dword [[LOAD6]], off, s[0:3], s32 offset:24
	; GCN-DAG: buffer_store_dword [[LOAD7]], off, s[0:3], s32 offset:28			; GCN-DAG: buffer_store_dword [[LOAD7]], off, s[0:3], s32 offset:28

	; GCN: s_swappc_b64			; GCN: s_swappc_b64
	; GCN-NOT: v_readlane_b32 s32			; GCN-NOT: v_readlane_b32 s32
	; GCN: v_readlane_b32			; GCN: v_readlane_b32
	▲ Show 20 Lines • Show All 53 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/call-argument-types.ll

	Show First 20 Lines • Show All 672 Lines • ▼ Show 20 Lines
	; GCN-DAG: v_mov_b32_e32 [[VAL0:v[0-9]+]], 3			; GCN-DAG: v_mov_b32_e32 [[VAL0:v[0-9]+]], 3
	; GCN-DAG: v_mov_b32_e32 [[VAL1:v[0-9]+]], 8			; GCN-DAG: v_mov_b32_e32 [[VAL1:v[0-9]+]], 8
	; MESA-DAG: buffer_store_byte [[VAL0]], off, s[36:39], s33 offset:8			; MESA-DAG: buffer_store_byte [[VAL0]], off, s[36:39], s33 offset:8
	; MESA-DAG: buffer_store_dword [[VAL1]], off, s[36:39], s33 offset:12			; MESA-DAG: buffer_store_dword [[VAL1]], off, s[36:39], s33 offset:12

	; HSA-DAG: buffer_store_byte [[VAL0]], off, s[0:3], s33 offset:8			; HSA-DAG: buffer_store_byte [[VAL0]], off, s[0:3], s33 offset:8
	; HSA-DAG: buffer_store_dword [[VAL1]], off, s[0:3], s33 offset:12			; HSA-DAG: buffer_store_dword [[VAL1]], off, s[0:3], s33 offset:12

	; GCN-NOT: s_add_u32 [[SP]],			; HSA-DAG: buffer_load_dword [[RELOAD_VAL0:v[0-9]+]], off, s[0:3], s33 offset:8
				; HSA-DAG: buffer_load_dword [[RELOAD_VAL1:v[0-9]+]], off, s[0:3], s33 offset:12
	; HSA: buffer_load_dword [[RELOAD_VAL0:v[0-9]+]], off, s[0:3], s33 offset:8
	; HSA: buffer_load_dword [[RELOAD_VAL1:v[0-9]+]], off, s[0:3], s33 offset:12

	; HSA-DAG: buffer_store_dword [[RELOAD_VAL0]], off, s[0:3], [[SP]]{{$}}			; HSA-DAG: buffer_store_dword [[RELOAD_VAL0]], off, s[0:3], [[SP]]{{$}}
	; HSA-DAG: buffer_store_dword [[RELOAD_VAL1]], off, s[0:3], [[SP]] offset:4			; HSA-DAG: buffer_store_dword [[RELOAD_VAL1]], off, s[0:3], [[SP]] offset:4


	; MESA: buffer_load_dword [[RELOAD_VAL0:v[0-9]+]], off, s[36:39], s33 offset:8			; MESA-DAG: buffer_load_dword [[RELOAD_VAL0:v[0-9]+]], off, s[36:39], s33 offset:8
	; MESA: buffer_load_dword [[RELOAD_VAL1:v[0-9]+]], off, s[36:39], s33 offset:12			; MESA-DAG: buffer_load_dword [[RELOAD_VAL1:v[0-9]+]], off, s[36:39], s33 offset:12

	; MESA-DAG: buffer_store_dword [[RELOAD_VAL0]], off, s[36:39], [[SP]]{{$}}			; MESA-DAG: buffer_store_dword [[RELOAD_VAL0]], off, s[36:39], [[SP]]{{$}}
	; MESA-DAG: buffer_store_dword [[RELOAD_VAL1]], off, s[36:39], [[SP]] offset:4			; MESA-DAG: buffer_store_dword [[RELOAD_VAL1]], off, s[36:39], [[SP]] offset:4

	; GCN-NEXT: s_swappc_b64			; GCN-NEXT: s_swappc_b64
	; GCN-NOT: [[SP]]			; GCN-NOT: [[SP]]
	define amdgpu_kernel void @test_call_external_void_func_byval_struct_i8_i32() #0 {			define amdgpu_kernel void @test_call_external_void_func_byval_struct_i8_i32() #0 {
	%val = alloca { i8, i32 }, align 4, addrspace(5)			%val = alloca { i8, i32 }, align 4, addrspace(5)
	▲ Show 20 Lines • Show All 247 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/chain-hi-to-lo.ll

	Show First 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
	; Make sure we don't lose any of the private stores.			; Make sure we don't lose any of the private stores.
	define amdgpu_kernel void @vload2_private(i16 addrspace(1)* nocapture readonly %in, <2 x i16> addrspace(1)* nocapture %out) #0 {			define amdgpu_kernel void @vload2_private(i16 addrspace(1)* nocapture readonly %in, <2 x i16> addrspace(1)* nocapture %out) #0 {
	; GCN-LABEL: vload2_private:			; GCN-LABEL: vload2_private:
	; GCN: ; %bb.0: ; %entry			; GCN: ; %bb.0: ; %entry
	; GCN-NEXT: s_add_u32 flat_scratch_lo, s6, s9			; GCN-NEXT: s_add_u32 flat_scratch_lo, s6, s9
	; GCN-NEXT: s_addc_u32 flat_scratch_hi, s7, 0			; GCN-NEXT: s_addc_u32 flat_scratch_hi, s7, 0
	; GCN-NEXT: s_load_dwordx4 s[4:7], s[4:5], 0x0			; GCN-NEXT: s_load_dwordx4 s[4:7], s[4:5], 0x0
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: v_mov_b32_e32 v2, s4			; GCN-NEXT: v_mov_b32_e32 v0, s4
	; GCN-NEXT: v_mov_b32_e32 v3, s5			; GCN-NEXT: v_mov_b32_e32 v1, s5
	; GCN-NEXT: global_load_ushort v4, v[2:3], off offset:4			; GCN-NEXT: global_load_ushort v2, v[0:1], off offset:4
	; GCN-NEXT: global_load_dword v2, v[2:3], off			; GCN-NEXT: global_load_dword v3, v[0:1], off
	; GCN-NEXT: v_mov_b32_e32 v0, s6			; GCN-NEXT: v_mov_b32_e32 v0, s6
	; GCN-NEXT: v_mov_b32_e32 v1, s7			; GCN-NEXT: v_mov_b32_e32 v1, s7
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: buffer_store_short v2, off, s[0:3], s9 offset:4			; GCN-NEXT: buffer_store_short v3, off, s[0:3], s9 offset:4
	; GCN-NEXT: buffer_store_short_d16_hi v2, off, s[0:3], s9 offset:6			; GCN-NEXT: buffer_store_short_d16_hi v3, off, s[0:3], s9 offset:6
	; GCN-NEXT: buffer_store_short v4, off, s[0:3], s9 offset:8			; GCN-NEXT: buffer_store_short v2, off, s[0:3], s9 offset:8
	; GCN-NEXT: buffer_load_ushort v2, off, s[0:3], s9 offset:4			; GCN-NEXT: buffer_load_ushort v2, off, s[0:3], s9 offset:4
	; GCN-NEXT: buffer_load_ushort v4, off, s[0:3], s9 offset:6			; GCN-NEXT: buffer_load_ushort v4, off, s[0:3], s9 offset:6
	; GCN-NEXT: s_waitcnt vmcnt(1)			; GCN-NEXT: s_waitcnt vmcnt(1)
	; GCN-NEXT: v_and_b32_e32 v2, 0xffff, v2			; GCN-NEXT: v_and_b32_e32 v2, 0xffff, v2
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_mov_b32_e32 v3, v4			; GCN-NEXT: v_mov_b32_e32 v3, v4
	; GCN-NEXT: buffer_load_short_d16_hi v3, off, s[0:3], s9 offset:8			; GCN-NEXT: buffer_load_short_d16_hi v3, off, s[0:3], s9 offset:8
	; GCN-NEXT: v_lshl_or_b32 v2, v4, 16, v2			; GCN-NEXT: v_lshl_or_b32 v2, v4, 16, v2
	▲ Show 20 Lines • Show All 165 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/copy-illegal-type.ll

	Show First 20 Lines • Show All 132 Lines • ▼ Show 20 Lines
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s14, s10
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v1, s7			; VI-NEXT: v_mov_b32_e32 v1, s7
	; VI-NEXT: v_add_u32_e32 v0, vcc, s6, v0			; VI-NEXT: v_add_u32_e32 v0, vcc, s6, v0
	; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; VI-NEXT: flat_load_dword v0, v[0:1]			; VI-NEXT: flat_load_dword v0, v[0:1]
	; VI-NEXT: s_mov_b32 s12, s2			; VI-NEXT: s_mov_b32 s12, s2
	; VI-NEXT: s_mov_b32 s13, s3			; VI-NEXT: s_mov_b32 s13, s3
				; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: s_mov_b32 s8, s4			; VI-NEXT: s_mov_b32 s8, s4
	; VI-NEXT: s_mov_b32 s9, s5			; VI-NEXT: s_mov_b32 s9, s5
	; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: s_mov_b32 s2, s10			; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_mov_b32 s3, s11			; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: buffer_store_dword v0, off, s[12:15], 0			; VI-NEXT: buffer_store_dword v0, off, s[12:15], 0
	; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	%tid.x = call i32 @llvm.amdgcn.workitem.id.x()			%tid.x = call i32 @llvm.amdgcn.workitem.id.x()
	%gep = getelementptr <4 x i8>, <4 x i8> addrspace(1)* %in, i32 %tid.x			%gep = getelementptr <4 x i8>, <4 x i8> addrspace(1)* %in, i32 %tid.x
	%val = load <4 x i8>, <4 x i8> addrspace(1)* %gep, align 4			%val = load <4 x i8>, <4 x i8> addrspace(1)* %gep, align 4
	store <4 x i8> %val, <4 x i8> addrspace(1)* %out0, align 4			store <4 x i8> %val, <4 x i8> addrspace(1)* %out0, align 4
	store <4 x i8> %val, <4 x i8> addrspace(1)* %out1, align 4			store <4 x i8> %val, <4 x i8> addrspace(1)* %out1, align 4
	store <4 x i8> %val, <4 x i8> addrspace(1)* %out2, align 4			store <4 x i8> %val, <4 x i8> addrspace(1)* %out2, align 4
	ret void			ret void
	}			}

	define amdgpu_kernel void @test_copy_v4i8_x4(<4 x i8> addrspace(1)* %out0, <4 x i8> addrspace(1)* %out1, <4 x i8> addrspace(1)* %out2, <4 x i8> addrspace(1)* %out3, <4 x i8> addrspace(1)* %in) nounwind {			define amdgpu_kernel void @test_copy_v4i8_x4(<4 x i8> addrspace(1)* %out0, <4 x i8> addrspace(1)* %out1, <4 x i8> addrspace(1)* %out2, <4 x i8> addrspace(1)* %out3, <4 x i8> addrspace(1)* %in) nounwind {
	; SI-LABEL: test_copy_v4i8_x4:			; SI-LABEL: test_copy_v4i8_x4:
	; SI: ; %bb.0:			; SI: ; %bb.0:
	; SI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x11			; SI-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x11
	; SI-NEXT: s_mov_b32 s15, 0xf000			; SI-NEXT: s_mov_b32 s11, 0xf000
	; SI-NEXT: s_mov_b32 s10, 0			; SI-NEXT: s_mov_b32 s6, 0
	; SI-NEXT: s_mov_b32 s11, s15			; SI-NEXT: s_mov_b32 s7, s11
	; SI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; SI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; SI-NEXT: v_mov_b32_e32 v1, 0			; SI-NEXT: v_mov_b32_e32 v1, 0
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
	; SI-NEXT: buffer_load_dword v0, v[0:1], s[8:11], 0 addr64			; SI-NEXT: buffer_load_dword v0, v[0:1], s[4:7], 0 addr64
	; SI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x9			; SI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x9
	; SI-NEXT: s_mov_b32 s14, -1			; SI-NEXT: s_mov_b32 s10, -1
	; SI-NEXT: s_mov_b32 s18, s14			; SI-NEXT: s_mov_b32 s14, s10
	; SI-NEXT: s_mov_b32 s19, s15			; SI-NEXT: s_mov_b32 s15, s11
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
	; SI-NEXT: s_mov_b32 s12, s6			; SI-NEXT: s_mov_b32 s8, s6
	; SI-NEXT: s_mov_b32 s13, s7			; SI-NEXT: s_mov_b32 s9, s7
	; SI-NEXT: s_mov_b32 s16, s2			; SI-NEXT: s_mov_b32 s12, s2
	; SI-NEXT: s_mov_b32 s17, s3			; SI-NEXT: s_mov_b32 s13, s3
	; SI-NEXT: s_mov_b32 s6, s14			; SI-NEXT: s_mov_b32 s6, s10
	; SI-NEXT: s_mov_b32 s7, s15			; SI-NEXT: s_mov_b32 s7, s11
	; SI-NEXT: s_mov_b32 s2, s14			; SI-NEXT: s_mov_b32 s2, s10
	; SI-NEXT: s_mov_b32 s3, s15			; SI-NEXT: s_mov_b32 s3, s11
	; SI-NEXT: s_waitcnt vmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0)
	; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; SI-NEXT: buffer_store_dword v0, off, s[16:19], 0
	; SI-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; SI-NEXT: buffer_store_dword v0, off, s[12:15], 0			; SI-NEXT: buffer_store_dword v0, off, s[12:15], 0
				; SI-NEXT: buffer_store_dword v0, off, s[4:7], 0
				; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: test_copy_v4i8_x4:			; VI-LABEL: test_copy_v4i8_x4:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x44			; VI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x44
	; VI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; VI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v1, s9			; VI-NEXT: v_mov_b32_e32 v1, s9
	; VI-NEXT: v_add_u32_e32 v0, vcc, s8, v0			; VI-NEXT: v_add_u32_e32 v0, vcc, s8, v0
	; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; VI-NEXT: flat_load_dword v0, v[0:1]			; VI-NEXT: flat_load_dword v0, v[0:1]
	; VI-NEXT: s_mov_b32 s8, s6			; VI-NEXT: s_mov_b32 s8, s6
	; VI-NEXT: s_mov_b32 s9, s7			; VI-NEXT: s_mov_b32 s9, s7
	; VI-NEXT: s_mov_b32 s12, s2			; VI-NEXT: s_mov_b32 s12, s2
	; VI-NEXT: s_mov_b32 s13, s3			; VI-NEXT: s_mov_b32 s13, s3
	; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s14, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s15, s11
				; VI-NEXT: s_mov_b32 s6, s10
				; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: s_mov_b32 s2, s10			; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_mov_b32 s3, s11			; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: buffer_store_dword v0, off, s[12:15], 0			; VI-NEXT: buffer_store_dword v0, off, s[12:15], 0
	; VI-NEXT: buffer_store_dword v0, off, s[4:7], 0			; VI-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	▲ Show 20 Lines • Show All 99 Lines • ▼ Show 20 Lines
	; SI-NEXT: s_mov_b32 s3, 0xf000			; SI-NEXT: s_mov_b32 s3, 0xf000
	; SI-NEXT: s_mov_b32 s14, 0			; SI-NEXT: s_mov_b32 s14, 0
	; SI-NEXT: s_mov_b32 s15, s3			; SI-NEXT: s_mov_b32 s15, s3
	; SI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; SI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
	; SI-NEXT: s_mov_b64 s[12:13], s[10:11]			; SI-NEXT: s_mov_b64 s[12:13], s[10:11]
	; SI-NEXT: v_mov_b32_e32 v1, 0			; SI-NEXT: v_mov_b32_e32 v1, 0
	; SI-NEXT: buffer_load_dword v0, v[0:1], s[12:15], 0 addr64			; SI-NEXT: buffer_load_dword v0, v[0:1], s[12:15], 0 addr64
	; SI-NEXT: s_mov_b32 s16, 0xff00			; SI-NEXT: s_mov_b32 s12, 0xff00
	; SI-NEXT: s_movk_i32 s17, 0xff			; SI-NEXT: s_movk_i32 s13, 0xff
	; SI-NEXT: s_mov_b32 s2, -1			; SI-NEXT: s_mov_b32 s2, -1
	; SI-NEXT: s_mov_b32 s0, s8			; SI-NEXT: s_mov_b32 s0, s8
	; SI-NEXT: s_mov_b32 s1, s9			; SI-NEXT: s_mov_b32 s1, s9
	; SI-NEXT: s_mov_b32 s8, s6			; SI-NEXT: s_mov_b32 s8, s6
	; SI-NEXT: s_mov_b32 s9, s7			; SI-NEXT: s_mov_b32 s9, s7
	; SI-NEXT: s_mov_b32 s10, s2			; SI-NEXT: s_mov_b32 s10, s2
	; SI-NEXT: s_mov_b32 s11, s3			; SI-NEXT: s_mov_b32 s11, s3
	; SI-NEXT: s_mov_b32 s6, s2			; SI-NEXT: s_mov_b32 s6, s2
	; SI-NEXT: s_mov_b32 s7, s3			; SI-NEXT: s_mov_b32 s7, s3
	; SI-NEXT: s_waitcnt vmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0)
	; SI-NEXT: v_add_i32_e32 v3, vcc, 9, v0			; SI-NEXT: v_add_i32_e32 v3, vcc, 9, v0
	; SI-NEXT: v_lshrrev_b32_e32 v1, 16, v0			; SI-NEXT: v_lshrrev_b32_e32 v1, 16, v0
	; SI-NEXT: v_and_b32_e32 v4, s16, v1			; SI-NEXT: v_and_b32_e32 v4, s12, v1
	; SI-NEXT: v_add_i32_e32 v1, vcc, 9, v1			; SI-NEXT: v_add_i32_e32 v1, vcc, 9, v1
	; SI-NEXT: v_and_b32_e32 v2, s16, v0			; SI-NEXT: v_and_b32_e32 v2, s12, v0
	; SI-NEXT: v_and_b32_e32 v3, s17, v3			; SI-NEXT: v_and_b32_e32 v3, s13, v3
	; SI-NEXT: v_or_b32_e32 v2, v2, v3			; SI-NEXT: v_or_b32_e32 v2, v2, v3
	; SI-NEXT: v_and_b32_e32 v1, s17, v1			; SI-NEXT: v_and_b32_e32 v1, s13, v1
	; SI-NEXT: v_add_i32_e32 v2, vcc, 0x900, v2			; SI-NEXT: v_add_i32_e32 v2, vcc, 0x900, v2
	; SI-NEXT: v_or_b32_e32 v1, v4, v1			; SI-NEXT: v_or_b32_e32 v1, v4, v1
	; SI-NEXT: v_and_b32_e32 v2, 0xffff, v2			; SI-NEXT: v_and_b32_e32 v2, 0xffff, v2
	; SI-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; SI-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; SI-NEXT: v_or_b32_e32 v1, v1, v2			; SI-NEXT: v_or_b32_e32 v1, v1, v2
	; SI-NEXT: v_add_i32_e32 v1, vcc, 0x9000000, v1			; SI-NEXT: v_add_i32_e32 v1, vcc, 0x9000000, v1
	; SI-NEXT: buffer_store_dword v0, off, s[4:7], 0			; SI-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; SI-NEXT: buffer_store_dword v1, off, s[8:11], 0			; SI-NEXT: buffer_store_dword v1, off, s[8:11], 0
	▲ Show 20 Lines • Show All 280 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/cvt_f32_ubyte.ll

	Show First 20 Lines • Show All 270 Lines • ▼ Show 20 Lines
	; SI-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0xd			; SI-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0xd
	; SI-NEXT: s_mov_b32 s3, 0xf000			; SI-NEXT: s_mov_b32 s3, 0xf000
	; SI-NEXT: s_mov_b32 s6, 0			; SI-NEXT: s_mov_b32 s6, 0
	; SI-NEXT: s_mov_b32 s7, s3			; SI-NEXT: s_mov_b32 s7, s3
	; SI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; SI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; SI-NEXT: v_mov_b32_e32 v1, 0			; SI-NEXT: v_mov_b32_e32 v1, 0
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
	; SI-NEXT: buffer_load_dword v1, v[0:1], s[4:7], 0 addr64			; SI-NEXT: buffer_load_dword v1, v[0:1], s[4:7], 0 addr64
	; SI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x9			; SI-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x9
	; SI-NEXT: s_mov_b32 s2, -1			; SI-NEXT: s_mov_b32 s2, -1
	; SI-NEXT: s_movk_i32 s12, 0xff			; SI-NEXT: s_movk_i32 s8, 0xff
	; SI-NEXT: s_mov_b32 s10, s2			; SI-NEXT: s_mov_b32 s6, s2
	; SI-NEXT: s_mov_b32 s11, s3
	; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xb			; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xb
	; SI-NEXT: s_waitcnt vmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0)
	; SI-NEXT: v_lshrrev_b32_e32 v4, 16, v1			; SI-NEXT: v_lshrrev_b32_e32 v4, 16, v1
	; SI-NEXT: v_add_i32_e32 v7, vcc, 9, v1			; SI-NEXT: v_add_i32_e32 v7, vcc, 9, v1
	; SI-NEXT: v_and_b32_e32 v6, 0xff00, v1			; SI-NEXT: v_and_b32_e32 v6, 0xff00, v1
	; SI-NEXT: v_lshrrev_b32_e32 v5, 24, v1			; SI-NEXT: v_lshrrev_b32_e32 v5, 24, v1
	; SI-NEXT: v_cvt_f32_ubyte3_e32 v3, v1			; SI-NEXT: v_cvt_f32_ubyte3_e32 v3, v1
	; SI-NEXT: v_cvt_f32_ubyte2_e32 v2, v1			; SI-NEXT: v_cvt_f32_ubyte2_e32 v2, v1
	; SI-NEXT: v_cvt_f32_ubyte0_e32 v0, v1			; SI-NEXT: v_cvt_f32_ubyte0_e32 v0, v1
	; SI-NEXT: v_cvt_f32_ubyte1_e32 v1, v6			; SI-NEXT: v_cvt_f32_ubyte1_e32 v1, v6
	; SI-NEXT: v_and_b32_e32 v7, s12, v7			; SI-NEXT: v_and_b32_e32 v7, s8, v7
	; SI-NEXT: v_add_i32_e32 v4, vcc, 9, v4			; SI-NEXT: v_add_i32_e32 v4, vcc, 9, v4
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
	; SI-NEXT: buffer_store_dwordx4 v[0:3], off, s[8:11], 0			; SI-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0
	; SI-NEXT: s_waitcnt expcnt(0)			; SI-NEXT: s_waitcnt expcnt(0)
	; SI-NEXT: v_or_b32_e32 v0, v6, v7			; SI-NEXT: v_or_b32_e32 v0, v6, v7
	; SI-NEXT: v_lshlrev_b32_e32 v5, 8, v5			; SI-NEXT: v_lshlrev_b32_e32 v5, 8, v5
	; SI-NEXT: v_and_b32_e32 v1, s12, v4			; SI-NEXT: v_and_b32_e32 v1, s8, v4
	; SI-NEXT: v_add_i32_e32 v0, vcc, 0x900, v0			; SI-NEXT: v_add_i32_e32 v0, vcc, 0x900, v0
	; SI-NEXT: v_or_b32_e32 v1, v5, v1			; SI-NEXT: v_or_b32_e32 v1, v5, v1
	; SI-NEXT: v_and_b32_e32 v0, 0xffff, v0			; SI-NEXT: v_and_b32_e32 v0, 0xffff, v0
	; SI-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; SI-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; SI-NEXT: v_or_b32_e32 v0, v1, v0			; SI-NEXT: v_or_b32_e32 v0, v1, v0
	; SI-NEXT: v_add_i32_e32 v0, vcc, 0x9000000, v0			; SI-NEXT: v_add_i32_e32 v0, vcc, 0x9000000, v0
	; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v1, s1			; VI-NEXT: v_mov_b32_e32 v1, s1
	; VI-NEXT: v_add_u32_e32 v0, vcc, s0, v0			; VI-NEXT: v_add_u32_e32 v0, vcc, s0, v0
	; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; VI-NEXT: v_add_u32_e32 v2, vcc, 1, v0			; VI-NEXT: v_add_u32_e32 v2, vcc, 1, v0
	; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v1, vcc
	; VI-NEXT: v_add_u32_e32 v4, vcc, 3, v0			; VI-NEXT: v_add_u32_e32 v4, vcc, 3, v0
	; VI-NEXT: v_addc_u32_e32 v5, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v5, vcc, 0, v1, vcc
	; VI-NEXT: flat_load_ubyte v9, v[2:3]			; VI-NEXT: flat_load_ubyte v8, v[2:3]
	; VI-NEXT: flat_load_ubyte v10, v[4:5]			; VI-NEXT: flat_load_ubyte v9, v[4:5]
	; VI-NEXT: v_add_u32_e32 v2, vcc, 2, v0			; VI-NEXT: v_add_u32_e32 v2, vcc, 2, v0
	; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v1, vcc
	; VI-NEXT: v_add_u32_e32 v4, vcc, 5, v0			; VI-NEXT: v_add_u32_e32 v4, vcc, 5, v0
	; VI-NEXT: v_addc_u32_e32 v5, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v5, vcc, 0, v1, vcc
	; VI-NEXT: v_add_u32_e32 v6, vcc, 4, v0			; VI-NEXT: v_add_u32_e32 v6, vcc, 4, v0
	; VI-NEXT: v_addc_u32_e32 v7, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v7, vcc, 0, v1, vcc
	; VI-NEXT: flat_load_ubyte v8, v[0:1]			; VI-NEXT: flat_load_ubyte v10, v[0:1]
	; VI-NEXT: v_add_u32_e32 v0, vcc, 6, v0			; VI-NEXT: v_add_u32_e32 v0, vcc, 6, v0
	; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; VI-NEXT: flat_load_ubyte v2, v[2:3]			; VI-NEXT: flat_load_ubyte v2, v[2:3]
	; VI-NEXT: flat_load_ubyte v3, v[4:5]			; VI-NEXT: flat_load_ubyte v3, v[4:5]
	; VI-NEXT: flat_load_ubyte v4, v[6:7]			; VI-NEXT: flat_load_ubyte v4, v[6:7]
	; VI-NEXT: flat_load_ubyte v0, v[0:1]			; VI-NEXT: flat_load_ubyte v0, v[0:1]
	; VI-NEXT: s_waitcnt vmcnt(6) lgkmcnt(6)			; VI-NEXT: s_waitcnt vmcnt(6) lgkmcnt(6)
	; VI-NEXT: v_lshlrev_b32_e32 v1, 8, v9			; VI-NEXT: v_lshlrev_b32_e32 v1, 8, v8
	; VI-NEXT: s_waitcnt vmcnt(5) lgkmcnt(5)			; VI-NEXT: s_waitcnt vmcnt(5) lgkmcnt(5)
	; VI-NEXT: v_lshlrev_b32_e32 v5, 8, v10			; VI-NEXT: v_lshlrev_b32_e32 v5, 8, v9
	; VI-NEXT: s_waitcnt vmcnt(2) lgkmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2) lgkmcnt(2)
	; VI-NEXT: v_lshlrev_b32_e32 v3, 8, v3			; VI-NEXT: v_lshlrev_b32_e32 v3, 8, v3
	; VI-NEXT: s_waitcnt vmcnt(1) lgkmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1) lgkmcnt(1)
	; VI-NEXT: v_or_b32_e32 v4, v3, v4			; VI-NEXT: v_or_b32_e32 v4, v3, v4
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: v_cvt_f32_ubyte0_e32 v6, v0			; VI-NEXT: v_cvt_f32_ubyte0_e32 v6, v0
	; VI-NEXT: v_or_b32_e32 v0, v1, v8			; VI-NEXT: v_or_b32_e32 v0, v1, v10
	; VI-NEXT: v_or_b32_sdwa v1, v5, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v1, v5, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; VI-NEXT: v_or_b32_e32 v0, v1, v0			; VI-NEXT: v_or_b32_e32 v0, v1, v0
	; VI-NEXT: v_and_b32_e32 v5, 0xffff0000, v0			; VI-NEXT: v_and_b32_e32 v5, 0xffff0000, v0
	; VI-NEXT: v_or_b32_e32 v4, v4, v5			; VI-NEXT: v_or_b32_e32 v4, v4, v5
	; VI-NEXT: v_cvt_f32_ubyte1_e32 v5, v4			; VI-NEXT: v_cvt_f32_ubyte1_e32 v5, v4
	; VI-NEXT: v_cvt_f32_ubyte3_e32 v3, v0			; VI-NEXT: v_cvt_f32_ubyte3_e32 v3, v0
	; VI-NEXT: v_cvt_f32_ubyte2_e32 v2, v0			; VI-NEXT: v_cvt_f32_ubyte2_e32 v2, v0
	; VI-NEXT: v_cvt_f32_ubyte1_e32 v1, v0			; VI-NEXT: v_cvt_f32_ubyte1_e32 v1, v0
	▲ Show 20 Lines • Show All 506 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fcmp.f16.ll

	Show First 20 Lines • Show All 603 Lines • ▼ Show 20 Lines
	; GCN-DAG: v_lshrrev_b32_e32 v[[A_F16_1:[0-9]+]], 16, v[[A_V2_F16]]			; GCN-DAG: v_lshrrev_b32_e32 v[[A_F16_1:[0-9]+]], 16, v[[A_V2_F16]]
	; SI-DAG: v_cvt_f32_f16_e32 v[[B_F32_0:[0-9]+]], v[[B_V2_F16]]			; SI-DAG: v_cvt_f32_f16_e32 v[[B_F32_0:[0-9]+]], v[[B_V2_F16]]
	; SI-DAG: v_cmp_nlt_f32_e32 vcc, v[[A_F32_0]], v[[B_F32_0]]			; SI-DAG: v_cmp_nlt_f32_e32 vcc, v[[A_F32_0]], v[[B_F32_0]]

	; GCN-DAG: v_lshrrev_b32_e32 v[[B_F16_1:[0-9]+]], 16, v[[B_V2_F16]]			; GCN-DAG: v_lshrrev_b32_e32 v[[B_F16_1:[0-9]+]], 16, v[[B_V2_F16]]
	; SI-DAG: v_cvt_f32_f16_e32 v[[A_F32_1:[0-9]+]], v[[A_F16_1]]			; SI-DAG: v_cvt_f32_f16_e32 v[[A_F32_1:[0-9]+]], v[[A_F16_1]]
	; SI-DAG: v_cvt_f32_f16_e32 v[[B_F32_1:[0-9]+]], v[[B_F16_1]]			; SI-DAG: v_cvt_f32_f16_e32 v[[B_F32_1:[0-9]+]], v[[B_F16_1]]
	; SI-DAG: v_cmp_nlt_f32_e32 vcc, v[[A_F32_1]], v[[B_F32_1]]			; SI-DAG: v_cmp_nlt_f32_e32 vcc, v[[A_F32_1]], v[[B_F32_1]]
	; VI-DAG: v_cmp_nlt_f16_e32 vcc, v[[A_V2_F16]], v[[B_V2_F16]]			; VI-DAG: v_cmp_nlt_f16_e32 vcc, v[[B_V2_F16]], v[[A_V2_F16]]
	; GCN: v_cndmask_b32_e64 v[[R_I32_0:[0-9]+]]			; GCN: v_cndmask_b32_e64 v[[R_I32_0:[0-9]+]]

	; VI: v_cmp_nlt_f16_e32 vcc, v[[A_F16_1]], v[[B_F16_1]]			; VI: v_cmp_nlt_f16_e32 vcc, v[[B_F16_1]], v[[A_F16_1]]
	; GCN: v_cndmask_b32_e64 v[[R_I32_1:[0-9]+]]			; GCN: v_cndmask_b32_e64 v[[R_I32_1:[0-9]+]]
	; GCN: buffer_store_dwordx2 v{{\[}}[[R_I32_0]]:[[R_I32_1]]{{\]}}			; GCN: buffer_store_dwordx2 v{{\[}}[[R_I32_0]]:[[R_I32_1]]{{\]}}
	; GCN: s_endpgm			; GCN: s_endpgm
	define amdgpu_kernel void @fcmp_v2f16_nlt(			define amdgpu_kernel void @fcmp_v2f16_nlt(
	<2 x i32> addrspace(1)* %r,			<2 x i32> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a,			<2 x half> addrspace(1)* %a,
	<2 x half> addrspace(1)* %b) {			<2 x half> addrspace(1)* %b) {
	entry:			entry:
	Show All 12 Lines

llvm/test/CodeGen/AMDGPU/fneg-combines.ll

Show First 20 Lines • Show All 1,320 Lines • ▼ Show 20 Lines	define amdgpu_kernel void @v_fneg_fma_store_use_fneg_x_y_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr) #0 {
ret void		ret void
}		}

; GCN-LABEL: {{^}}v_fneg_fma_multi_use_fneg_x_y_f32:		; GCN-LABEL: {{^}}v_fneg_fma_multi_use_fneg_x_y_f32:
; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]		; GCN: {{buffer\|flat}}_load_dword [[C:v[0-9]+]]

; GCN: v_mul_f32_e64 [[MUL:v[0-9]+]], -[[A]], s{{[0-9]+}}		; GCN-DAG: v_mul_f32_e64 [[MUL:v[0-9]+]], -[[A]], s{{[0-9]+}}
; GCN-SAFE: v_fma_f32 [[FMA:v[0-9]+]]		; GCN-SAFE-DAG: v_fma_f32 [[FMA:v[0-9]+]]
; GCN-SAFE: v_xor_b32_e32 v{{[0-9]+}}, 0x80000000, [[FMA]]		; GCN-SAFE-DAG: v_xor_b32_e32 v{{[0-9]+}}, 0x80000000, [[FMA]]

; GCN-NSZ-DAG: v_fma_f32 [[NEG_FMA:v[0-9]+]], [[A]], [[B]], -[[C]]		; GCN-NSZ-DAG: v_fma_f32 [[NEG_FMA:v[0-9]+]], [[A]], [[B]], -[[C]]
; GCN-NSZ-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_FMA]]		; GCN-NSZ-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[NEG_FMA]]
; GCN-NSZ-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]		; GCN-NSZ-NEXT: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, [[MUL]]
define amdgpu_kernel void @v_fneg_fma_multi_use_fneg_x_y_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr, float %d) #0 {		define amdgpu_kernel void @v_fneg_fma_multi_use_fneg_x_y_f32(float addrspace(1)* %out, float addrspace(1)* %a.ptr, float addrspace(1)* %b.ptr, float addrspace(1)* %c.ptr, float %d) #0 {
%tid = call i32 @llvm.amdgcn.workitem.id.x()		%tid = call i32 @llvm.amdgcn.workitem.id.x()
%tid.ext = sext i32 %tid to i64		%tid.ext = sext i32 %tid to i64
%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext		%a.gep = getelementptr inbounds float, float addrspace(1)* %a.ptr, i64 %tid.ext
▲ Show 20 Lines • Show All 1,187 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/global-saddr.ll

	; RUN: llc -march=amdgcn -mcpu=gfx900 -verify-machineinstrs -amdgpu-enable-global-sgpr-addr < %s \| FileCheck -check-prefix=GFX9 %s			; RUN: llc -march=amdgcn -mcpu=gfx900 -verify-machineinstrs -amdgpu-enable-global-sgpr-addr < %s \| FileCheck -check-prefix=GFX9 %s

	; Test for a conv2d like sequence of loads.			; Test for a conv2d like sequence of loads.

	; GFX9: global_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:16{{$}}
	; GFX9: global_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}}{{$}}			; GFX9: global_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}}{{$}}
	; GFX9: global_load_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:32{{$}}			; GFX9: global_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:16{{$}}
	; GFX9: global_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:-16{{$}}			; GFX9: global_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:-16{{$}}
	; GFX9: global_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:-32{{$}}			; GFX9: global_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:-32{{$}}
				; GFX9: global_load_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:32{{$}}
	; GFX9: global_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:8{{$}}			; GFX9: global_store_dwordx2 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:8{{$}}

	define hidden amdgpu_kernel void @simpleSaddrs(i64 addrspace(1)* %dst_image, i64 addrspace(1)* %src_image ) {			define hidden amdgpu_kernel void @simpleSaddrs(i64 addrspace(1)* %dst_image, i64 addrspace(1)* %src_image ) {
	entry:			entry:
	%id = call i32 @llvm.amdgcn.workitem.id.x()			%id = call i32 @llvm.amdgcn.workitem.id.x()
	%idx = zext i32 %id to i64			%idx = zext i32 %id to i64
	%gep = getelementptr i64, i64 addrspace(1)* %src_image, i64 %idx			%gep = getelementptr i64, i64 addrspace(1)* %src_image, i64 %idx
	%ptr0 = getelementptr inbounds i64, i64 addrspace(1)* %gep, i64 1			%ptr0 = getelementptr inbounds i64, i64 addrspace(1)* %gep, i64 1
	▲ Show 20 Lines • Show All 85 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/global_smrd.ll

Show First 20 Lines • Show All 76 Lines • ▼ Show 20 Lines	define amdgpu_kernel void @memdep(i32 addrspace(1)* %in, [8 x i32], i32 addrspace(1)* %out0, [8 x i32], i32 addrspace(1)* %out1) {
store i32 %val, i32 addrspace(1)* %out1		store i32 %val, i32 addrspace(1)* %out1
ret void		ret void
}		}

; uniform load from global array		; uniform load from global array
; CHECK-LABEL: @global_array		; CHECK-LABEL: @global_array
; CHECK: s_getpc_b64 [[GET_PC:s\[[0-9]+:[0-9]+\]]]		; CHECK: s_getpc_b64 [[GET_PC:s\[[0-9]+:[0-9]+\]]]
; CHECK: s_load_dwordx2 [[A_ADDR:s\[[0-9]+:[0-9]+\]]], [[GET_PC]], 0x0		; CHECK: s_load_dwordx2 [[A_ADDR:s\[[0-9]+:[0-9]+\]]], [[GET_PC]], 0x0
; CHECK: s_load_dwordx2 [[A_ADDR1:s\[[0-9]+:[0-9]+\]]], [[A_ADDR]], 0x0		; CHECK-DAG: s_load_dwordx2 [[A_ADDR1:s\[[0-9]+:[0-9]+\]]], [[A_ADDR]], 0x0
; CHECK: s_load_dwordx2 [[OUT:s\[[0-9]+:[0-9]+\]]], s[4:5], 0x0		; CHECK-DAG: s_load_dwordx2 [[OUT:s\[[0-9]+:[0-9]+\]]], s[4:5], 0x0
; CHECK: s_load_dword [[SVAL:s[0-9]+]], [[A_ADDR1]], 0x0		; CHECK: s_load_dword [[SVAL:s[0-9]+]], [[A_ADDR1]], 0x0
; CHECK: v_mov_b32_e32 [[VVAL:v[0-9]+]], [[SVAL]]		; CHECK: v_mov_b32_e32 [[VVAL:v[0-9]+]], [[SVAL]]
; CHECK: flat_store_dword v[{{[0-9]+:[0-9]+}}], [[VVAL]]		; CHECK: flat_store_dword v[{{[0-9]+:[0-9]+}}], [[VVAL]]
@A = common local_unnamed_addr addrspace(1) global i32 addrspace(1)* null, align 4		@A = common local_unnamed_addr addrspace(1) global i32 addrspace(1)* null, align 4

define amdgpu_kernel void @global_array(i32 addrspace(1)* nocapture %out) {		define amdgpu_kernel void @global_array(i32 addrspace(1)* nocapture %out) {
entry:		entry:
%load0 = load i32 addrspace(1), i32 addrspace(1) addrspace(1)* @A, align 4		%load0 = load i32 addrspace(1), i32 addrspace(1) addrspace(1)* @A, align 4
Show All 33 Lines

llvm/test/CodeGen/AMDGPU/idiv-licm.ll

Show All 18 Lines
; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v2		; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v2
; GFX9-NEXT: v_cndmask_b32_e32 v1, v1, v3, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v1, v1, v3, vcc
; GFX9-NEXT: v_mul_hi_u32 v1, v1, v0		; GFX9-NEXT: v_mul_hi_u32 v1, v1, v0
; GFX9-NEXT: v_add_u32_e32 v2, v0, v1		; GFX9-NEXT: v_add_u32_e32 v2, v0, v1
; GFX9-NEXT: v_sub_u32_e32 v0, v0, v1		; GFX9-NEXT: v_sub_u32_e32 v0, v0, v1
; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
; GFX9-NEXT: BB0_1: ; %bb3		; GFX9-NEXT: BB0_1: ; %bb3
; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1		; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
; GFX9-NEXT: v_mul_lo_u32 v1, v0, s7		; GFX9-NEXT: v_mul_lo_u32 v3, v0, s7
; GFX9-NEXT: v_mul_hi_u32 v2, v0, s6		; GFX9-NEXT: v_mul_hi_u32 v4, v0, s6
; GFX9-NEXT: v_add_u32_e32 v3, v2, v1		; GFX9-NEXT: v_mov_b32_e32 v1, s4
; GFX9-NEXT: v_mul_lo_u32 v1, s3, v3		; GFX9-NEXT: v_mov_b32_e32 v2, s5
; GFX9-NEXT: v_mul_lo_u32 v4, v3, s2		; GFX9-NEXT: v_add_u32_e32 v3, v4, v3
		; GFX9-NEXT: v_mul_lo_u32 v4, s3, v3
		; GFX9-NEXT: v_mul_lo_u32 v5, v3, s2
; GFX9-NEXT: v_add_u32_e32 v7, 1, v3		; GFX9-NEXT: v_add_u32_e32 v7, 1, v3
; GFX9-NEXT: v_add_u32_e32 v6, -1, v3		; GFX9-NEXT: v_add_u32_e32 v6, -1, v3
; GFX9-NEXT: v_add_u32_e32 v5, s6, v1		; GFX9-NEXT: v_add_u32_e32 v4, s6, v4
; GFX9-NEXT: v_cmp_ge_u32_e32 vcc, s6, v4		; GFX9-NEXT: v_cmp_ge_u32_e32 vcc, s6, v5
; GFX9-NEXT: v_cmp_le_u32_e64 s[0:1], s2, v5		; GFX9-NEXT: v_cmp_le_u32_e64 s[0:1], s2, v4
; GFX9-NEXT: s_and_b64 s[0:1], s[0:1], vcc		; GFX9-NEXT: s_and_b64 s[0:1], s[0:1], vcc
; GFX9-NEXT: s_add_u32 s6, s6, 1		; GFX9-NEXT: s_add_u32 s6, s6, 1
; GFX9-NEXT: v_mov_b32_e32 v1, s4
; GFX9-NEXT: s_addc_u32 s7, s7, 0		; GFX9-NEXT: s_addc_u32 s7, s7, 0
; GFX9-NEXT: v_mov_b32_e32 v2, s5
; GFX9-NEXT: s_add_u32 s4, s4, 4		; GFX9-NEXT: s_add_u32 s4, s4, 4
; GFX9-NEXT: v_cndmask_b32_e64 v3, v3, v7, s[0:1]		; GFX9-NEXT: v_cndmask_b32_e64 v3, v3, v7, s[0:1]
; GFX9-NEXT: s_addc_u32 s5, s5, 0		; GFX9-NEXT: s_addc_u32 s5, s5, 0
; GFX9-NEXT: v_cndmask_b32_e32 v3, v6, v3, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v3, v6, v3, vcc
; GFX9-NEXT: s_cmpk_eq_i32 s6, 0x400		; GFX9-NEXT: s_cmpk_eq_i32 s6, 0x400
; GFX9-NEXT: global_store_dword v[1:2], v3, off		; GFX9-NEXT: global_store_dword v[1:2], v3, off
; GFX9-NEXT: s_cbranch_scc0 BB0_1		; GFX9-NEXT: s_cbranch_scc0 BB0_1
; GFX9-NEXT: ; %bb.2: ; %bb2		; GFX9-NEXT: ; %bb.2: ; %bb2
Show All 33 Lines
; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v2		; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v2
; GFX9-NEXT: v_cndmask_b32_e32 v1, v1, v3, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v1, v1, v3, vcc
; GFX9-NEXT: v_mul_hi_u32 v1, v1, v0		; GFX9-NEXT: v_mul_hi_u32 v1, v1, v0
; GFX9-NEXT: v_add_u32_e32 v2, v0, v1		; GFX9-NEXT: v_add_u32_e32 v2, v0, v1
; GFX9-NEXT: v_sub_u32_e32 v0, v0, v1		; GFX9-NEXT: v_sub_u32_e32 v0, v0, v1
; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
; GFX9-NEXT: BB1_1: ; %bb3		; GFX9-NEXT: BB1_1: ; %bb3
; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1		; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
; GFX9-NEXT: v_mul_lo_u32 v1, v0, s7		; GFX9-NEXT: v_mul_lo_u32 v3, v0, s7
; GFX9-NEXT: v_mul_hi_u32 v2, v0, s6		; GFX9-NEXT: v_mul_hi_u32 v4, v0, s6
; GFX9-NEXT: v_add_u32_e32 v3, v2, v1		; GFX9-NEXT: v_mov_b32_e32 v1, s4
		; GFX9-NEXT: v_mov_b32_e32 v2, s5
		; GFX9-NEXT: v_add_u32_e32 v3, v4, v3
; GFX9-NEXT: v_mul_lo_u32 v4, s3, v3		; GFX9-NEXT: v_mul_lo_u32 v4, s3, v3
; GFX9-NEXT: v_mul_lo_u32 v6, v3, s2		; GFX9-NEXT: v_mul_lo_u32 v6, v3, s2
; GFX9-NEXT: v_sub_u32_e32 v5, 1, v3		; GFX9-NEXT: v_sub_u32_e32 v5, 1, v3
; GFX9-NEXT: v_not_b32_e32 v3, v3		; GFX9-NEXT: v_not_b32_e32 v3, v3
; GFX9-NEXT: v_mul_lo_u32 v5, s2, v5		; GFX9-NEXT: v_mul_lo_u32 v5, s2, v5
; GFX9-NEXT: v_mul_lo_u32 v3, s2, v3		; GFX9-NEXT: v_mul_lo_u32 v3, s2, v3
; GFX9-NEXT: v_add_u32_e32 v4, s6, v4		; GFX9-NEXT: v_add_u32_e32 v4, s6, v4
; GFX9-NEXT: v_cmp_le_u32_e32 vcc, s2, v4		; GFX9-NEXT: v_cmp_le_u32_e32 vcc, s2, v4
; GFX9-NEXT: v_cmp_ge_u32_e64 s[0:1], s6, v6		; GFX9-NEXT: v_cmp_ge_u32_e64 s[0:1], s6, v6
; GFX9-NEXT: s_and_b64 vcc, vcc, s[0:1]		; GFX9-NEXT: s_and_b64 vcc, vcc, s[0:1]
; GFX9-NEXT: v_add_u32_e32 v3, s6, v3		; GFX9-NEXT: v_add_u32_e32 v3, s6, v3
; GFX9-NEXT: v_add_u32_e32 v5, s6, v5		; GFX9-NEXT: v_add_u32_e32 v5, s6, v5
; GFX9-NEXT: s_add_u32 s6, s6, 1		; GFX9-NEXT: s_add_u32 s6, s6, 1
; GFX9-NEXT: v_mov_b32_e32 v1, s4
; GFX9-NEXT: s_addc_u32 s7, s7, 0		; GFX9-NEXT: s_addc_u32 s7, s7, 0
; GFX9-NEXT: v_mov_b32_e32 v2, s5
; GFX9-NEXT: s_add_u32 s4, s4, 4		; GFX9-NEXT: s_add_u32 s4, s4, 4
; GFX9-NEXT: v_cndmask_b32_e32 v3, v4, v3, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v3, v4, v3, vcc
; GFX9-NEXT: s_addc_u32 s5, s5, 0		; GFX9-NEXT: s_addc_u32 s5, s5, 0
; GFX9-NEXT: v_cndmask_b32_e64 v3, v5, v3, s[0:1]		; GFX9-NEXT: v_cndmask_b32_e64 v3, v5, v3, s[0:1]
; GFX9-NEXT: s_cmpk_eq_i32 s6, 0x400		; GFX9-NEXT: s_cmpk_eq_i32 s6, 0x400
; GFX9-NEXT: global_store_dword v[1:2], v3, off		; GFX9-NEXT: global_store_dword v[1:2], v3, off
; GFX9-NEXT: s_cbranch_scc0 BB1_1		; GFX9-NEXT: s_cbranch_scc0 BB1_1
; GFX9-NEXT: ; %bb.2: ; %bb2		; GFX9-NEXT: ; %bb.2: ; %bb2
Show All 39 Lines
; GFX9-NEXT: v_sub_u32_e32 v0, v0, v1		; GFX9-NEXT: v_sub_u32_e32 v0, v0, v1
; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
; GFX9-NEXT: BB2_1: ; %bb3		; GFX9-NEXT: BB2_1: ; %bb3
; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1		; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
; GFX9-NEXT: v_mul_hi_u32 v3, v0, s6		; GFX9-NEXT: v_mul_hi_u32 v3, v0, s6
; GFX9-NEXT: v_mov_b32_e32 v1, s4		; GFX9-NEXT: v_mov_b32_e32 v1, s4
; GFX9-NEXT: v_mov_b32_e32 v2, s5		; GFX9-NEXT: v_mov_b32_e32 v2, s5
; GFX9-NEXT: v_mul_lo_u32 v4, v3, s3		; GFX9-NEXT: v_mul_lo_u32 v4, v3, s3
; GFX9-NEXT: v_add_u32_e32 v6, 1, v3		; GFX9-NEXT: v_add_u32_e32 v5, 1, v3
; GFX9-NEXT: v_add_u32_e32 v7, -1, v3		; GFX9-NEXT: v_add_u32_e32 v6, -1, v3
; GFX9-NEXT: v_sub_u32_e32 v5, s6, v4		; GFX9-NEXT: v_sub_u32_e32 v7, s6, v4
; GFX9-NEXT: v_cmp_ge_u32_e32 vcc, s6, v4		; GFX9-NEXT: v_cmp_ge_u32_e32 vcc, s6, v4
; GFX9-NEXT: v_cmp_le_u32_e64 s[0:1], s3, v5		; GFX9-NEXT: v_cmp_le_u32_e64 s[0:1], s3, v7
; GFX9-NEXT: s_and_b64 s[0:1], s[0:1], vcc		; GFX9-NEXT: s_and_b64 s[0:1], s[0:1], vcc
; GFX9-NEXT: v_cndmask_b32_e64 v3, v3, v6, s[0:1]		; GFX9-NEXT: v_cndmask_b32_e64 v3, v3, v5, s[0:1]
; GFX9-NEXT: s_add_i32 s6, s6, 1		; GFX9-NEXT: s_add_i32 s6, s6, 1
; GFX9-NEXT: v_cndmask_b32_e32 v3, v7, v3, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v3, v6, v3, vcc
; GFX9-NEXT: s_add_u32 s4, s4, 4		; GFX9-NEXT: s_add_u32 s4, s4, 4
; GFX9-NEXT: v_xor_b32_e32 v3, s2, v3		; GFX9-NEXT: v_xor_b32_e32 v3, s2, v3
; GFX9-NEXT: s_addc_u32 s5, s5, 0		; GFX9-NEXT: s_addc_u32 s5, s5, 0
; GFX9-NEXT: v_subrev_u32_e32 v3, s2, v3		; GFX9-NEXT: v_subrev_u32_e32 v3, s2, v3
; GFX9-NEXT: s_cmpk_eq_i32 s6, 0x400		; GFX9-NEXT: s_cmpk_eq_i32 s6, 0x400
; GFX9-NEXT: global_store_dword v[1:2], v3, off		; GFX9-NEXT: global_store_dword v[1:2], v3, off
; GFX9-NEXT: s_cbranch_scc0 BB2_1		; GFX9-NEXT: s_cbranch_scc0 BB2_1
; GFX9-NEXT: ; %bb.2: ; %bb2		; GFX9-NEXT: ; %bb.2: ; %bb2
Show All 35 Lines
; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v2		; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v2
; GFX9-NEXT: v_cndmask_b32_e32 v1, v1, v3, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v1, v1, v3, vcc
; GFX9-NEXT: v_mul_hi_u32 v1, v1, v0		; GFX9-NEXT: v_mul_hi_u32 v1, v1, v0
; GFX9-NEXT: v_add_u32_e32 v2, v0, v1		; GFX9-NEXT: v_add_u32_e32 v2, v0, v1
; GFX9-NEXT: v_sub_u32_e32 v0, v0, v1		; GFX9-NEXT: v_sub_u32_e32 v0, v0, v1
; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc		; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
; GFX9-NEXT: BB3_1: ; %bb3		; GFX9-NEXT: BB3_1: ; %bb3
; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1		; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
; GFX9-NEXT: v_mul_hi_u32 v1, v0, s3		; GFX9-NEXT: v_mul_hi_u32 v3, v0, s3
; GFX9-NEXT: v_mul_lo_u32 v3, v1, s2
; GFX9-NEXT: v_mov_b32_e32 v1, s4		; GFX9-NEXT: v_mov_b32_e32 v1, s4
; GFX9-NEXT: v_mov_b32_e32 v2, s5		; GFX9-NEXT: v_mov_b32_e32 v2, s5
		; GFX9-NEXT: v_mul_lo_u32 v3, v3, s2
; GFX9-NEXT: v_sub_u32_e32 v4, s3, v3		; GFX9-NEXT: v_sub_u32_e32 v4, s3, v3
; GFX9-NEXT: v_cmp_ge_u32_e64 s[0:1], s3, v3		; GFX9-NEXT: v_cmp_ge_u32_e64 s[0:1], s3, v3
; GFX9-NEXT: v_cmp_le_u32_e32 vcc, s2, v4		; GFX9-NEXT: v_cmp_le_u32_e32 vcc, s2, v4
; GFX9-NEXT: s_add_i32 s3, s3, 1		; GFX9-NEXT: s_add_i32 s3, s3, 1
; GFX9-NEXT: s_and_b64 vcc, vcc, s[0:1]		; GFX9-NEXT: s_and_b64 vcc, vcc, s[0:1]
; GFX9-NEXT: v_subrev_u32_e32 v3, s2, v4		; GFX9-NEXT: v_subrev_u32_e32 v3, s2, v4
; GFX9-NEXT: s_add_u32 s4, s4, 4		; GFX9-NEXT: s_add_u32 s4, s4, 4
; GFX9-NEXT: s_addc_u32 s5, s5, 0		; GFX9-NEXT: s_addc_u32 s5, s5, 0
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	bb3: ; preds = %bb3, %bb
%tmp7 = add nuw nsw i16 %tmp, 1		%tmp7 = add nuw nsw i16 %tmp, 1
%tmp8 = icmp eq i16 %tmp7, 1024		%tmp8 = icmp eq i16 %tmp7, 1024
br i1 %tmp8, label %bb2, label %bb3		br i1 %tmp8, label %bb2, label %bb3
}		}

define amdgpu_kernel void @urem16_invariant_denom(i16 addrspace(1)* nocapture %arg, i16 %arg1) {		define amdgpu_kernel void @urem16_invariant_denom(i16 addrspace(1)* nocapture %arg, i16 %arg1) {
; GFX9-LABEL: urem16_invariant_denom:		; GFX9-LABEL: urem16_invariant_denom:
; GFX9: ; %bb.0: ; %bb		; GFX9: ; %bb.0: ; %bb
; GFX9-NEXT: s_load_dword s3, s[0:1], 0x2c		; GFX9-NEXT: s_load_dword s2, s[0:1], 0x2c
; GFX9-NEXT: s_mov_b32 s2, 0xffff		; GFX9-NEXT: s_mov_b32 s4, 0xffff
; GFX9-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GFX9-NEXT: s_load_dwordx2 s[6:7], s[0:1], 0x24
; GFX9-NEXT: v_mov_b32_e32 v3, 0		; GFX9-NEXT: v_mov_b32_e32 v3, 0
; GFX9-NEXT: s_movk_i32 s6, 0x400		; GFX9-NEXT: s_movk_i32 s8, 0x400
; GFX9-NEXT: s_waitcnt lgkmcnt(0)		; GFX9-NEXT: s_waitcnt lgkmcnt(0)
; GFX9-NEXT: s_and_b32 s3, s2, s3		; GFX9-NEXT: s_and_b32 s5, s4, s2
; GFX9-NEXT: v_cvt_f32_u32_e32 v0, s3		; GFX9-NEXT: v_cvt_f32_u32_e32 v0, s5
; GFX9-NEXT: v_mov_b32_e32 v4, 0		; GFX9-NEXT: v_mov_b32_e32 v4, 0
; GFX9-NEXT: v_rcp_iflag_f32_e32 v1, v0		; GFX9-NEXT: v_rcp_iflag_f32_e32 v1, v0
; GFX9-NEXT: BB5_1: ; %bb3		; GFX9-NEXT: BB5_1: ; %bb3
; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1		; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
; GFX9-NEXT: v_and_b32_e32 v2, s2, v4		; GFX9-NEXT: v_and_b32_e32 v2, s4, v4
; GFX9-NEXT: v_cvt_f32_u32_e32 v7, v2		; GFX9-NEXT: v_cvt_f32_u32_e32 v7, v2
; GFX9-NEXT: v_lshlrev_b64 v[5:6], 1, v[2:3]		; GFX9-NEXT: v_lshlrev_b64 v[5:6], 1, v[2:3]
; GFX9-NEXT: v_mov_b32_e32 v8, s5
; GFX9-NEXT: v_add_co_u32_e64 v5, s[0:1], s4, v5
; GFX9-NEXT: v_addc_co_u32_e64 v6, s[0:1], v8, v6, s[0:1]
; GFX9-NEXT: v_mul_f32_e32 v8, v7, v1
; GFX9-NEXT: v_trunc_f32_e32 v8, v8
; GFX9-NEXT: v_cvt_u32_f32_e32 v9, v8
; GFX9-NEXT: v_mad_f32 v7, -v8, v0, v7
; GFX9-NEXT: v_cmp_ge_f32_e64 s[0:1], \|v7\|, v0
; GFX9-NEXT: v_add_u16_e32 v4, 1, v4		; GFX9-NEXT: v_add_u16_e32 v4, 1, v4
; GFX9-NEXT: v_addc_co_u32_e64 v7, s[0:1], 0, v9, s[0:1]		; GFX9-NEXT: v_cmp_eq_u16_e32 vcc, s8, v4
; GFX9-NEXT: v_mul_lo_u32 v7, v7, s3		; GFX9-NEXT: v_mul_f32_e32 v9, v7, v1
; GFX9-NEXT: v_cmp_eq_u16_e32 vcc, s6, v4		; GFX9-NEXT: v_trunc_f32_e32 v9, v9
		; GFX9-NEXT: v_cvt_u32_f32_e32 v10, v9
		; GFX9-NEXT: v_mad_f32 v7, -v9, v0, v7
		; GFX9-NEXT: v_cmp_ge_f32_e64 s[2:3], \|v7\|, v0
		; GFX9-NEXT: v_mov_b32_e32 v8, s7
		; GFX9-NEXT: v_addc_co_u32_e64 v7, s[2:3], 0, v10, s[2:3]
		; GFX9-NEXT: v_mul_lo_u32 v7, v7, s5
		; GFX9-NEXT: v_add_co_u32_e64 v5, s[0:1], s6, v5
; GFX9-NEXT: s_and_b64 vcc, exec, vcc		; GFX9-NEXT: s_and_b64 vcc, exec, vcc
		; GFX9-NEXT: v_addc_co_u32_e64 v6, s[0:1], v8, v6, s[0:1]
; GFX9-NEXT: v_sub_u32_e32 v2, v2, v7		; GFX9-NEXT: v_sub_u32_e32 v2, v2, v7
; GFX9-NEXT: global_store_short v[5:6], v2, off		; GFX9-NEXT: global_store_short v[5:6], v2, off
; GFX9-NEXT: s_cbranch_vccz BB5_1		; GFX9-NEXT: s_cbranch_vccz BB5_1
; GFX9-NEXT: ; %bb.2: ; %bb2		; GFX9-NEXT: ; %bb.2: ; %bb2
; GFX9-NEXT: s_endpgm		; GFX9-NEXT: s_endpgm
bb:		bb:
br label %bb3		br label %bb3

▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines	bb3: ; preds = %bb3, %bb
%tmp8 = icmp eq i16 %tmp7, 1024		%tmp8 = icmp eq i16 %tmp7, 1024
br i1 %tmp8, label %bb2, label %bb3		br i1 %tmp8, label %bb2, label %bb3
}		}

define amdgpu_kernel void @srem16_invariant_denom(i16 addrspace(1)* nocapture %arg, i16 %arg1) {		define amdgpu_kernel void @srem16_invariant_denom(i16 addrspace(1)* nocapture %arg, i16 %arg1) {
; GFX9-LABEL: srem16_invariant_denom:		; GFX9-LABEL: srem16_invariant_denom:
; GFX9: ; %bb.0: ; %bb		; GFX9: ; %bb.0: ; %bb
; GFX9-NEXT: s_load_dword s2, s[0:1], 0x2c		; GFX9-NEXT: s_load_dword s2, s[0:1], 0x2c
; GFX9-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GFX9-NEXT: s_load_dwordx2 s[6:7], s[0:1], 0x24
; GFX9-NEXT: v_mov_b32_e32 v3, 0		; GFX9-NEXT: v_mov_b32_e32 v3, 0
; GFX9-NEXT: s_movk_i32 s3, 0x400		; GFX9-NEXT: s_movk_i32 s5, 0x400
; GFX9-NEXT: v_mov_b32_e32 v4, 0		; GFX9-NEXT: v_mov_b32_e32 v4, 0
; GFX9-NEXT: s_waitcnt lgkmcnt(0)		; GFX9-NEXT: s_waitcnt lgkmcnt(0)
; GFX9-NEXT: s_sext_i32_i16 s2, s2		; GFX9-NEXT: s_sext_i32_i16 s4, s2
; GFX9-NEXT: v_cvt_f32_i32_e32 v0, s2		; GFX9-NEXT: v_cvt_f32_i32_e32 v0, s4
; GFX9-NEXT: v_rcp_iflag_f32_e32 v1, v0		; GFX9-NEXT: v_rcp_iflag_f32_e32 v1, v0
; GFX9-NEXT: BB7_1: ; %bb3		; GFX9-NEXT: BB7_1: ; %bb3
; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1		; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
; GFX9-NEXT: v_bfe_i32 v7, v4, 0, 16		; GFX9-NEXT: v_bfe_i32 v7, v4, 0, 16
; GFX9-NEXT: v_and_b32_e32 v2, 0xffff, v4
; GFX9-NEXT: v_cvt_f32_i32_e32 v10, v7		; GFX9-NEXT: v_cvt_f32_i32_e32 v10, v7
		; GFX9-NEXT: v_and_b32_e32 v2, 0xffff, v4
		; GFX9-NEXT: v_xor_b32_e32 v9, s4, v7
; GFX9-NEXT: v_lshlrev_b64 v[5:6], 1, v[2:3]		; GFX9-NEXT: v_lshlrev_b64 v[5:6], 1, v[2:3]
; GFX9-NEXT: v_mov_b32_e32 v8, s5
; GFX9-NEXT: v_add_co_u32_e64 v5, s[0:1], s4, v5
; GFX9-NEXT: v_addc_co_u32_e64 v6, s[0:1], v8, v6, s[0:1]
; GFX9-NEXT: v_mul_f32_e32 v8, v10, v1
; GFX9-NEXT: v_xor_b32_e32 v9, s2, v7
; GFX9-NEXT: v_trunc_f32_e32 v8, v8
; GFX9-NEXT: v_ashrrev_i32_e32 v2, 30, v9		; GFX9-NEXT: v_ashrrev_i32_e32 v2, 30, v9
; GFX9-NEXT: v_cvt_i32_f32_e32 v9, v8		; GFX9-NEXT: v_mul_f32_e32 v9, v10, v1
; GFX9-NEXT: v_mad_f32 v8, -v8, v0, v10		; GFX9-NEXT: v_trunc_f32_e32 v9, v9
		; GFX9-NEXT: v_cvt_i32_f32_e32 v11, v9
		; GFX9-NEXT: v_mad_f32 v9, -v9, v0, v10
; GFX9-NEXT: v_or_b32_e32 v2, 1, v2		; GFX9-NEXT: v_or_b32_e32 v2, 1, v2
; GFX9-NEXT: v_cmp_ge_f32_e64 s[0:1], \|v8\|, \|v0\|		; GFX9-NEXT: v_cmp_ge_f32_e64 s[2:3], \|v9\|, \|v0\|
; GFX9-NEXT: v_cndmask_b32_e64 v2, 0, v2, s[0:1]		; GFX9-NEXT: v_cndmask_b32_e64 v2, 0, v2, s[2:3]
; GFX9-NEXT: v_add_u32_e32 v2, v9, v2		; GFX9-NEXT: v_add_u32_e32 v2, v11, v2
; GFX9-NEXT: v_mul_lo_u32 v2, v2, s2		; GFX9-NEXT: v_mul_lo_u32 v2, v2, s4
; GFX9-NEXT: v_add_u16_e32 v4, 1, v4		; GFX9-NEXT: v_add_u16_e32 v4, 1, v4
; GFX9-NEXT: v_cmp_eq_u16_e32 vcc, s3, v4		; GFX9-NEXT: v_cmp_eq_u16_e32 vcc, s5, v4
		; GFX9-NEXT: v_mov_b32_e32 v8, s7
		; GFX9-NEXT: v_add_co_u32_e64 v5, s[0:1], s6, v5
; GFX9-NEXT: s_and_b64 vcc, exec, vcc		; GFX9-NEXT: s_and_b64 vcc, exec, vcc
; GFX9-NEXT: v_sub_u32_e32 v2, v7, v2		; GFX9-NEXT: v_sub_u32_e32 v2, v7, v2
		; GFX9-NEXT: v_addc_co_u32_e64 v6, s[0:1], v8, v6, s[0:1]
; GFX9-NEXT: global_store_short v[5:6], v2, off		; GFX9-NEXT: global_store_short v[5:6], v2, off
; GFX9-NEXT: s_cbranch_vccz BB7_1		; GFX9-NEXT: s_cbranch_vccz BB7_1
; GFX9-NEXT: ; %bb.2: ; %bb2		; GFX9-NEXT: ; %bb.2: ; %bb2
; GFX9-NEXT: s_endpgm		; GFX9-NEXT: s_endpgm
bb:		bb:
br label %bb3		br label %bb3

bb2: ; preds = %bb3		bb2: ; preds = %bb3
Show All 12 Lines

llvm/test/CodeGen/AMDGPU/idot2.ll

	Show First 20 Lines • Show All 2,567 Lines • ▼ Show 20 Lines
	; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0			; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: udot2_acc16:			; GFX8-LABEL: udot2_acc16:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_load_dword s2, s[4:5], 0x0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_load_ushort v2, v[0:1]			; GFX8-NEXT: flat_load_ushort v2, v[0:1]
	; GFX8-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX8-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX8-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX8-NEXT: s_mov_b32 s0, 0xffff			; GFX8-NEXT: s_mov_b32 s0, 0xffff
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_and_b32 s3, s1, s0			; GFX8-NEXT: s_and_b32 s3, s2, s0
	; GFX8-NEXT: s_lshr_b32 s1, s1, 16
	; GFX8-NEXT: s_and_b32 s0, s2, s0
	; GFX8-NEXT: s_lshr_b32 s2, s2, 16			; GFX8-NEXT: s_lshr_b32 s2, s2, 16
	; GFX8-NEXT: v_mov_b32_e32 v3, s1			; GFX8-NEXT: s_and_b32 s0, s1, s0
				; GFX8-NEXT: s_lshr_b32 s1, s1, 16
				; GFX8-NEXT: v_mov_b32_e32 v3, s2
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_mad_u32_u24 v2, s2, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s1, v3, v2
	; GFX8-NEXT: v_mov_b32_e32 v3, s3			; GFX8-NEXT: v_mov_b32_e32 v3, s3
	; GFX8-NEXT: v_mad_u32_u24 v2, s0, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s0, v3, v2
	; GFX8-NEXT: flat_store_short v[0:1], v2			; GFX8-NEXT: flat_store_short v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-NODL-LABEL: udot2_acc16:			; GFX9-NODL-LABEL: udot2_acc16:
	; GFX9-NODL: ; %bb.0: ; %entry			; GFX9-NODL: ; %bb.0: ; %entry
	; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NODL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-NODL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NODL-NEXT: s_load_dword s2, s[4:5], 0x0
	; GFX9-NODL-NEXT: v_mov_b32_e32 v0, s0			; GFX9-NODL-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-NODL-NEXT: v_mov_b32_e32 v1, s1			; GFX9-NODL-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NODL-NEXT: global_load_ushort v2, v[0:1], off			; GFX9-NODL-NEXT: global_load_ushort v2, v[0:1], off
	; GFX9-NODL-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX9-NODL-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX9-NODL-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX9-NODL-NEXT: s_mov_b32 s0, 0xffff			; GFX9-NODL-NEXT: s_mov_b32 s0, 0xffff
	; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NODL-NEXT: s_and_b32 s3, s1, s0			; GFX9-NODL-NEXT: s_and_b32 s3, s2, s0
	; GFX9-NODL-NEXT: s_lshr_b32 s1, s1, 16
	; GFX9-NODL-NEXT: s_and_b32 s0, s2, s0
	; GFX9-NODL-NEXT: s_lshr_b32 s2, s2, 16			; GFX9-NODL-NEXT: s_lshr_b32 s2, s2, 16
	; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NODL-NEXT: s_and_b32 s0, s1, s0
				; GFX9-NODL-NEXT: s_lshr_b32 s1, s1, 16
				; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s2
	; GFX9-NODL-NEXT: s_waitcnt vmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s2, v3, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s1, v3, v2
	; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s3			; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s3
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s0, v3, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s0, v3, v2
	; GFX9-NODL-NEXT: global_store_short v[0:1], v2, off			; GFX9-NODL-NEXT: global_store_short v[0:1], v2, off
	; GFX9-NODL-NEXT: s_endpgm			; GFX9-NODL-NEXT: s_endpgm
	;			;
	; GFX9-DL-LABEL: udot2_acc16:			; GFX9-DL-LABEL: udot2_acc16:
	; GFX9-DL: ; %bb.0: ; %entry			; GFX9-DL: ; %bb.0: ; %entry
	; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	▲ Show 20 Lines • Show All 215 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/idot4s.ll

	Show First 20 Lines • Show All 350 Lines • ▼ Show 20 Lines

	define amdgpu_kernel void @idot4_acc8(<4 x i8> addrspace(1)* %src1,			define amdgpu_kernel void @idot4_acc8(<4 x i8> addrspace(1)* %src1,
	; GFX7-LABEL: idot4_acc8:			; GFX7-LABEL: idot4_acc8:
	; GFX7: ; %bb.0: ; %entry			; GFX7: ; %bb.0: ; %entry
	; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd			; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd
	; GFX7-NEXT: s_mov_b32 s3, 0xf000			; GFX7-NEXT: s_mov_b32 s3, 0xf000
	; GFX7-NEXT: s_mov_b32 s2, -1			; GFX7-NEXT: s_mov_b32 s2, -1
				; GFX7-NEXT: s_movk_i32 s8, 0xff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0			; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0
	; GFX7-NEXT: buffer_load_ubyte v0, off, s[0:3], 0			; GFX7-NEXT: buffer_load_ubyte v0, off, s[0:3], 0
	; GFX7-NEXT: s_load_dword s6, s[6:7], 0x0			; GFX7-NEXT: s_load_dword s5, s[6:7], 0x0
	; GFX7-NEXT: s_movk_i32 s5, 0xff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
				; GFX7-NEXT: s_and_b32 s7, s4, s8
	; GFX7-NEXT: s_bfe_u32 s9, s4, 0x80008			; GFX7-NEXT: s_bfe_u32 s9, s4, 0x80008
	; GFX7-NEXT: s_bfe_u32 s11, s4, 0x80010			; GFX7-NEXT: s_and_b32 s6, s5, s8
	; GFX7-NEXT: s_and_b32 s7, s6, s5			; GFX7-NEXT: s_bfe_u32 s8, s5, 0x80008
	; GFX7-NEXT: s_and_b32 s5, s4, s5			; GFX7-NEXT: v_mov_b32_e32 v1, s6
	; GFX7-NEXT: s_bfe_u32 s8, s6, 0x80008			; GFX7-NEXT: s_bfe_u32 s10, s5, 0x80010
	; GFX7-NEXT: v_mov_b32_e32 v1, s7
	; GFX7-NEXT: s_bfe_u32 s10, s6, 0x80010
	; GFX7-NEXT: v_mov_b32_e32 v2, s8			; GFX7-NEXT: v_mov_b32_e32 v2, s8
	; GFX7-NEXT: s_lshr_b32 s6, s6, 24			; GFX7-NEXT: s_bfe_u32 s11, s4, 0x80010
				; GFX7-NEXT: s_lshr_b32 s5, s5, 24
	; GFX7-NEXT: v_mov_b32_e32 v3, s10			; GFX7-NEXT: v_mov_b32_e32 v3, s10
	; GFX7-NEXT: s_lshr_b32 s4, s4, 24			; GFX7-NEXT: s_lshr_b32 s4, s4, 24
	; GFX7-NEXT: s_waitcnt vmcnt(0)			; GFX7-NEXT: s_waitcnt vmcnt(0)
	; GFX7-NEXT: v_mad_u32_u24 v0, s5, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s7, v1, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s9, v2, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s9, v2, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s11, v3, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s11, v3, v0
	; GFX7-NEXT: v_mov_b32_e32 v1, s6			; GFX7-NEXT: v_mov_b32_e32 v1, s5
	; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0
	; GFX7-NEXT: buffer_store_byte v0, off, s[0:3], 0			; GFX7-NEXT: buffer_store_byte v0, off, s[0:3], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: idot4_acc8:			; GFX8-LABEL: idot4_acc8:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_load_dword s2, s[4:5], 0x0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_load_ubyte v2, v[0:1]			; GFX8-NEXT: flat_load_ubyte v2, v[0:1]
	; GFX8-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX8-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX8-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX8-NEXT: s_movk_i32 s0, 0xff			; GFX8-NEXT: s_movk_i32 s0, 0xff
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_bfe_u32 s5, s2, 0x80008			; GFX8-NEXT: s_bfe_u32 s5, s1, 0x80008
	; GFX8-NEXT: s_bfe_u32 s7, s2, 0x80010			; GFX8-NEXT: s_and_b32 s3, s2, s0
	; GFX8-NEXT: s_and_b32 s3, s1, s0			; GFX8-NEXT: s_bfe_u32 s4, s2, 0x80008
	; GFX8-NEXT: s_and_b32 s0, s2, s0			; GFX8-NEXT: s_and_b32 s0, s1, s0
	; GFX8-NEXT: s_bfe_u32 s4, s1, 0x80008
	; GFX8-NEXT: v_mov_b32_e32 v3, s3			; GFX8-NEXT: v_mov_b32_e32 v3, s3
	; GFX8-NEXT: s_bfe_u32 s6, s1, 0x80010			; GFX8-NEXT: s_bfe_u32 s6, s2, 0x80010
	; GFX8-NEXT: v_mov_b32_e32 v4, s4			; GFX8-NEXT: v_mov_b32_e32 v4, s4
	; GFX8-NEXT: s_lshr_b32 s1, s1, 24			; GFX8-NEXT: s_bfe_u32 s7, s1, 0x80010
	; GFX8-NEXT: v_mov_b32_e32 v5, s6
	; GFX8-NEXT: s_lshr_b32 s2, s2, 24			; GFX8-NEXT: s_lshr_b32 s2, s2, 24
				; GFX8-NEXT: v_mov_b32_e32 v5, s6
				; GFX8-NEXT: s_lshr_b32 s1, s1, 24
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_mad_u32_u24 v2, s0, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s0, v3, v2
	; GFX8-NEXT: v_mad_u32_u24 v2, s5, v4, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s5, v4, v2
	; GFX8-NEXT: v_mad_u32_u24 v2, s7, v5, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s7, v5, v2
	; GFX8-NEXT: v_mov_b32_e32 v3, s1			; GFX8-NEXT: v_mov_b32_e32 v3, s2
	; GFX8-NEXT: v_mad_u32_u24 v2, s2, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s1, v3, v2
	; GFX8-NEXT: flat_store_byte v[0:1], v2			; GFX8-NEXT: flat_store_byte v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-NODL-LABEL: idot4_acc8:			; GFX9-NODL-LABEL: idot4_acc8:
	; GFX9-NODL: ; %bb.0: ; %entry			; GFX9-NODL: ; %bb.0: ; %entry
	; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NODL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-NODL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NODL-NEXT: s_load_dword s2, s[4:5], 0x0
	; GFX9-NODL-NEXT: v_mov_b32_e32 v0, s0			; GFX9-NODL-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-NODL-NEXT: v_mov_b32_e32 v1, s1			; GFX9-NODL-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NODL-NEXT: global_load_ubyte v2, v[0:1], off			; GFX9-NODL-NEXT: global_load_ubyte v2, v[0:1], off
	; GFX9-NODL-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX9-NODL-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX9-NODL-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX9-NODL-NEXT: s_movk_i32 s0, 0xff			; GFX9-NODL-NEXT: s_movk_i32 s0, 0xff
	; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NODL-NEXT: s_bfe_u32 s5, s2, 0x80008			; GFX9-NODL-NEXT: s_bfe_u32 s5, s1, 0x80008
	; GFX9-NODL-NEXT: s_bfe_u32 s7, s2, 0x80010			; GFX9-NODL-NEXT: s_and_b32 s3, s2, s0
	; GFX9-NODL-NEXT: s_and_b32 s3, s1, s0			; GFX9-NODL-NEXT: s_bfe_u32 s4, s2, 0x80008
	; GFX9-NODL-NEXT: s_and_b32 s0, s2, s0			; GFX9-NODL-NEXT: s_and_b32 s0, s1, s0
	; GFX9-NODL-NEXT: s_bfe_u32 s4, s1, 0x80008
	; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s3			; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s3
	; GFX9-NODL-NEXT: s_bfe_u32 s6, s1, 0x80010			; GFX9-NODL-NEXT: s_bfe_u32 s6, s2, 0x80010
	; GFX9-NODL-NEXT: v_mov_b32_e32 v4, s4			; GFX9-NODL-NEXT: v_mov_b32_e32 v4, s4
	; GFX9-NODL-NEXT: s_lshr_b32 s1, s1, 24			; GFX9-NODL-NEXT: s_bfe_u32 s7, s1, 0x80010
	; GFX9-NODL-NEXT: v_mov_b32_e32 v5, s6
	; GFX9-NODL-NEXT: s_lshr_b32 s2, s2, 24			; GFX9-NODL-NEXT: s_lshr_b32 s2, s2, 24
				; GFX9-NODL-NEXT: v_mov_b32_e32 v5, s6
				; GFX9-NODL-NEXT: s_lshr_b32 s1, s1, 24
	; GFX9-NODL-NEXT: s_waitcnt vmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s0, v3, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s0, v3, v2
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s5, v4, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s5, v4, v2
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s7, v5, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s7, v5, v2
	; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s2
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s2, v3, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s1, v3, v2
	; GFX9-NODL-NEXT: global_store_byte v[0:1], v2, off			; GFX9-NODL-NEXT: global_store_byte v[0:1], v2, off
	; GFX9-NODL-NEXT: s_endpgm			; GFX9-NODL-NEXT: s_endpgm
	;			;
	; GFX9-DL-LABEL: idot4_acc8:			; GFX9-DL-LABEL: idot4_acc8:
	; GFX9-DL: ; %bb.0: ; %entry			; GFX9-DL: ; %bb.0: ; %entry
	; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)
	▲ Show 20 Lines • Show All 468 Lines • ▼ Show 20 Lines
	; GFX7-NEXT: v_mad_i32_i24 v0, s6, v1, v0			; GFX7-NEXT: v_mad_i32_i24 v0, s6, v1, v0
	; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0			; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: idot4_acc16_vecMul:			; GFX8-LABEL: idot4_acc16_vecMul:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX8-NEXT: s_mov_b32 s2, 0xffff
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_load_dword s3, s[6:7], 0x0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_load_ushort v2, v[0:1]			; GFX8-NEXT: flat_load_ushort v2, v[0:1]
	; GFX8-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX8-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX8-NEXT: s_load_dword s2, s[6:7], 0x0
				; GFX8-NEXT: s_mov_b32 s0, 0xffff
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_bfe_i32 s6, s3, 0x80000			; GFX8-NEXT: s_lshr_b32 s3, s1, 16
	; GFX8-NEXT: s_lshr_b32 s4, s3, 16			; GFX8-NEXT: s_bfe_i32 s6, s2, 0x80000
	; GFX8-NEXT: v_ashrrev_i16_e64 v3, 8, s3			; GFX8-NEXT: s_lshr_b32 s4, s2, 16
	; GFX8-NEXT: s_bfe_i32 s3, s4, 0x80000			; GFX8-NEXT: s_bfe_i32 s5, s1, 0x80000
	; GFX8-NEXT: s_lshr_b32 s1, s0, 16			; GFX8-NEXT: v_ashrrev_i16_e64 v4, 8, s1
	; GFX8-NEXT: s_bfe_i32 s5, s0, 0x80000			; GFX8-NEXT: s_bfe_i32 s1, s3, 0x80000
	; GFX8-NEXT: v_ashrrev_i16_e64 v4, 8, s0			; GFX8-NEXT: v_ashrrev_i16_e64 v6, 8, s3
	; GFX8-NEXT: s_bfe_i32 s0, s1, 0x80000			; GFX8-NEXT: s_and_b32 s3, s0, s6
	; GFX8-NEXT: v_ashrrev_i16_e64 v6, 8, s1			; GFX8-NEXT: v_ashrrev_i16_e64 v3, 8, s2
	; GFX8-NEXT: s_and_b32 s1, s2, s6			; GFX8-NEXT: s_bfe_i32 s2, s4, 0x80000
	; GFX8-NEXT: v_ashrrev_i16_e64 v5, 8, s4			; GFX8-NEXT: v_ashrrev_i16_e64 v5, 8, s4
	; GFX8-NEXT: s_and_b32 s4, s2, s5			; GFX8-NEXT: s_and_b32 s4, s0, s5
	; GFX8-NEXT: v_mov_b32_e32 v7, s1			; GFX8-NEXT: v_mov_b32_e32 v7, s3
	; GFX8-NEXT: s_and_b32 s3, s2, s3			; GFX8-NEXT: s_and_b32 s2, s0, s2
	; GFX8-NEXT: s_and_b32 s0, s2, s0			; GFX8-NEXT: s_and_b32 s0, s0, s1
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_mad_u32_u24 v2, s4, v7, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s4, v7, v2
	; GFX8-NEXT: v_mad_u32_u24 v2, v4, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, v4, v3, v2
	; GFX8-NEXT: v_mov_b32_e32 v3, s3			; GFX8-NEXT: v_mov_b32_e32 v3, s2
	; GFX8-NEXT: v_mad_u32_u24 v2, s0, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s0, v3, v2
	; GFX8-NEXT: v_mad_u32_u24 v2, v6, v5, v2			; GFX8-NEXT: v_mad_u32_u24 v2, v6, v5, v2
	; GFX8-NEXT: flat_store_short v[0:1], v2			; GFX8-NEXT: flat_store_short v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-NODL-LABEL: idot4_acc16_vecMul:			; GFX9-NODL-LABEL: idot4_acc16_vecMul:
	; GFX9-NODL: ; %bb.0: ; %entry			; GFX9-NODL: ; %bb.0: ; %entry
	; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	▲ Show 20 Lines • Show All 141 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/idot4u.ll

	Show First 20 Lines • Show All 177 Lines • ▼ Show 20 Lines

	define amdgpu_kernel void @udot4_acc16(<4 x i8> addrspace(1)* %src1,			define amdgpu_kernel void @udot4_acc16(<4 x i8> addrspace(1)* %src1,
	; GFX7-LABEL: udot4_acc16:			; GFX7-LABEL: udot4_acc16:
	; GFX7: ; %bb.0: ; %entry			; GFX7: ; %bb.0: ; %entry
	; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd			; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd
	; GFX7-NEXT: s_mov_b32 s3, 0xf000			; GFX7-NEXT: s_mov_b32 s3, 0xf000
	; GFX7-NEXT: s_mov_b32 s2, -1			; GFX7-NEXT: s_mov_b32 s2, -1
				; GFX7-NEXT: s_movk_i32 s8, 0xff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0			; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0
	; GFX7-NEXT: buffer_load_ushort v0, off, s[0:3], 0			; GFX7-NEXT: buffer_load_ushort v0, off, s[0:3], 0
	; GFX7-NEXT: s_load_dword s6, s[6:7], 0x0			; GFX7-NEXT: s_load_dword s5, s[6:7], 0x0
	; GFX7-NEXT: s_movk_i32 s5, 0xff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
				; GFX7-NEXT: s_and_b32 s7, s4, s8
	; GFX7-NEXT: s_bfe_u32 s9, s4, 0x80008			; GFX7-NEXT: s_bfe_u32 s9, s4, 0x80008
	; GFX7-NEXT: s_bfe_u32 s11, s4, 0x80010			; GFX7-NEXT: s_and_b32 s6, s5, s8
	; GFX7-NEXT: s_and_b32 s7, s6, s5			; GFX7-NEXT: s_bfe_u32 s8, s5, 0x80008
	; GFX7-NEXT: s_and_b32 s5, s4, s5			; GFX7-NEXT: v_mov_b32_e32 v1, s6
	; GFX7-NEXT: s_bfe_u32 s8, s6, 0x80008			; GFX7-NEXT: s_bfe_u32 s10, s5, 0x80010
	; GFX7-NEXT: v_mov_b32_e32 v1, s7
	; GFX7-NEXT: s_bfe_u32 s10, s6, 0x80010
	; GFX7-NEXT: v_mov_b32_e32 v2, s8			; GFX7-NEXT: v_mov_b32_e32 v2, s8
	; GFX7-NEXT: s_lshr_b32 s6, s6, 24			; GFX7-NEXT: s_bfe_u32 s11, s4, 0x80010
				; GFX7-NEXT: s_lshr_b32 s5, s5, 24
	; GFX7-NEXT: v_mov_b32_e32 v3, s10			; GFX7-NEXT: v_mov_b32_e32 v3, s10
	; GFX7-NEXT: s_lshr_b32 s4, s4, 24			; GFX7-NEXT: s_lshr_b32 s4, s4, 24
	; GFX7-NEXT: s_waitcnt vmcnt(0)			; GFX7-NEXT: s_waitcnt vmcnt(0)
	; GFX7-NEXT: v_mad_u32_u24 v0, s5, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s7, v1, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s9, v2, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s9, v2, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s11, v3, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s11, v3, v0
	; GFX7-NEXT: v_mov_b32_e32 v1, s6			; GFX7-NEXT: v_mov_b32_e32 v1, s5
	; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0
	; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0			; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: udot4_acc16:			; GFX8-LABEL: udot4_acc16:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_load_ushort v2, v[0:1]			; GFX8-NEXT: flat_load_ushort v2, v[0:1]
	; GFX8-NEXT: s_load_dword s1, s[4:5], 0x0			; GFX8-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX8-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX8-NEXT: s_movk_i32 s0, 0xff			; GFX8-NEXT: s_movk_i32 s0, 0xff
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_bfe_u32 s5, s2, 0x80008
	; GFX8-NEXT: s_bfe_u32 s7, s2, 0x80010
	; GFX8-NEXT: v_mov_b32_e32 v4, s5
	; GFX8-NEXT: s_and_b32 s3, s1, s0			; GFX8-NEXT: s_and_b32 s3, s1, s0
	; GFX8-NEXT: s_and_b32 s0, s2, s0			; GFX8-NEXT: s_and_b32 s0, s2, s0
				; GFX8-NEXT: s_bfe_u32 s5, s2, 0x80008
	; GFX8-NEXT: v_mov_b32_e32 v3, s0			; GFX8-NEXT: v_mov_b32_e32 v3, s0
				; GFX8-NEXT: s_bfe_u32 s7, s2, 0x80010
	; GFX8-NEXT: s_bfe_u32 s4, s1, 0x80008			; GFX8-NEXT: s_bfe_u32 s4, s1, 0x80008
				; GFX8-NEXT: v_mov_b32_e32 v4, s5
	; GFX8-NEXT: s_bfe_u32 s6, s1, 0x80010			; GFX8-NEXT: s_bfe_u32 s6, s1, 0x80010
	; GFX8-NEXT: s_lshr_b32 s2, s2, 24			; GFX8-NEXT: s_lshr_b32 s2, s2, 24
	; GFX8-NEXT: v_mov_b32_e32 v5, s7			; GFX8-NEXT: v_mov_b32_e32 v5, s7
	; GFX8-NEXT: s_lshr_b32 s1, s1, 24			; GFX8-NEXT: s_lshr_b32 s1, s1, 24
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_mad_u32_u24 v2, s3, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s3, v3, v2
	; GFX8-NEXT: v_mad_u32_u24 v2, s4, v4, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s4, v4, v2
	; GFX8-NEXT: v_mad_u32_u24 v2, s6, v5, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s6, v5, v2
	; GFX8-NEXT: v_mov_b32_e32 v3, s2			; GFX8-NEXT: v_mov_b32_e32 v3, s2
	; GFX8-NEXT: v_mad_u32_u24 v2, s1, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s1, v3, v2
	; GFX8-NEXT: flat_store_short v[0:1], v2			; GFX8-NEXT: flat_store_short v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-NODL-LABEL: udot4_acc16:			; GFX9-NODL-LABEL: udot4_acc16:
	; GFX9-NODL: ; %bb.0: ; %entry			; GFX9-NODL: ; %bb.0: ; %entry
	; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NODL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-NODL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NODL-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX9-NODL-NEXT: v_mov_b32_e32 v0, s0			; GFX9-NODL-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-NODL-NEXT: v_mov_b32_e32 v1, s1			; GFX9-NODL-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NODL-NEXT: global_load_ushort v2, v[0:1], off			; GFX9-NODL-NEXT: global_load_ushort v2, v[0:1], off
	; GFX9-NODL-NEXT: s_load_dword s1, s[4:5], 0x0			; GFX9-NODL-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX9-NODL-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX9-NODL-NEXT: s_movk_i32 s0, 0xff			; GFX9-NODL-NEXT: s_movk_i32 s0, 0xff
	; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NODL-NEXT: s_bfe_u32 s5, s2, 0x80008
	; GFX9-NODL-NEXT: s_bfe_u32 s7, s2, 0x80010
	; GFX9-NODL-NEXT: v_mov_b32_e32 v4, s5
	; GFX9-NODL-NEXT: s_and_b32 s3, s1, s0			; GFX9-NODL-NEXT: s_and_b32 s3, s1, s0
	; GFX9-NODL-NEXT: s_and_b32 s0, s2, s0			; GFX9-NODL-NEXT: s_and_b32 s0, s2, s0
				; GFX9-NODL-NEXT: s_bfe_u32 s5, s2, 0x80008
	; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s0			; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s0
				; GFX9-NODL-NEXT: s_bfe_u32 s7, s2, 0x80010
	; GFX9-NODL-NEXT: s_bfe_u32 s4, s1, 0x80008			; GFX9-NODL-NEXT: s_bfe_u32 s4, s1, 0x80008
				; GFX9-NODL-NEXT: v_mov_b32_e32 v4, s5
	; GFX9-NODL-NEXT: s_bfe_u32 s6, s1, 0x80010			; GFX9-NODL-NEXT: s_bfe_u32 s6, s1, 0x80010
	; GFX9-NODL-NEXT: s_lshr_b32 s2, s2, 24			; GFX9-NODL-NEXT: s_lshr_b32 s2, s2, 24
	; GFX9-NODL-NEXT: v_mov_b32_e32 v5, s7			; GFX9-NODL-NEXT: v_mov_b32_e32 v5, s7
	; GFX9-NODL-NEXT: s_lshr_b32 s1, s1, 24			; GFX9-NODL-NEXT: s_lshr_b32 s1, s1, 24
	; GFX9-NODL-NEXT: s_waitcnt vmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s3, v3, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s3, v3, v2
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s4, v4, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s4, v4, v2
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s6, v5, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s6, v5, v2
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines

	define amdgpu_kernel void @udot4_acc8(<4 x i8> addrspace(1)* %src1,			define amdgpu_kernel void @udot4_acc8(<4 x i8> addrspace(1)* %src1,
	; GFX7-LABEL: udot4_acc8:			; GFX7-LABEL: udot4_acc8:
	; GFX7: ; %bb.0: ; %entry			; GFX7: ; %bb.0: ; %entry
	; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd			; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd
	; GFX7-NEXT: s_mov_b32 s3, 0xf000			; GFX7-NEXT: s_mov_b32 s3, 0xf000
	; GFX7-NEXT: s_mov_b32 s2, -1			; GFX7-NEXT: s_mov_b32 s2, -1
				; GFX7-NEXT: s_movk_i32 s8, 0xff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0			; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0
	; GFX7-NEXT: buffer_load_ubyte v0, off, s[0:3], 0			; GFX7-NEXT: buffer_load_ubyte v0, off, s[0:3], 0
	; GFX7-NEXT: s_load_dword s6, s[6:7], 0x0			; GFX7-NEXT: s_load_dword s5, s[6:7], 0x0
	; GFX7-NEXT: s_movk_i32 s5, 0xff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
				; GFX7-NEXT: s_and_b32 s7, s4, s8
	; GFX7-NEXT: s_bfe_u32 s9, s4, 0x80008			; GFX7-NEXT: s_bfe_u32 s9, s4, 0x80008
	; GFX7-NEXT: s_bfe_u32 s11, s4, 0x80010			; GFX7-NEXT: s_and_b32 s6, s5, s8
	; GFX7-NEXT: s_and_b32 s7, s6, s5			; GFX7-NEXT: s_bfe_u32 s8, s5, 0x80008
	; GFX7-NEXT: s_and_b32 s5, s4, s5			; GFX7-NEXT: v_mov_b32_e32 v1, s6
	; GFX7-NEXT: s_bfe_u32 s8, s6, 0x80008			; GFX7-NEXT: s_bfe_u32 s10, s5, 0x80010
	; GFX7-NEXT: v_mov_b32_e32 v1, s7
	; GFX7-NEXT: s_bfe_u32 s10, s6, 0x80010
	; GFX7-NEXT: v_mov_b32_e32 v2, s8			; GFX7-NEXT: v_mov_b32_e32 v2, s8
	; GFX7-NEXT: s_lshr_b32 s6, s6, 24			; GFX7-NEXT: s_bfe_u32 s11, s4, 0x80010
				; GFX7-NEXT: s_lshr_b32 s5, s5, 24
	; GFX7-NEXT: v_mov_b32_e32 v3, s10			; GFX7-NEXT: v_mov_b32_e32 v3, s10
	; GFX7-NEXT: s_lshr_b32 s4, s4, 24			; GFX7-NEXT: s_lshr_b32 s4, s4, 24
	; GFX7-NEXT: s_waitcnt vmcnt(0)			; GFX7-NEXT: s_waitcnt vmcnt(0)
	; GFX7-NEXT: v_mad_u32_u24 v0, s5, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s7, v1, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s9, v2, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s9, v2, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s11, v3, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s11, v3, v0
	; GFX7-NEXT: v_mov_b32_e32 v1, s6			; GFX7-NEXT: v_mov_b32_e32 v1, s5
	; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0
	; GFX7-NEXT: buffer_store_byte v0, off, s[0:3], 0			; GFX7-NEXT: buffer_store_byte v0, off, s[0:3], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: udot4_acc8:			; GFX8-LABEL: udot4_acc8:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_load_dword s2, s[4:5], 0x0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_load_ubyte v2, v[0:1]			; GFX8-NEXT: flat_load_ubyte v2, v[0:1]
	; GFX8-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX8-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX8-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX8-NEXT: s_movk_i32 s0, 0xff			; GFX8-NEXT: s_movk_i32 s0, 0xff
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_bfe_u32 s5, s2, 0x80008			; GFX8-NEXT: s_bfe_u32 s5, s1, 0x80008
	; GFX8-NEXT: s_bfe_u32 s7, s2, 0x80010			; GFX8-NEXT: s_and_b32 s3, s2, s0
	; GFX8-NEXT: s_and_b32 s3, s1, s0			; GFX8-NEXT: s_bfe_u32 s4, s2, 0x80008
	; GFX8-NEXT: s_and_b32 s0, s2, s0			; GFX8-NEXT: s_and_b32 s0, s1, s0
	; GFX8-NEXT: s_bfe_u32 s4, s1, 0x80008
	; GFX8-NEXT: v_mov_b32_e32 v3, s3			; GFX8-NEXT: v_mov_b32_e32 v3, s3
	; GFX8-NEXT: s_bfe_u32 s6, s1, 0x80010			; GFX8-NEXT: s_bfe_u32 s6, s2, 0x80010
	; GFX8-NEXT: v_mov_b32_e32 v4, s4			; GFX8-NEXT: v_mov_b32_e32 v4, s4
	; GFX8-NEXT: s_lshr_b32 s1, s1, 24			; GFX8-NEXT: s_bfe_u32 s7, s1, 0x80010
	; GFX8-NEXT: v_mov_b32_e32 v5, s6
	; GFX8-NEXT: s_lshr_b32 s2, s2, 24			; GFX8-NEXT: s_lshr_b32 s2, s2, 24
				; GFX8-NEXT: v_mov_b32_e32 v5, s6
				; GFX8-NEXT: s_lshr_b32 s1, s1, 24
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_mad_u32_u24 v2, s0, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s0, v3, v2
	; GFX8-NEXT: v_mad_u32_u24 v2, s5, v4, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s5, v4, v2
	; GFX8-NEXT: v_mad_u32_u24 v2, s7, v5, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s7, v5, v2
	; GFX8-NEXT: v_mov_b32_e32 v3, s1			; GFX8-NEXT: v_mov_b32_e32 v3, s2
	; GFX8-NEXT: v_mad_u32_u24 v2, s2, v3, v2			; GFX8-NEXT: v_mad_u32_u24 v2, s1, v3, v2
	; GFX8-NEXT: flat_store_byte v[0:1], v2			; GFX8-NEXT: flat_store_byte v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-NODL-LABEL: udot4_acc8:			; GFX9-NODL-LABEL: udot4_acc8:
	; GFX9-NODL: ; %bb.0: ; %entry			; GFX9-NODL: ; %bb.0: ; %entry
	; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NODL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NODL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-NODL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NODL-NEXT: s_load_dword s2, s[4:5], 0x0
	; GFX9-NODL-NEXT: v_mov_b32_e32 v0, s0			; GFX9-NODL-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-NODL-NEXT: v_mov_b32_e32 v1, s1			; GFX9-NODL-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NODL-NEXT: global_load_ubyte v2, v[0:1], off			; GFX9-NODL-NEXT: global_load_ubyte v2, v[0:1], off
	; GFX9-NODL-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX9-NODL-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX9-NODL-NEXT: s_load_dword s2, s[6:7], 0x0
	; GFX9-NODL-NEXT: s_movk_i32 s0, 0xff			; GFX9-NODL-NEXT: s_movk_i32 s0, 0xff
	; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NODL-NEXT: s_bfe_u32 s5, s2, 0x80008			; GFX9-NODL-NEXT: s_bfe_u32 s5, s1, 0x80008
	; GFX9-NODL-NEXT: s_bfe_u32 s7, s2, 0x80010			; GFX9-NODL-NEXT: s_and_b32 s3, s2, s0
	; GFX9-NODL-NEXT: s_and_b32 s3, s1, s0			; GFX9-NODL-NEXT: s_bfe_u32 s4, s2, 0x80008
	; GFX9-NODL-NEXT: s_and_b32 s0, s2, s0			; GFX9-NODL-NEXT: s_and_b32 s0, s1, s0
	; GFX9-NODL-NEXT: s_bfe_u32 s4, s1, 0x80008
	; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s3			; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s3
	; GFX9-NODL-NEXT: s_bfe_u32 s6, s1, 0x80010			; GFX9-NODL-NEXT: s_bfe_u32 s6, s2, 0x80010
	; GFX9-NODL-NEXT: v_mov_b32_e32 v4, s4			; GFX9-NODL-NEXT: v_mov_b32_e32 v4, s4
	; GFX9-NODL-NEXT: s_lshr_b32 s1, s1, 24			; GFX9-NODL-NEXT: s_bfe_u32 s7, s1, 0x80010
	; GFX9-NODL-NEXT: v_mov_b32_e32 v5, s6
	; GFX9-NODL-NEXT: s_lshr_b32 s2, s2, 24			; GFX9-NODL-NEXT: s_lshr_b32 s2, s2, 24
				; GFX9-NODL-NEXT: v_mov_b32_e32 v5, s6
				; GFX9-NODL-NEXT: s_lshr_b32 s1, s1, 24
	; GFX9-NODL-NEXT: s_waitcnt vmcnt(0)			; GFX9-NODL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s0, v3, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s0, v3, v2
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s5, v4, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s5, v4, v2
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s7, v5, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s7, v5, v2
	; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NODL-NEXT: v_mov_b32_e32 v3, s2
	; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s2, v3, v2			; GFX9-NODL-NEXT: v_mad_u32_u24 v2, s1, v3, v2
	; GFX9-NODL-NEXT: global_store_byte v[0:1], v2, off			; GFX9-NODL-NEXT: global_store_byte v[0:1], v2, off
	; GFX9-NODL-NEXT: s_endpgm			; GFX9-NODL-NEXT: s_endpgm
	;			;
	; GFX9-DL-LABEL: udot4_acc8:			; GFX9-DL-LABEL: udot4_acc8:
	; GFX9-DL: ; %bb.0: ; %entry			; GFX9-DL: ; %bb.0: ; %entry
	; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)
	▲ Show 20 Lines • Show All 965 Lines • ▼ Show 20 Lines
	; GFX7-LABEL: notdot4_mixedtypes:			; GFX7-LABEL: notdot4_mixedtypes:
	; GFX7: ; %bb.0: ; %entry			; GFX7: ; %bb.0: ; %entry
	; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd			; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd
	; GFX7-NEXT: s_mov_b32 s3, 0xf000			; GFX7-NEXT: s_mov_b32 s3, 0xf000
	; GFX7-NEXT: s_mov_b32 s2, -1			; GFX7-NEXT: s_mov_b32 s2, -1
	; GFX7-NEXT: s_mov_b32 s8, 0xffff			; GFX7-NEXT: s_mov_b32 s8, 0xffff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_load_dword s6, s[6:7], 0x0
	; GFX7-NEXT: buffer_load_ushort v0, off, s[0:3], 0
	; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0			; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0
				; GFX7-NEXT: buffer_load_ushort v0, off, s[0:3], 0
				; GFX7-NEXT: s_load_dword s5, s[6:7], 0x0
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_sext_i32_i8 s7, s6			; GFX7-NEXT: s_sext_i32_i8 s6, s4
	; GFX7-NEXT: s_bfe_u32 s9, s6, 0x80008
	; GFX7-NEXT: s_sext_i32_i8 s5, s4
	; GFX7-NEXT: s_and_b32 s7, s7, s8
	; GFX7-NEXT: s_bfe_u32 s10, s4, 0x80008			; GFX7-NEXT: s_bfe_u32 s10, s4, 0x80008
				; GFX7-NEXT: s_sext_i32_i8 s7, s5
				; GFX7-NEXT: s_bfe_u32 s9, s5, 0x80008
				; GFX7-NEXT: s_and_b32 s7, s7, s8
	; GFX7-NEXT: v_mov_b32_e32 v1, s9			; GFX7-NEXT: v_mov_b32_e32 v1, s9
	; GFX7-NEXT: s_bfe_u32 s11, s6, 0x80010			; GFX7-NEXT: s_bfe_u32 s11, s5, 0x80010
	; GFX7-NEXT: s_and_b32 s5, s5, s8			; GFX7-NEXT: s_and_b32 s6, s6, s8
	; GFX7-NEXT: v_mov_b32_e32 v3, s7			; GFX7-NEXT: v_mov_b32_e32 v3, s7
	; GFX7-NEXT: s_bfe_u32 s12, s4, 0x80010			; GFX7-NEXT: s_bfe_u32 s12, s4, 0x80010
	; GFX7-NEXT: s_lshr_b32 s6, s6, 24			; GFX7-NEXT: s_lshr_b32 s5, s5, 24
	; GFX7-NEXT: v_mov_b32_e32 v2, s11			; GFX7-NEXT: v_mov_b32_e32 v2, s11
	; GFX7-NEXT: s_lshr_b32 s4, s4, 24			; GFX7-NEXT: s_lshr_b32 s4, s4, 24
	; GFX7-NEXT: s_waitcnt vmcnt(0)			; GFX7-NEXT: s_waitcnt vmcnt(0)
	; GFX7-NEXT: v_mad_u32_u24 v0, s10, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s10, v1, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s5, v3, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s6, v3, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s12, v2, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s12, v2, v0
	; GFX7-NEXT: v_mov_b32_e32 v1, s6			; GFX7-NEXT: v_mov_b32_e32 v1, s5
	; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0
	; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0			; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: notdot4_mixedtypes:			; GFX8-LABEL: notdot4_mixedtypes:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	▲ Show 20 Lines • Show All 343 Lines • ▼ Show 20 Lines
	; TODO: This pattern should be recognized.			; TODO: This pattern should be recognized.
	define amdgpu_kernel void @udot4_acc16_vecMul(<4 x i8> addrspace(1)* %src1,			define amdgpu_kernel void @udot4_acc16_vecMul(<4 x i8> addrspace(1)* %src1,
	; GFX7-LABEL: udot4_acc16_vecMul:			; GFX7-LABEL: udot4_acc16_vecMul:
	; GFX7: ; %bb.0: ; %entry			; GFX7: ; %bb.0: ; %entry
	; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GFX7-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd			; GFX7-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0xd
	; GFX7-NEXT: s_mov_b32 s3, 0xf000			; GFX7-NEXT: s_mov_b32 s3, 0xf000
	; GFX7-NEXT: s_mov_b32 s2, -1			; GFX7-NEXT: s_mov_b32 s2, -1
				; GFX7-NEXT: s_movk_i32 s8, 0xff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_load_dword s6, s[6:7], 0x0
	; GFX7-NEXT: buffer_load_ushort v0, off, s[0:3], 0
	; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0			; GFX7-NEXT: s_load_dword s4, s[4:5], 0x0
	; GFX7-NEXT: s_movk_i32 s7, 0xff			; GFX7-NEXT: buffer_load_ushort v0, off, s[0:3], 0
				; GFX7-NEXT: s_load_dword s5, s[6:7], 0x0
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_bfe_u32 s10, s6, 0x80008			; GFX7-NEXT: s_lshr_b32 s6, s4, 24
	; GFX7-NEXT: s_bfe_u32 s12, s6, 0x80010			; GFX7-NEXT: s_bfe_u32 s7, s4, 0x80008
	; GFX7-NEXT: s_lshr_b32 s9, s6, 24			; GFX7-NEXT: s_bfe_u32 s10, s5, 0x80008
	; GFX7-NEXT: s_and_b32 s6, s6, s7			; GFX7-NEXT: s_bfe_u32 s12, s5, 0x80010
	; GFX7-NEXT: s_lshr_b32 s5, s4, 24			; GFX7-NEXT: s_lshr_b32 s9, s5, 24
	; GFX7-NEXT: s_bfe_u32 s8, s4, 0x80008			; GFX7-NEXT: s_and_b32 s5, s5, s8
	; GFX7-NEXT: s_bfe_u32 s11, s4, 0x80010			; GFX7-NEXT: s_bfe_u32 s11, s4, 0x80010
	; GFX7-NEXT: s_and_b32 s4, s4, s7			; GFX7-NEXT: s_and_b32 s4, s4, s8
	; GFX7-NEXT: v_mov_b32_e32 v1, s6			; GFX7-NEXT: v_mov_b32_e32 v1, s5
	; GFX7-NEXT: v_mov_b32_e32 v2, s10			; GFX7-NEXT: v_mov_b32_e32 v2, s10
	; GFX7-NEXT: v_mov_b32_e32 v3, s12			; GFX7-NEXT: v_mov_b32_e32 v3, s12
	; GFX7-NEXT: s_waitcnt vmcnt(0)			; GFX7-NEXT: s_waitcnt vmcnt(0)
	; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s4, v1, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s8, v2, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s7, v2, v0
	; GFX7-NEXT: v_mad_u32_u24 v0, s11, v3, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s11, v3, v0
	; GFX7-NEXT: v_mov_b32_e32 v1, s9			; GFX7-NEXT: v_mov_b32_e32 v1, s9
	; GFX7-NEXT: v_mad_u32_u24 v0, s5, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s6, v1, v0
	; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0			; GFX7-NEXT: buffer_store_short v0, off, s[0:3], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: udot4_acc16_vecMul:			; GFX8-LABEL: udot4_acc16_vecMul:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	▲ Show 20 Lines • Show All 376 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/idot8s.ll

	Show First 20 Lines • Show All 648 Lines • ▼ Show 20 Lines
	; GFX7-NEXT: v_mad_u32_u24 v0, s0, v1, v0			; GFX7-NEXT: v_mad_u32_u24 v0, s0, v1, v0
	; GFX7-NEXT: buffer_store_byte v0, off, s[4:7], 0			; GFX7-NEXT: buffer_store_byte v0, off, s[4:7], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: idot8_acc8:			; GFX8-LABEL: idot8_acc8:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX8-NEXT: s_movk_i32 s2, 0xff
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_load_dword s6, s[6:7], 0x0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_load_ubyte v2, v[0:1]			; GFX8-NEXT: flat_load_ubyte v2, v[0:1]
	; GFX8-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX8-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX8-NEXT: s_load_dword s2, s[6:7], 0x0
				; GFX8-NEXT: s_movk_i32 s0, 0xff
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_bfe_i32 s7, s6, 0x40000			; GFX8-NEXT: s_lshr_b32 s4, s1, 12
	; GFX8-NEXT: s_lshr_b32 s4, s6, 12			; GFX8-NEXT: s_bfe_i32 s7, s2, 0x40000
	; GFX8-NEXT: s_bfe_i32 s9, s6, 0x40004			; GFX8-NEXT: s_lshr_b32 s5, s2, 12
	; GFX8-NEXT: s_bfe_i32 s11, s6, 0x40008			; GFX8-NEXT: s_bfe_i32 s9, s2, 0x40004
	; GFX8-NEXT: s_lshr_b32 s1, s0, 12			; GFX8-NEXT: s_bfe_i32 s11, s2, 0x40008
	; GFX8-NEXT: s_bfe_i32 s5, s0, 0x40000			; GFX8-NEXT: s_bfe_i32 s6, s1, 0x40000
	; GFX8-NEXT: v_mov_b32_e32 v6, s7			; GFX8-NEXT: v_mov_b32_e32 v6, s7
	; GFX8-NEXT: v_lshlrev_b16_e64 v4, 12, s1			; GFX8-NEXT: v_lshlrev_b16_e64 v4, 12, s4
	; GFX8-NEXT: v_lshlrev_b16_e64 v5, 12, s4			; GFX8-NEXT: v_lshlrev_b16_e64 v5, 12, s5
	; GFX8-NEXT: s_bfe_i32 s8, s0, 0x40004			; GFX8-NEXT: s_bfe_i32 s8, s1, 0x40004
	; GFX8-NEXT: s_bfe_i32 s10, s0, 0x40008			; GFX8-NEXT: s_bfe_i32 s10, s1, 0x40008
	; GFX8-NEXT: v_mov_b32_e32 v3, s11			; GFX8-NEXT: v_mov_b32_e32 v3, s11
	; GFX8-NEXT: v_mov_b32_e32 v7, s9			; GFX8-NEXT: v_mov_b32_e32 v7, s9
	; GFX8-NEXT: v_ashrrev_i16_e32 v4, 12, v4			; GFX8-NEXT: v_ashrrev_i16_e32 v4, 12, v4
	; GFX8-NEXT: v_ashrrev_i16_e32 v5, 12, v5			; GFX8-NEXT: v_ashrrev_i16_e32 v5, 12, v5
	; GFX8-NEXT: v_mul_i32_i24_e32 v3, s10, v3			; GFX8-NEXT: v_mul_i32_i24_e32 v3, s10, v3
	; GFX8-NEXT: s_bfe_i32 s13, s6, 0x40010			; GFX8-NEXT: s_bfe_i32 s13, s2, 0x40010
	; GFX8-NEXT: v_and_b32_e32 v4, s2, v4			; GFX8-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX8-NEXT: v_and_b32_e32 v5, s2, v5			; GFX8-NEXT: v_and_b32_e32 v5, s0, v5
	; GFX8-NEXT: s_bfe_i32 s15, s6, 0x40014			; GFX8-NEXT: s_bfe_i32 s15, s2, 0x40014
	; GFX8-NEXT: s_bfe_i32 s12, s0, 0x40010			; GFX8-NEXT: s_bfe_i32 s12, s1, 0x40010
	; GFX8-NEXT: v_mov_b32_e32 v8, s13			; GFX8-NEXT: v_mov_b32_e32 v8, s13
	; GFX8-NEXT: s_bfe_i32 s17, s6, 0x40018			; GFX8-NEXT: s_bfe_i32 s17, s2, 0x40018
	; GFX8-NEXT: s_bfe_i32 s14, s0, 0x40014			; GFX8-NEXT: s_bfe_i32 s14, s1, 0x40014
	; GFX8-NEXT: v_mov_b32_e32 v9, s15			; GFX8-NEXT: v_mov_b32_e32 v9, s15
	; GFX8-NEXT: s_bfe_i32 s16, s0, 0x40018			; GFX8-NEXT: s_bfe_i32 s16, s1, 0x40018
	; GFX8-NEXT: s_ashr_i32 s6, s6, 28			; GFX8-NEXT: s_ashr_i32 s2, s2, 28
	; GFX8-NEXT: v_mov_b32_e32 v10, s17			; GFX8-NEXT: v_mov_b32_e32 v10, s17
	; GFX8-NEXT: s_ashr_i32 s0, s0, 28			; GFX8-NEXT: s_ashr_i32 s1, s1, 28
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_mad_i32_i24 v2, s5, v6, v2			; GFX8-NEXT: v_mad_i32_i24 v2, s6, v6, v2
	; GFX8-NEXT: v_mad_i32_i24 v2, s8, v7, v2			; GFX8-NEXT: v_mad_i32_i24 v2, s8, v7, v2
	; GFX8-NEXT: v_add_u32_sdwa v2, vcc, v3, v2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_0			; GFX8-NEXT: v_add_u32_sdwa v2, vcc, v3, v2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_0
	; GFX8-NEXT: v_mad_u32_u24 v2, v4, v5, v2			; GFX8-NEXT: v_mad_u32_u24 v2, v4, v5, v2
	; GFX8-NEXT: v_mad_i32_i24 v2, s12, v8, v2			; GFX8-NEXT: v_mad_i32_i24 v2, s12, v8, v2
	; GFX8-NEXT: v_mad_i32_i24 v2, s14, v9, v2			; GFX8-NEXT: v_mad_i32_i24 v2, s14, v9, v2
	; GFX8-NEXT: v_mad_i32_i24 v2, s16, v10, v2			; GFX8-NEXT: v_mad_i32_i24 v2, s16, v10, v2
	; GFX8-NEXT: v_mov_b32_e32 v3, s6			; GFX8-NEXT: v_mov_b32_e32 v3, s2
	; GFX8-NEXT: v_mad_i32_i24 v2, s0, v3, v2			; GFX8-NEXT: v_mad_i32_i24 v2, s1, v3, v2
	; GFX8-NEXT: flat_store_byte v[0:1], v2			; GFX8-NEXT: flat_store_byte v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: idot8_acc8:			; GFX9-LABEL: idot8_acc8:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NEXT: s_movk_i32 s2, 0xff
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_load_dword s6, s[6:7], 0x0
	; GFX9-NEXT: v_mov_b32_e32 v0, s0			; GFX9-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-NEXT: v_mov_b32_e32 v1, s1			; GFX9-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NEXT: global_load_ubyte v2, v[0:1], off			; GFX9-NEXT: global_load_ubyte v2, v[0:1], off
	; GFX9-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX9-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX9-NEXT: s_load_dword s2, s[6:7], 0x0
				; GFX9-NEXT: s_movk_i32 s0, 0xff
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_bfe_i32 s7, s6, 0x40000			; GFX9-NEXT: s_lshr_b32 s4, s1, 12
	; GFX9-NEXT: s_lshr_b32 s4, s6, 12			; GFX9-NEXT: s_bfe_i32 s7, s2, 0x40000
	; GFX9-NEXT: s_bfe_i32 s9, s6, 0x40004			; GFX9-NEXT: s_lshr_b32 s5, s2, 12
	; GFX9-NEXT: s_bfe_i32 s11, s6, 0x40008			; GFX9-NEXT: s_bfe_i32 s9, s2, 0x40004
	; GFX9-NEXT: s_lshr_b32 s1, s0, 12			; GFX9-NEXT: s_bfe_i32 s11, s2, 0x40008
	; GFX9-NEXT: s_bfe_i32 s5, s0, 0x40000			; GFX9-NEXT: s_bfe_i32 s6, s1, 0x40000
	; GFX9-NEXT: v_mov_b32_e32 v6, s7			; GFX9-NEXT: v_mov_b32_e32 v6, s7
	; GFX9-NEXT: v_lshlrev_b16_e64 v4, 12, s1			; GFX9-NEXT: v_lshlrev_b16_e64 v4, 12, s4
	; GFX9-NEXT: v_lshlrev_b16_e64 v5, 12, s4			; GFX9-NEXT: v_lshlrev_b16_e64 v5, 12, s5
	; GFX9-NEXT: s_bfe_i32 s8, s0, 0x40004			; GFX9-NEXT: s_bfe_i32 s8, s1, 0x40004
	; GFX9-NEXT: s_bfe_i32 s10, s0, 0x40008			; GFX9-NEXT: s_bfe_i32 s10, s1, 0x40008
	; GFX9-NEXT: v_mov_b32_e32 v3, s11			; GFX9-NEXT: v_mov_b32_e32 v3, s11
	; GFX9-NEXT: v_mov_b32_e32 v7, s9			; GFX9-NEXT: v_mov_b32_e32 v7, s9
	; GFX9-NEXT: v_ashrrev_i16_e32 v4, 12, v4			; GFX9-NEXT: v_ashrrev_i16_e32 v4, 12, v4
	; GFX9-NEXT: v_ashrrev_i16_e32 v5, 12, v5			; GFX9-NEXT: v_ashrrev_i16_e32 v5, 12, v5
	; GFX9-NEXT: v_mul_i32_i24_e32 v3, s10, v3			; GFX9-NEXT: v_mul_i32_i24_e32 v3, s10, v3
	; GFX9-NEXT: s_bfe_i32 s13, s6, 0x40010			; GFX9-NEXT: s_bfe_i32 s13, s2, 0x40010
	; GFX9-NEXT: v_and_b32_e32 v4, s2, v4			; GFX9-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX9-NEXT: v_and_b32_e32 v5, s2, v5			; GFX9-NEXT: v_and_b32_e32 v5, s0, v5
	; GFX9-NEXT: s_bfe_i32 s15, s6, 0x40014			; GFX9-NEXT: s_bfe_i32 s15, s2, 0x40014
	; GFX9-NEXT: s_bfe_i32 s12, s0, 0x40010			; GFX9-NEXT: s_bfe_i32 s12, s1, 0x40010
	; GFX9-NEXT: v_mov_b32_e32 v8, s13			; GFX9-NEXT: v_mov_b32_e32 v8, s13
	; GFX9-NEXT: s_bfe_i32 s17, s6, 0x40018			; GFX9-NEXT: s_bfe_i32 s17, s2, 0x40018
	; GFX9-NEXT: s_bfe_i32 s14, s0, 0x40014			; GFX9-NEXT: s_bfe_i32 s14, s1, 0x40014
	; GFX9-NEXT: v_mov_b32_e32 v9, s15			; GFX9-NEXT: v_mov_b32_e32 v9, s15
	; GFX9-NEXT: s_bfe_i32 s16, s0, 0x40018			; GFX9-NEXT: s_bfe_i32 s16, s1, 0x40018
	; GFX9-NEXT: s_ashr_i32 s6, s6, 28			; GFX9-NEXT: s_ashr_i32 s2, s2, 28
	; GFX9-NEXT: v_mov_b32_e32 v10, s17			; GFX9-NEXT: v_mov_b32_e32 v10, s17
	; GFX9-NEXT: s_ashr_i32 s0, s0, 28			; GFX9-NEXT: s_ashr_i32 s1, s1, 28
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_mad_i32_i24 v2, s5, v6, v2			; GFX9-NEXT: v_mad_i32_i24 v2, s6, v6, v2
	; GFX9-NEXT: v_mad_i32_i24 v2, s8, v7, v2			; GFX9-NEXT: v_mad_i32_i24 v2, s8, v7, v2
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v3 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_0			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v3 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_0
	; GFX9-NEXT: v_mad_u32_u24 v2, v4, v5, v2			; GFX9-NEXT: v_mad_u32_u24 v2, v4, v5, v2
	; GFX9-NEXT: v_mad_i32_i24 v2, s12, v8, v2			; GFX9-NEXT: v_mad_i32_i24 v2, s12, v8, v2
	; GFX9-NEXT: v_mad_i32_i24 v2, s14, v9, v2			; GFX9-NEXT: v_mad_i32_i24 v2, s14, v9, v2
	; GFX9-NEXT: v_mad_i32_i24 v2, s16, v10, v2			; GFX9-NEXT: v_mad_i32_i24 v2, s16, v10, v2
	; GFX9-NEXT: v_mov_b32_e32 v3, s6			; GFX9-NEXT: v_mov_b32_e32 v3, s2
	; GFX9-NEXT: v_mad_i32_i24 v2, s0, v3, v2			; GFX9-NEXT: v_mad_i32_i24 v2, s1, v3, v2
	; GFX9-NEXT: global_store_byte v[0:1], v2, off			; GFX9-NEXT: global_store_byte v[0:1], v2, off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX9-DL-LABEL: idot8_acc8:			; GFX9-DL-LABEL: idot8_acc8:
	; GFX9-DL: ; %bb.0: ; %entry			; GFX9-DL: ; %bb.0: ; %entry
	; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-DL-NEXT: s_movk_i32 s2, 0xff
	; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DL-NEXT: s_load_dword s6, s[6:7], 0x0
	; GFX9-DL-NEXT: v_mov_b32_e32 v0, s0			; GFX9-DL-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-DL-NEXT: v_mov_b32_e32 v1, s1			; GFX9-DL-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-DL-NEXT: global_load_ubyte v2, v[0:1], off			; GFX9-DL-NEXT: global_load_ubyte v2, v[0:1], off
	; GFX9-DL-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX9-DL-NEXT: s_load_dword s1, s[4:5], 0x0
				; GFX9-DL-NEXT: s_load_dword s2, s[6:7], 0x0
				; GFX9-DL-NEXT: s_movk_i32 s0, 0xff
	; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DL-NEXT: s_bfe_i32 s7, s6, 0x40000			; GFX9-DL-NEXT: s_lshr_b32 s4, s1, 12
	; GFX9-DL-NEXT: s_lshr_b32 s4, s6, 12			; GFX9-DL-NEXT: s_bfe_i32 s7, s2, 0x40000
	; GFX9-DL-NEXT: s_bfe_i32 s9, s6, 0x40004			; GFX9-DL-NEXT: s_lshr_b32 s5, s2, 12
	; GFX9-DL-NEXT: s_bfe_i32 s11, s6, 0x40008			; GFX9-DL-NEXT: s_bfe_i32 s9, s2, 0x40004
	; GFX9-DL-NEXT: s_lshr_b32 s1, s0, 12			; GFX9-DL-NEXT: s_bfe_i32 s11, s2, 0x40008
	; GFX9-DL-NEXT: s_bfe_i32 s5, s0, 0x40000			; GFX9-DL-NEXT: s_bfe_i32 s6, s1, 0x40000
	; GFX9-DL-NEXT: v_mov_b32_e32 v6, s7			; GFX9-DL-NEXT: v_mov_b32_e32 v6, s7
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v4, 12, s1			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v4, 12, s4
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v5, 12, s4			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v5, 12, s5
	; GFX9-DL-NEXT: s_bfe_i32 s8, s0, 0x40004			; GFX9-DL-NEXT: s_bfe_i32 s8, s1, 0x40004
	; GFX9-DL-NEXT: s_bfe_i32 s10, s0, 0x40008			; GFX9-DL-NEXT: s_bfe_i32 s10, s1, 0x40008
	; GFX9-DL-NEXT: v_mov_b32_e32 v3, s11			; GFX9-DL-NEXT: v_mov_b32_e32 v3, s11
	; GFX9-DL-NEXT: v_mov_b32_e32 v7, s9			; GFX9-DL-NEXT: v_mov_b32_e32 v7, s9
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v4, 12, v4			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v4, 12, v4
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v5, 12, v5			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v5, 12, v5
	; GFX9-DL-NEXT: v_mul_i32_i24_e32 v3, s10, v3			; GFX9-DL-NEXT: v_mul_i32_i24_e32 v3, s10, v3
	; GFX9-DL-NEXT: s_bfe_i32 s13, s6, 0x40010			; GFX9-DL-NEXT: s_bfe_i32 s13, s2, 0x40010
	; GFX9-DL-NEXT: v_and_b32_e32 v4, s2, v4			; GFX9-DL-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX9-DL-NEXT: v_and_b32_e32 v5, s2, v5			; GFX9-DL-NEXT: v_and_b32_e32 v5, s0, v5
	; GFX9-DL-NEXT: s_bfe_i32 s15, s6, 0x40014			; GFX9-DL-NEXT: s_bfe_i32 s15, s2, 0x40014
	; GFX9-DL-NEXT: s_bfe_i32 s12, s0, 0x40010			; GFX9-DL-NEXT: s_bfe_i32 s12, s1, 0x40010
	; GFX9-DL-NEXT: v_mov_b32_e32 v8, s13			; GFX9-DL-NEXT: v_mov_b32_e32 v8, s13
	; GFX9-DL-NEXT: s_bfe_i32 s17, s6, 0x40018			; GFX9-DL-NEXT: s_bfe_i32 s17, s2, 0x40018
	; GFX9-DL-NEXT: s_bfe_i32 s14, s0, 0x40014			; GFX9-DL-NEXT: s_bfe_i32 s14, s1, 0x40014
	; GFX9-DL-NEXT: v_mov_b32_e32 v9, s15			; GFX9-DL-NEXT: v_mov_b32_e32 v9, s15
	; GFX9-DL-NEXT: s_bfe_i32 s16, s0, 0x40018			; GFX9-DL-NEXT: s_bfe_i32 s16, s1, 0x40018
	; GFX9-DL-NEXT: s_ashr_i32 s6, s6, 28			; GFX9-DL-NEXT: s_ashr_i32 s2, s2, 28
	; GFX9-DL-NEXT: v_mov_b32_e32 v10, s17			; GFX9-DL-NEXT: v_mov_b32_e32 v10, s17
	; GFX9-DL-NEXT: s_ashr_i32 s0, s0, 28			; GFX9-DL-NEXT: s_ashr_i32 s1, s1, 28
	; GFX9-DL-NEXT: s_waitcnt vmcnt(0)			; GFX9-DL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DL-NEXT: v_mad_i32_i24 v2, s5, v6, v2			; GFX9-DL-NEXT: v_mad_i32_i24 v2, s6, v6, v2
	; GFX9-DL-NEXT: v_mad_i32_i24 v2, s8, v7, v2			; GFX9-DL-NEXT: v_mad_i32_i24 v2, s8, v7, v2
	; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v3 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_0			; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v3 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_0
	; GFX9-DL-NEXT: v_mad_u32_u24 v2, v4, v5, v2			; GFX9-DL-NEXT: v_mad_u32_u24 v2, v4, v5, v2
	; GFX9-DL-NEXT: v_mad_i32_i24 v2, s12, v8, v2			; GFX9-DL-NEXT: v_mad_i32_i24 v2, s12, v8, v2
	; GFX9-DL-NEXT: v_mad_i32_i24 v2, s14, v9, v2			; GFX9-DL-NEXT: v_mad_i32_i24 v2, s14, v9, v2
	; GFX9-DL-NEXT: v_mad_i32_i24 v2, s16, v10, v2			; GFX9-DL-NEXT: v_mad_i32_i24 v2, s16, v10, v2
	; GFX9-DL-NEXT: v_mov_b32_e32 v3, s6			; GFX9-DL-NEXT: v_mov_b32_e32 v3, s2
	; GFX9-DL-NEXT: v_mad_i32_i24 v2, s0, v3, v2			; GFX9-DL-NEXT: v_mad_i32_i24 v2, s1, v3, v2
	; GFX9-DL-NEXT: global_store_byte v[0:1], v2, off			; GFX9-DL-NEXT: global_store_byte v[0:1], v2, off
	; GFX9-DL-NEXT: s_endpgm			; GFX9-DL-NEXT: s_endpgm
	;			;
	; GFX10-DL-LABEL: idot8_acc8:			; GFX10-DL-LABEL: idot8_acc8:
	; GFX10-DL: ; %bb.0: ; %entry			; GFX10-DL: ; %bb.0: ; %entry
	; GFX10-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX10-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX10-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX10-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX10-DL-NEXT: s_movk_i32 s2, 0xff			; GFX10-DL-NEXT: s_movk_i32 s2, 0xff
	▲ Show 20 Lines • Show All 753 Lines • ▼ Show 20 Lines
	; TODO: Support this pattern.			; TODO: Support this pattern.
	define amdgpu_kernel void @idot8_acc16_vecMul(<8 x i4> addrspace(1)* %src1,			define amdgpu_kernel void @idot8_acc16_vecMul(<8 x i4> addrspace(1)* %src1,
	; GFX7-LABEL: idot8_acc16_vecMul:			; GFX7-LABEL: idot8_acc16_vecMul:
	; GFX7: ; %bb.0: ; %entry			; GFX7: ; %bb.0: ; %entry
	; GFX7-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x9			; GFX7-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x9
	; GFX7-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0xd			; GFX7-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0xd
	; GFX7-NEXT: s_mov_b32 s7, 0xf000			; GFX7-NEXT: s_mov_b32 s7, 0xf000
	; GFX7-NEXT: s_mov_b32 s6, -1			; GFX7-NEXT: s_mov_b32 s6, -1
	; GFX7-NEXT: s_mov_b32 s2, 0xffff			; GFX7-NEXT: s_mov_b32 s0, 0xffff
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_load_dword s0, s[10:11], 0x0
	; GFX7-NEXT: buffer_load_ushort v0, off, s[4:7], 0
	; GFX7-NEXT: s_load_dword s1, s[8:9], 0x0			; GFX7-NEXT: s_load_dword s1, s[8:9], 0x0
				; GFX7-NEXT: buffer_load_ushort v0, off, s[4:7], 0
				; GFX7-NEXT: s_load_dword s2, s[10:11], 0x0
	; GFX7-NEXT: s_waitcnt lgkmcnt(0)			; GFX7-NEXT: s_waitcnt lgkmcnt(0)
	; GFX7-NEXT: s_bfe_i32 s16, s0, 0x40018
	; GFX7-NEXT: s_bfe_i32 s17, s0, 0x40014
	; GFX7-NEXT: s_bfe_i32 s18, s0, 0x40010
	; GFX7-NEXT: s_bfe_i32 s19, s0, 0x40000
	; GFX7-NEXT: s_bfe_i32 s20, s0, 0x40004
	; GFX7-NEXT: s_bfe_i32 s21, s0, 0x40008
	; GFX7-NEXT: s_ashr_i32 s15, s0, 28
	; GFX7-NEXT: s_bfe_i32 s0, s0, 0x4000c
	; GFX7-NEXT: s_ashr_i32 s8, s1, 28			; GFX7-NEXT: s_ashr_i32 s8, s1, 28
	; GFX7-NEXT: s_bfe_i32 s9, s1, 0x40018			; GFX7-NEXT: s_bfe_i32 s9, s1, 0x40018
				; GFX7-NEXT: s_bfe_i32 s16, s2, 0x40018
				; GFX7-NEXT: s_bfe_i32 s17, s2, 0x40014
				; GFX7-NEXT: s_bfe_i32 s18, s2, 0x40010
				; GFX7-NEXT: s_bfe_i32 s19, s2, 0x40000
				; GFX7-NEXT: s_bfe_i32 s20, s2, 0x40004
				; GFX7-NEXT: s_bfe_i32 s21, s2, 0x40008
				; GFX7-NEXT: s_ashr_i32 s15, s2, 28
				; GFX7-NEXT: s_bfe_i32 s2, s2, 0x4000c
	; GFX7-NEXT: s_bfe_i32 s10, s1, 0x40014			; GFX7-NEXT: s_bfe_i32 s10, s1, 0x40014
	; GFX7-NEXT: s_bfe_i32 s11, s1, 0x40010			; GFX7-NEXT: s_bfe_i32 s11, s1, 0x40010
	; GFX7-NEXT: s_bfe_i32 s12, s1, 0x40000			; GFX7-NEXT: s_bfe_i32 s12, s1, 0x40000
	; GFX7-NEXT: v_mov_b32_e32 v4, s19			; GFX7-NEXT: v_mov_b32_e32 v4, s19
	; GFX7-NEXT: s_bfe_i32 s13, s1, 0x40004			; GFX7-NEXT: s_bfe_i32 s13, s1, 0x40004
	; GFX7-NEXT: v_mov_b32_e32 v3, s20			; GFX7-NEXT: v_mov_b32_e32 v3, s20
	; GFX7-NEXT: s_bfe_i32 s14, s1, 0x40008			; GFX7-NEXT: s_bfe_i32 s14, s1, 0x40008
	; GFX7-NEXT: v_mov_b32_e32 v2, s21			; GFX7-NEXT: v_mov_b32_e32 v2, s21
	; GFX7-NEXT: s_bfe_i32 s1, s1, 0x4000c			; GFX7-NEXT: s_bfe_i32 s1, s1, 0x4000c
	; GFX7-NEXT: v_mov_b32_e32 v1, s0			; GFX7-NEXT: v_mov_b32_e32 v1, s2
	; GFX7-NEXT: v_mul_i32_i24_e32 v1, s1, v1			; GFX7-NEXT: v_mul_i32_i24_e32 v1, s1, v1
	; GFX7-NEXT: v_mul_i32_i24_e32 v2, s14, v2			; GFX7-NEXT: v_mul_i32_i24_e32 v2, s14, v2
	; GFX7-NEXT: v_mul_i32_i24_e32 v3, s13, v3			; GFX7-NEXT: v_mul_i32_i24_e32 v3, s13, v3
	; GFX7-NEXT: v_mul_i32_i24_e32 v4, s12, v4			; GFX7-NEXT: v_mul_i32_i24_e32 v4, s12, v4
	; GFX7-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; GFX7-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; GFX7-NEXT: v_and_b32_e32 v2, s2, v2			; GFX7-NEXT: v_and_b32_e32 v2, s0, v2
	; GFX7-NEXT: v_lshlrev_b32_e32 v3, 16, v3			; GFX7-NEXT: v_lshlrev_b32_e32 v3, 16, v3
	; GFX7-NEXT: v_and_b32_e32 v4, s2, v4			; GFX7-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX7-NEXT: v_or_b32_e32 v1, v2, v1			; GFX7-NEXT: v_or_b32_e32 v1, v2, v1
	; GFX7-NEXT: v_or_b32_e32 v2, v4, v3			; GFX7-NEXT: v_or_b32_e32 v2, v4, v3
	; GFX7-NEXT: v_alignbit_b32 v3, v1, v2, 16			; GFX7-NEXT: v_alignbit_b32 v3, v1, v2, 16
	; GFX7-NEXT: v_lshrrev_b32_e32 v4, 16, v1			; GFX7-NEXT: v_lshrrev_b32_e32 v4, 16, v1
	; GFX7-NEXT: v_mov_b32_e32 v5, s18			; GFX7-NEXT: v_mov_b32_e32 v5, s18
	; GFX7-NEXT: v_mov_b32_e32 v6, s17			; GFX7-NEXT: v_mov_b32_e32 v6, s17
	; GFX7-NEXT: v_mov_b32_e32 v7, s16			; GFX7-NEXT: v_mov_b32_e32 v7, s16
	; GFX7-NEXT: s_waitcnt vmcnt(0)			; GFX7-NEXT: s_waitcnt vmcnt(0)
	Show All 9 Lines
	; GFX7-NEXT: buffer_store_short v0, off, s[4:7], 0			; GFX7-NEXT: buffer_store_short v0, off, s[4:7], 0
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: idot8_acc16_vecMul:			; GFX8-LABEL: idot8_acc16_vecMul:
	; GFX8: ; %bb.0: ; %entry			; GFX8: ; %bb.0: ; %entry
	; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: s_load_dword s2, s[6:7], 0x0			; GFX8-NEXT: s_load_dword s2, s[4:5], 0x0
	; GFX8-NEXT: v_mov_b32_e32 v0, s0			; GFX8-NEXT: v_mov_b32_e32 v0, s0
	; GFX8-NEXT: v_mov_b32_e32 v1, s1			; GFX8-NEXT: v_mov_b32_e32 v1, s1
	; GFX8-NEXT: flat_load_ushort v2, v[0:1]			; GFX8-NEXT: flat_load_ushort v2, v[0:1]
	; GFX8-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX8-NEXT: s_load_dword s0, s[6:7], 0x0
	; GFX8-NEXT: s_waitcnt lgkmcnt(0)			; GFX8-NEXT: s_waitcnt lgkmcnt(0)
	; GFX8-NEXT: v_lshlrev_b16_e64 v4, 12, s2			; GFX8-NEXT: v_lshlrev_b16_e64 v3, 12, s2
	; GFX8-NEXT: s_lshr_b32 s15, s2, 4			; GFX8-NEXT: s_lshr_b32 s8, s2, 4
	; GFX8-NEXT: s_lshr_b32 s16, s2, 8			; GFX8-NEXT: s_lshr_b32 s9, s2, 8
	; GFX8-NEXT: v_lshlrev_b16_e64 v12, 12, s16
	; GFX8-NEXT: v_lshlrev_b16_e64 v3, 12, s0
	; GFX8-NEXT: s_lshr_b32 s8, s0, 4
	; GFX8-NEXT: s_lshr_b32 s9, s0, 8
	; GFX8-NEXT: v_lshlrev_b16_e64 v5, 12, s9			; GFX8-NEXT: v_lshlrev_b16_e64 v5, 12, s9
				; GFX8-NEXT: v_lshlrev_b16_e64 v4, 12, s0
				; GFX8-NEXT: s_lshr_b32 s15, s0, 4
				; GFX8-NEXT: s_lshr_b32 s16, s0, 8
	; GFX8-NEXT: v_lshlrev_b16_e64 v6, 12, s8			; GFX8-NEXT: v_lshlrev_b16_e64 v6, 12, s8
				; GFX8-NEXT: v_lshlrev_b16_e64 v12, 12, s16
	; GFX8-NEXT: v_lshlrev_b16_e64 v13, 12, s15			; GFX8-NEXT: v_lshlrev_b16_e64 v13, 12, s15
	; GFX8-NEXT: v_ashrrev_i16_e32 v3, 12, v3			; GFX8-NEXT: v_ashrrev_i16_e32 v3, 12, v3
	; GFX8-NEXT: v_ashrrev_i16_e32 v4, 12, v4			; GFX8-NEXT: v_ashrrev_i16_e32 v4, 12, v4
	; GFX8-NEXT: s_lshr_b32 s7, s0, 12			; GFX8-NEXT: s_lshr_b32 s7, s2, 12
	; GFX8-NEXT: s_lshr_b32 s14, s2, 12			; GFX8-NEXT: s_lshr_b32 s14, s0, 12
	; GFX8-NEXT: v_ashrrev_i16_e32 v6, 12, v6			; GFX8-NEXT: v_ashrrev_i16_e32 v6, 12, v6
	; GFX8-NEXT: v_ashrrev_i16_e32 v5, 12, v5			; GFX8-NEXT: v_ashrrev_i16_e32 v5, 12, v5
	; GFX8-NEXT: v_ashrrev_i16_e32 v12, 12, v12			; GFX8-NEXT: v_ashrrev_i16_e32 v12, 12, v12
	; GFX8-NEXT: v_ashrrev_i16_e32 v13, 12, v13			; GFX8-NEXT: v_ashrrev_i16_e32 v13, 12, v13
	; GFX8-NEXT: v_lshlrev_b16_e64 v7, 12, s7			; GFX8-NEXT: v_lshlrev_b16_e64 v7, 12, s7
	; GFX8-NEXT: v_lshlrev_b16_e64 v14, 12, s14			; GFX8-NEXT: v_lshlrev_b16_e64 v14, 12, s14
	; GFX8-NEXT: s_lshr_b32 s6, s0, 16			; GFX8-NEXT: s_lshr_b32 s6, s2, 16
	; GFX8-NEXT: s_lshr_b32 s13, s2, 16			; GFX8-NEXT: s_lshr_b32 s13, s0, 16
	; GFX8-NEXT: v_mul_u32_u24_e32 v5, v5, v12			; GFX8-NEXT: v_mul_u32_u24_e32 v5, v5, v12
	; GFX8-NEXT: v_lshlrev_b16_e64 v8, 12, s6			; GFX8-NEXT: v_lshlrev_b16_e64 v8, 12, s6
	; GFX8-NEXT: v_lshlrev_b16_e64 v15, 12, s13			; GFX8-NEXT: v_lshlrev_b16_e64 v15, 12, s13
	; GFX8-NEXT: s_lshr_b32 s5, s0, 20			; GFX8-NEXT: s_lshr_b32 s5, s2, 20
	; GFX8-NEXT: s_lshr_b32 s12, s2, 20			; GFX8-NEXT: s_lshr_b32 s12, s0, 20
	; GFX8-NEXT: v_ashrrev_i16_e32 v7, 12, v7			; GFX8-NEXT: v_ashrrev_i16_e32 v7, 12, v7
	; GFX8-NEXT: v_ashrrev_i16_e32 v14, 12, v14			; GFX8-NEXT: v_ashrrev_i16_e32 v14, 12, v14
	; GFX8-NEXT: v_lshlrev_b16_e64 v9, 12, s5			; GFX8-NEXT: v_lshlrev_b16_e64 v9, 12, s5
	; GFX8-NEXT: v_lshlrev_b16_e64 v16, 12, s12			; GFX8-NEXT: v_lshlrev_b16_e64 v16, 12, s12
	; GFX8-NEXT: s_lshr_b32 s4, s0, 24			; GFX8-NEXT: s_lshr_b32 s4, s2, 24
	; GFX8-NEXT: s_lshr_b32 s11, s2, 24			; GFX8-NEXT: s_lshr_b32 s11, s0, 24
	; GFX8-NEXT: v_ashrrev_i16_e32 v8, 12, v8			; GFX8-NEXT: v_ashrrev_i16_e32 v8, 12, v8
	; GFX8-NEXT: v_ashrrev_i16_e32 v15, 12, v15			; GFX8-NEXT: v_ashrrev_i16_e32 v15, 12, v15
	; GFX8-NEXT: v_lshlrev_b16_e64 v10, 12, s4			; GFX8-NEXT: v_lshlrev_b16_e64 v10, 12, s4
	; GFX8-NEXT: v_lshlrev_b16_e64 v17, 12, s11			; GFX8-NEXT: v_lshlrev_b16_e64 v17, 12, s11
	; GFX8-NEXT: s_lshr_b32 s1, s0, 28			; GFX8-NEXT: s_lshr_b32 s1, s2, 28
	; GFX8-NEXT: s_lshr_b32 s10, s2, 28			; GFX8-NEXT: s_lshr_b32 s10, s0, 28
	; GFX8-NEXT: v_ashrrev_i16_e32 v9, 12, v9			; GFX8-NEXT: v_ashrrev_i16_e32 v9, 12, v9
	; GFX8-NEXT: v_ashrrev_i16_e32 v16, 12, v16			; GFX8-NEXT: v_ashrrev_i16_e32 v16, 12, v16
	; GFX8-NEXT: v_lshlrev_b16_e64 v11, 12, s1			; GFX8-NEXT: v_lshlrev_b16_e64 v11, 12, s1
	; GFX8-NEXT: v_lshlrev_b16_e64 v18, 12, s10			; GFX8-NEXT: v_lshlrev_b16_e64 v18, 12, s10
	; GFX8-NEXT: v_ashrrev_i16_e32 v10, 12, v10			; GFX8-NEXT: v_ashrrev_i16_e32 v10, 12, v10
	; GFX8-NEXT: v_ashrrev_i16_e32 v17, 12, v17			; GFX8-NEXT: v_ashrrev_i16_e32 v17, 12, v17
	; GFX8-NEXT: v_ashrrev_i16_e32 v11, 12, v11			; GFX8-NEXT: v_ashrrev_i16_e32 v11, 12, v11
	; GFX8-NEXT: v_ashrrev_i16_e32 v18, 12, v18			; GFX8-NEXT: v_ashrrev_i16_e32 v18, 12, v18
	▲ Show 20 Lines • Show All 413 Lines • ▼ Show 20 Lines
	; GFX8-NEXT: v_add_u32_sdwa v2, vcc, v6, v2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_3 src1_sel:DWORD			; GFX8-NEXT: v_add_u32_sdwa v2, vcc, v6, v2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_3 src1_sel:DWORD
	; GFX8-NEXT: flat_store_byte v[0:1], v2			; GFX8-NEXT: flat_store_byte v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: idot8_acc8_vecMul:			; GFX9-LABEL: idot8_acc8_vecMul:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NEXT: s_mov_b32 s2, 0xffff
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v0, s0			; GFX9-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-NEXT: v_mov_b32_e32 v1, s1			; GFX9-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NEXT: global_load_ubyte v2, v[0:1], off			; GFX9-NEXT: global_load_ubyte v2, v[0:1], off
	; GFX9-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX9-NEXT: s_load_dword s1, s[4:5], 0x0
	; GFX9-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX9-NEXT: s_load_dword s2, s[6:7], 0x0
				; GFX9-NEXT: s_mov_b32 s0, 0xffff
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_lshr_b32 s8, s0, 4			; GFX9-NEXT: s_lshr_b32 s8, s1, 4
	; GFX9-NEXT: s_lshr_b32 s15, s1, 4			; GFX9-NEXT: s_lshr_b32 s15, s2, 4
	; GFX9-NEXT: v_lshlrev_b16_e64 v3, 12, s0			; GFX9-NEXT: v_lshlrev_b16_e64 v3, 12, s1
	; GFX9-NEXT: v_lshlrev_b16_e64 v4, 12, s1			; GFX9-NEXT: v_lshlrev_b16_e64 v4, 12, s2
	; GFX9-NEXT: v_lshlrev_b16_e64 v7, 12, s8			; GFX9-NEXT: v_lshlrev_b16_e64 v7, 12, s8
	; GFX9-NEXT: v_lshlrev_b16_e64 v14, 12, s15			; GFX9-NEXT: v_lshlrev_b16_e64 v14, 12, s15
	; GFX9-NEXT: s_lshr_b32 s9, s0, 12			; GFX9-NEXT: s_lshr_b32 s9, s1, 12
	; GFX9-NEXT: s_lshr_b32 s10, s0, 8			; GFX9-NEXT: s_lshr_b32 s10, s1, 8
	; GFX9-NEXT: s_lshr_b32 s16, s1, 12			; GFX9-NEXT: s_lshr_b32 s16, s2, 12
	; GFX9-NEXT: s_lshr_b32 s17, s1, 8			; GFX9-NEXT: s_lshr_b32 s17, s2, 8
	; GFX9-NEXT: v_lshlrev_b16_e64 v5, 12, s10			; GFX9-NEXT: v_lshlrev_b16_e64 v5, 12, s10
	; GFX9-NEXT: v_lshlrev_b16_e64 v6, 12, s9			; GFX9-NEXT: v_lshlrev_b16_e64 v6, 12, s9
	; GFX9-NEXT: v_lshlrev_b16_e64 v12, 12, s17			; GFX9-NEXT: v_lshlrev_b16_e64 v12, 12, s17
	; GFX9-NEXT: v_lshlrev_b16_e64 v13, 12, s16			; GFX9-NEXT: v_lshlrev_b16_e64 v13, 12, s16
	; GFX9-NEXT: v_ashrrev_i16_e32 v3, 12, v3			; GFX9-NEXT: v_ashrrev_i16_e32 v3, 12, v3
	; GFX9-NEXT: v_ashrrev_i16_e32 v4, 12, v4			; GFX9-NEXT: v_ashrrev_i16_e32 v4, 12, v4
	; GFX9-NEXT: v_ashrrev_i16_e32 v7, 12, v7			; GFX9-NEXT: v_ashrrev_i16_e32 v7, 12, v7
	; GFX9-NEXT: v_ashrrev_i16_e32 v14, 12, v14			; GFX9-NEXT: v_ashrrev_i16_e32 v14, 12, v14
	; GFX9-NEXT: v_ashrrev_i16_e32 v5, 12, v5			; GFX9-NEXT: v_ashrrev_i16_e32 v5, 12, v5
	; GFX9-NEXT: v_ashrrev_i16_e32 v12, 12, v12			; GFX9-NEXT: v_ashrrev_i16_e32 v12, 12, v12
	; GFX9-NEXT: v_ashrrev_i16_e32 v6, 12, v6			; GFX9-NEXT: v_ashrrev_i16_e32 v6, 12, v6
	; GFX9-NEXT: v_ashrrev_i16_e32 v13, 12, v13			; GFX9-NEXT: v_ashrrev_i16_e32 v13, 12, v13
	; GFX9-NEXT: v_mul_lo_u16_e32 v3, v3, v4			; GFX9-NEXT: v_mul_lo_u16_e32 v3, v3, v4
	; GFX9-NEXT: v_mul_lo_u16_sdwa v7, v7, v14 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_mul_lo_u16_sdwa v7, v7, v14 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_or_b32_sdwa v3, v3, v7 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD			; GFX9-NEXT: v_or_b32_sdwa v3, v3, v7 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
	; GFX9-NEXT: s_lshr_b32 s4, s0, 20			; GFX9-NEXT: s_lshr_b32 s4, s1, 20
	; GFX9-NEXT: s_lshr_b32 s5, s0, 16			; GFX9-NEXT: s_lshr_b32 s5, s1, 16
	; GFX9-NEXT: s_lshr_b32 s11, s1, 20			; GFX9-NEXT: s_lshr_b32 s11, s2, 20
	; GFX9-NEXT: s_lshr_b32 s12, s1, 16			; GFX9-NEXT: s_lshr_b32 s12, s2, 16
	; GFX9-NEXT: v_mul_lo_u16_sdwa v6, v6, v13 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_mul_lo_u16_sdwa v6, v6, v13 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_mul_lo_u16_e32 v5, v5, v12			; GFX9-NEXT: v_mul_lo_u16_e32 v5, v5, v12
	; GFX9-NEXT: v_lshlrev_b16_e64 v10, 12, s5			; GFX9-NEXT: v_lshlrev_b16_e64 v10, 12, s5
	; GFX9-NEXT: v_lshlrev_b16_e64 v11, 12, s4			; GFX9-NEXT: v_lshlrev_b16_e64 v11, 12, s4
	; GFX9-NEXT: v_lshlrev_b16_e64 v17, 12, s12			; GFX9-NEXT: v_lshlrev_b16_e64 v17, 12, s12
	; GFX9-NEXT: v_lshlrev_b16_e64 v18, 12, s11			; GFX9-NEXT: v_lshlrev_b16_e64 v18, 12, s11
	; GFX9-NEXT: s_lshr_b32 s6, s0, 28			; GFX9-NEXT: s_lshr_b32 s6, s1, 28
	; GFX9-NEXT: s_lshr_b32 s7, s0, 24			; GFX9-NEXT: s_lshr_b32 s7, s1, 24
	; GFX9-NEXT: s_lshr_b32 s13, s1, 28			; GFX9-NEXT: s_lshr_b32 s13, s2, 28
	; GFX9-NEXT: s_lshr_b32 s14, s1, 24			; GFX9-NEXT: s_lshr_b32 s14, s2, 24
	; GFX9-NEXT: v_and_b32_e32 v3, s2, v3			; GFX9-NEXT: v_and_b32_e32 v3, s0, v3
	; GFX9-NEXT: v_or_b32_sdwa v5, v5, v6 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD			; GFX9-NEXT: v_or_b32_sdwa v5, v5, v6 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
	; GFX9-NEXT: v_lshlrev_b16_e64 v8, 12, s7			; GFX9-NEXT: v_lshlrev_b16_e64 v8, 12, s7
	; GFX9-NEXT: v_lshlrev_b16_e64 v9, 12, s6			; GFX9-NEXT: v_lshlrev_b16_e64 v9, 12, s6
	; GFX9-NEXT: v_lshlrev_b16_e64 v15, 12, s14			; GFX9-NEXT: v_lshlrev_b16_e64 v15, 12, s14
	; GFX9-NEXT: v_lshlrev_b16_e64 v16, 12, s13			; GFX9-NEXT: v_lshlrev_b16_e64 v16, 12, s13
	; GFX9-NEXT: v_or_b32_e32 v5, v3, v5			; GFX9-NEXT: v_or_b32_e32 v5, v3, v5
	; GFX9-NEXT: v_ashrrev_i16_e32 v10, 12, v10			; GFX9-NEXT: v_ashrrev_i16_e32 v10, 12, v10
	; GFX9-NEXT: v_ashrrev_i16_e32 v17, 12, v17			; GFX9-NEXT: v_ashrrev_i16_e32 v17, 12, v17
	; GFX9-NEXT: v_ashrrev_i16_e32 v11, 12, v11			; GFX9-NEXT: v_ashrrev_i16_e32 v11, 12, v11
	; GFX9-NEXT: v_ashrrev_i16_e32 v18, 12, v18			; GFX9-NEXT: v_ashrrev_i16_e32 v18, 12, v18
	; GFX9-NEXT: v_ashrrev_i16_e32 v8, 12, v8			; GFX9-NEXT: v_ashrrev_i16_e32 v8, 12, v8
	; GFX9-NEXT: v_ashrrev_i16_e32 v15, 12, v15			; GFX9-NEXT: v_ashrrev_i16_e32 v15, 12, v15
	; GFX9-NEXT: v_ashrrev_i16_e32 v9, 12, v9			; GFX9-NEXT: v_ashrrev_i16_e32 v9, 12, v9
	; GFX9-NEXT: v_ashrrev_i16_e32 v16, 12, v16			; GFX9-NEXT: v_ashrrev_i16_e32 v16, 12, v16
	; GFX9-NEXT: v_mul_lo_u16_sdwa v4, v11, v18 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_mul_lo_u16_sdwa v4, v11, v18 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_mul_lo_u16_e32 v10, v10, v17			; GFX9-NEXT: v_mul_lo_u16_e32 v10, v10, v17
	; GFX9-NEXT: v_lshrrev_b32_e32 v7, 8, v5			; GFX9-NEXT: v_lshrrev_b32_e32 v7, 8, v5
	; GFX9-NEXT: v_or_b32_sdwa v4, v10, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD			; GFX9-NEXT: v_or_b32_sdwa v4, v10, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
	; GFX9-NEXT: v_mul_lo_u16_sdwa v9, v9, v16 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_mul_lo_u16_sdwa v9, v9, v16 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_mul_lo_u16_e32 v8, v8, v15			; GFX9-NEXT: v_mul_lo_u16_e32 v8, v8, v15
	; GFX9-NEXT: v_or_b32_sdwa v8, v8, v9 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD			; GFX9-NEXT: v_or_b32_sdwa v8, v8, v9 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
	; GFX9-NEXT: v_and_b32_e32 v4, s2, v4			; GFX9-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX9-NEXT: v_or_b32_e32 v6, v4, v8			; GFX9-NEXT: v_or_b32_e32 v6, v4, v8
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_add_u32_e32 v2, v3, v2			; GFX9-NEXT: v_add_u32_e32 v2, v3, v2
	; GFX9-NEXT: v_add_u32_e32 v2, v2, v7			; GFX9-NEXT: v_add_u32_e32 v2, v2, v7
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_2			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_2
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3
	; GFX9-NEXT: v_add_u32_e32 v2, v2, v4			; GFX9-NEXT: v_add_u32_e32 v2, v2, v4
	; GFX9-NEXT: v_lshrrev_b32_e32 v3, 8, v6			; GFX9-NEXT: v_lshrrev_b32_e32 v3, 8, v6
	; GFX9-NEXT: v_add_u32_e32 v2, v2, v3			; GFX9-NEXT: v_add_u32_e32 v2, v2, v3
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:WORD_1			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:WORD_1
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3
	; GFX9-NEXT: global_store_byte v[0:1], v2, off			; GFX9-NEXT: global_store_byte v[0:1], v2, off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX9-DL-LABEL: idot8_acc8_vecMul:			; GFX9-DL-LABEL: idot8_acc8_vecMul:
	; GFX9-DL: ; %bb.0: ; %entry			; GFX9-DL: ; %bb.0: ; %entry
	; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-DL-NEXT: s_mov_b32 s2, 0xffff
	; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DL-NEXT: v_mov_b32_e32 v0, s0			; GFX9-DL-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-DL-NEXT: v_mov_b32_e32 v1, s1			; GFX9-DL-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-DL-NEXT: global_load_ubyte v2, v[0:1], off			; GFX9-DL-NEXT: global_load_ubyte v2, v[0:1], off
	; GFX9-DL-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX9-DL-NEXT: s_load_dword s1, s[4:5], 0x0
	; GFX9-DL-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX9-DL-NEXT: s_load_dword s2, s[6:7], 0x0
				; GFX9-DL-NEXT: s_mov_b32 s0, 0xffff
	; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DL-NEXT: s_lshr_b32 s8, s0, 4			; GFX9-DL-NEXT: s_lshr_b32 s8, s1, 4
	; GFX9-DL-NEXT: s_lshr_b32 s15, s1, 4			; GFX9-DL-NEXT: s_lshr_b32 s15, s2, 4
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v3, 12, s0			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v3, 12, s1
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v4, 12, s1			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v4, 12, s2
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v7, 12, s8			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v7, 12, s8
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v14, 12, s15			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v14, 12, s15
	; GFX9-DL-NEXT: s_lshr_b32 s9, s0, 12			; GFX9-DL-NEXT: s_lshr_b32 s9, s1, 12
	; GFX9-DL-NEXT: s_lshr_b32 s10, s0, 8			; GFX9-DL-NEXT: s_lshr_b32 s10, s1, 8
	; GFX9-DL-NEXT: s_lshr_b32 s16, s1, 12			; GFX9-DL-NEXT: s_lshr_b32 s16, s2, 12
	; GFX9-DL-NEXT: s_lshr_b32 s17, s1, 8			; GFX9-DL-NEXT: s_lshr_b32 s17, s2, 8
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v5, 12, s10			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v5, 12, s10
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v6, 12, s9			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v6, 12, s9
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v12, 12, s17			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v12, 12, s17
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v13, 12, s16			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v13, 12, s16
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v3, 12, v3			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v3, 12, v3
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v4, 12, v4			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v4, 12, v4
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v7, 12, v7			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v7, 12, v7
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v14, 12, v14			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v14, 12, v14
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v5, 12, v5			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v5, 12, v5
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v12, 12, v12			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v12, 12, v12
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v6, 12, v6			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v6, 12, v6
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v13, 12, v13			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v13, 12, v13
	; GFX9-DL-NEXT: v_mul_lo_u16_e32 v3, v3, v4			; GFX9-DL-NEXT: v_mul_lo_u16_e32 v3, v3, v4
	; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v7, v7, v14 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v7, v7, v14 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_or_b32_sdwa v3, v3, v7 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD			; GFX9-DL-NEXT: v_or_b32_sdwa v3, v3, v7 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
	; GFX9-DL-NEXT: s_lshr_b32 s4, s0, 20			; GFX9-DL-NEXT: s_lshr_b32 s4, s1, 20
	; GFX9-DL-NEXT: s_lshr_b32 s5, s0, 16			; GFX9-DL-NEXT: s_lshr_b32 s5, s1, 16
	; GFX9-DL-NEXT: s_lshr_b32 s11, s1, 20			; GFX9-DL-NEXT: s_lshr_b32 s11, s2, 20
	; GFX9-DL-NEXT: s_lshr_b32 s12, s1, 16			; GFX9-DL-NEXT: s_lshr_b32 s12, s2, 16
	; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v6, v6, v13 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v6, v6, v13 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_mul_lo_u16_e32 v5, v5, v12			; GFX9-DL-NEXT: v_mul_lo_u16_e32 v5, v5, v12
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v10, 12, s5			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v10, 12, s5
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v11, 12, s4			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v11, 12, s4
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v17, 12, s12			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v17, 12, s12
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v18, 12, s11			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v18, 12, s11
	; GFX9-DL-NEXT: s_lshr_b32 s6, s0, 28			; GFX9-DL-NEXT: s_lshr_b32 s6, s1, 28
	; GFX9-DL-NEXT: s_lshr_b32 s7, s0, 24			; GFX9-DL-NEXT: s_lshr_b32 s7, s1, 24
	; GFX9-DL-NEXT: s_lshr_b32 s13, s1, 28			; GFX9-DL-NEXT: s_lshr_b32 s13, s2, 28
	; GFX9-DL-NEXT: s_lshr_b32 s14, s1, 24			; GFX9-DL-NEXT: s_lshr_b32 s14, s2, 24
	; GFX9-DL-NEXT: v_and_b32_e32 v3, s2, v3			; GFX9-DL-NEXT: v_and_b32_e32 v3, s0, v3
	; GFX9-DL-NEXT: v_or_b32_sdwa v5, v5, v6 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD			; GFX9-DL-NEXT: v_or_b32_sdwa v5, v5, v6 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v8, 12, s7			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v8, 12, s7
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v9, 12, s6			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v9, 12, s6
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v15, 12, s14			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v15, 12, s14
	; GFX9-DL-NEXT: v_lshlrev_b16_e64 v16, 12, s13			; GFX9-DL-NEXT: v_lshlrev_b16_e64 v16, 12, s13
	; GFX9-DL-NEXT: v_or_b32_e32 v5, v3, v5			; GFX9-DL-NEXT: v_or_b32_e32 v5, v3, v5
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v10, 12, v10			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v10, 12, v10
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v17, 12, v17			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v17, 12, v17
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v11, 12, v11			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v11, 12, v11
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v18, 12, v18			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v18, 12, v18
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v8, 12, v8			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v8, 12, v8
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v15, 12, v15			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v15, 12, v15
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v9, 12, v9			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v9, 12, v9
	; GFX9-DL-NEXT: v_ashrrev_i16_e32 v16, 12, v16			; GFX9-DL-NEXT: v_ashrrev_i16_e32 v16, 12, v16
	; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v4, v11, v18 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v4, v11, v18 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_mul_lo_u16_e32 v10, v10, v17			; GFX9-DL-NEXT: v_mul_lo_u16_e32 v10, v10, v17
	; GFX9-DL-NEXT: v_lshrrev_b32_e32 v7, 8, v5			; GFX9-DL-NEXT: v_lshrrev_b32_e32 v7, 8, v5
	; GFX9-DL-NEXT: v_or_b32_sdwa v4, v10, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD			; GFX9-DL-NEXT: v_or_b32_sdwa v4, v10, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
	; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v9, v9, v16 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v9, v9, v16 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_mul_lo_u16_e32 v8, v8, v15			; GFX9-DL-NEXT: v_mul_lo_u16_e32 v8, v8, v15
	; GFX9-DL-NEXT: v_or_b32_sdwa v8, v8, v9 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD			; GFX9-DL-NEXT: v_or_b32_sdwa v8, v8, v9 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
	; GFX9-DL-NEXT: v_and_b32_e32 v4, s2, v4			; GFX9-DL-NEXT: v_and_b32_e32 v4, s0, v4
	; GFX9-DL-NEXT: v_or_b32_e32 v6, v4, v8			; GFX9-DL-NEXT: v_or_b32_e32 v6, v4, v8
	; GFX9-DL-NEXT: s_waitcnt vmcnt(0)			; GFX9-DL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DL-NEXT: v_add_u32_e32 v2, v3, v2			; GFX9-DL-NEXT: v_add_u32_e32 v2, v3, v2
	; GFX9-DL-NEXT: v_add_u32_e32 v2, v2, v7			; GFX9-DL-NEXT: v_add_u32_e32 v2, v2, v7
	; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_2			; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_2
	; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3			; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v5 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3
	; GFX9-DL-NEXT: v_add_u32_e32 v2, v2, v4			; GFX9-DL-NEXT: v_add_u32_e32 v2, v2, v4
	; GFX9-DL-NEXT: v_lshrrev_b32_e32 v3, 8, v6			; GFX9-DL-NEXT: v_lshrrev_b32_e32 v3, 8, v6
	▲ Show 20 Lines • Show All 130 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/idot8u.ll

	Show First 20 Lines • Show All 2,412 Lines • ▼ Show 20 Lines
	; GFX8-NEXT: v_add_u32_sdwa v2, vcc, v6, v2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_3 src1_sel:DWORD			; GFX8-NEXT: v_add_u32_sdwa v2, vcc, v6, v2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_3 src1_sel:DWORD
	; GFX8-NEXT: flat_store_byte v[0:1], v2			; GFX8-NEXT: flat_store_byte v[0:1], v2
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: udot8_acc8_vecMul:			; GFX9-LABEL: udot8_acc8_vecMul:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NEXT: s_mov_b32 s2, 0xffff
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v0, s0			; GFX9-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-NEXT: v_mov_b32_e32 v1, s1			; GFX9-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NEXT: global_load_ubyte v2, v[0:1], off			; GFX9-NEXT: global_load_ubyte v2, v[0:1], off
	; GFX9-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX9-NEXT: s_load_dword s1, s[4:5], 0x0
	; GFX9-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX9-NEXT: s_load_dword s2, s[6:7], 0x0
				; GFX9-NEXT: s_mov_b32 s0, 0xffff
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_bfe_u32 s4, s0, 0x40010			; GFX9-NEXT: s_bfe_u32 s4, s1, 0x40010
	; GFX9-NEXT: s_bfe_u32 s11, s1, 0x40010			; GFX9-NEXT: s_bfe_u32 s11, s2, 0x40010
	; GFX9-NEXT: s_bfe_u32 s12, s1, 0x40014			; GFX9-NEXT: s_bfe_u32 s12, s2, 0x40014
	; GFX9-NEXT: s_bfe_u32 s13, s1, 0x40018			; GFX9-NEXT: s_bfe_u32 s13, s2, 0x40018
	; GFX9-NEXT: s_lshr_b32 s14, s1, 28			; GFX9-NEXT: s_lshr_b32 s14, s2, 28
	; GFX9-NEXT: s_and_b32 s15, s1, 15			; GFX9-NEXT: s_and_b32 s15, s2, 15
	; GFX9-NEXT: s_bfe_u32 s16, s1, 0x40004			; GFX9-NEXT: s_bfe_u32 s16, s2, 0x40004
	; GFX9-NEXT: s_bfe_u32 s17, s1, 0x40008			; GFX9-NEXT: s_bfe_u32 s17, s2, 0x40008
	; GFX9-NEXT: v_mov_b32_e32 v3, s11			; GFX9-NEXT: v_mov_b32_e32 v3, s11
	; GFX9-NEXT: s_bfe_u32 s1, s1, 0x4000c			; GFX9-NEXT: s_bfe_u32 s2, s2, 0x4000c
	; GFX9-NEXT: s_bfe_u32 s5, s0, 0x40014			; GFX9-NEXT: s_bfe_u32 s5, s1, 0x40014
	; GFX9-NEXT: v_mov_b32_e32 v4, s12			; GFX9-NEXT: v_mov_b32_e32 v4, s12
	; GFX9-NEXT: s_bfe_u32 s6, s0, 0x40018			; GFX9-NEXT: s_bfe_u32 s6, s1, 0x40018
	; GFX9-NEXT: v_mov_b32_e32 v5, s13			; GFX9-NEXT: v_mov_b32_e32 v5, s13
	; GFX9-NEXT: s_lshr_b32 s7, s0, 28			; GFX9-NEXT: s_lshr_b32 s7, s1, 28
	; GFX9-NEXT: v_mov_b32_e32 v6, s14			; GFX9-NEXT: v_mov_b32_e32 v6, s14
	; GFX9-NEXT: s_and_b32 s8, s0, 15			; GFX9-NEXT: s_and_b32 s8, s1, 15
	; GFX9-NEXT: v_mov_b32_e32 v7, s15			; GFX9-NEXT: v_mov_b32_e32 v7, s15
	; GFX9-NEXT: s_bfe_u32 s9, s0, 0x40004			; GFX9-NEXT: s_bfe_u32 s9, s1, 0x40004
	; GFX9-NEXT: v_mov_b32_e32 v8, s16			; GFX9-NEXT: v_mov_b32_e32 v8, s16
	; GFX9-NEXT: s_bfe_u32 s10, s0, 0x40008			; GFX9-NEXT: s_bfe_u32 s10, s1, 0x40008
	; GFX9-NEXT: v_mov_b32_e32 v9, s17			; GFX9-NEXT: v_mov_b32_e32 v9, s17
	; GFX9-NEXT: s_bfe_u32 s0, s0, 0x4000c			; GFX9-NEXT: s_bfe_u32 s1, s1, 0x4000c
	; GFX9-NEXT: v_mov_b32_e32 v10, s1			; GFX9-NEXT: v_mov_b32_e32 v10, s2
	; GFX9-NEXT: v_mul_lo_u16_e32 v3, s4, v3			; GFX9-NEXT: v_mul_lo_u16_e32 v3, s4, v3
	; GFX9-NEXT: v_mul_lo_u16_sdwa v4, s5, v4 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_mul_lo_u16_sdwa v4, s5, v4 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_mul_lo_u16_e32 v5, s6, v5			; GFX9-NEXT: v_mul_lo_u16_e32 v5, s6, v5
	; GFX9-NEXT: v_mul_lo_u16_sdwa v6, s7, v6 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_mul_lo_u16_sdwa v6, s7, v6 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_mul_lo_u16_e32 v7, s8, v7			; GFX9-NEXT: v_mul_lo_u16_e32 v7, s8, v7
	; GFX9-NEXT: v_mul_lo_u16_sdwa v8, s9, v8 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_mul_lo_u16_sdwa v8, s9, v8 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_or_b32_e32 v3, v3, v4			; GFX9-NEXT: v_or_b32_e32 v3, v3, v4
	; GFX9-NEXT: v_or_b32_sdwa v4, v5, v6 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_or_b32_sdwa v4, v5, v6 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_or_b32_e32 v5, v7, v8			; GFX9-NEXT: v_or_b32_e32 v5, v7, v8
	; GFX9-NEXT: v_mul_lo_u16_e32 v9, s10, v9			; GFX9-NEXT: v_mul_lo_u16_e32 v9, s10, v9
	; GFX9-NEXT: v_mul_lo_u16_sdwa v10, s0, v10 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_mul_lo_u16_sdwa v10, s1, v10 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_and_b32_e32 v5, s2, v5			; GFX9-NEXT: v_and_b32_e32 v5, s0, v5
	; GFX9-NEXT: v_or_b32_sdwa v6, v9, v10 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-NEXT: v_or_b32_sdwa v6, v9, v10 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-NEXT: v_or_b32_e32 v6, v5, v6			; GFX9-NEXT: v_or_b32_e32 v6, v5, v6
	; GFX9-NEXT: v_lshrrev_b32_e32 v7, 8, v6			; GFX9-NEXT: v_lshrrev_b32_e32 v7, 8, v6
	; GFX9-NEXT: v_and_b32_e32 v3, s2, v3			; GFX9-NEXT: v_and_b32_e32 v3, s0, v3
	; GFX9-NEXT: v_or_b32_e32 v4, v3, v4			; GFX9-NEXT: v_or_b32_e32 v4, v3, v4
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_add_u32_e32 v2, v5, v2			; GFX9-NEXT: v_add_u32_e32 v2, v5, v2
	; GFX9-NEXT: v_add_u32_e32 v2, v2, v7			; GFX9-NEXT: v_add_u32_e32 v2, v2, v7
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_2			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_2
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3
	; GFX9-NEXT: v_add_u32_e32 v2, v2, v3			; GFX9-NEXT: v_add_u32_e32 v2, v2, v3
	; GFX9-NEXT: v_lshrrev_b32_e32 v3, 8, v4			; GFX9-NEXT: v_lshrrev_b32_e32 v3, 8, v4
	; GFX9-NEXT: v_add_u32_e32 v2, v2, v3			; GFX9-NEXT: v_add_u32_e32 v2, v2, v3
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:WORD_1			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:WORD_1
	; GFX9-NEXT: v_add_u32_sdwa v2, v2, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3			; GFX9-NEXT: v_add_u32_sdwa v2, v2, v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3
	; GFX9-NEXT: global_store_byte v[0:1], v2, off			; GFX9-NEXT: global_store_byte v[0:1], v2, off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX9-DL-LABEL: udot8_acc8_vecMul:			; GFX9-DL-LABEL: udot8_acc8_vecMul:
	; GFX9-DL: ; %bb.0: ; %entry			; GFX9-DL: ; %bb.0: ; %entry
	; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-DL-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-DL-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-DL-NEXT: s_mov_b32 s2, 0xffff
	; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DL-NEXT: v_mov_b32_e32 v0, s0			; GFX9-DL-NEXT: v_mov_b32_e32 v0, s0
	; GFX9-DL-NEXT: v_mov_b32_e32 v1, s1			; GFX9-DL-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-DL-NEXT: global_load_ubyte v2, v[0:1], off			; GFX9-DL-NEXT: global_load_ubyte v2, v[0:1], off
	; GFX9-DL-NEXT: s_load_dword s0, s[4:5], 0x0			; GFX9-DL-NEXT: s_load_dword s1, s[4:5], 0x0
	; GFX9-DL-NEXT: s_load_dword s1, s[6:7], 0x0			; GFX9-DL-NEXT: s_load_dword s2, s[6:7], 0x0
				; GFX9-DL-NEXT: s_mov_b32 s0, 0xffff
	; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-DL-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-DL-NEXT: s_bfe_u32 s4, s0, 0x40010			; GFX9-DL-NEXT: s_bfe_u32 s4, s1, 0x40010
	; GFX9-DL-NEXT: s_bfe_u32 s11, s1, 0x40010			; GFX9-DL-NEXT: s_bfe_u32 s11, s2, 0x40010
	; GFX9-DL-NEXT: s_bfe_u32 s12, s1, 0x40014			; GFX9-DL-NEXT: s_bfe_u32 s12, s2, 0x40014
	; GFX9-DL-NEXT: s_bfe_u32 s13, s1, 0x40018			; GFX9-DL-NEXT: s_bfe_u32 s13, s2, 0x40018
	; GFX9-DL-NEXT: s_lshr_b32 s14, s1, 28			; GFX9-DL-NEXT: s_lshr_b32 s14, s2, 28
	; GFX9-DL-NEXT: s_and_b32 s15, s1, 15			; GFX9-DL-NEXT: s_and_b32 s15, s2, 15
	; GFX9-DL-NEXT: s_bfe_u32 s16, s1, 0x40004			; GFX9-DL-NEXT: s_bfe_u32 s16, s2, 0x40004
	; GFX9-DL-NEXT: s_bfe_u32 s17, s1, 0x40008			; GFX9-DL-NEXT: s_bfe_u32 s17, s2, 0x40008
	; GFX9-DL-NEXT: v_mov_b32_e32 v3, s11			; GFX9-DL-NEXT: v_mov_b32_e32 v3, s11
	; GFX9-DL-NEXT: s_bfe_u32 s1, s1, 0x4000c			; GFX9-DL-NEXT: s_bfe_u32 s2, s2, 0x4000c
	; GFX9-DL-NEXT: s_bfe_u32 s5, s0, 0x40014			; GFX9-DL-NEXT: s_bfe_u32 s5, s1, 0x40014
	; GFX9-DL-NEXT: v_mov_b32_e32 v4, s12			; GFX9-DL-NEXT: v_mov_b32_e32 v4, s12
	; GFX9-DL-NEXT: s_bfe_u32 s6, s0, 0x40018			; GFX9-DL-NEXT: s_bfe_u32 s6, s1, 0x40018
	; GFX9-DL-NEXT: v_mov_b32_e32 v5, s13			; GFX9-DL-NEXT: v_mov_b32_e32 v5, s13
	; GFX9-DL-NEXT: s_lshr_b32 s7, s0, 28			; GFX9-DL-NEXT: s_lshr_b32 s7, s1, 28
	; GFX9-DL-NEXT: v_mov_b32_e32 v6, s14			; GFX9-DL-NEXT: v_mov_b32_e32 v6, s14
	; GFX9-DL-NEXT: s_and_b32 s8, s0, 15			; GFX9-DL-NEXT: s_and_b32 s8, s1, 15
	; GFX9-DL-NEXT: v_mov_b32_e32 v7, s15			; GFX9-DL-NEXT: v_mov_b32_e32 v7, s15
	; GFX9-DL-NEXT: s_bfe_u32 s9, s0, 0x40004			; GFX9-DL-NEXT: s_bfe_u32 s9, s1, 0x40004
	; GFX9-DL-NEXT: v_mov_b32_e32 v8, s16			; GFX9-DL-NEXT: v_mov_b32_e32 v8, s16
	; GFX9-DL-NEXT: s_bfe_u32 s10, s0, 0x40008			; GFX9-DL-NEXT: s_bfe_u32 s10, s1, 0x40008
	; GFX9-DL-NEXT: v_mov_b32_e32 v9, s17			; GFX9-DL-NEXT: v_mov_b32_e32 v9, s17
	; GFX9-DL-NEXT: s_bfe_u32 s0, s0, 0x4000c			; GFX9-DL-NEXT: s_bfe_u32 s1, s1, 0x4000c
	; GFX9-DL-NEXT: v_mov_b32_e32 v10, s1			; GFX9-DL-NEXT: v_mov_b32_e32 v10, s2
	; GFX9-DL-NEXT: v_mul_lo_u16_e32 v3, s4, v3			; GFX9-DL-NEXT: v_mul_lo_u16_e32 v3, s4, v3
	; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v4, s5, v4 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v4, s5, v4 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_mul_lo_u16_e32 v5, s6, v5			; GFX9-DL-NEXT: v_mul_lo_u16_e32 v5, s6, v5
	; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v6, s7, v6 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v6, s7, v6 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_mul_lo_u16_e32 v7, s8, v7			; GFX9-DL-NEXT: v_mul_lo_u16_e32 v7, s8, v7
	; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v8, s9, v8 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v8, s9, v8 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_or_b32_e32 v3, v3, v4			; GFX9-DL-NEXT: v_or_b32_e32 v3, v3, v4
	; GFX9-DL-NEXT: v_or_b32_sdwa v4, v5, v6 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_or_b32_sdwa v4, v5, v6 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_or_b32_e32 v5, v7, v8			; GFX9-DL-NEXT: v_or_b32_e32 v5, v7, v8
	; GFX9-DL-NEXT: v_mul_lo_u16_e32 v9, s10, v9			; GFX9-DL-NEXT: v_mul_lo_u16_e32 v9, s10, v9
	; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v10, s0, v10 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_mul_lo_u16_sdwa v10, s1, v10 dst_sel:BYTE_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_and_b32_e32 v5, s2, v5			; GFX9-DL-NEXT: v_and_b32_e32 v5, s0, v5
	; GFX9-DL-NEXT: v_or_b32_sdwa v6, v9, v10 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; GFX9-DL-NEXT: v_or_b32_sdwa v6, v9, v10 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; GFX9-DL-NEXT: v_or_b32_e32 v6, v5, v6			; GFX9-DL-NEXT: v_or_b32_e32 v6, v5, v6
	; GFX9-DL-NEXT: v_lshrrev_b32_e32 v7, 8, v6			; GFX9-DL-NEXT: v_lshrrev_b32_e32 v7, 8, v6
	; GFX9-DL-NEXT: v_and_b32_e32 v3, s2, v3			; GFX9-DL-NEXT: v_and_b32_e32 v3, s0, v3
	; GFX9-DL-NEXT: v_or_b32_e32 v4, v3, v4			; GFX9-DL-NEXT: v_or_b32_e32 v4, v3, v4
	; GFX9-DL-NEXT: s_waitcnt vmcnt(0)			; GFX9-DL-NEXT: s_waitcnt vmcnt(0)
	; GFX9-DL-NEXT: v_add_u32_e32 v2, v5, v2			; GFX9-DL-NEXT: v_add_u32_e32 v2, v5, v2
	; GFX9-DL-NEXT: v_add_u32_e32 v2, v2, v7			; GFX9-DL-NEXT: v_add_u32_e32 v2, v2, v7
	; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_2			; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:BYTE_2
	; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3			; GFX9-DL-NEXT: v_add_u32_sdwa v2, v2, v6 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_3
	; GFX9-DL-NEXT: v_add_u32_e32 v2, v2, v3			; GFX9-DL-NEXT: v_add_u32_e32 v2, v2, v3
	; GFX9-DL-NEXT: v_lshrrev_b32_e32 v3, 8, v4			; GFX9-DL-NEXT: v_lshrrev_b32_e32 v3, 8, v4
	▲ Show 20 Lines • Show All 613 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/insert_vector_elt.v2i16.ll

	Show First 20 Lines • Show All 1,102 Lines • ▼ Show 20 Lines
	define amdgpu_kernel void @s_insertelement_v2i16_dynamic(<2 x i16> addrspace(1)* %out, <2 x i16> addrspace(4)* %vec.ptr, i32 addrspace(4)* %idx.ptr) #0 {			define amdgpu_kernel void @s_insertelement_v2i16_dynamic(<2 x i16> addrspace(1)* %out, <2 x i16> addrspace(4)* %vec.ptr, i32 addrspace(4)* %idx.ptr) #0 {
	; GFX9-LABEL: s_insertelement_v2i16_dynamic:			; GFX9-LABEL: s_insertelement_v2i16_dynamic:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0			; GFX9-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[4:5], 0x10			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[4:5], 0x10
	; GFX9-NEXT: v_mov_b32_e32 v2, 0x3e703e7			; GFX9-NEXT: v_mov_b32_e32 v2, 0x3e703e7
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v0, s0			; GFX9-NEXT: v_mov_b32_e32 v0, s0
				; GFX9-NEXT: s_load_dword s4, s[4:5], 0x0
				; GFX9-NEXT: s_load_dword s2, s[2:3], 0x0
	; GFX9-NEXT: v_mov_b32_e32 v1, s1			; GFX9-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NEXT: s_load_dword s0, s[4:5], 0x0
	; GFX9-NEXT: s_load_dword s1, s[2:3], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_lshl_b32 s0, s0, 4			; GFX9-NEXT: s_lshl_b32 s0, s4, 4
	; GFX9-NEXT: s_lshl_b32 s0, 0xffff, s0			; GFX9-NEXT: s_lshl_b32 s0, 0xffff, s0
	; GFX9-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NEXT: v_mov_b32_e32 v3, s2
	; GFX9-NEXT: v_bfi_b32 v2, s0, v2, v3			; GFX9-NEXT: v_bfi_b32 v2, s0, v2, v3
	; GFX9-NEXT: global_store_dword v[0:1], v2, off			; GFX9-NEXT: global_store_dword v[0:1], v2, off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; VI-LABEL: s_insertelement_v2i16_dynamic:			; VI-LABEL: s_insertelement_v2i16_dynamic:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0			; VI-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0
	; VI-NEXT: s_load_dwordx4 s[4:7], s[4:5], 0x10			; VI-NEXT: s_load_dwordx4 s[4:7], s[4:5], 0x10
	; VI-NEXT: v_mov_b32_e32 v2, 0x3e703e7			; VI-NEXT: v_mov_b32_e32 v2, 0x3e703e7
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v0, s0			; VI-NEXT: v_mov_b32_e32 v0, s0
				; VI-NEXT: s_load_dword s4, s[4:5], 0x0
				; VI-NEXT: s_load_dword s2, s[2:3], 0x0
	; VI-NEXT: v_mov_b32_e32 v1, s1			; VI-NEXT: v_mov_b32_e32 v1, s1
	; VI-NEXT: s_load_dword s0, s[4:5], 0x0
	; VI-NEXT: s_load_dword s1, s[2:3], 0x0
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_lshl_b32 s0, s0, 4			; VI-NEXT: s_lshl_b32 s0, s4, 4
	; VI-NEXT: s_lshl_b32 s0, 0xffff, s0			; VI-NEXT: s_lshl_b32 s0, 0xffff, s0
	; VI-NEXT: v_mov_b32_e32 v3, s1			; VI-NEXT: v_mov_b32_e32 v3, s2
	; VI-NEXT: v_bfi_b32 v2, s0, v2, v3			; VI-NEXT: v_bfi_b32 v2, s0, v2, v3
	; VI-NEXT: flat_store_dword v[0:1], v2			; VI-NEXT: flat_store_dword v[0:1], v2
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; CI-LABEL: s_insertelement_v2i16_dynamic:			; CI-LABEL: s_insertelement_v2i16_dynamic:
	; CI: ; %bb.0:			; CI: ; %bb.0:
	; CI-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0			; CI-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0
	; CI-NEXT: s_load_dwordx4 s[4:7], s[4:5], 0x4			; CI-NEXT: s_load_dwordx4 s[4:7], s[4:5], 0x4
	; CI-NEXT: v_mov_b32_e32 v2, 0x3e703e7			; CI-NEXT: v_mov_b32_e32 v2, 0x3e703e7
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: v_mov_b32_e32 v0, s0			; CI-NEXT: v_mov_b32_e32 v0, s0
				; CI-NEXT: s_load_dword s4, s[4:5], 0x0
				; CI-NEXT: s_load_dword s2, s[2:3], 0x0
	; CI-NEXT: v_mov_b32_e32 v1, s1			; CI-NEXT: v_mov_b32_e32 v1, s1
	; CI-NEXT: s_load_dword s0, s[4:5], 0x0
	; CI-NEXT: s_load_dword s1, s[2:3], 0x0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_lshl_b32 s0, s0, 4			; CI-NEXT: s_lshl_b32 s0, s4, 4
	; CI-NEXT: s_lshl_b32 s0, 0xffff, s0			; CI-NEXT: s_lshl_b32 s0, 0xffff, s0
	; CI-NEXT: v_mov_b32_e32 v3, s1			; CI-NEXT: v_mov_b32_e32 v3, s2
	; CI-NEXT: v_bfi_b32 v2, s0, v2, v3			; CI-NEXT: v_bfi_b32 v2, s0, v2, v3
	; CI-NEXT: flat_store_dword v[0:1], v2			; CI-NEXT: flat_store_dword v[0:1], v2
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%idx = load volatile i32, i32 addrspace(4)* %idx.ptr			%idx = load volatile i32, i32 addrspace(4)* %idx.ptr
	%vec = load <2 x i16>, <2 x i16> addrspace(4)* %vec.ptr			%vec = load <2 x i16>, <2 x i16> addrspace(4)* %vec.ptr
	%vecins = insertelement <2 x i16> %vec, i16 999, i32 %idx			%vecins = insertelement <2 x i16> %vec, i16 999, i32 %idx
	store <2 x i16> %vecins, <2 x i16> addrspace(1)* %out			store <2 x i16> %vecins, <2 x i16> addrspace(1)* %out
	ret void			ret void
	▲ Show 20 Lines • Show All 718 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.buffer.atomic.ll

	;RUN: llc < %s -march=amdgcn -mcpu=verde -amdgpu-atomic-optimizations=false -verify-machineinstrs \| FileCheck %s -check-prefix=CHECK -check-prefix=SICI			;RUN: llc < %s -march=amdgcn -mcpu=verde -amdgpu-atomic-optimizations=false -verify-machineinstrs \| FileCheck %s -check-prefix=CHECK -check-prefix=SICI
	;RUN: llc < %s -march=amdgcn -mcpu=tonga -amdgpu-atomic-optimizations=false -verify-machineinstrs \| FileCheck %s -check-prefix=CHECK -check-prefix=VI			;RUN: llc < %s -march=amdgcn -mcpu=tonga -amdgpu-atomic-optimizations=false -verify-machineinstrs \| FileCheck %s -check-prefix=CHECK -check-prefix=VI

	;CHECK-LABEL: {{^}}test1:			;CHECK-LABEL: {{^}}test1:
	;CHECK-NOT: s_waitcnt			;CHECK-NOT: s_waitcnt
	;CHECK: buffer_atomic_swap v0, off, s[0:3], 0 glc			;CHECK: buffer_atomic_swap v0, off, s[0:3], 0 glc
				;SICI: v_mov_b32_e32 v3, 0x2000
	;VI: s_movk_i32 [[SOFS:s[0-9]+]], 0x1ffc			;VI: s_movk_i32 [[SOFS:s[0-9]+]], 0x1ffc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, v1, s[0:3], 0 idxen glc			;CHECK: buffer_atomic_swap v0, v1, s[0:3], 0 idxen glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, v2, s[0:3], 0 offen glc			;CHECK: buffer_atomic_swap v0, v2, s[0:3], 0 offen glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, v[1:2], s[0:3], 0 idxen offen glc			;CHECK: buffer_atomic_swap v0, v[1:2], s[0:3], 0 idxen offen glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, v2, s[0:3], 0 offen offset:42 glc			;CHECK: buffer_atomic_swap v0, v2, s[0:3], 0 offen offset:42 glc
	;CHECK-DAG: s_waitcnt vmcnt(0)			;CHECK-DAG: s_waitcnt vmcnt(0)
	;SICI: buffer_atomic_swap v0, v1, s[0:3], 0 offen glc			;SICI: buffer_atomic_swap v0, v3, s[0:3], 0 offen glc
	;VI: buffer_atomic_swap v0, off, s[0:3], [[SOFS]] offset:4 glc			;VI: buffer_atomic_swap v0, off, s[0:3], [[SOFS]] offset:4 glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, off, s[0:3], 0{{$}}			;CHECK: buffer_atomic_swap v0, off, s[0:3], 0{{$}}
	define amdgpu_ps float @test1(<4 x i32> inreg %rsrc, i32 %data, i32 %vindex, i32 %voffset) {			define amdgpu_ps float @test1(<4 x i32> inreg %rsrc, i32 %data, i32 %vindex, i32 %voffset) {
	main_body:			main_body:
	%o1 = call i32 @llvm.amdgcn.buffer.atomic.swap.i32(i32 %data, <4 x i32> %rsrc, i32 0, i32 0, i1 0)			%o1 = call i32 @llvm.amdgcn.buffer.atomic.swap.i32(i32 %data, <4 x i32> %rsrc, i32 0, i32 0, i1 0)
	%o2 = call i32 @llvm.amdgcn.buffer.atomic.swap.i32(i32 %o1, <4 x i32> %rsrc, i32 %vindex, i32 0, i1 0)			%o2 = call i32 @llvm.amdgcn.buffer.atomic.swap.i32(i32 %o1, <4 x i32> %rsrc, i32 %vindex, i32 0, i1 0)
	%o3 = call i32 @llvm.amdgcn.buffer.atomic.swap.i32(i32 %o2, <4 x i32> %rsrc, i32 0, i32 %voffset, i1 0)			%o3 = call i32 @llvm.amdgcn.buffer.atomic.swap.i32(i32 %o2, <4 x i32> %rsrc, i32 0, i32 %voffset, i1 0)
	▲ Show 20 Lines • Show All 183 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.struct.buffer.atomic.ll

	;RUN: llc < %s -march=amdgcn -mcpu=verde -amdgpu-atomic-optimizations=false -verify-machineinstrs \| FileCheck %s -check-prefix=CHECK -check-prefix=SICI			;RUN: llc < %s -march=amdgcn -mcpu=verde -amdgpu-atomic-optimizations=false -verify-machineinstrs \| FileCheck %s -check-prefix=CHECK -check-prefix=SICI
	;RUN: llc < %s -march=amdgcn -mcpu=tonga -amdgpu-atomic-optimizations=false -verify-machineinstrs \| FileCheck %s -check-prefix=CHECK -check-prefix=VI			;RUN: llc < %s -march=amdgcn -mcpu=tonga -amdgpu-atomic-optimizations=false -verify-machineinstrs \| FileCheck %s -check-prefix=CHECK -check-prefix=VI

	;CHECK-LABEL: {{^}}test1:			;CHECK-LABEL: {{^}}test1:
	;CHECK-NOT: s_waitcnt			;CHECK-NOT: s_waitcnt
	;CHECK: buffer_atomic_swap v0, {{v[0-9]+}}, s[0:3], 0 idxen glc			;CHECK: buffer_atomic_swap v0, {{v[0-9]+}}, s[0:3], 0 idxen glc
				;CHECK: s_movk_i32 [[SOFS:s[0-9]+]], 0x1ffc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, {{v[0-9]+}}, s[0:3], 0 idxen glc			;CHECK: buffer_atomic_swap v0, {{v[0-9]+}}, s[0:3], 0 idxen glc
	;CHECK: s_movk_i32 [[SOFS:s[0-9]+]], 0x1ffc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen glc			;CHECK: buffer_atomic_swap v0, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen glc			;CHECK: buffer_atomic_swap v0, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, v[1:2], s[0:3], 0 idxen offen offset:42 glc			;CHECK: buffer_atomic_swap v0, v[1:2], s[0:3], 0 idxen offen offset:42 glc
	;CHECK-DAG: s_waitcnt vmcnt(0)			;CHECK-DAG: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_swap v0, {{v[0-9]+}}, s[0:3], [[SOFS]] idxen offset:4 glc			;CHECK: buffer_atomic_swap v0, {{v[0-9]+}}, s[0:3], [[SOFS]] idxen offset:4 glc
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; Ideally, we would teach tablegen & friends that cmpswap only modifies the			; Ideally, we would teach tablegen & friends that cmpswap only modifies the
	; first vgpr. Since we don't do that yet, the register allocator will have to			; first vgpr. Since we don't do that yet, the register allocator will have to
	; create copies which we don't bother to track here.			; create copies which we don't bother to track here.
	;			;
	;CHECK-LABEL: {{^}}test3:			;CHECK-LABEL: {{^}}test3:
	;CHECK-NOT: s_waitcnt			;CHECK-NOT: s_waitcnt
	;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v[0-9]+}}, s[0:3], 0 idxen glc			;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v[0-9]+}}, s[0:3], 0 idxen glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, v2, s[0:3], 0 idxen glc
	;CHECK: s_waitcnt vmcnt(0)
	;CHECK: s_movk_i32 [[SOFS:s[0-9]+]], 0x1ffc			;CHECK: s_movk_i32 [[SOFS:s[0-9]+]], 0x1ffc
				;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, v4, s[0:3], 0 idxen glc
				;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen glc			;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen glc			;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen glc
	;CHECK: s_waitcnt vmcnt(0)			;CHECK: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen offset:44 glc			;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, s[0:3], 0 idxen offen offset:44 glc
	;CHECK-DAG: s_waitcnt vmcnt(0)			;CHECK-DAG: s_waitcnt vmcnt(0)
	;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v[0-9]+}}, s[0:3], [[SOFS]] idxen offset:4 glc			;CHECK: buffer_atomic_cmpswap {{v\[[0-9]+:[0-9]+\]}}, {{v[0-9]+}}, s[0:3], [[SOFS]] idxen offset:4 glc
	define amdgpu_ps float @test3(<4 x i32> inreg %rsrc, i32 %data, i32 %cmp, i32 %vindex, i32 %voffset) {			define amdgpu_ps float @test3(<4 x i32> inreg %rsrc, i32 %data, i32 %cmp, i32 %vindex, i32 %voffset) {
	▲ Show 20 Lines • Show All 43 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.ubfe.ll

	Show First 20 Lines • Show All 1,553 Lines • ▼ Show 20 Lines
	; SI-NEXT: v_bfe_u32 v1, v0, 2, 2			; SI-NEXT: v_bfe_u32 v1, v0, 2, 2
	; SI-NEXT: buffer_store_dword v1, off, s[8:11], 0			; SI-NEXT: buffer_store_dword v1, off, s[8:11], 0
	; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: simplify_bfe_u32_multi_use_arg:			; VI-LABEL: simplify_bfe_u32_multi_use_arg:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; VI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34			; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s10, s2			; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_mov_b32 s11, s3			; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: buffer_load_dword v0, off, s[8:11], 0			; VI-NEXT: buffer_load_dword v0, off, s[0:3], 0
	; VI-NEXT: s_mov_b32 s0, s6			; VI-NEXT: s_mov_b32 s8, s6
	; VI-NEXT: s_mov_b32 s1, s7			; VI-NEXT: s_mov_b32 s9, s7
	; VI-NEXT: s_mov_b32 s6, s2			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s3			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_and_b32_e32 v0, 63, v0			; VI-NEXT: v_and_b32_e32 v0, 63, v0
	; VI-NEXT: v_bfe_u32 v1, v0, 2, 2			; VI-NEXT: v_bfe_u32 v1, v0, 2, 2
	; VI-NEXT: buffer_store_dword v1, off, s[4:7], 0			; VI-NEXT: buffer_store_dword v1, off, s[4:7], 0
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	i32 addrspace(1)* %out1,			i32 addrspace(1)* %out1,
	i32 addrspace(1)* %in) #0 {			i32 addrspace(1)* %in) #0 {
	%src = load i32, i32 addrspace(1)* %in, align 4			%src = load i32, i32 addrspace(1)* %in, align 4
	%and = and i32 %src, 63			%and = and i32 %src, 63
	%bfe_u32 = call i32 @llvm.amdgcn.ubfe.i32(i32 %and, i32 2, i32 2)			%bfe_u32 = call i32 @llvm.amdgcn.ubfe.i32(i32 %and, i32 2, i32 2)
	store i32 %bfe_u32, i32 addrspace(1)* %out0, align 4			store i32 %bfe_u32, i32 addrspace(1)* %out0, align 4
	store i32 %and, i32 addrspace(1)* %out1, align 4			store i32 %and, i32 addrspace(1)* %out1, align 4
	▲ Show 20 Lines • Show All 157 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/llvm.fma.f16.ll

Show First 20 Lines • Show All 167 Lines • ▼ Show 20 Lines
; SI: v_cvt_f32_f16_e32 v[[C_F32_0:[0-9]+]], v[[C_V2_F16]]		; SI: v_cvt_f32_f16_e32 v[[C_F32_0:[0-9]+]], v[[C_V2_F16]]
; SI: v_cvt_f32_f16_e32 v[[B_F32_0:[0-9]+]], v[[B_V2_F16]]		; SI: v_cvt_f32_f16_e32 v[[B_F32_0:[0-9]+]], v[[B_V2_F16]]

; SI: v_fma_f32 v[[R_F32_1:[0-9]+]], v[[B_F32_1]], s[[A_F32]], v[[C_F32_1]]		; SI: v_fma_f32 v[[R_F32_1:[0-9]+]], v[[B_F32_1]], s[[A_F32]], v[[C_F32_1]]
; SI-DAG: v_fma_f32 v[[R_F32_0:[0-9]+]], v[[B_F32_0]], s[[A_F32]], v[[C_F32_0]]		; SI-DAG: v_fma_f32 v[[R_F32_0:[0-9]+]], v[[B_F32_0]], s[[A_F32]], v[[C_F32_0]]
; SI-DAG: v_cvt_f16_f32_e32 v[[R_F16_0:[0-9]+]], v[[R_F32_0]]		; SI-DAG: v_cvt_f16_f32_e32 v[[R_F16_0:[0-9]+]], v[[R_F32_0]]
; SI-DAG: v_cvt_f16_f32_e32 v[[R_F16_1:[0-9]+]], v[[R_F32_1]]		; SI-DAG: v_cvt_f16_f32_e32 v[[R_F16_1:[0-9]+]], v[[R_F32_1]]

; VI-DAG: v_fma_f16 v[[R_F16_1:[0-9]+]], v[[C_F16_1]], s[[A_F16]], v[[B_F16_1]]		; VI-DAG: v_fma_f16 v[[R_F16_1:[0-9]+]], v[[B_F16_1]], s[[A_F16]], v[[C_F16_1]]
; VI-DAG: v_fma_f16 v[[R_F16_0:[0-9]+]], v[[C_V2_F16]], s[[A_F16]], v[[B_V2_F16]]		; VI-DAG: v_fma_f16 v[[R_F16_0:[0-9]+]], v[[B_V2_F16]], s[[A_F16]], v[[C_V2_F16]]

; GFX9: v_pk_fma_f16 v[[R_V2_F16:[0-9]+]], v[[C_V2_F16]], s[[A_F16]], v[[B_V2_F16]]		; GFX9: v_pk_fma_f16 v[[R_V2_F16:[0-9]+]], v[[C_V2_F16]], s[[A_F16]], v[[B_V2_F16]]

; SIVI-DAG: v_lshlrev_b32_e32 v[[R_F16_HI:[0-9]+]], 16, v[[R_F16_1]]		; SIVI-DAG: v_lshlrev_b32_e32 v[[R_F16_HI:[0-9]+]], 16, v[[R_F16_1]]
; GCN-NOT: and		; GCN-NOT: and
; SIVI: v_or_b32_e32 v[[R_V2_F16:[0-9]+]], v[[R_F16_0]], v[[R_F16_HI]]		; SIVI: v_or_b32_e32 v[[R_V2_F16:[0-9]+]], v[[R_F16_0]], v[[R_F16_HI]]
; GCN: buffer_store_dword v[[R_V2_F16]]		; GCN: buffer_store_dword v[[R_V2_F16]]
; GCN: s_endpgm		; GCN: s_endpgm
define amdgpu_kernel void @fma_v2f16_imm_a(		define amdgpu_kernel void @fma_v2f16_imm_a(
<2 x half> addrspace(1)* %r,		<2 x half> addrspace(1)* %r,
<2 x half> addrspace(1)* %b,		<2 x half> addrspace(1)* %b,
<2 x half> addrspace(1)* %c) {		<2 x half> addrspace(1)* %c) {
%b.val = load <2 x half>, <2 x half> addrspace(1)* %b		%b.val = load <2 x half>, <2 x half> addrspace(1)* %b
%c.val = load <2 x half>, <2 x half> addrspace(1)* %c		%c.val = load <2 x half>, <2 x half> addrspace(1)* %c
%r.val = call <2 x half> @llvm.fma.v2f16(<2 x half> <half 3.0, half 3.0>, <2 x half> %b.val, <2 x half> %c.val)		%r.val = call <2 x half> @llvm.fma.v2f16(<2 x half> <half 3.0, half 3.0>, <2 x half> %b.val, <2 x half> %c.val)
store <2 x half> %r.val, <2 x half> addrspace(1)* %r		store <2 x half> %r.val, <2 x half> addrspace(1)* %r
ret void		ret void
}		}

; GCN-LABEL: {{^}}fma_v2f16_imm_b:		; GCN-LABEL: {{^}}fma_v2f16_imm_b:
; SI: buffer_load_dword v[[C_V2_F16:[0-9]+]]		; SI: buffer_load_dword v[[C_V2_F16:[0-9]+]]
; SI: buffer_load_dword v[[A_V2_F16:[0-9]+]]		; SI: buffer_load_dword v[[A_V2_F16:[0-9]+]]

		; VI: buffer_load_dword v[[C_V2_F16:[0-9]+]]
; VIGFX9: buffer_load_dword v[[A_V2_F16:[0-9]+]]		; VIGFX9: buffer_load_dword v[[A_V2_F16:[0-9]+]]
; VIGFX9: buffer_load_dword v[[C_V2_F16:[0-9]+]]		; GFX9: buffer_load_dword v[[C_V2_F16:[0-9]+]]

; SI: s_mov_b32 s[[B_F32:[0-9]+]], 0x40400000{{$}}		; SI: s_mov_b32 s[[B_F32:[0-9]+]], 0x40400000{{$}}
; VIGFX9: s_movk_i32 s[[B_F16:[0-9]+]], 0x4200{{$}}		; VIGFX9: s_movk_i32 s[[B_F16:[0-9]+]], 0x4200{{$}}

; SI-DAG: v_cvt_f32_f16_e32 v[[A_F32_0:[0-9]+]], v[[A_V2_F16]]		; SI-DAG: v_cvt_f32_f16_e32 v[[A_F32_0:[0-9]+]], v[[A_V2_F16]]
; SI-DAG: v_lshrrev_b32_e32 v[[A_F16_1:[0-9]+]], 16, v[[A_V2_F16]]		; SI-DAG: v_lshrrev_b32_e32 v[[A_F16_1:[0-9]+]], 16, v[[A_V2_F16]]
; SI-DAG: v_cvt_f32_f16_e32 v[[C_F32_0:[0-9]+]], v[[C_V2_F16]]		; SI-DAG: v_cvt_f32_f16_e32 v[[C_F32_0:[0-9]+]], v[[C_V2_F16]]
; SI-DAG: v_lshrrev_b32_e32 v[[C_F16_1:[0-9]+]], 16, v[[C_V2_F16]]		; SI-DAG: v_lshrrev_b32_e32 v[[C_F16_1:[0-9]+]], 16, v[[C_V2_F16]]
Show All 27 Lines	define amdgpu_kernel void @fma_v2f16_imm_b(
store <2 x half> %r.val, <2 x half> addrspace(1)* %r		store <2 x half> %r.val, <2 x half> addrspace(1)* %r
ret void		ret void
}		}

; GCN-LABEL: {{^}}fma_v2f16_imm_c:		; GCN-LABEL: {{^}}fma_v2f16_imm_c:
; SI: buffer_load_dword v[[B_V2_F16:[0-9]+]]		; SI: buffer_load_dword v[[B_V2_F16:[0-9]+]]
; SI: buffer_load_dword v[[A_V2_F16:[0-9]+]]		; SI: buffer_load_dword v[[A_V2_F16:[0-9]+]]

; VIGFX9: buffer_load_dword v[[A_V2_F16:[0-9]+]]		; GFX9: buffer_load_dword v[[A_V2_F16:[0-9]+]]
; VIGFX9: buffer_load_dword v[[B_V2_F16:[0-9]+]]		; VIGFX9: buffer_load_dword v[[B_V2_F16:[0-9]+]]
		; VI: buffer_load_dword v[[A_V2_F16:[0-9]+]]

; SI: s_mov_b32 s[[C_F32:[0-9]+]], 0x40400000{{$}}		; SI: s_mov_b32 s[[C_F32:[0-9]+]], 0x40400000{{$}}
; VIGFX9: s_movk_i32 s[[C_F16:[0-9]+]], 0x4200{{$}}		; VIGFX9: s_movk_i32 s[[C_F16:[0-9]+]], 0x4200{{$}}

; SI: v_lshrrev_b32_e32 v[[B_F16_1:[0-9]+]], 16, v[[B_V2_F16]]		; SI: v_lshrrev_b32_e32 v[[B_F16_1:[0-9]+]], 16, v[[B_V2_F16]]
; SI: v_lshrrev_b32_e32 v[[A_F16_1:[0-9]+]], 16, v[[A_V2_F16]]		; SI: v_lshrrev_b32_e32 v[[A_F16_1:[0-9]+]], 16, v[[A_V2_F16]]

; SI-DAG: v_cvt_f32_f16_e32 v[[A_F32_0:[0-9]+]], v[[A_V2_F16]]		; SI-DAG: v_cvt_f32_f16_e32 v[[A_F32_0:[0-9]+]], v[[A_V2_F16]]
▲ Show 20 Lines • Show All 105 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/llvm.maxnum.f16.ll

	Show All 34 Lines
	; SI-NEXT: v_max_f32_e32 v0, v0, v1			; SI-NEXT: v_max_f32_e32 v0, v0, v1
	; SI-NEXT: v_cvt_f16_f32_e32 v0, v0			; SI-NEXT: v_cvt_f16_f32_e32 v0, v0
	; SI-NEXT: buffer_store_short v0, off, s[8:11], 0			; SI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: maxnum_f16:			; VI-LABEL: maxnum_f16:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; VI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34			; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s10, s2			; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_mov_b32 s0, s4			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s1, s5			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s4, s6			; VI-NEXT: s_mov_b32 s13, s7
	; VI-NEXT: s_mov_b32 s5, s7			; VI-NEXT: s_mov_b32 s14, s10
	; VI-NEXT: s_mov_b32 s11, s3			; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: s_mov_b32 s6, s2			; VI-NEXT: buffer_load_ushort v0, off, s[12:15], 0
	; VI-NEXT: s_mov_b32 s7, s3			; VI-NEXT: buffer_load_ushort v1, off, s[0:3], 0
	; VI-NEXT: buffer_load_ushort v0, off, s[4:7], 0			; VI-NEXT: s_mov_b32 s8, s4
	; VI-NEXT: buffer_load_ushort v1, off, s[8:11], 0			; VI-NEXT: s_mov_b32 s9, s5
	; VI-NEXT: s_waitcnt vmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1)
	; VI-NEXT: v_max_f16_e32 v0, v0, v0			; VI-NEXT: v_max_f16_e32 v0, v0, v0
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_max_f16_e32 v1, v1, v1			; VI-NEXT: v_max_f16_e32 v1, v1, v1
	; VI-NEXT: v_max_f16_e32 v0, v0, v1			; VI-NEXT: v_max_f16_e32 v0, v0, v1
	; VI-NEXT: buffer_store_short v0, off, s[0:3], 0			; VI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: maxnum_f16:			; GFX9-LABEL: maxnum_f16:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s11, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s10, -1
	; GFX9-NEXT: s_mov_b32 s10, s2			; GFX9-NEXT: s_mov_b32 s2, s10
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_mov_b32 s3, s11
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s12, s6
	; GFX9-NEXT: s_mov_b32 s4, s6			; GFX9-NEXT: s_mov_b32 s13, s7
	; GFX9-NEXT: s_mov_b32 s5, s7			; GFX9-NEXT: s_mov_b32 s14, s10
	; GFX9-NEXT: s_mov_b32 s11, s3			; GFX9-NEXT: s_mov_b32 s15, s11
	; GFX9-NEXT: s_mov_b32 s6, s2			; GFX9-NEXT: buffer_load_ushort v0, off, s[12:15], 0
	; GFX9-NEXT: s_mov_b32 s7, s3			; GFX9-NEXT: buffer_load_ushort v1, off, s[0:3], 0
	; GFX9-NEXT: buffer_load_ushort v0, off, s[4:7], 0			; GFX9-NEXT: s_mov_b32 s8, s4
	; GFX9-NEXT: buffer_load_ushort v1, off, s[8:11], 0			; GFX9-NEXT: s_mov_b32 s9, s5
	; GFX9-NEXT: s_waitcnt vmcnt(1)			; GFX9-NEXT: s_waitcnt vmcnt(1)
	; GFX9-NEXT: v_max_f16_e32 v0, v0, v0			; GFX9-NEXT: v_max_f16_e32 v0, v0, v0
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_max_f16_e32 v1, v1, v1			; GFX9-NEXT: v_max_f16_e32 v1, v1, v1
	; GFX9-NEXT: v_max_f16_e32 v0, v0, v1			; GFX9-NEXT: v_max_f16_e32 v0, v0, v1
	; GFX9-NEXT: buffer_store_short v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_short v0, off, s[8:11], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	half addrspace(1)* %r,			half addrspace(1)* %r,
	half addrspace(1)* %a,			half addrspace(1)* %a,
	half addrspace(1)* %b) {			half addrspace(1)* %b) {
	entry:			entry:
	%a.val = load volatile half, half addrspace(1)* %a			%a.val = load volatile half, half addrspace(1)* %a
	%b.val = load volatile half, half addrspace(1)* %b			%b.val = load volatile half, half addrspace(1)* %b
	%r.val = call half @llvm.maxnum.f16(half %a.val, half %b.val)			%r.val = call half @llvm.maxnum.f16(half %a.val, half %b.val)
	▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
	; VI-NEXT: v_max_f16_sdwa v1, v2, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; VI-NEXT: v_max_f16_sdwa v1, v2, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: maxnum_v2f16:			; GFX9-LABEL: maxnum_v2f16:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_load_dword s6, s[6:7], 0x0
				; GFX9-NEXT: s_load_dword s7, s[0:1], 0x0
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: s_load_dword s4, s[6:7], 0x0
	; GFX9-NEXT: s_load_dword s5, s[8:9], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_pk_max_f16 v1, s4, s4			; GFX9-NEXT: v_pk_max_f16 v1, s6, s6
	; GFX9-NEXT: v_pk_max_f16 v0, s5, s5			; GFX9-NEXT: v_pk_max_f16 v0, s7, s7
	; GFX9-NEXT: v_pk_max_f16 v0, v1, v0			; GFX9-NEXT: v_pk_max_f16 v0, v1, v0
	; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a,			<2 x half> addrspace(1)* %a,
	<2 x half> addrspace(1)* %b) {			<2 x half> addrspace(1)* %b) {
	entry:			entry:
	%a.val = load <2 x half>, <2 x half> addrspace(1)* %a			%a.val = load <2 x half>, <2 x half> addrspace(1)* %a
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; VI-NEXT: v_max_f16_e32 v0, 0x4200, v0			; VI-NEXT: v_max_f16_e32 v0, 0x4200, v0
	; VI-NEXT: v_max_f16_sdwa v1, v1, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; VI-NEXT: v_max_f16_sdwa v1, v1, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: maxnum_v2f16_imm_a:			; GFX9-LABEL: maxnum_v2f16_imm_a:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s7, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s6, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_load_dword s2, s[2:3], 0x0
	; GFX9-NEXT: s_load_dword s4, s[6:7], 0x0			; GFX9-NEXT: s_mov_b32 s4, s0
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s0, 0x44004200
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_mov_b32 s5, s1
	; GFX9-NEXT: v_pk_max_f16 v0, s4, s4			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s4, 0x44004200			; GFX9-NEXT: v_pk_max_f16 v0, s2, s2
	; GFX9-NEXT: v_pk_max_f16 v0, v0, s4			; GFX9-NEXT: v_pk_max_f16 v0, v0, s0
	; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %b) {			<2 x half> addrspace(1)* %b) {
	entry:			entry:
	%b.val = load <2 x half>, <2 x half> addrspace(1)* %b			%b.val = load <2 x half>, <2 x half> addrspace(1)* %b
	%r.val = call <2 x half> @llvm.maxnum.v2f16(<2 x half> <half 3.0, half 4.0>, <2 x half> %b.val)			%r.val = call <2 x half> @llvm.maxnum.v2f16(<2 x half> <half 3.0, half 4.0>, <2 x half> %b.val)
	store <2 x half> %r.val, <2 x half> addrspace(1)* %r			store <2 x half> %r.val, <2 x half> addrspace(1)* %r
	ret void			ret void
	Show All 39 Lines
	; VI-NEXT: v_max_f16_e32 v0, 4.0, v0			; VI-NEXT: v_max_f16_e32 v0, 4.0, v0
	; VI-NEXT: v_max_f16_sdwa v1, v1, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; VI-NEXT: v_max_f16_sdwa v1, v1, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: maxnum_v2f16_imm_b:			; GFX9-LABEL: maxnum_v2f16_imm_b:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s7, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s6, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_load_dword s2, s[2:3], 0x0
	; GFX9-NEXT: s_load_dword s4, s[6:7], 0x0			; GFX9-NEXT: s_mov_b32 s4, s0
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s0, 0x42004400
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_mov_b32 s5, s1
	; GFX9-NEXT: v_pk_max_f16 v0, s4, s4			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s4, 0x42004400			; GFX9-NEXT: v_pk_max_f16 v0, s2, s2
	; GFX9-NEXT: v_pk_max_f16 v0, v0, s4			; GFX9-NEXT: v_pk_max_f16 v0, v0, s0
	; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a) {			<2 x half> addrspace(1)* %a) {
	entry:			entry:
	%a.val = load <2 x half>, <2 x half> addrspace(1)* %a			%a.val = load <2 x half>, <2 x half> addrspace(1)* %a
	%r.val = call <2 x half> @llvm.maxnum.v2f16(<2 x half> %a.val, <2 x half> <half 4.0, half 3.0>)			%r.val = call <2 x half> @llvm.maxnum.v2f16(<2 x half> %a.val, <2 x half> <half 4.0, half 3.0>)
	store <2 x half> %r.val, <2 x half> addrspace(1)* %r			store <2 x half> %r.val, <2 x half> addrspace(1)* %r
	ret void			ret void
	▲ Show 20 Lines • Show All 278 Lines • ▼ Show 20 Lines
	; GFX9-LABEL: fmax_v4f16_imm_a:			; GFX9-LABEL: fmax_v4f16_imm_a:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s8, 0x44004200			; GFX9-NEXT: s_mov_b32 s8, 0x44004200
	; GFX9-NEXT: s_mov_b32 s9, 0x40004800			; GFX9-NEXT: s_mov_b32 s9, 0x40004800
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_load_dwordx2 s[6:7], s[6:7], 0x0
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: s_load_dwordx2 s[4:5], s[6:7], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_pk_max_f16 v0, s5, s5			; GFX9-NEXT: v_pk_max_f16 v0, s7, s7
	; GFX9-NEXT: v_pk_max_f16 v2, s4, s4			; GFX9-NEXT: v_pk_max_f16 v2, s6, s6
	; GFX9-NEXT: v_pk_max_f16 v1, v0, s8			; GFX9-NEXT: v_pk_max_f16 v1, v0, s8
	; GFX9-NEXT: v_pk_max_f16 v0, v2, s9			; GFX9-NEXT: v_pk_max_f16 v0, v2, s9
	; GFX9-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0			; GFX9-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	<4 x half> addrspace(1)* %r,			<4 x half> addrspace(1)* %r,
	<4 x half> addrspace(1)* %b) {			<4 x half> addrspace(1)* %b) {
	entry:			entry:
	%b.val = load <4 x half>, <4 x half> addrspace(1)* %b			%b.val = load <4 x half>, <4 x half> addrspace(1)* %b
	%r.val = call <4 x half> @llvm.maxnum.v4f16(<4 x half> <half 8.0, half 2.0, half 3.0, half 4.0>, <4 x half> %b.val)			%r.val = call <4 x half> @llvm.maxnum.v4f16(<4 x half> <half 8.0, half 2.0, half 3.0, half 4.0>, <4 x half> %b.val)
	store <4 x half> %r.val, <4 x half> addrspace(1)* %r			store <4 x half> %r.val, <4 x half> addrspace(1)* %r
	ret void			ret void
	}			}

llvm/test/CodeGen/AMDGPU/llvm.minnum.f16.ll

	Show All 34 Lines
	; SI-NEXT: v_min_f32_e32 v0, v0, v1			; SI-NEXT: v_min_f32_e32 v0, v0, v1
	; SI-NEXT: v_cvt_f16_f32_e32 v0, v0			; SI-NEXT: v_cvt_f16_f32_e32 v0, v0
	; SI-NEXT: buffer_store_short v0, off, s[8:11], 0			; SI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: minnum_f16_ieee:			; VI-LABEL: minnum_f16_ieee:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; VI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34			; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s10, s2			; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_mov_b32 s0, s4			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s1, s5			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s4, s6			; VI-NEXT: s_mov_b32 s13, s7
	; VI-NEXT: s_mov_b32 s5, s7			; VI-NEXT: s_mov_b32 s14, s10
	; VI-NEXT: s_mov_b32 s11, s3			; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: s_mov_b32 s6, s2			; VI-NEXT: buffer_load_ushort v0, off, s[12:15], 0
	; VI-NEXT: s_mov_b32 s7, s3			; VI-NEXT: buffer_load_ushort v1, off, s[0:3], 0
	; VI-NEXT: buffer_load_ushort v0, off, s[4:7], 0			; VI-NEXT: s_mov_b32 s8, s4
	; VI-NEXT: buffer_load_ushort v1, off, s[8:11], 0			; VI-NEXT: s_mov_b32 s9, s5
	; VI-NEXT: s_waitcnt vmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1)
	; VI-NEXT: v_max_f16_e32 v0, v0, v0			; VI-NEXT: v_max_f16_e32 v0, v0, v0
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_max_f16_e32 v1, v1, v1			; VI-NEXT: v_max_f16_e32 v1, v1, v1
	; VI-NEXT: v_min_f16_e32 v0, v0, v1			; VI-NEXT: v_min_f16_e32 v0, v0, v1
	; VI-NEXT: buffer_store_short v0, off, s[0:3], 0			; VI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: minnum_f16_ieee:			; GFX9-LABEL: minnum_f16_ieee:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s11, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s10, -1
	; GFX9-NEXT: s_mov_b32 s10, s2			; GFX9-NEXT: s_mov_b32 s2, s10
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_mov_b32 s3, s11
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s12, s6
	; GFX9-NEXT: s_mov_b32 s4, s6			; GFX9-NEXT: s_mov_b32 s13, s7
	; GFX9-NEXT: s_mov_b32 s5, s7			; GFX9-NEXT: s_mov_b32 s14, s10
	; GFX9-NEXT: s_mov_b32 s11, s3			; GFX9-NEXT: s_mov_b32 s15, s11
	; GFX9-NEXT: s_mov_b32 s6, s2			; GFX9-NEXT: buffer_load_ushort v0, off, s[12:15], 0
	; GFX9-NEXT: s_mov_b32 s7, s3			; GFX9-NEXT: buffer_load_ushort v1, off, s[0:3], 0
	; GFX9-NEXT: buffer_load_ushort v0, off, s[4:7], 0			; GFX9-NEXT: s_mov_b32 s8, s4
	; GFX9-NEXT: buffer_load_ushort v1, off, s[8:11], 0			; GFX9-NEXT: s_mov_b32 s9, s5
	; GFX9-NEXT: s_waitcnt vmcnt(1)			; GFX9-NEXT: s_waitcnt vmcnt(1)
	; GFX9-NEXT: v_max_f16_e32 v0, v0, v0			; GFX9-NEXT: v_max_f16_e32 v0, v0, v0
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_max_f16_e32 v1, v1, v1			; GFX9-NEXT: v_max_f16_e32 v1, v1, v1
	; GFX9-NEXT: v_min_f16_e32 v0, v0, v1			; GFX9-NEXT: v_min_f16_e32 v0, v0, v1
	; GFX9-NEXT: buffer_store_short v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_short v0, off, s[8:11], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	half addrspace(1)* %r,			half addrspace(1)* %r,
	half addrspace(1)* %a,			half addrspace(1)* %a,
	half addrspace(1)* %b) {			half addrspace(1)* %b) {
	entry:			entry:
	%a.val = load volatile half, half addrspace(1)* %a			%a.val = load volatile half, half addrspace(1)* %a
	%b.val = load volatile half, half addrspace(1)* %b			%b.val = load volatile half, half addrspace(1)* %b
	%r.val = call half @llvm.minnum.f16(half %a.val, half %b.val)			%r.val = call half @llvm.minnum.f16(half %a.val, half %b.val)
	▲ Show 20 Lines • Show All 214 Lines • ▼ Show 20 Lines
	; VI-NEXT: v_min_f16_sdwa v1, v2, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; VI-NEXT: v_min_f16_sdwa v1, v2, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: minnum_v2f16_ieee:			; GFX9-LABEL: minnum_v2f16_ieee:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_load_dword s6, s[6:7], 0x0
				; GFX9-NEXT: s_load_dword s7, s[0:1], 0x0
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: s_load_dword s4, s[6:7], 0x0
	; GFX9-NEXT: s_load_dword s5, s[8:9], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_pk_max_f16 v1, s4, s4			; GFX9-NEXT: v_pk_max_f16 v1, s6, s6
	; GFX9-NEXT: v_pk_max_f16 v0, s5, s5			; GFX9-NEXT: v_pk_max_f16 v0, s7, s7
	; GFX9-NEXT: v_pk_min_f16 v0, v1, v0			; GFX9-NEXT: v_pk_min_f16 v0, v1, v0
	; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a,			<2 x half> addrspace(1)* %a,
	<2 x half> addrspace(1)* %b) {			<2 x half> addrspace(1)* %b) {
	entry:			entry:
	%a.val = load <2 x half>, <2 x half> addrspace(1)* %a			%a.val = load <2 x half>, <2 x half> addrspace(1)* %a
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	; VI-NEXT: v_min_f16_e32 v0, 0x4200, v0			; VI-NEXT: v_min_f16_e32 v0, 0x4200, v0
	; VI-NEXT: v_min_f16_sdwa v1, v1, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; VI-NEXT: v_min_f16_sdwa v1, v1, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: minnum_v2f16_imm_a:			; GFX9-LABEL: minnum_v2f16_imm_a:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s7, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s6, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_load_dword s2, s[2:3], 0x0
	; GFX9-NEXT: s_load_dword s4, s[6:7], 0x0			; GFX9-NEXT: s_mov_b32 s4, s0
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s0, 0x44004200
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_mov_b32 s5, s1
	; GFX9-NEXT: v_pk_max_f16 v0, s4, s4			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s4, 0x44004200			; GFX9-NEXT: v_pk_max_f16 v0, s2, s2
	; GFX9-NEXT: v_pk_min_f16 v0, v0, s4			; GFX9-NEXT: v_pk_min_f16 v0, v0, s0
	; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %b) {			<2 x half> addrspace(1)* %b) {
	entry:			entry:
	%b.val = load <2 x half>, <2 x half> addrspace(1)* %b			%b.val = load <2 x half>, <2 x half> addrspace(1)* %b
	%r.val = call <2 x half> @llvm.minnum.v2f16(<2 x half> <half 3.0, half 4.0>, <2 x half> %b.val)			%r.val = call <2 x half> @llvm.minnum.v2f16(<2 x half> <half 3.0, half 4.0>, <2 x half> %b.val)
	store <2 x half> %r.val, <2 x half> addrspace(1)* %r			store <2 x half> %r.val, <2 x half> addrspace(1)* %r
	ret void			ret void
	Show All 39 Lines
	; VI-NEXT: v_min_f16_e32 v0, 4.0, v0			; VI-NEXT: v_min_f16_e32 v0, 4.0, v0
	; VI-NEXT: v_min_f16_sdwa v1, v1, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD			; VI-NEXT: v_min_f16_sdwa v1, v1, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: minnum_v2f16_imm_b:			; GFX9-LABEL: minnum_v2f16_imm_b:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s7, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s6, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_load_dword s2, s[2:3], 0x0
	; GFX9-NEXT: s_load_dword s4, s[6:7], 0x0			; GFX9-NEXT: s_mov_b32 s4, s0
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s0, 0x42004400
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_mov_b32 s5, s1
	; GFX9-NEXT: v_pk_max_f16 v0, s4, s4			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s4, 0x42004400			; GFX9-NEXT: v_pk_max_f16 v0, s2, s2
	; GFX9-NEXT: v_pk_min_f16 v0, v0, s4			; GFX9-NEXT: v_pk_min_f16 v0, v0, s0
	; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a) {			<2 x half> addrspace(1)* %a) {
	entry:			entry:
	%a.val = load <2 x half>, <2 x half> addrspace(1)* %a			%a.val = load <2 x half>, <2 x half> addrspace(1)* %a
	%r.val = call <2 x half> @llvm.minnum.v2f16(<2 x half> %a.val, <2 x half> <half 4.0, half 3.0>)			%r.val = call <2 x half> @llvm.minnum.v2f16(<2 x half> %a.val, <2 x half> <half 4.0, half 3.0>)
	store <2 x half> %r.val, <2 x half> addrspace(1)* %r			store <2 x half> %r.val, <2 x half> addrspace(1)* %r
	ret void			ret void
	▲ Show 20 Lines • Show All 278 Lines • ▼ Show 20 Lines
	; GFX9-LABEL: fmin_v4f16_imm_a:			; GFX9-LABEL: fmin_v4f16_imm_a:
	; GFX9: ; %bb.0: ; %entry			; GFX9: ; %bb.0: ; %entry
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s8, 0x44004200			; GFX9-NEXT: s_mov_b32 s8, 0x44004200
	; GFX9-NEXT: s_mov_b32 s9, 0x40004800			; GFX9-NEXT: s_mov_b32 s9, 0x40004800
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_load_dwordx2 s[6:7], s[6:7], 0x0
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: s_load_dwordx2 s[4:5], s[6:7], 0x0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_pk_max_f16 v0, s5, s5			; GFX9-NEXT: v_pk_max_f16 v0, s7, s7
	; GFX9-NEXT: v_pk_max_f16 v2, s4, s4			; GFX9-NEXT: v_pk_max_f16 v2, s6, s6
	; GFX9-NEXT: v_pk_min_f16 v1, v0, s8			; GFX9-NEXT: v_pk_min_f16 v1, v0, s8
	; GFX9-NEXT: v_pk_min_f16 v0, v2, s9			; GFX9-NEXT: v_pk_min_f16 v0, v2, s9
	; GFX9-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0			; GFX9-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	<4 x half> addrspace(1)* %r,			<4 x half> addrspace(1)* %r,
	<4 x half> addrspace(1)* %b) {			<4 x half> addrspace(1)* %b) {
	entry:			entry:
	%b.val = load <4 x half>, <4 x half> addrspace(1)* %b			%b.val = load <4 x half>, <4 x half> addrspace(1)* %b
	%r.val = call <4 x half> @llvm.minnum.v4f16(<4 x half> <half 8.0, half 2.0, half 3.0, half 4.0>, <4 x half> %b.val)			%r.val = call <4 x half> @llvm.minnum.v4f16(<4 x half> <half 8.0, half 2.0, half 3.0, half 4.0>, <4 x half> %b.val)
	store <4 x half> %r.val, <4 x half> addrspace(1)* %r			store <4 x half> %r.val, <4 x half> addrspace(1)* %r
	ret void			ret void
	}			}

llvm/test/CodeGen/AMDGPU/lshr.v2i16.ll

	Show First 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_mov_b32 s7, 0xf000			; CI-NEXT: s_mov_b32 s7, 0xf000
	; CI-NEXT: s_mov_b32 s6, 0			; CI-NEXT: s_mov_b32 s6, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[4:5], s[2:3]			; CI-NEXT: s_mov_b64 s[4:5], s[2:3]
	; CI-NEXT: buffer_load_dword v2, v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_load_dword v2, v[0:1], s[4:7], 0 addr64
	; CI-NEXT: buffer_load_dword v3, v[0:1], s[4:7], 0 addr64 offset:4			; CI-NEXT: buffer_load_dword v3, v[0:1], s[4:7], 0 addr64 offset:4
	; CI-NEXT: s_mov_b32 s8, 0xffff			; CI-NEXT: s_mov_b32 s4, 0xffff
	; CI-NEXT: s_mov_b64 s[2:3], s[6:7]			; CI-NEXT: s_mov_b64 s[2:3], s[6:7]
	; CI-NEXT: s_waitcnt vmcnt(1)			; CI-NEXT: s_waitcnt vmcnt(1)
	; CI-NEXT: v_lshrrev_b32_e32 v4, 16, v2			; CI-NEXT: v_lshrrev_b32_e32 v4, 16, v2
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_lshrrev_b32_e32 v5, 16, v3			; CI-NEXT: v_lshrrev_b32_e32 v5, 16, v3
	; CI-NEXT: v_and_b32_e32 v2, s8, v2			; CI-NEXT: v_and_b32_e32 v2, s4, v2
	; CI-NEXT: v_and_b32_e32 v3, s8, v3			; CI-NEXT: v_and_b32_e32 v3, s4, v3
	; CI-NEXT: v_lshrrev_b32_e32 v2, v3, v2			; CI-NEXT: v_lshrrev_b32_e32 v2, v3, v2
	; CI-NEXT: v_lshrrev_b32_e32 v3, v5, v4			; CI-NEXT: v_lshrrev_b32_e32 v3, v5, v4
	; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3			; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3
	; CI-NEXT: v_or_b32_e32 v2, v2, v3			; CI-NEXT: v_or_b32_e32 v2, v2, v3
	; CI-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64			; CI-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%tid.ext = sext i32 %tid to i64			%tid.ext = sext i32 %tid to i64
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_load_dword s8, s[0:1], 0xd			; CI-NEXT: s_load_dword s8, s[0:1], 0xd
	; CI-NEXT: s_mov_b32 s3, 0xf000			; CI-NEXT: s_mov_b32 s3, 0xf000
	; CI-NEXT: s_mov_b32 s2, 0			; CI-NEXT: s_mov_b32 s2, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[0:1], s[6:7]			; CI-NEXT: s_mov_b64 s[0:1], s[6:7]
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: buffer_load_dword v2, v[0:1], s[0:3], 0 addr64			; CI-NEXT: buffer_load_dword v2, v[0:1], s[0:3], 0 addr64
	; CI-NEXT: s_lshr_b32 s9, s8, 16			; CI-NEXT: s_mov_b32 s0, 0xffff
	; CI-NEXT: s_mov_b32 s10, 0xffff			; CI-NEXT: s_lshr_b32 s1, s8, 16
	; CI-NEXT: s_and_b32 s8, s8, s10			; CI-NEXT: s_and_b32 s8, s8, s0
	; CI-NEXT: s_mov_b64 s[6:7], s[2:3]			; CI-NEXT: s_mov_b64 s[6:7], s[2:3]
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_lshrrev_b32_e32 v3, 16, v2			; CI-NEXT: v_lshrrev_b32_e32 v3, 16, v2
	; CI-NEXT: v_and_b32_e32 v2, s10, v2			; CI-NEXT: v_and_b32_e32 v2, s0, v2
	; CI-NEXT: v_lshrrev_b32_e32 v3, s9, v3			; CI-NEXT: v_lshrrev_b32_e32 v3, s1, v3
	; CI-NEXT: v_lshrrev_b32_e32 v2, s8, v2			; CI-NEXT: v_lshrrev_b32_e32 v2, s8, v2
	; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3			; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3
	; CI-NEXT: v_or_b32_e32 v2, v2, v3			; CI-NEXT: v_or_b32_e32 v2, v2, v3
	; CI-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%tid.ext = sext i32 %tid to i64			%tid.ext = sext i32 %tid to i64
	%in.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %in, i64 %tid.ext			%in.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %in, i64 %tid.ext
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_load_dword s8, s[0:1], 0xd			; CI-NEXT: s_load_dword s8, s[0:1], 0xd
	; CI-NEXT: s_mov_b32 s3, 0xf000			; CI-NEXT: s_mov_b32 s3, 0xf000
	; CI-NEXT: s_mov_b32 s2, 0			; CI-NEXT: s_mov_b32 s2, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[0:1], s[6:7]			; CI-NEXT: s_mov_b64 s[0:1], s[6:7]
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: buffer_load_dword v2, v[0:1], s[0:3], 0 addr64			; CI-NEXT: buffer_load_dword v2, v[0:1], s[0:3], 0 addr64
	; CI-NEXT: s_lshr_b32 s9, s8, 16			; CI-NEXT: s_mov_b32 s0, 0xffff
	; CI-NEXT: s_mov_b32 s10, 0xffff			; CI-NEXT: s_lshr_b32 s1, s8, 16
	; CI-NEXT: s_and_b32 s8, s8, s10			; CI-NEXT: s_and_b32 s8, s8, s0
	; CI-NEXT: s_mov_b64 s[6:7], s[2:3]			; CI-NEXT: s_mov_b64 s[6:7], s[2:3]
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_lshrrev_b32_e32 v3, 16, v2			; CI-NEXT: v_lshrrev_b32_e32 v3, 16, v2
	; CI-NEXT: v_and_b32_e32 v2, s10, v2			; CI-NEXT: v_and_b32_e32 v2, s0, v2
	; CI-NEXT: v_lshr_b32_e32 v3, s9, v3			; CI-NEXT: v_lshr_b32_e32 v3, s1, v3
	; CI-NEXT: v_lshr_b32_e32 v2, s8, v2			; CI-NEXT: v_lshr_b32_e32 v2, s8, v2
	; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3			; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3
	; CI-NEXT: v_or_b32_e32 v2, v2, v3			; CI-NEXT: v_or_b32_e32 v2, v2, v3
	; CI-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%tid.ext = sext i32 %tid to i64			%tid.ext = sext i32 %tid to i64
	%in.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %in, i64 %tid.ext			%in.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %in, i64 %tid.ext
	▲ Show 20 Lines • Show All 186 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_mov_b32 s7, 0xf000			; CI-NEXT: s_mov_b32 s7, 0xf000
	; CI-NEXT: s_mov_b32 s6, 0			; CI-NEXT: s_mov_b32 s6, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 3, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 3, v0
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[4:5], s[2:3]			; CI-NEXT: s_mov_b64 s[4:5], s[2:3]
	; CI-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64
	; CI-NEXT: buffer_load_dwordx2 v[4:5], v[0:1], s[4:7], 0 addr64 offset:8			; CI-NEXT: buffer_load_dwordx2 v[4:5], v[0:1], s[4:7], 0 addr64 offset:8
	; CI-NEXT: s_mov_b32 s8, 0xffff			; CI-NEXT: s_mov_b32 s4, 0xffff
	; CI-NEXT: s_mov_b64 s[2:3], s[6:7]			; CI-NEXT: s_mov_b64 s[2:3], s[6:7]
	; CI-NEXT: s_waitcnt vmcnt(1)			; CI-NEXT: s_waitcnt vmcnt(1)
	; CI-NEXT: v_lshrrev_b32_e32 v6, 16, v2			; CI-NEXT: v_lshrrev_b32_e32 v6, 16, v2
	; CI-NEXT: v_lshrrev_b32_e32 v7, 16, v3			; CI-NEXT: v_lshrrev_b32_e32 v7, 16, v3
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_lshrrev_b32_e32 v8, 16, v4			; CI-NEXT: v_lshrrev_b32_e32 v8, 16, v4
	; CI-NEXT: v_lshrrev_b32_e32 v9, 16, v5			; CI-NEXT: v_lshrrev_b32_e32 v9, 16, v5
	; CI-NEXT: v_and_b32_e32 v2, s8, v2			; CI-NEXT: v_and_b32_e32 v2, s4, v2
	; CI-NEXT: v_and_b32_e32 v4, s8, v4			; CI-NEXT: v_and_b32_e32 v4, s4, v4
	; CI-NEXT: v_and_b32_e32 v3, s8, v3			; CI-NEXT: v_and_b32_e32 v3, s4, v3
	; CI-NEXT: v_and_b32_e32 v5, s8, v5			; CI-NEXT: v_and_b32_e32 v5, s4, v5
	; CI-NEXT: v_lshrrev_b32_e32 v3, v5, v3			; CI-NEXT: v_lshrrev_b32_e32 v3, v5, v3
	; CI-NEXT: v_lshrrev_b32_e32 v5, v9, v7			; CI-NEXT: v_lshrrev_b32_e32 v5, v9, v7
	; CI-NEXT: v_lshrrev_b32_e32 v2, v4, v2			; CI-NEXT: v_lshrrev_b32_e32 v2, v4, v2
	; CI-NEXT: v_lshrrev_b32_e32 v4, v8, v6			; CI-NEXT: v_lshrrev_b32_e32 v4, v8, v6
	; CI-NEXT: v_lshlrev_b32_e32 v5, 16, v5			; CI-NEXT: v_lshlrev_b32_e32 v5, 16, v5
	; CI-NEXT: v_lshlrev_b32_e32 v4, 16, v4			; CI-NEXT: v_lshlrev_b32_e32 v4, 16, v4
	; CI-NEXT: v_or_b32_e32 v3, v3, v5			; CI-NEXT: v_or_b32_e32 v3, v3, v5
	; CI-NEXT: v_or_b32_e32 v2, v2, v4			; CI-NEXT: v_or_b32_e32 v2, v2, v4
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9			; CI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
	; CI-NEXT: s_mov_b32 s7, 0xf000			; CI-NEXT: s_mov_b32 s7, 0xf000
	; CI-NEXT: s_mov_b32 s6, 0			; CI-NEXT: s_mov_b32 s6, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 3, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 3, v0
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[4:5], s[2:3]			; CI-NEXT: s_mov_b64 s[4:5], s[2:3]
	; CI-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64
	; CI-NEXT: s_mov_b32 s8, 0xff00ff			; CI-NEXT: s_mov_b32 s4, 0xff00ff
	; CI-NEXT: s_mov_b64 s[2:3], s[6:7]			; CI-NEXT: s_mov_b64 s[2:3], s[6:7]
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_lshrrev_b32_e32 v3, 8, v3			; CI-NEXT: v_lshrrev_b32_e32 v3, 8, v3
	; CI-NEXT: v_lshrrev_b32_e32 v2, 8, v2			; CI-NEXT: v_lshrrev_b32_e32 v2, 8, v2
	; CI-NEXT: v_and_b32_e32 v3, s8, v3			; CI-NEXT: v_and_b32_e32 v3, s4, v3
	; CI-NEXT: v_and_b32_e32 v2, s8, v2			; CI-NEXT: v_and_b32_e32 v2, s4, v2
	; CI-NEXT: buffer_store_dwordx2 v[2:3], v[0:1], s[0:3], 0 addr64			; CI-NEXT: buffer_store_dwordx2 v[2:3], v[0:1], s[0:3], 0 addr64
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%tid.ext = sext i32 %tid to i64			%tid.ext = sext i32 %tid to i64
	%in.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %in, i64 %tid.ext			%in.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %in, i64 %tid.ext
	%out.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %out, i64 %tid.ext			%out.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %out, i64 %tid.ext
	%vgpr = load <4 x i16>, <4 x i16> addrspace(1)* %in.gep			%vgpr = load <4 x i16>, <4 x i16> addrspace(1)* %in.gep
	%result = lshr <4 x i16> %vgpr, <i16 8, i16 8, i16 8, i16 8>			%result = lshr <4 x i16> %vgpr, <i16 8, i16 8, i16 8, i16 8>
	store <4 x i16> %result, <4 x i16> addrspace(1)* %out.gep			store <4 x i16> %result, <4 x i16> addrspace(1)* %out.gep
	ret void			ret void
	}			}

	declare i32 @llvm.amdgcn.workitem.id.x() #1			declare i32 @llvm.amdgcn.workitem.id.x() #1

	attributes #0 = { nounwind }			attributes #0 = { nounwind }
	attributes #1 = { nounwind readnone }			attributes #1 = { nounwind readnone }

llvm/test/CodeGen/AMDGPU/max.i16.ll

	Show First 20 Lines • Show All 128 Lines • ▼ Show 20 Lines
	; VI-NEXT: v_mov_b32_e32 v1, s7			; VI-NEXT: v_mov_b32_e32 v1, s7
	; VI-NEXT: v_add_u32_e32 v0, vcc, s6, v6			; VI-NEXT: v_add_u32_e32 v0, vcc, s6, v6
	; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; VI-NEXT: v_mov_b32_e32 v3, s1			; VI-NEXT: v_mov_b32_e32 v3, s1
	; VI-NEXT: v_add_u32_e32 v2, vcc, s0, v6			; VI-NEXT: v_add_u32_e32 v2, vcc, s0, v6
	; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v3, vcc			; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v3, vcc
	; VI-NEXT: v_add_u32_e32 v4, vcc, 4, v0			; VI-NEXT: v_add_u32_e32 v4, vcc, 4, v0
	; VI-NEXT: v_addc_u32_e32 v5, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v5, vcc, 0, v1, vcc
	; VI-NEXT: v_mov_b32_e32 v7, s5			; VI-NEXT: flat_load_ushort v4, v[4:5]
	; VI-NEXT: v_add_u32_e32 v6, vcc, s4, v6			; VI-NEXT: flat_load_dword v5, v[0:1]
	; VI-NEXT: v_addc_u32_e32 v7, vcc, 0, v7, vcc
	; VI-NEXT: flat_load_ushort v8, v[4:5]
	; VI-NEXT: flat_load_dword v9, v[0:1]
	; VI-NEXT: v_add_u32_e32 v0, vcc, 4, v2			; VI-NEXT: v_add_u32_e32 v0, vcc, 4, v2
	; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v3, vcc			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v3, vcc
	; VI-NEXT: flat_load_ushort v0, v[0:1]			; VI-NEXT: flat_load_ushort v7, v[0:1]
	; VI-NEXT: flat_load_dword v1, v[2:3]			; VI-NEXT: flat_load_dword v8, v[2:3]
	; VI-NEXT: v_add_u32_e32 v4, vcc, 4, v6			; VI-NEXT: v_add_u32_e32 v0, vcc, s4, v6
	; VI-NEXT: v_addc_u32_e32 v5, vcc, 0, v7, vcc			; VI-NEXT: v_mov_b32_e32 v1, s5
				; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
				; VI-NEXT: v_add_u32_e32 v2, vcc, 4, v0
				; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v1, vcc
	; VI-NEXT: s_waitcnt vmcnt(1) lgkmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1) lgkmcnt(1)
	; VI-NEXT: v_max_i16_e32 v0, v8, v0			; VI-NEXT: v_max_i16_e32 v4, v4, v7
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: v_max_i16_e32 v2, v9, v1			; VI-NEXT: v_max_i16_e32 v6, v5, v8
	; VI-NEXT: v_max_i16_sdwa v1, v9, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1			; VI-NEXT: v_max_i16_sdwa v5, v5, v8 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
	; VI-NEXT: v_or_b32_e32 v1, v2, v1			; VI-NEXT: v_or_b32_e32 v5, v6, v5
	; VI-NEXT: flat_store_short v[4:5], v0			; VI-NEXT: flat_store_short v[2:3], v4
	; VI-NEXT: flat_store_dword v[6:7], v1			; VI-NEXT: flat_store_dword v[0:1], v5
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: v_test_imax_sge_v3i16:			; GFX9-LABEL: v_test_imax_sge_v3i16:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; GFX9-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; GFX9-NEXT: v_lshlrev_b32_e32 v4, 3, v0			; GFX9-NEXT: v_lshlrev_b32_e32 v4, 3, v0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s7			; GFX9-NEXT: v_mov_b32_e32 v1, s7
	; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s6, v4			; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s6, v4
	; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc			; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc
	; GFX9-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NEXT: v_mov_b32_e32 v3, s1
	; GFX9-NEXT: v_add_co_u32_e32 v2, vcc, s0, v4			; GFX9-NEXT: v_add_co_u32_e32 v2, vcc, s0, v4
	; GFX9-NEXT: v_addc_co_u32_e32 v3, vcc, 0, v3, vcc			; GFX9-NEXT: v_addc_co_u32_e32 v3, vcc, 0, v3, vcc
	; GFX9-NEXT: global_load_dword v6, v[0:1], off			; GFX9-NEXT: global_load_dword v5, v[0:1], off
	; GFX9-NEXT: global_load_dword v7, v[2:3], off			; GFX9-NEXT: global_load_dword v6, v[2:3], off
	; GFX9-NEXT: v_mov_b32_e32 v5, s5
	; GFX9-NEXT: v_add_co_u32_e32 v4, vcc, s4, v4
	; GFX9-NEXT: v_addc_co_u32_e32 v5, vcc, 0, v5, vcc
	; GFX9-NEXT: s_waitcnt vmcnt(1)			; GFX9-NEXT: s_waitcnt vmcnt(1)
	; GFX9-NEXT: v_mov_b32_e32 v8, v6			; GFX9-NEXT: v_mov_b32_e32 v7, v5
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v9, v7			; GFX9-NEXT: v_mov_b32_e32 v8, v6
	; GFX9-NEXT: global_load_short_d16 v8, v[0:1], off offset:4			; GFX9-NEXT: global_load_short_d16 v7, v[0:1], off offset:4
	; GFX9-NEXT: global_load_short_d16 v9, v[2:3], off offset:4			; GFX9-NEXT: global_load_short_d16 v8, v[2:3], off offset:4
	; GFX9-NEXT: v_pk_max_i16 v6, v6, v7			; GFX9-NEXT: v_mov_b32_e32 v1, s5
				; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s4, v4
				; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc
				; GFX9-NEXT: v_pk_max_i16 v2, v5, v6
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_pk_max_i16 v0, v8, v9			; GFX9-NEXT: v_pk_max_i16 v3, v7, v8
	; GFX9-NEXT: global_store_dword v[4:5], v6, off			; GFX9-NEXT: global_store_dword v[0:1], v2, off
	; GFX9-NEXT: global_store_short v[4:5], v0, off offset:4			; GFX9-NEXT: global_store_short v[0:1], v3, off offset:4
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x() nounwind readnone			%tid = call i32 @llvm.amdgcn.workitem.id.x() nounwind readnone
	%gep0 = getelementptr <3 x i16>, <3 x i16> addrspace(1)* %aptr, i32 %tid			%gep0 = getelementptr <3 x i16>, <3 x i16> addrspace(1)* %aptr, i32 %tid
	%gep1 = getelementptr <3 x i16>, <3 x i16> addrspace(1)* %bptr, i32 %tid			%gep1 = getelementptr <3 x i16>, <3 x i16> addrspace(1)* %bptr, i32 %tid
	%outgep = getelementptr <3 x i16>, <3 x i16> addrspace(1)* %out, i32 %tid			%outgep = getelementptr <3 x i16>, <3 x i16> addrspace(1)* %out, i32 %tid
	%a = load <3 x i16>, <3 x i16> addrspace(1)* %gep0, align 4			%a = load <3 x i16>, <3 x i16> addrspace(1)* %gep0, align 4
	%b = load <3 x i16>, <3 x i16> addrspace(1)* %gep1, align 4			%b = load <3 x i16>, <3 x i16> addrspace(1)* %gep1, align 4
	%cmp = icmp sge <3 x i16> %a, %b			%cmp = icmp sge <3 x i16> %a, %b
	▲ Show 20 Lines • Show All 298 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/mul24-pass-ordering.ll

	Show First 20 Lines • Show All 51 Lines • ▼ Show 20 Lines

	define void @lsr_order_mul24_1(i32 %arg, i32 %arg1, i32 %arg2, float addrspace(3)* nocapture %arg3, i32 %arg4, i32 %arg5, i32 %arg6, i32 %arg7, i32 %arg8, i32 %arg9, float addrspace(1)* nocapture readonly %arg10, i32 %arg11, i32 %arg12, i32 %arg13, i32 %arg14, i32 %arg15, i32 %arg16, i1 zeroext %arg17, i1 zeroext %arg18) #0 {			define void @lsr_order_mul24_1(i32 %arg, i32 %arg1, i32 %arg2, float addrspace(3)* nocapture %arg3, i32 %arg4, i32 %arg5, i32 %arg6, i32 %arg7, i32 %arg8, i32 %arg9, float addrspace(1)* nocapture readonly %arg10, i32 %arg11, i32 %arg12, i32 %arg13, i32 %arg14, i32 %arg15, i32 %arg16, i1 zeroext %arg17, i1 zeroext %arg18) #0 {
	; GFX9-LABEL: lsr_order_mul24_1:			; GFX9-LABEL: lsr_order_mul24_1:
	; GFX9: ; %bb.0: ; %bb			; GFX9: ; %bb.0: ; %bb
	; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX9-NEXT: v_and_b32_e32 v5, 1, v18			; GFX9-NEXT: v_and_b32_e32 v5, 1, v18
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 1, v5			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 1, v5
	; GFX9-NEXT: v_cmp_lt_u32_e64 s[4:5], v0, v1			; GFX9-NEXT: v_cmp_lt_u32_e64 s[4:5], v0, v1
	; GFX9-NEXT: s_and_saveexec_b64 s[10:11], s[4:5]			; GFX9-NEXT: s_and_saveexec_b64 s[8:9], s[4:5]
	; GFX9-NEXT: s_cbranch_execz BB1_4			; GFX9-NEXT: s_cbranch_execz BB1_4
	; GFX9-NEXT: ; %bb.1: ; %bb19			; GFX9-NEXT: ; %bb.1: ; %bb19
	; GFX9-NEXT: v_cvt_f32_u32_e32 v7, v6			; GFX9-NEXT: v_cvt_f32_u32_e32 v7, v6
	; GFX9-NEXT: v_and_b32_e32 v5, 0xffffff, v6			; GFX9-NEXT: v_and_b32_e32 v5, 0xffffff, v6
	; GFX9-NEXT: v_add_u32_e32 v6, v4, v0			; GFX9-NEXT: v_add_u32_e32 v6, v4, v0
	; GFX9-NEXT: v_lshl_add_u32 v3, v6, 2, v3			; GFX9-NEXT: v_lshl_add_u32 v3, v6, 2, v3
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v4, v7			; GFX9-NEXT: v_rcp_iflag_f32_e32 v4, v7
	; GFX9-NEXT: v_lshlrev_b32_e32 v6, 2, v2			; GFX9-NEXT: v_lshlrev_b32_e32 v6, 2, v2
	; GFX9-NEXT: v_add_u32_e32 v7, v17, v12			; GFX9-NEXT: v_add_u32_e32 v7, v17, v12
	; GFX9-NEXT: s_mov_b64 s[12:13], 0			; GFX9-NEXT: s_mov_b64 s[10:11], 0
	; GFX9-NEXT: BB1_2: ; %bb23			; GFX9-NEXT: BB1_2: ; %bb23
	; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1			; GFX9-NEXT: ; =>This Inner Loop Header: Depth=1
	; GFX9-NEXT: v_cvt_f32_u32_e32 v8, v0			; GFX9-NEXT: v_cvt_f32_u32_e32 v8, v0
	; GFX9-NEXT: v_add_u32_e32 v9, v17, v0			; GFX9-NEXT: v_add_u32_e32 v9, v17, v0
	; GFX9-NEXT: v_add_u32_e32 v12, v7, v0			; GFX9-NEXT: v_add_u32_e32 v12, v7, v0
	; GFX9-NEXT: v_add_u32_e32 v0, v0, v2			; GFX9-NEXT: v_add_u32_e32 v0, v0, v2
	; GFX9-NEXT: v_madak_f32 v8, v8, v4, 0x3727c5ac			; GFX9-NEXT: v_madak_f32 v8, v8, v4, 0x3727c5ac
	; GFX9-NEXT: v_cvt_u32_f32_e32 v8, v8			; GFX9-NEXT: v_cvt_u32_f32_e32 v8, v8
	; GFX9-NEXT: v_cmp_ge_u32_e64 s[4:5], v0, v1
	; GFX9-NEXT: v_mul_u32_u24_e32 v18, v8, v5			; GFX9-NEXT: v_mul_u32_u24_e32 v18, v8, v5
	; GFX9-NEXT: v_add_u32_e32 v8, v8, v16			; GFX9-NEXT: v_add_u32_e32 v8, v8, v16
	; GFX9-NEXT: v_cmp_lt_u32_e64 s[6:7], v8, v13			; GFX9-NEXT: v_cmp_lt_u32_e64 s[4:5], v8, v13
	; GFX9-NEXT: v_mul_lo_u32 v8, v8, v15			; GFX9-NEXT: v_mul_lo_u32 v8, v8, v15
	; GFX9-NEXT: v_sub_u32_e32 v19, v9, v18			; GFX9-NEXT: v_sub_u32_e32 v19, v9, v18
	; GFX9-NEXT: v_cmp_lt_u32_e64 s[8:9], v19, v14			; GFX9-NEXT: v_cmp_lt_u32_e64 s[6:7], v19, v14
	; GFX9-NEXT: s_and_b64 s[6:7], s[6:7], s[8:9]			; GFX9-NEXT: s_and_b64 s[4:5], s[4:5], s[6:7]
	; GFX9-NEXT: v_sub_u32_e32 v12, v12, v18			; GFX9-NEXT: v_sub_u32_e32 v12, v12, v18
	; GFX9-NEXT: s_and_b64 s[6:7], s[6:7], vcc
	; GFX9-NEXT: v_add_u32_e32 v8, v12, v8			; GFX9-NEXT: v_add_u32_e32 v8, v12, v8
				; GFX9-NEXT: s_and_b64 s[4:5], s[4:5], vcc
	; GFX9-NEXT: v_mov_b32_e32 v9, 0			; GFX9-NEXT: v_mov_b32_e32 v9, 0
	; GFX9-NEXT: v_cndmask_b32_e64 v8, 0, v8, s[6:7]			; GFX9-NEXT: v_cndmask_b32_e64 v8, 0, v8, s[4:5]
	; GFX9-NEXT: v_lshlrev_b64 v[8:9], 2, v[8:9]			; GFX9-NEXT: v_lshlrev_b64 v[8:9], 2, v[8:9]
	; GFX9-NEXT: s_or_b64 s[12:13], s[4:5], s[12:13]			; GFX9-NEXT: v_add_co_u32_e64 v8, s[6:7], v10, v8
	; GFX9-NEXT: v_add_co_u32_e64 v8, s[4:5], v10, v8			; GFX9-NEXT: v_addc_co_u32_e64 v9, s[6:7], v11, v9, s[6:7]
	; GFX9-NEXT: v_addc_co_u32_e64 v9, s[4:5], v11, v9, s[4:5]
	; GFX9-NEXT: global_load_dword v8, v[8:9], off			; GFX9-NEXT: global_load_dword v8, v[8:9], off
				; GFX9-NEXT: v_cmp_ge_u32_e64 s[6:7], v0, v1
				; GFX9-NEXT: s_or_b64 s[10:11], s[6:7], s[10:11]
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cndmask_b32_e64 v8, 0, v8, s[6:7]			; GFX9-NEXT: v_cndmask_b32_e64 v8, 0, v8, s[4:5]
	; GFX9-NEXT: ds_write_b32 v3, v8			; GFX9-NEXT: ds_write_b32 v3, v8
	; GFX9-NEXT: v_add_u32_e32 v3, v3, v6			; GFX9-NEXT: v_add_u32_e32 v3, v3, v6
	; GFX9-NEXT: s_andn2_b64 exec, exec, s[12:13]			; GFX9-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GFX9-NEXT: s_cbranch_execnz BB1_2			; GFX9-NEXT: s_cbranch_execnz BB1_2
	; GFX9-NEXT: ; %bb.3: ; %Flow			; GFX9-NEXT: ; %bb.3: ; %Flow
	; GFX9-NEXT: s_or_b64 exec, exec, s[12:13]
	; GFX9-NEXT: BB1_4: ; %Flow3
	; GFX9-NEXT: s_or_b64 exec, exec, s[10:11]			; GFX9-NEXT: s_or_b64 exec, exec, s[10:11]
				; GFX9-NEXT: BB1_4: ; %Flow3
				; GFX9-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_setpc_b64 s[30:31]			; GFX9-NEXT: s_setpc_b64 s[30:31]
	bb:			bb:
	%tmp = icmp ult i32 %arg, %arg1			%tmp = icmp ult i32 %arg, %arg1
	br i1 %tmp, label %bb19, label %.loopexit			br i1 %tmp, label %bb19, label %.loopexit

	bb19: ; preds = %bb			bb19: ; preds = %bb
	%tmp20 = uitofp i32 %arg6 to float			%tmp20 = uitofp i32 %arg6 to float
	▲ Show 20 Lines • Show All 146 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/promote-constOffset-to-imm.ll

	Show First 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; GFX8: flat_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}]			; GFX8: flat_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}]
	; GFX8: flat_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}]			; GFX8: flat_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}]
	; GFX8: flat_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}]			; GFX8: flat_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}]
	; GFX8: flat_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}]			; GFX8: flat_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}]
	;			;
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-4096			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-4096
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
				; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:2048			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:2048
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-4096			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-4096
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:2048			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:2048
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-4096			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-4096
	; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off			; GFX9: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
	;			;
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
				; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
				; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off offset:-2048
	; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off			; GFX10: global_load_dwordx2 v[{{[0-9]+:[0-9]+}}], v[{{[0-9]+:[0-9]+}}], off{{$}}
	entry:			entry:
	%call = tail call i64 @_Z13get_global_idj(i32 0)			%call = tail call i64 @_Z13get_global_idj(i32 0)
	%conv = and i64 %call, 255			%conv = and i64 %call, 255
	%a0 = shl i64 %call, 17			%a0 = shl i64 %call, 17
	%idx.ext11 = and i64 %a0, 4261412864			%idx.ext11 = and i64 %a0, 4261412864
	%add.ptr12 = getelementptr inbounds i8, i8 addrspace(1)* %buffer, i64 %idx.ext11			%add.ptr12 = getelementptr inbounds i8, i8 addrspace(1)* %buffer, i64 %idx.ext11
	%a1 = bitcast i8 addrspace(1)* %add.ptr12 to i64 addrspace(1)*			%a1 = bitcast i8 addrspace(1)* %add.ptr12 to i64 addrspace(1)*
	%add.ptr6 = getelementptr inbounds i64, i64 addrspace(1)* %a1, i64 %conv			%add.ptr6 = getelementptr inbounds i64, i64 addrspace(1)* %a1, i64 %conv
	▲ Show 20 Lines • Show All 429 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/saddo.ll

	Show First 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	; SI-NEXT: buffer_store_dword v2, off, s[4:7], 0			; SI-NEXT: buffer_store_dword v2, off, s[4:7], 0
	; SI-NEXT: buffer_store_byte v0, off, s[12:15], 0			; SI-NEXT: buffer_store_byte v0, off, s[12:15], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: v_saddo_i32:			; VI-LABEL: v_saddo_i32:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v4, s6			; VI-NEXT: v_mov_b32_e32 v0, s6
	; VI-NEXT: v_mov_b32_e32 v5, s7			; VI-NEXT: v_mov_b32_e32 v1, s7
	; VI-NEXT: v_mov_b32_e32 v6, s4			; VI-NEXT: v_mov_b32_e32 v2, s4
	; VI-NEXT: v_mov_b32_e32 v7, s5			; VI-NEXT: v_mov_b32_e32 v3, s5
	; VI-NEXT: flat_load_dword v6, v[6:7]			; VI-NEXT: flat_load_dword v4, v[2:3]
	; VI-NEXT: flat_load_dword v4, v[4:5]			; VI-NEXT: flat_load_dword v5, v[0:1]
	; VI-NEXT: v_mov_b32_e32 v2, s0			; VI-NEXT: v_mov_b32_e32 v2, s0
	; VI-NEXT: v_mov_b32_e32 v3, s1			; VI-NEXT: v_mov_b32_e32 v3, s1
	; VI-NEXT: v_mov_b32_e32 v0, s2			; VI-NEXT: v_mov_b32_e32 v0, s2
	; VI-NEXT: v_mov_b32_e32 v1, s3			; VI-NEXT: v_mov_b32_e32 v1, s3
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: v_add_u32_e32 v5, vcc, v4, v6			; VI-NEXT: v_add_u32_e32 v6, vcc, v5, v4
	; VI-NEXT: v_cmp_gt_i32_e32 vcc, 0, v4			; VI-NEXT: v_cmp_gt_i32_e32 vcc, 0, v5
	; VI-NEXT: v_cmp_lt_i32_e64 s[0:1], v5, v6			; VI-NEXT: v_cmp_lt_i32_e64 s[0:1], v6, v4
	; VI-NEXT: s_xor_b64 s[0:1], vcc, s[0:1]			; VI-NEXT: s_xor_b64 s[0:1], vcc, s[0:1]
	; VI-NEXT: flat_store_dword v[2:3], v5			; VI-NEXT: flat_store_dword v[2:3], v6
	; VI-NEXT: v_cndmask_b32_e64 v2, 0, 1, s[0:1]			; VI-NEXT: v_cndmask_b32_e64 v2, 0, 1, s[0:1]
	; VI-NEXT: flat_store_byte v[0:1], v2			; VI-NEXT: flat_store_byte v[0:1], v2
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: v_saddo_i32:			; GFX9-LABEL: v_saddo_i32:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v4, s6			; GFX9-NEXT: v_mov_b32_e32 v0, s6
	; GFX9-NEXT: v_mov_b32_e32 v5, s7			; GFX9-NEXT: v_mov_b32_e32 v1, s7
	; GFX9-NEXT: v_mov_b32_e32 v6, s4			; GFX9-NEXT: v_mov_b32_e32 v2, s4
	; GFX9-NEXT: v_mov_b32_e32 v7, s5			; GFX9-NEXT: v_mov_b32_e32 v3, s5
	; GFX9-NEXT: global_load_dword v6, v[6:7], off			; GFX9-NEXT: global_load_dword v4, v[2:3], off
	; GFX9-NEXT: global_load_dword v4, v[4:5], off			; GFX9-NEXT: global_load_dword v5, v[0:1], off
	; GFX9-NEXT: v_mov_b32_e32 v2, s0			; GFX9-NEXT: v_mov_b32_e32 v2, s0
	; GFX9-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NEXT: v_mov_b32_e32 v3, s1
	; GFX9-NEXT: v_mov_b32_e32 v0, s2			; GFX9-NEXT: v_mov_b32_e32 v0, s2
	; GFX9-NEXT: v_mov_b32_e32 v1, s3			; GFX9-NEXT: v_mov_b32_e32 v1, s3
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_add_u32_e32 v5, v6, v4			; GFX9-NEXT: v_add_u32_e32 v6, v4, v5
	; GFX9-NEXT: v_cmp_gt_i32_e32 vcc, 0, v4			; GFX9-NEXT: v_cmp_gt_i32_e32 vcc, 0, v5
	; GFX9-NEXT: v_cmp_lt_i32_e64 s[0:1], v5, v6			; GFX9-NEXT: v_cmp_lt_i32_e64 s[0:1], v6, v4
	; GFX9-NEXT: s_xor_b64 s[0:1], vcc, s[0:1]			; GFX9-NEXT: s_xor_b64 s[0:1], vcc, s[0:1]
	; GFX9-NEXT: global_store_dword v[2:3], v5, off			; GFX9-NEXT: global_store_dword v[2:3], v6, off
	; GFX9-NEXT: v_cndmask_b32_e64 v2, 0, 1, s[0:1]			; GFX9-NEXT: v_cndmask_b32_e64 v2, 0, 1, s[0:1]
	; GFX9-NEXT: global_store_byte v[0:1], v2, off			; GFX9-NEXT: global_store_byte v[0:1], v2, off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	%a = load i32, i32 addrspace(1)* %aptr, align 4			%a = load i32, i32 addrspace(1)* %aptr, align 4
	%b = load i32, i32 addrspace(1)* %bptr, align 4			%b = load i32, i32 addrspace(1)* %bptr, align 4
	%sadd = call { i32, i1 } @llvm.sadd.with.overflow.i32(i32 %a, i32 %b) nounwind			%sadd = call { i32, i1 } @llvm.sadd.with.overflow.i32(i32 %a, i32 %b) nounwind
	%val = extractvalue { i32, i1 } %sadd, 0			%val = extractvalue { i32, i1 } %sadd, 0
	%carry = extractvalue { i32, i1 } %sadd, 1			%carry = extractvalue { i32, i1 } %sadd, 1
	▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines
	; SI-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[0:1]			; SI-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[0:1]
	; SI-NEXT: buffer_store_byte v0, off, s[12:15], 0			; SI-NEXT: buffer_store_byte v0, off, s[12:15], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: v_saddo_i64:			; VI-LABEL: v_saddo_i64:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v4, s6			; VI-NEXT: v_mov_b32_e32 v0, s6
	; VI-NEXT: v_mov_b32_e32 v5, s7			; VI-NEXT: v_mov_b32_e32 v1, s7
	; VI-NEXT: v_mov_b32_e32 v6, s4			; VI-NEXT: v_mov_b32_e32 v2, s4
	; VI-NEXT: v_mov_b32_e32 v7, s5			; VI-NEXT: v_mov_b32_e32 v3, s5
	; VI-NEXT: flat_load_dwordx2 v[6:7], v[6:7]			; VI-NEXT: flat_load_dwordx2 v[2:3], v[2:3]
	; VI-NEXT: flat_load_dwordx2 v[4:5], v[4:5]			; VI-NEXT: flat_load_dwordx2 v[0:1], v[0:1]
	; VI-NEXT: v_mov_b32_e32 v2, s0			; VI-NEXT: v_mov_b32_e32 v6, s0
	; VI-NEXT: v_mov_b32_e32 v3, s1			; VI-NEXT: v_mov_b32_e32 v7, s1
	; VI-NEXT: v_mov_b32_e32 v0, s2			; VI-NEXT: v_mov_b32_e32 v4, s2
	; VI-NEXT: v_mov_b32_e32 v1, s3			; VI-NEXT: v_mov_b32_e32 v5, s3
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: v_add_u32_e32 v8, vcc, v6, v4			; VI-NEXT: v_add_u32_e32 v8, vcc, v2, v0
	; VI-NEXT: v_addc_u32_e32 v9, vcc, v7, v5, vcc			; VI-NEXT: v_addc_u32_e32 v9, vcc, v3, v1, vcc
	; VI-NEXT: v_cmp_gt_i64_e32 vcc, 0, v[4:5]			; VI-NEXT: v_cmp_gt_i64_e32 vcc, 0, v[0:1]
	; VI-NEXT: v_cmp_lt_i64_e64 s[0:1], v[8:9], v[6:7]			; VI-NEXT: v_cmp_lt_i64_e64 s[0:1], v[8:9], v[2:3]
	; VI-NEXT: flat_store_dwordx2 v[2:3], v[8:9]			; VI-NEXT: flat_store_dwordx2 v[6:7], v[8:9]
	; VI-NEXT: s_xor_b64 s[0:1], vcc, s[0:1]			; VI-NEXT: s_xor_b64 s[0:1], vcc, s[0:1]
	; VI-NEXT: v_cndmask_b32_e64 v2, 0, 1, s[0:1]			; VI-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[0:1]
	; VI-NEXT: flat_store_byte v[0:1], v2			; VI-NEXT: flat_store_byte v[4:5], v0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: v_saddo_i64:			; GFX9-LABEL: v_saddo_i64:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v4, s6			; GFX9-NEXT: v_mov_b32_e32 v0, s6
	; GFX9-NEXT: v_mov_b32_e32 v5, s7			; GFX9-NEXT: v_mov_b32_e32 v1, s7
	; GFX9-NEXT: v_mov_b32_e32 v6, s4			; GFX9-NEXT: v_mov_b32_e32 v2, s4
	; GFX9-NEXT: v_mov_b32_e32 v7, s5			; GFX9-NEXT: v_mov_b32_e32 v3, s5
	; GFX9-NEXT: global_load_dwordx2 v[6:7], v[6:7], off			; GFX9-NEXT: global_load_dwordx2 v[2:3], v[2:3], off
	; GFX9-NEXT: global_load_dwordx2 v[4:5], v[4:5], off			; GFX9-NEXT: global_load_dwordx2 v[0:1], v[0:1], off
	; GFX9-NEXT: v_mov_b32_e32 v2, s0			; GFX9-NEXT: v_mov_b32_e32 v6, s0
	; GFX9-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NEXT: v_mov_b32_e32 v7, s1
	; GFX9-NEXT: v_mov_b32_e32 v0, s2			; GFX9-NEXT: v_mov_b32_e32 v4, s2
	; GFX9-NEXT: v_mov_b32_e32 v1, s3			; GFX9-NEXT: v_mov_b32_e32 v5, s3
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_add_co_u32_e32 v8, vcc, v6, v4			; GFX9-NEXT: v_add_co_u32_e32 v8, vcc, v2, v0
	; GFX9-NEXT: v_addc_co_u32_e32 v9, vcc, v7, v5, vcc			; GFX9-NEXT: v_addc_co_u32_e32 v9, vcc, v3, v1, vcc
	; GFX9-NEXT: v_cmp_gt_i64_e32 vcc, 0, v[4:5]			; GFX9-NEXT: v_cmp_gt_i64_e32 vcc, 0, v[0:1]
	; GFX9-NEXT: v_cmp_lt_i64_e64 s[0:1], v[8:9], v[6:7]			; GFX9-NEXT: v_cmp_lt_i64_e64 s[0:1], v[8:9], v[2:3]
	; GFX9-NEXT: global_store_dwordx2 v[2:3], v[8:9], off			; GFX9-NEXT: global_store_dwordx2 v[6:7], v[8:9], off
	; GFX9-NEXT: s_xor_b64 s[0:1], vcc, s[0:1]			; GFX9-NEXT: s_xor_b64 s[0:1], vcc, s[0:1]
	; GFX9-NEXT: v_cndmask_b32_e64 v2, 0, 1, s[0:1]			; GFX9-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[0:1]
	; GFX9-NEXT: global_store_byte v[0:1], v2, off			; GFX9-NEXT: global_store_byte v[4:5], v0, off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	%a = load i64, i64 addrspace(1)* %aptr, align 4			%a = load i64, i64 addrspace(1)* %aptr, align 4
	%b = load i64, i64 addrspace(1)* %bptr, align 4			%b = load i64, i64 addrspace(1)* %bptr, align 4
	%sadd = call { i64, i1 } @llvm.sadd.with.overflow.i64(i64 %a, i64 %b) nounwind			%sadd = call { i64, i1 } @llvm.sadd.with.overflow.i64(i64 %a, i64 %b) nounwind
	%val = extractvalue { i64, i1 } %sadd, 0			%val = extractvalue { i64, i1 } %sadd, 0
	%carry = extractvalue { i64, i1 } %sadd, 1			%carry = extractvalue { i64, i1 } %sadd, 1
	store i64 %val, i64 addrspace(1)* %out, align 8			store i64 %val, i64 addrspace(1)* %out, align 8
	store i1 %carry, i1 addrspace(1)* %carryout			store i1 %carry, i1 addrspace(1)* %carryout
	Show All 33 Lines
	; SI-NEXT: buffer_store_dwordx2 v[4:5], off, s[8:11], 0			; SI-NEXT: buffer_store_dwordx2 v[4:5], off, s[8:11], 0
	; SI-NEXT: buffer_store_dwordx2 v[0:1], off, s[16:19], 0			; SI-NEXT: buffer_store_dwordx2 v[0:1], off, s[16:19], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: v_saddo_v2i32:			; VI-LABEL: v_saddo_v2i32:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v4, s6			; VI-NEXT: v_mov_b32_e32 v0, s6
	; VI-NEXT: v_mov_b32_e32 v5, s7			; VI-NEXT: v_mov_b32_e32 v1, s7
	; VI-NEXT: v_mov_b32_e32 v6, s4			; VI-NEXT: v_mov_b32_e32 v2, s4
	; VI-NEXT: v_mov_b32_e32 v7, s5			; VI-NEXT: v_mov_b32_e32 v3, s5
	; VI-NEXT: flat_load_dwordx2 v[6:7], v[6:7]			; VI-NEXT: flat_load_dwordx2 v[2:3], v[2:3]
	; VI-NEXT: flat_load_dwordx2 v[4:5], v[4:5]			; VI-NEXT: flat_load_dwordx2 v[0:1], v[0:1]
	; VI-NEXT: v_mov_b32_e32 v2, s0			; VI-NEXT: v_mov_b32_e32 v6, s0
	; VI-NEXT: v_mov_b32_e32 v3, s1			; VI-NEXT: v_mov_b32_e32 v7, s1
	; VI-NEXT: v_mov_b32_e32 v0, s2			; VI-NEXT: v_mov_b32_e32 v4, s2
	; VI-NEXT: v_mov_b32_e32 v1, s3			; VI-NEXT: v_mov_b32_e32 v5, s3
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: v_add_u32_e32 v9, vcc, v7, v5			; VI-NEXT: v_add_u32_e32 v9, vcc, v3, v1
	; VI-NEXT: v_add_u32_e32 v8, vcc, v6, v4			; VI-NEXT: v_add_u32_e32 v8, vcc, v2, v0
	; VI-NEXT: v_cmp_gt_i32_e64 s[0:1], 0, v5			; VI-NEXT: v_cmp_gt_i32_e64 s[0:1], 0, v1
	; VI-NEXT: v_cmp_lt_i32_e64 s[4:5], v9, v7			; VI-NEXT: v_cmp_lt_i32_e64 s[4:5], v9, v3
	; VI-NEXT: v_cmp_gt_i32_e32 vcc, 0, v4
	; VI-NEXT: v_cmp_lt_i32_e64 s[2:3], v8, v6
	; VI-NEXT: s_xor_b64 s[0:1], s[0:1], s[4:5]			; VI-NEXT: s_xor_b64 s[0:1], s[0:1], s[4:5]
	; VI-NEXT: flat_store_dwordx2 v[2:3], v[8:9]			; VI-NEXT: v_cmp_gt_i32_e32 vcc, 0, v0
	; VI-NEXT: v_cndmask_b32_e64 v3, 0, 1, s[0:1]			; VI-NEXT: v_cmp_lt_i32_e64 s[2:3], v8, v2
				; VI-NEXT: v_cndmask_b32_e64 v1, 0, 1, s[0:1]
	; VI-NEXT: s_xor_b64 s[0:1], vcc, s[2:3]			; VI-NEXT: s_xor_b64 s[0:1], vcc, s[2:3]
	; VI-NEXT: v_cndmask_b32_e64 v2, 0, 1, s[0:1]			; VI-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[0:1]
	; VI-NEXT: flat_store_dwordx2 v[0:1], v[2:3]			; VI-NEXT: flat_store_dwordx2 v[6:7], v[8:9]
				; VI-NEXT: flat_store_dwordx2 v[4:5], v[0:1]
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: v_saddo_v2i32:			; GFX9-LABEL: v_saddo_v2i32:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v4, s6			; GFX9-NEXT: v_mov_b32_e32 v0, s6
	; GFX9-NEXT: v_mov_b32_e32 v5, s7			; GFX9-NEXT: v_mov_b32_e32 v1, s7
	; GFX9-NEXT: v_mov_b32_e32 v6, s4			; GFX9-NEXT: v_mov_b32_e32 v2, s4
	; GFX9-NEXT: v_mov_b32_e32 v7, s5			; GFX9-NEXT: v_mov_b32_e32 v3, s5
	; GFX9-NEXT: global_load_dwordx2 v[6:7], v[6:7], off			; GFX9-NEXT: global_load_dwordx2 v[2:3], v[2:3], off
	; GFX9-NEXT: global_load_dwordx2 v[4:5], v[4:5], off			; GFX9-NEXT: global_load_dwordx2 v[0:1], v[0:1], off
	; GFX9-NEXT: v_mov_b32_e32 v2, s0			; GFX9-NEXT: v_mov_b32_e32 v6, s0
	; GFX9-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NEXT: v_mov_b32_e32 v7, s1
	; GFX9-NEXT: v_mov_b32_e32 v0, s2			; GFX9-NEXT: v_mov_b32_e32 v4, s2
	; GFX9-NEXT: v_mov_b32_e32 v1, s3			; GFX9-NEXT: v_mov_b32_e32 v5, s3
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_add_u32_e32 v9, v7, v5			; GFX9-NEXT: v_add_u32_e32 v9, v3, v1
	; GFX9-NEXT: v_add_u32_e32 v8, v6, v4			; GFX9-NEXT: v_add_u32_e32 v8, v2, v0
	; GFX9-NEXT: v_cmp_gt_i32_e64 s[0:1], 0, v5			; GFX9-NEXT: v_cmp_gt_i32_e64 s[0:1], 0, v1
	; GFX9-NEXT: v_cmp_lt_i32_e64 s[4:5], v9, v7			; GFX9-NEXT: v_cmp_lt_i32_e64 s[4:5], v9, v3
	; GFX9-NEXT: v_cmp_gt_i32_e32 vcc, 0, v4
	; GFX9-NEXT: v_cmp_lt_i32_e64 s[2:3], v8, v6
	; GFX9-NEXT: s_xor_b64 s[0:1], s[0:1], s[4:5]			; GFX9-NEXT: s_xor_b64 s[0:1], s[0:1], s[4:5]
	; GFX9-NEXT: global_store_dwordx2 v[2:3], v[8:9], off			; GFX9-NEXT: v_cmp_gt_i32_e32 vcc, 0, v0
	; GFX9-NEXT: v_cndmask_b32_e64 v3, 0, 1, s[0:1]			; GFX9-NEXT: v_cmp_lt_i32_e64 s[2:3], v8, v2
				; GFX9-NEXT: v_cndmask_b32_e64 v1, 0, 1, s[0:1]
	; GFX9-NEXT: s_xor_b64 s[0:1], vcc, s[2:3]			; GFX9-NEXT: s_xor_b64 s[0:1], vcc, s[2:3]
	; GFX9-NEXT: v_cndmask_b32_e64 v2, 0, 1, s[0:1]			; GFX9-NEXT: v_cndmask_b32_e64 v0, 0, 1, s[0:1]
	; GFX9-NEXT: global_store_dwordx2 v[0:1], v[2:3], off			; GFX9-NEXT: global_store_dwordx2 v[6:7], v[8:9], off
				; GFX9-NEXT: global_store_dwordx2 v[4:5], v[0:1], off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	%a = load <2 x i32>, <2 x i32> addrspace(1)* %aptr, align 4			%a = load <2 x i32>, <2 x i32> addrspace(1)* %aptr, align 4
	%b = load <2 x i32>, <2 x i32> addrspace(1)* %bptr, align 4			%b = load <2 x i32>, <2 x i32> addrspace(1)* %bptr, align 4
	%sadd = call { <2 x i32>, <2 x i1> } @llvm.sadd.with.overflow.v2i32(<2 x i32> %a, <2 x i32> %b) nounwind			%sadd = call { <2 x i32>, <2 x i1> } @llvm.sadd.with.overflow.v2i32(<2 x i32> %a, <2 x i32> %b) nounwind
	%val = extractvalue { <2 x i32>, <2 x i1> } %sadd, 0			%val = extractvalue { <2 x i32>, <2 x i1> } %sadd, 0
	%carry = extractvalue { <2 x i32>, <2 x i1> } %sadd, 1			%carry = extractvalue { <2 x i32>, <2 x i1> } %sadd, 1
	store <2 x i32> %val, <2 x i32> addrspace(1)* %out, align 4			store <2 x i32> %val, <2 x i32> addrspace(1)* %out, align 4
	%carry.ext = zext <2 x i1> %carry to <2 x i32>			%carry.ext = zext <2 x i1> %carry to <2 x i32>
	store <2 x i32> %carry.ext, <2 x i32> addrspace(1)* %carryout			store <2 x i32> %carry.ext, <2 x i32> addrspace(1)* %carryout
	ret void			ret void
	}			}

llvm/test/CodeGen/AMDGPU/salu-to-valu.ll

Show First 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
; Original scalar load uses SGPR offset on SI and 32-bit literal on		; Original scalar load uses SGPR offset on SI and 32-bit literal on
; CI.		; CI.

; GCN-LABEL: {{^}}smrd_valu_ci_offset_x8:		; GCN-LABEL: {{^}}smrd_valu_ci_offset_x8:
; GCN-NOHSA: s_mov_b32 [[OFFSET0:s[0-9]+]], 0x9a40{{$}}		; GCN-NOHSA: s_mov_b32 [[OFFSET0:s[0-9]+]], 0x9a40{{$}}
; GCN-NOHSA-NOT: v_add		; GCN-NOHSA-NOT: v_add
; CI-NOHSA: s_mov_b32 [[OFFSET1:s[0-9]+]], 0x9a50{{$}}		; CI-NOHSA: s_mov_b32 [[OFFSET1:s[0-9]+]], 0x9a50{{$}}
; CI-NOHSA-NOT: v_add		; CI-NOHSA-NOT: v_add
; SI: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], 0 addr64 offset:16		; SI-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], 0 addr64 offset:16
; CI-NOHSA: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET1]] addr64{{$}}		; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET1]] addr64{{$}}
; GCN-NOHSA: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET0]] addr64{{$}}		; GCN-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET0]] addr64{{$}}

; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}		; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}
; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}		; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}
; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}		; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}
; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}		; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}
; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}		; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}
; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}		; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}
; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}		; GCN-NOHSA: v_or_b32_e32 {{v[0-9]+}}, {{s[0-9]+}}, {{v[0-9]+}}
Show All 11 Lines	entry:
%tmp5 = or <8 x i32> %tmp4, %c		%tmp5 = or <8 x i32> %tmp4, %c
store <8 x i32> %tmp5, <8 x i32> addrspace(1)* %out		store <8 x i32> %tmp5, <8 x i32> addrspace(1)* %out
ret void		ret void
}		}

; GCN-LABEL: {{^}}smrd_valu_ci_offset_x16:		; GCN-LABEL: {{^}}smrd_valu_ci_offset_x16:

; SI: s_mov_b32 {{s[0-9]+}}, 0x13480		; SI: s_mov_b32 {{s[0-9]+}}, 0x13480
; SI: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], 0 addr64 offset:16		; SI-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], 0 addr64 offset:16
; SI: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], 0 addr64 offset:32		; SI-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], 0 addr64 offset:32
; SI: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], 0 addr64 offset:48		; SI-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], 0 addr64 offset:48
; SI: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], {{s[0-9]+}} addr64		; SI-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], {{s[0-9]+}} addr64
; CI-NOHSA-DAG: s_mov_b32 [[OFFSET0:s[0-9]+]], 0x13480{{$}}		; CI-NOHSA-DAG: s_mov_b32 [[OFFSET0:s[0-9]+]], 0x13480{{$}}
; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET0]] addr64{{$}}		; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET0]] addr64{{$}}
; CI-NOHSA-DAG: s_mov_b32 [[OFFSET1:s[0-9]+]], 0x13490{{$}}		; CI-NOHSA-DAG: s_mov_b32 [[OFFSET1:s[0-9]+]], 0x13490{{$}}
; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET1]] addr64{{$}}		; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET1]] addr64{{$}}
; CI-NOHSA-DAG: s_mov_b32 [[OFFSET2:s[0-9]+]], 0x134a0{{$}}		; CI-NOHSA-DAG: s_mov_b32 [[OFFSET2:s[0-9]+]], 0x134a0{{$}}
; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET2]] addr64{{$}}		; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET2]] addr64{{$}}
; CI-NOHSA-DAG: s_mov_b32 [[OFFSET3:s[0-9]+]], 0x134b0{{$}}		; CI-NOHSA-DAG: s_mov_b32 [[OFFSET3:s[0-9]+]], 0x134b0{{$}}
; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET3]] addr64{{$}}		; CI-NOHSA-DAG: buffer_load_dwordx4 v{{\[[0-9]+:[0-9]+\]}}, v{{\[[0-9]+:[0-9]+\]}}, s[{{[0-9]+:[0-9]+}}], [[OFFSET3]] addr64{{$}}
▲ Show 20 Lines • Show All 296 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/sched-assert-dead-def-subreg-use-other-subreg.mir

Show All 31 Lines	body: \|
; CHECK: dead %6:vgpr_32 = DS_READ_B32_gfx9 undef %7:vgpr_32, 0, 0, implicit $exec		; CHECK: dead %6:vgpr_32 = DS_READ_B32_gfx9 undef %7:vgpr_32, 0, 0, implicit $exec
; CHECK: dead %8:vreg_64 = DS_READ_B64_gfx9 [[V_MOV_B32_e32_]], 0, 0, implicit $exec		; CHECK: dead %8:vreg_64 = DS_READ_B64_gfx9 [[V_MOV_B32_e32_]], 0, 0, implicit $exec
; CHECK: dead %9:vreg_128 = DS_READ_B128_gfx9 [[V_ADD_U32_e32_]], 0, 0, implicit $exec		; CHECK: dead %9:vreg_128 = DS_READ_B128_gfx9 [[V_ADD_U32_e32_]], 0, 0, implicit $exec
; CHECK: [[COPY1:%[0-9]+]]:vgpr_32 = COPY [[COPY]].sub0		; CHECK: [[COPY1:%[0-9]+]]:vgpr_32 = COPY [[COPY]].sub0
; CHECK: undef %11.sub1:vreg_512 = COPY [[COPY]].sub1		; CHECK: undef %11.sub1:vreg_512 = COPY [[COPY]].sub1
; CHECK: INLINEASM &"", 1, 851978, def dead [[COPY1]], 851978, def dead [[COPY]].sub1, 2147483657, [[COPY1]], 2147549193, [[COPY]].sub1		; CHECK: INLINEASM &"", 1, 851978, def dead [[COPY1]], 851978, def dead [[COPY]].sub1, 2147483657, [[COPY1]], 2147549193, [[COPY]].sub1
; CHECK: %11.sub0:vreg_512 = COPY [[COPY]].sub0		; CHECK: %11.sub0:vreg_512 = COPY [[COPY]].sub0
; CHECK: %11.sub3:vreg_512 = COPY [[COPY]].sub3		; CHECK: %11.sub3:vreg_512 = COPY [[COPY]].sub3
; CHECK: dead %10:vgpr_32 = V_ADD_I32_e32 4, [[V_MOV_B32_e32_1]], implicit-def dead $vcc, implicit $exec
; CHECK: %11.sub2:vreg_512 = COPY undef [[V_MOV_B32_e32_]]		; CHECK: %11.sub2:vreg_512 = COPY undef [[V_MOV_B32_e32_]]
; CHECK: %11.sub5:vreg_512 = COPY undef [[V_MOV_B32_e32_]]		; CHECK: %11.sub5:vreg_512 = COPY undef [[V_MOV_B32_e32_]]
; CHECK: [[COPY2:%[0-9]+]]:vreg_512 = COPY %11		; CHECK: [[COPY2:%[0-9]+]]:vreg_512 = COPY %11
		; CHECK: dead %10:vgpr_32 = V_ADD_I32_e32 4, [[V_MOV_B32_e32_1]], implicit-def dead $vcc, implicit $exec
; CHECK: S_BRANCH %bb.1		; CHECK: S_BRANCH %bb.1
bb.0:		bb.0:
liveins: $sgpr6_sgpr7		liveins: $sgpr6_sgpr7

undef %0.sub3:vreg_512 = V_MOV_B32_e32 0, implicit $exec		undef %0.sub3:vreg_512 = V_MOV_B32_e32 0, implicit $exec
%1:vgpr_32 = V_MOV_B32_e32 0, implicit $exec		%1:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
%2:vgpr_32 = V_ADD_U32_e32 0, %1, implicit $exec		%2:vgpr_32 = V_ADD_U32_e32 0, %1, implicit $exec
%3:vgpr_32 = V_MOV_B32_e32 0, implicit $exec		%3:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
Show All 19 Lines

llvm/test/CodeGen/AMDGPU/sdiv.ll

	Show First 20 Lines • Show All 234 Lines • ▼ Show 20 Lines
	; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0			; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; TONGA-LABEL: sdiv_i32_4:			; TONGA-LABEL: sdiv_i32_4:
	; TONGA: ; %bb.0:			; TONGA: ; %bb.0:
	; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; TONGA-NEXT: s_mov_b32 s3, 0xf000			; TONGA-NEXT: s_mov_b32 s3, 0xf000
	; TONGA-NEXT: s_mov_b32 s2, -1			; TONGA-NEXT: s_mov_b32 s2, -1
				; TONGA-NEXT: s_mov_b32 s10, s2
				; TONGA-NEXT: s_mov_b32 s11, s3
	; TONGA-NEXT: s_waitcnt lgkmcnt(0)			; TONGA-NEXT: s_waitcnt lgkmcnt(0)
				; TONGA-NEXT: s_mov_b32 s8, s6
				; TONGA-NEXT: s_mov_b32 s9, s7
				; TONGA-NEXT: buffer_load_dword v0, off, s[8:11], 0
	; TONGA-NEXT: s_mov_b32 s0, s4			; TONGA-NEXT: s_mov_b32 s0, s4
	; TONGA-NEXT: s_mov_b32 s1, s5			; TONGA-NEXT: s_mov_b32 s1, s5
	; TONGA-NEXT: s_mov_b32 s4, s6
	; TONGA-NEXT: s_mov_b32 s5, s7
	; TONGA-NEXT: s_mov_b32 s6, s2
	; TONGA-NEXT: s_mov_b32 s7, s3
	; TONGA-NEXT: buffer_load_dword v0, off, s[4:7], 0
	; TONGA-NEXT: s_waitcnt vmcnt(0)			; TONGA-NEXT: s_waitcnt vmcnt(0)
	; TONGA-NEXT: v_ashrrev_i32_e32 v1, 31, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v1, 31, v0
	; TONGA-NEXT: v_lshrrev_b32_e32 v1, 30, v1			; TONGA-NEXT: v_lshrrev_b32_e32 v1, 30, v1
	; TONGA-NEXT: v_add_u32_e32 v0, vcc, v0, v1			; TONGA-NEXT: v_add_u32_e32 v0, vcc, v0, v1
	; TONGA-NEXT: v_ashrrev_i32_e32 v0, 2, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v0, 2, v0
	; TONGA-NEXT: buffer_store_dword v0, off, s[0:3], 0			; TONGA-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; TONGA-NEXT: s_endpgm			; TONGA-NEXT: s_endpgm
	;			;
	▲ Show 20 Lines • Show All 229 Lines • ▼ Show 20 Lines
	; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[8:11], 0			; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[8:11], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; TONGA-LABEL: sdiv_v2i32:			; TONGA-LABEL: sdiv_v2i32:
	; TONGA: ; %bb.0:			; TONGA: ; %bb.0:
	; TONGA-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; TONGA-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; TONGA-NEXT: s_mov_b32 s11, 0xf000			; TONGA-NEXT: s_mov_b32 s11, 0xf000
	; TONGA-NEXT: s_mov_b32 s10, -1			; TONGA-NEXT: s_mov_b32 s10, -1
	; TONGA-NEXT: s_mov_b32 s4, 0x4f800000			; TONGA-NEXT: s_mov_b32 s6, s10
				; TONGA-NEXT: s_mov_b32 s7, s11
	; TONGA-NEXT: s_waitcnt lgkmcnt(0)			; TONGA-NEXT: s_waitcnt lgkmcnt(0)
				; TONGA-NEXT: s_mov_b32 s4, s2
				; TONGA-NEXT: s_mov_b32 s5, s3
				; TONGA-NEXT: buffer_load_dwordx4 v[0:3], off, s[4:7], 0
				; TONGA-NEXT: s_mov_b32 s2, 0x4f800000
	; TONGA-NEXT: s_mov_b32 s8, s0			; TONGA-NEXT: s_mov_b32 s8, s0
	; TONGA-NEXT: s_mov_b32 s9, s1			; TONGA-NEXT: s_mov_b32 s9, s1
	; TONGA-NEXT: s_mov_b32 s0, s2
	; TONGA-NEXT: s_mov_b32 s1, s3
	; TONGA-NEXT: s_mov_b32 s2, s10
	; TONGA-NEXT: s_mov_b32 s3, s11
	; TONGA-NEXT: buffer_load_dwordx4 v[0:3], off, s[0:3], 0
	; TONGA-NEXT: s_waitcnt vmcnt(0)			; TONGA-NEXT: s_waitcnt vmcnt(0)
	; TONGA-NEXT: v_ashrrev_i32_e32 v5, 31, v2			; TONGA-NEXT: v_ashrrev_i32_e32 v5, 31, v2
	; TONGA-NEXT: v_ashrrev_i32_e32 v7, 31, v3			; TONGA-NEXT: v_ashrrev_i32_e32 v7, 31, v3
	; TONGA-NEXT: v_add_u32_e32 v2, vcc, v5, v2			; TONGA-NEXT: v_add_u32_e32 v2, vcc, v5, v2
	; TONGA-NEXT: v_ashrrev_i32_e32 v4, 31, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v4, 31, v0
	; TONGA-NEXT: v_add_u32_e32 v3, vcc, v7, v3			; TONGA-NEXT: v_add_u32_e32 v3, vcc, v7, v3
	; TONGA-NEXT: v_xor_b32_e32 v2, v2, v5			; TONGA-NEXT: v_xor_b32_e32 v2, v2, v5
	; TONGA-NEXT: v_ashrrev_i32_e32 v6, 31, v1			; TONGA-NEXT: v_ashrrev_i32_e32 v6, 31, v1
	; TONGA-NEXT: v_xor_b32_e32 v8, v4, v5			; TONGA-NEXT: v_xor_b32_e32 v8, v4, v5
	; TONGA-NEXT: v_cvt_f32_u32_e32 v5, v2			; TONGA-NEXT: v_cvt_f32_u32_e32 v5, v2
	; TONGA-NEXT: v_xor_b32_e32 v3, v3, v7			; TONGA-NEXT: v_xor_b32_e32 v3, v3, v7
	; TONGA-NEXT: v_xor_b32_e32 v9, v6, v7			; TONGA-NEXT: v_xor_b32_e32 v9, v6, v7
	; TONGA-NEXT: v_cvt_f32_u32_e32 v7, v3			; TONGA-NEXT: v_cvt_f32_u32_e32 v7, v3
	; TONGA-NEXT: v_rcp_iflag_f32_e32 v5, v5			; TONGA-NEXT: v_rcp_iflag_f32_e32 v5, v5
	; TONGA-NEXT: v_add_u32_e32 v0, vcc, v4, v0			; TONGA-NEXT: v_add_u32_e32 v0, vcc, v4, v0
	; TONGA-NEXT: v_xor_b32_e32 v0, v0, v4			; TONGA-NEXT: v_xor_b32_e32 v0, v0, v4
	; TONGA-NEXT: v_rcp_iflag_f32_e32 v7, v7			; TONGA-NEXT: v_rcp_iflag_f32_e32 v7, v7
	; TONGA-NEXT: v_mul_f32_e32 v4, s4, v5			; TONGA-NEXT: v_mul_f32_e32 v4, s2, v5
	; TONGA-NEXT: v_cvt_u32_f32_e32 v4, v4			; TONGA-NEXT: v_cvt_u32_f32_e32 v4, v4
	; TONGA-NEXT: v_add_u32_e32 v1, vcc, v6, v1			; TONGA-NEXT: v_add_u32_e32 v1, vcc, v6, v1
	; TONGA-NEXT: v_mul_f32_e32 v5, s4, v7			; TONGA-NEXT: v_mul_f32_e32 v5, s2, v7
	; TONGA-NEXT: v_cvt_u32_f32_e32 v5, v5			; TONGA-NEXT: v_cvt_u32_f32_e32 v5, v5
	; TONGA-NEXT: v_xor_b32_e32 v1, v1, v6			; TONGA-NEXT: v_xor_b32_e32 v1, v1, v6
	; TONGA-NEXT: v_mul_hi_u32 v6, v4, v2			; TONGA-NEXT: v_mul_hi_u32 v6, v4, v2
	; TONGA-NEXT: v_mul_lo_u32 v7, v4, v2			; TONGA-NEXT: v_mul_lo_u32 v7, v4, v2
	; TONGA-NEXT: v_mul_hi_u32 v10, v5, v3			; TONGA-NEXT: v_mul_hi_u32 v10, v5, v3
	; TONGA-NEXT: v_mul_lo_u32 v11, v5, v3			; TONGA-NEXT: v_mul_lo_u32 v11, v5, v3
	; TONGA-NEXT: v_cmp_eq_u32_e64 s[0:1], 0, v6			; TONGA-NEXT: v_cmp_eq_u32_e64 s[0:1], 0, v6
	; TONGA-NEXT: v_sub_u32_e32 v12, vcc, 0, v7			; TONGA-NEXT: v_sub_u32_e32 v12, vcc, 0, v7
	Show All 36 Lines
	; TONGA-NEXT: buffer_store_dwordx2 v[0:1], off, s[8:11], 0			; TONGA-NEXT: buffer_store_dwordx2 v[0:1], off, s[8:11], 0
	; TONGA-NEXT: s_endpgm			; TONGA-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: sdiv_v2i32:			; GFX9-LABEL: sdiv_v2i32:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s11, 0xf000			; GFX9-NEXT: s_mov_b32 s11, 0xf000
	; GFX9-NEXT: s_mov_b32 s10, -1			; GFX9-NEXT: s_mov_b32 s10, -1
	; GFX9-NEXT: s_mov_b32 s4, 0x4f800000			; GFX9-NEXT: s_mov_b32 s6, s10
				; GFX9-NEXT: s_mov_b32 s7, s11
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_mov_b32 s4, s2
				; GFX9-NEXT: s_mov_b32 s5, s3
				; GFX9-NEXT: buffer_load_dwordx4 v[0:3], off, s[4:7], 0
				; GFX9-NEXT: s_mov_b32 s2, 0x4f800000
	; GFX9-NEXT: s_mov_b32 s8, s0			; GFX9-NEXT: s_mov_b32 s8, s0
	; GFX9-NEXT: s_mov_b32 s9, s1			; GFX9-NEXT: s_mov_b32 s9, s1
	; GFX9-NEXT: s_mov_b32 s0, s2
	; GFX9-NEXT: s_mov_b32 s1, s3
	; GFX9-NEXT: s_mov_b32 s2, s10
	; GFX9-NEXT: s_mov_b32 s3, s11
	; GFX9-NEXT: buffer_load_dwordx4 v[0:3], off, s[0:3], 0
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_ashrrev_i32_e32 v5, 31, v2			; GFX9-NEXT: v_ashrrev_i32_e32 v5, 31, v2
	; GFX9-NEXT: v_ashrrev_i32_e32 v6, 31, v3			; GFX9-NEXT: v_ashrrev_i32_e32 v6, 31, v3
	; GFX9-NEXT: v_add_u32_e32 v2, v2, v5			; GFX9-NEXT: v_add_u32_e32 v2, v2, v5
	; GFX9-NEXT: v_add_u32_e32 v3, v3, v6			; GFX9-NEXT: v_add_u32_e32 v3, v3, v6
	; GFX9-NEXT: v_xor_b32_e32 v2, v2, v5			; GFX9-NEXT: v_xor_b32_e32 v2, v2, v5
	; GFX9-NEXT: v_cvt_f32_u32_e32 v7, v2			; GFX9-NEXT: v_cvt_f32_u32_e32 v7, v2
	; GFX9-NEXT: v_xor_b32_e32 v3, v3, v6			; GFX9-NEXT: v_xor_b32_e32 v3, v3, v6
	; GFX9-NEXT: v_cvt_f32_u32_e32 v8, v3			; GFX9-NEXT: v_cvt_f32_u32_e32 v8, v3
	; GFX9-NEXT: v_ashrrev_i32_e32 v4, 31, v0			; GFX9-NEXT: v_ashrrev_i32_e32 v4, 31, v0
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v7, v7			; GFX9-NEXT: v_rcp_iflag_f32_e32 v7, v7
	; GFX9-NEXT: v_add_u32_e32 v0, v0, v4			; GFX9-NEXT: v_add_u32_e32 v0, v0, v4
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v8, v8			; GFX9-NEXT: v_rcp_iflag_f32_e32 v8, v8
	; GFX9-NEXT: v_xor_b32_e32 v5, v4, v5			; GFX9-NEXT: v_xor_b32_e32 v5, v4, v5
	; GFX9-NEXT: v_mul_f32_e32 v7, s4, v7			; GFX9-NEXT: v_mul_f32_e32 v7, s2, v7
	; GFX9-NEXT: v_cvt_u32_f32_e32 v7, v7			; GFX9-NEXT: v_cvt_u32_f32_e32 v7, v7
	; GFX9-NEXT: v_mul_f32_e32 v8, s4, v8			; GFX9-NEXT: v_mul_f32_e32 v8, s2, v8
	; GFX9-NEXT: v_cvt_u32_f32_e32 v8, v8			; GFX9-NEXT: v_cvt_u32_f32_e32 v8, v8
	; GFX9-NEXT: v_xor_b32_e32 v0, v0, v4			; GFX9-NEXT: v_xor_b32_e32 v0, v0, v4
	; GFX9-NEXT: v_mul_lo_u32 v4, v7, v2			; GFX9-NEXT: v_mul_lo_u32 v4, v7, v2
	; GFX9-NEXT: v_mul_hi_u32 v11, v7, v2			; GFX9-NEXT: v_mul_hi_u32 v11, v7, v2
	; GFX9-NEXT: v_mul_lo_u32 v10, v8, v3			; GFX9-NEXT: v_mul_lo_u32 v10, v8, v3
	; GFX9-NEXT: v_mul_hi_u32 v12, v8, v3			; GFX9-NEXT: v_mul_hi_u32 v12, v8, v3
	; GFX9-NEXT: v_sub_u32_e32 v13, 0, v4			; GFX9-NEXT: v_sub_u32_e32 v13, 0, v4
	; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v11			; GFX9-NEXT: v_cmp_eq_u32_e32 vcc, 0, v11
	▲ Show 20 Lines • Show All 148 Lines • ▼ Show 20 Lines
	; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[4:7], 0			; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; TONGA-LABEL: sdiv_v2i32_4:			; TONGA-LABEL: sdiv_v2i32_4:
	; TONGA: ; %bb.0:			; TONGA: ; %bb.0:
	; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; TONGA-NEXT: s_mov_b32 s3, 0xf000			; TONGA-NEXT: s_mov_b32 s3, 0xf000
	; TONGA-NEXT: s_mov_b32 s2, -1			; TONGA-NEXT: s_mov_b32 s2, -1
				; TONGA-NEXT: s_mov_b32 s10, s2
				; TONGA-NEXT: s_mov_b32 s11, s3
	; TONGA-NEXT: s_waitcnt lgkmcnt(0)			; TONGA-NEXT: s_waitcnt lgkmcnt(0)
				; TONGA-NEXT: s_mov_b32 s8, s6
				; TONGA-NEXT: s_mov_b32 s9, s7
				; TONGA-NEXT: buffer_load_dwordx2 v[0:1], off, s[8:11], 0
	; TONGA-NEXT: s_mov_b32 s0, s4			; TONGA-NEXT: s_mov_b32 s0, s4
	; TONGA-NEXT: s_mov_b32 s1, s5			; TONGA-NEXT: s_mov_b32 s1, s5
	; TONGA-NEXT: s_mov_b32 s4, s6
	; TONGA-NEXT: s_mov_b32 s5, s7
	; TONGA-NEXT: s_mov_b32 s6, s2
	; TONGA-NEXT: s_mov_b32 s7, s3
	; TONGA-NEXT: buffer_load_dwordx2 v[0:1], off, s[4:7], 0
	; TONGA-NEXT: s_waitcnt vmcnt(0)			; TONGA-NEXT: s_waitcnt vmcnt(0)
	; TONGA-NEXT: v_ashrrev_i32_e32 v2, 31, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v2, 31, v0
	; TONGA-NEXT: v_ashrrev_i32_e32 v3, 31, v1			; TONGA-NEXT: v_ashrrev_i32_e32 v3, 31, v1
	; TONGA-NEXT: v_lshrrev_b32_e32 v2, 30, v2			; TONGA-NEXT: v_lshrrev_b32_e32 v2, 30, v2
	; TONGA-NEXT: v_lshrrev_b32_e32 v3, 30, v3			; TONGA-NEXT: v_lshrrev_b32_e32 v3, 30, v3
	; TONGA-NEXT: v_add_u32_e32 v0, vcc, v2, v0			; TONGA-NEXT: v_add_u32_e32 v0, vcc, v2, v0
	; TONGA-NEXT: v_add_u32_e32 v1, vcc, v3, v1			; TONGA-NEXT: v_add_u32_e32 v1, vcc, v3, v1
	; TONGA-NEXT: v_ashrrev_i32_e32 v0, 2, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v0, 2, v0
	; TONGA-NEXT: v_ashrrev_i32_e32 v1, 2, v1			; TONGA-NEXT: v_ashrrev_i32_e32 v1, 2, v1
	; TONGA-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0			; TONGA-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; TONGA-NEXT: s_endpgm			; TONGA-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: sdiv_v2i32_4:			; GFX9-LABEL: sdiv_v2i32_4:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
				; GFX9-NEXT: s_mov_b32 s10, s2
				; GFX9-NEXT: s_mov_b32 s11, s3
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_mov_b32 s8, s6
				; GFX9-NEXT: s_mov_b32 s9, s7
				; GFX9-NEXT: buffer_load_dwordx2 v[0:1], off, s[8:11], 0
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: s_mov_b32 s4, s6
	; GFX9-NEXT: s_mov_b32 s5, s7
	; GFX9-NEXT: s_mov_b32 s6, s2
	; GFX9-NEXT: s_mov_b32 s7, s3
	; GFX9-NEXT: buffer_load_dwordx2 v[0:1], off, s[4:7], 0
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_ashrrev_i32_e32 v2, 31, v0			; GFX9-NEXT: v_ashrrev_i32_e32 v2, 31, v0
	; GFX9-NEXT: v_ashrrev_i32_e32 v3, 31, v1			; GFX9-NEXT: v_ashrrev_i32_e32 v3, 31, v1
	; GFX9-NEXT: v_lshrrev_b32_e32 v2, 30, v2			; GFX9-NEXT: v_lshrrev_b32_e32 v2, 30, v2
	; GFX9-NEXT: v_lshrrev_b32_e32 v3, 30, v3			; GFX9-NEXT: v_lshrrev_b32_e32 v3, 30, v3
	; GFX9-NEXT: v_add_u32_e32 v0, v0, v2			; GFX9-NEXT: v_add_u32_e32 v0, v0, v2
	; GFX9-NEXT: v_add_u32_e32 v1, v1, v3			; GFX9-NEXT: v_add_u32_e32 v1, v1, v3
	; GFX9-NEXT: v_ashrrev_i32_e32 v0, 2, v0			; GFX9-NEXT: v_ashrrev_i32_e32 v0, 2, v0
	▲ Show 20 Lines • Show All 657 Lines • ▼ Show 20 Lines
	; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0			; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; TONGA-LABEL: sdiv_v4i32_4:			; TONGA-LABEL: sdiv_v4i32_4:
	; TONGA: ; %bb.0:			; TONGA: ; %bb.0:
	; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; TONGA-NEXT: s_mov_b32 s3, 0xf000			; TONGA-NEXT: s_mov_b32 s3, 0xf000
	; TONGA-NEXT: s_mov_b32 s2, -1			; TONGA-NEXT: s_mov_b32 s2, -1
				; TONGA-NEXT: s_mov_b32 s10, s2
				; TONGA-NEXT: s_mov_b32 s11, s3
	; TONGA-NEXT: s_waitcnt lgkmcnt(0)			; TONGA-NEXT: s_waitcnt lgkmcnt(0)
				; TONGA-NEXT: s_mov_b32 s8, s6
				; TONGA-NEXT: s_mov_b32 s9, s7
				; TONGA-NEXT: buffer_load_dwordx4 v[0:3], off, s[8:11], 0
	; TONGA-NEXT: s_mov_b32 s0, s4			; TONGA-NEXT: s_mov_b32 s0, s4
	; TONGA-NEXT: s_mov_b32 s1, s5			; TONGA-NEXT: s_mov_b32 s1, s5
	; TONGA-NEXT: s_mov_b32 s4, s6
	; TONGA-NEXT: s_mov_b32 s5, s7
	; TONGA-NEXT: s_mov_b32 s6, s2
	; TONGA-NEXT: s_mov_b32 s7, s3
	; TONGA-NEXT: buffer_load_dwordx4 v[0:3], off, s[4:7], 0
	; TONGA-NEXT: s_waitcnt vmcnt(0)			; TONGA-NEXT: s_waitcnt vmcnt(0)
	; TONGA-NEXT: v_ashrrev_i32_e32 v4, 31, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v4, 31, v0
	; TONGA-NEXT: v_ashrrev_i32_e32 v5, 31, v1			; TONGA-NEXT: v_ashrrev_i32_e32 v5, 31, v1
	; TONGA-NEXT: v_ashrrev_i32_e32 v6, 31, v2			; TONGA-NEXT: v_ashrrev_i32_e32 v6, 31, v2
	; TONGA-NEXT: v_ashrrev_i32_e32 v7, 31, v3			; TONGA-NEXT: v_ashrrev_i32_e32 v7, 31, v3
	; TONGA-NEXT: v_lshrrev_b32_e32 v4, 30, v4			; TONGA-NEXT: v_lshrrev_b32_e32 v4, 30, v4
	; TONGA-NEXT: v_lshrrev_b32_e32 v5, 30, v5			; TONGA-NEXT: v_lshrrev_b32_e32 v5, 30, v5
	; TONGA-NEXT: v_lshrrev_b32_e32 v6, 30, v6			; TONGA-NEXT: v_lshrrev_b32_e32 v6, 30, v6
	Show All 9 Lines
	; TONGA-NEXT: buffer_store_dwordx4 v[0:3], off, s[0:3], 0			; TONGA-NEXT: buffer_store_dwordx4 v[0:3], off, s[0:3], 0
	; TONGA-NEXT: s_endpgm			; TONGA-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: sdiv_v4i32_4:			; GFX9-LABEL: sdiv_v4i32_4:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
				; GFX9-NEXT: s_mov_b32 s10, s2
				; GFX9-NEXT: s_mov_b32 s11, s3
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_mov_b32 s8, s6
				; GFX9-NEXT: s_mov_b32 s9, s7
				; GFX9-NEXT: buffer_load_dwordx4 v[0:3], off, s[8:11], 0
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: s_mov_b32 s4, s6
	; GFX9-NEXT: s_mov_b32 s5, s7
	; GFX9-NEXT: s_mov_b32 s6, s2
	; GFX9-NEXT: s_mov_b32 s7, s3
	; GFX9-NEXT: buffer_load_dwordx4 v[0:3], off, s[4:7], 0
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_ashrrev_i32_e32 v4, 31, v0			; GFX9-NEXT: v_ashrrev_i32_e32 v4, 31, v0
	; GFX9-NEXT: v_ashrrev_i32_e32 v5, 31, v1			; GFX9-NEXT: v_ashrrev_i32_e32 v5, 31, v1
	; GFX9-NEXT: v_ashrrev_i32_e32 v6, 31, v2			; GFX9-NEXT: v_ashrrev_i32_e32 v6, 31, v2
	; GFX9-NEXT: v_ashrrev_i32_e32 v7, 31, v3			; GFX9-NEXT: v_ashrrev_i32_e32 v7, 31, v3
	; GFX9-NEXT: v_lshrrev_b32_e32 v4, 30, v4			; GFX9-NEXT: v_lshrrev_b32_e32 v4, 30, v4
	; GFX9-NEXT: v_lshrrev_b32_e32 v5, 30, v5			; GFX9-NEXT: v_lshrrev_b32_e32 v5, 30, v5
	; GFX9-NEXT: v_lshrrev_b32_e32 v6, 30, v6			; GFX9-NEXT: v_lshrrev_b32_e32 v6, 30, v6
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0			; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; TONGA-LABEL: v_sdiv_i8:			; TONGA-LABEL: v_sdiv_i8:
	; TONGA: ; %bb.0:			; TONGA: ; %bb.0:
	; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; TONGA-NEXT: s_mov_b32 s3, 0xf000			; TONGA-NEXT: s_mov_b32 s3, 0xf000
	; TONGA-NEXT: s_mov_b32 s2, -1			; TONGA-NEXT: s_mov_b32 s2, -1
				; TONGA-NEXT: s_mov_b32 s10, s2
				; TONGA-NEXT: s_mov_b32 s11, s3
	; TONGA-NEXT: s_waitcnt lgkmcnt(0)			; TONGA-NEXT: s_waitcnt lgkmcnt(0)
				; TONGA-NEXT: s_mov_b32 s8, s6
				; TONGA-NEXT: s_mov_b32 s9, s7
				; TONGA-NEXT: buffer_load_sbyte v0, off, s[8:11], 0 offset:1
				; TONGA-NEXT: buffer_load_sbyte v1, off, s[8:11], 0
	; TONGA-NEXT: s_mov_b32 s0, s4			; TONGA-NEXT: s_mov_b32 s0, s4
	; TONGA-NEXT: s_mov_b32 s1, s5			; TONGA-NEXT: s_mov_b32 s1, s5
	; TONGA-NEXT: s_mov_b32 s4, s6
	; TONGA-NEXT: s_mov_b32 s5, s7
	; TONGA-NEXT: s_mov_b32 s6, s2
	; TONGA-NEXT: s_mov_b32 s7, s3
	; TONGA-NEXT: buffer_load_sbyte v0, off, s[4:7], 0 offset:1
	; TONGA-NEXT: buffer_load_sbyte v2, off, s[4:7], 0
	; TONGA-NEXT: s_waitcnt vmcnt(1)			; TONGA-NEXT: s_waitcnt vmcnt(1)
	; TONGA-NEXT: v_cvt_f32_i32_e32 v1, v0			; TONGA-NEXT: v_cvt_f32_i32_e32 v2, v0
	; TONGA-NEXT: s_waitcnt vmcnt(0)			; TONGA-NEXT: s_waitcnt vmcnt(0)
	; TONGA-NEXT: v_cvt_f32_i32_e32 v3, v2			; TONGA-NEXT: v_cvt_f32_i32_e32 v3, v1
	; TONGA-NEXT: v_xor_b32_e32 v0, v2, v0			; TONGA-NEXT: v_xor_b32_e32 v0, v1, v0
	; TONGA-NEXT: v_ashrrev_i32_e32 v0, 30, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v0, 30, v0
	; TONGA-NEXT: v_rcp_iflag_f32_e32 v4, v1			; TONGA-NEXT: v_rcp_iflag_f32_e32 v4, v2
	; TONGA-NEXT: v_or_b32_e32 v0, 1, v0			; TONGA-NEXT: v_or_b32_e32 v0, 1, v0
	; TONGA-NEXT: v_mul_f32_e32 v2, v3, v4			; TONGA-NEXT: v_mul_f32_e32 v1, v3, v4
	; TONGA-NEXT: v_trunc_f32_e32 v2, v2			; TONGA-NEXT: v_trunc_f32_e32 v1, v1
	; TONGA-NEXT: v_mad_f32 v3, -v2, v1, v3			; TONGA-NEXT: v_mad_f32 v3, -v1, v2, v3
	; TONGA-NEXT: v_cvt_i32_f32_e32 v2, v2			; TONGA-NEXT: v_cvt_i32_f32_e32 v1, v1
	; TONGA-NEXT: v_cmp_ge_f32_e64 vcc, \|v3\|, \|v1\|			; TONGA-NEXT: v_cmp_ge_f32_e64 vcc, \|v3\|, \|v2\|
	; TONGA-NEXT: v_cndmask_b32_e32 v0, 0, v0, vcc			; TONGA-NEXT: v_cndmask_b32_e32 v0, 0, v0, vcc
	; TONGA-NEXT: v_add_u32_e32 v0, vcc, v0, v2			; TONGA-NEXT: v_add_u32_e32 v0, vcc, v0, v1
	; TONGA-NEXT: v_bfe_i32 v0, v0, 0, 8			; TONGA-NEXT: v_bfe_i32 v0, v0, 0, 8
	; TONGA-NEXT: buffer_store_dword v0, off, s[0:3], 0			; TONGA-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; TONGA-NEXT: s_endpgm			; TONGA-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: v_sdiv_i8:			; GFX9-LABEL: v_sdiv_i8:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
				; GFX9-NEXT: s_mov_b32 s10, s2
				; GFX9-NEXT: s_mov_b32 s11, s3
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_mov_b32 s8, s6
				; GFX9-NEXT: s_mov_b32 s9, s7
				; GFX9-NEXT: buffer_load_sbyte v0, off, s[8:11], 0 offset:1
				; GFX9-NEXT: buffer_load_sbyte v2, off, s[8:11], 0
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: s_mov_b32 s4, s6
	; GFX9-NEXT: s_mov_b32 s5, s7
	; GFX9-NEXT: s_mov_b32 s6, s2
	; GFX9-NEXT: s_mov_b32 s7, s3
	; GFX9-NEXT: buffer_load_sbyte v0, off, s[4:7], 0 offset:1
	; GFX9-NEXT: buffer_load_sbyte v2, off, s[4:7], 0
	; GFX9-NEXT: s_waitcnt vmcnt(1)			; GFX9-NEXT: s_waitcnt vmcnt(1)
	; GFX9-NEXT: v_cvt_f32_i32_e32 v1, v0			; GFX9-NEXT: v_cvt_f32_i32_e32 v1, v0
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_cvt_f32_i32_e32 v3, v2			; GFX9-NEXT: v_cvt_f32_i32_e32 v3, v2
	; GFX9-NEXT: v_xor_b32_e32 v0, v2, v0			; GFX9-NEXT: v_xor_b32_e32 v0, v2, v0
	; GFX9-NEXT: v_ashrrev_i32_e32 v0, 30, v0			; GFX9-NEXT: v_ashrrev_i32_e32 v0, 30, v0
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v4, v1			; GFX9-NEXT: v_rcp_iflag_f32_e32 v4, v1
	; GFX9-NEXT: v_or_b32_e32 v0, 1, v0			; GFX9-NEXT: v_or_b32_e32 v0, 1, v0
	▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
	; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0			; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; TONGA-LABEL: v_sdiv_i23:			; TONGA-LABEL: v_sdiv_i23:
	; TONGA: ; %bb.0:			; TONGA: ; %bb.0:
	; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; TONGA-NEXT: s_mov_b32 s3, 0xf000			; TONGA-NEXT: s_mov_b32 s3, 0xf000
	; TONGA-NEXT: s_mov_b32 s2, -1			; TONGA-NEXT: s_mov_b32 s2, -1
				; TONGA-NEXT: s_mov_b32 s10, s2
				; TONGA-NEXT: s_mov_b32 s11, s3
	; TONGA-NEXT: s_waitcnt lgkmcnt(0)			; TONGA-NEXT: s_waitcnt lgkmcnt(0)
				; TONGA-NEXT: s_mov_b32 s8, s6
				; TONGA-NEXT: s_mov_b32 s9, s7
				; TONGA-NEXT: buffer_load_ushort v0, off, s[8:11], 0 offset:4
				; TONGA-NEXT: buffer_load_ubyte v1, off, s[8:11], 0 offset:6
				; TONGA-NEXT: buffer_load_ubyte v2, off, s[8:11], 0 offset:2
				; TONGA-NEXT: buffer_load_ushort v3, off, s[8:11], 0
	; TONGA-NEXT: s_mov_b32 s0, s4			; TONGA-NEXT: s_mov_b32 s0, s4
	; TONGA-NEXT: s_mov_b32 s1, s5			; TONGA-NEXT: s_mov_b32 s1, s5
	; TONGA-NEXT: s_mov_b32 s4, s6			; TONGA-NEXT: s_waitcnt vmcnt(2)
	; TONGA-NEXT: s_mov_b32 s5, s7			; TONGA-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; TONGA-NEXT: s_mov_b32 s6, s2			; TONGA-NEXT: v_or_b32_e32 v0, v0, v1
	; TONGA-NEXT: s_mov_b32 s7, s3			; TONGA-NEXT: v_bfe_i32 v0, v0, 0, 23
	; TONGA-NEXT: buffer_load_ubyte v0, off, s[4:7], 0 offset:2			; TONGA-NEXT: v_cvt_f32_i32_e32 v1, v0
	; TONGA-NEXT: buffer_load_ushort v1, off, s[4:7], 0 offset:4
	; TONGA-NEXT: buffer_load_ubyte v2, off, s[4:7], 0 offset:6
	; TONGA-NEXT: buffer_load_ushort v3, off, s[4:7], 0
	; TONGA-NEXT: s_waitcnt vmcnt(3)
	; TONGA-NEXT: v_lshlrev_b32_e32 v0, 16, v0
	; TONGA-NEXT: s_waitcnt vmcnt(1)			; TONGA-NEXT: s_waitcnt vmcnt(1)
	; TONGA-NEXT: v_lshlrev_b32_e32 v2, 16, v2			; TONGA-NEXT: v_lshlrev_b32_e32 v2, 16, v2
	; TONGA-NEXT: v_or_b32_e32 v1, v1, v2
	; TONGA-NEXT: v_bfe_i32 v1, v1, 0, 23
	; TONGA-NEXT: v_cvt_f32_i32_e32 v2, v1
	; TONGA-NEXT: s_waitcnt vmcnt(0)			; TONGA-NEXT: s_waitcnt vmcnt(0)
	; TONGA-NEXT: v_or_b32_e32 v0, v3, v0			; TONGA-NEXT: v_or_b32_e32 v2, v3, v2
	; TONGA-NEXT: v_bfe_i32 v0, v0, 0, 23			; TONGA-NEXT: v_bfe_i32 v2, v2, 0, 23
	; TONGA-NEXT: v_cvt_f32_i32_e32 v3, v0			; TONGA-NEXT: v_cvt_f32_i32_e32 v3, v2
	; TONGA-NEXT: v_rcp_iflag_f32_e32 v4, v2			; TONGA-NEXT: v_rcp_iflag_f32_e32 v4, v1
	; TONGA-NEXT: v_xor_b32_e32 v0, v0, v1			; TONGA-NEXT: v_xor_b32_e32 v0, v2, v0
	; TONGA-NEXT: v_ashrrev_i32_e32 v0, 30, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v0, 30, v0
	; TONGA-NEXT: v_or_b32_e32 v0, 1, v0			; TONGA-NEXT: v_or_b32_e32 v0, 1, v0
	; TONGA-NEXT: v_mul_f32_e32 v1, v3, v4			; TONGA-NEXT: v_mul_f32_e32 v2, v3, v4
	; TONGA-NEXT: v_trunc_f32_e32 v1, v1			; TONGA-NEXT: v_trunc_f32_e32 v2, v2
	; TONGA-NEXT: v_mad_f32 v3, -v1, v2, v3			; TONGA-NEXT: v_mad_f32 v3, -v2, v1, v3
	; TONGA-NEXT: v_cvt_i32_f32_e32 v1, v1			; TONGA-NEXT: v_cvt_i32_f32_e32 v2, v2
	; TONGA-NEXT: v_cmp_ge_f32_e64 vcc, \|v3\|, \|v2\|			; TONGA-NEXT: v_cmp_ge_f32_e64 vcc, \|v3\|, \|v1\|
	; TONGA-NEXT: v_cndmask_b32_e32 v0, 0, v0, vcc			; TONGA-NEXT: v_cndmask_b32_e32 v0, 0, v0, vcc
	; TONGA-NEXT: v_add_u32_e32 v0, vcc, v0, v1			; TONGA-NEXT: v_add_u32_e32 v0, vcc, v0, v2
	; TONGA-NEXT: v_bfe_i32 v0, v0, 0, 23			; TONGA-NEXT: v_bfe_i32 v0, v0, 0, 23
	; TONGA-NEXT: buffer_store_dword v0, off, s[0:3], 0			; TONGA-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; TONGA-NEXT: s_endpgm			; TONGA-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: v_sdiv_i23:			; GFX9-LABEL: v_sdiv_i23:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
				; GFX9-NEXT: s_mov_b32 s10, s2
				; GFX9-NEXT: s_mov_b32 s11, s3
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
				; GFX9-NEXT: s_mov_b32 s8, s6
				; GFX9-NEXT: s_mov_b32 s9, s7
				; GFX9-NEXT: buffer_load_ushort v0, off, s[8:11], 0 offset:4
				; GFX9-NEXT: buffer_load_ubyte v1, off, s[8:11], 0 offset:6
				; GFX9-NEXT: buffer_load_ubyte v2, off, s[8:11], 0 offset:2
				; GFX9-NEXT: buffer_load_ushort v3, off, s[8:11], 0
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: s_mov_b32 s4, s6			; GFX9-NEXT: s_waitcnt vmcnt(2)
	; GFX9-NEXT: s_mov_b32 s5, s7			; GFX9-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; GFX9-NEXT: s_mov_b32 s6, s2			; GFX9-NEXT: v_or_b32_e32 v0, v0, v1
	; GFX9-NEXT: s_mov_b32 s7, s3			; GFX9-NEXT: v_bfe_i32 v0, v0, 0, 23
	; GFX9-NEXT: buffer_load_ubyte v0, off, s[4:7], 0 offset:2			; GFX9-NEXT: v_cvt_f32_i32_e32 v1, v0
	; GFX9-NEXT: buffer_load_ushort v1, off, s[4:7], 0 offset:4
	; GFX9-NEXT: buffer_load_ubyte v2, off, s[4:7], 0 offset:6
	; GFX9-NEXT: buffer_load_ushort v3, off, s[4:7], 0
	; GFX9-NEXT: s_waitcnt vmcnt(3)
	; GFX9-NEXT: v_lshlrev_b32_e32 v0, 16, v0
	; GFX9-NEXT: s_waitcnt vmcnt(1)			; GFX9-NEXT: s_waitcnt vmcnt(1)
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 16, v2			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 16, v2
	; GFX9-NEXT: v_or_b32_e32 v1, v1, v2
	; GFX9-NEXT: v_bfe_i32 v1, v1, 0, 23
	; GFX9-NEXT: v_cvt_f32_i32_e32 v2, v1
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_or_b32_e32 v0, v3, v0			; GFX9-NEXT: v_or_b32_e32 v2, v3, v2
	; GFX9-NEXT: v_bfe_i32 v0, v0, 0, 23			; GFX9-NEXT: v_bfe_i32 v2, v2, 0, 23
	; GFX9-NEXT: v_cvt_f32_i32_e32 v3, v0			; GFX9-NEXT: v_cvt_f32_i32_e32 v3, v2
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v4, v2			; GFX9-NEXT: v_rcp_iflag_f32_e32 v4, v1
	; GFX9-NEXT: v_xor_b32_e32 v0, v0, v1			; GFX9-NEXT: v_xor_b32_e32 v0, v2, v0
	; GFX9-NEXT: v_ashrrev_i32_e32 v0, 30, v0			; GFX9-NEXT: v_ashrrev_i32_e32 v0, 30, v0
	; GFX9-NEXT: v_or_b32_e32 v0, 1, v0			; GFX9-NEXT: v_or_b32_e32 v0, 1, v0
	; GFX9-NEXT: v_mul_f32_e32 v1, v3, v4			; GFX9-NEXT: v_mul_f32_e32 v2, v3, v4
	; GFX9-NEXT: v_trunc_f32_e32 v1, v1			; GFX9-NEXT: v_trunc_f32_e32 v2, v2
	; GFX9-NEXT: v_cvt_i32_f32_e32 v4, v1			; GFX9-NEXT: v_cvt_i32_f32_e32 v4, v2
	; GFX9-NEXT: v_mad_f32 v1, -v1, v2, v3			; GFX9-NEXT: v_mad_f32 v2, -v2, v1, v3
	; GFX9-NEXT: v_cmp_ge_f32_e64 vcc, \|v1\|, \|v2\|			; GFX9-NEXT: v_cmp_ge_f32_e64 vcc, \|v2\|, \|v1\|
	; GFX9-NEXT: v_cndmask_b32_e32 v0, 0, v0, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v0, 0, v0, vcc
	; GFX9-NEXT: v_add_u32_e32 v0, v4, v0			; GFX9-NEXT: v_add_u32_e32 v0, v4, v0
	; GFX9-NEXT: v_bfe_i32 v0, v0, 0, 23			; GFX9-NEXT: v_bfe_i32 v0, v0, 0, 23
	; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; EG-LABEL: v_sdiv_i23:			; EG-LABEL: v_sdiv_i23:
	; EG: ; %bb.0:			; EG: ; %bb.0:
	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines
	; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0			; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; TONGA-LABEL: v_sdiv_i24:			; TONGA-LABEL: v_sdiv_i24:
	; TONGA: ; %bb.0:			; TONGA: ; %bb.0:
	; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; TONGA-NEXT: s_mov_b32 s3, 0xf000			; TONGA-NEXT: s_mov_b32 s3, 0xf000
	; TONGA-NEXT: s_mov_b32 s2, -1			; TONGA-NEXT: s_mov_b32 s2, -1
				; TONGA-NEXT: s_mov_b32 s10, s2
				; TONGA-NEXT: s_mov_b32 s11, s3
	; TONGA-NEXT: s_waitcnt lgkmcnt(0)			; TONGA-NEXT: s_waitcnt lgkmcnt(0)
				; TONGA-NEXT: s_mov_b32 s8, s6
				; TONGA-NEXT: s_mov_b32 s9, s7
				; TONGA-NEXT: buffer_load_sbyte v0, off, s[8:11], 0 offset:6
				; TONGA-NEXT: buffer_load_ushort v1, off, s[8:11], 0 offset:4
				; TONGA-NEXT: buffer_load_sbyte v2, off, s[8:11], 0 offset:2
				; TONGA-NEXT: buffer_load_ushort v3, off, s[8:11], 0
	; TONGA-NEXT: s_mov_b32 s0, s4			; TONGA-NEXT: s_mov_b32 s0, s4
	; TONGA-NEXT: s_mov_b32 s1, s5			; TONGA-NEXT: s_mov_b32 s1, s5
	; TONGA-NEXT: s_mov_b32 s4, s6
	; TONGA-NEXT: s_mov_b32 s5, s7
	; TONGA-NEXT: s_mov_b32 s6, s2
	; TONGA-NEXT: s_mov_b32 s7, s3
	; TONGA-NEXT: buffer_load_sbyte v0, off, s[4:7], 0 offset:2
	; TONGA-NEXT: buffer_load_ushort v1, off, s[4:7], 0 offset:4
	; TONGA-NEXT: buffer_load_sbyte v2, off, s[4:7], 0 offset:6
	; TONGA-NEXT: buffer_load_ushort v3, off, s[4:7], 0
	; TONGA-NEXT: s_waitcnt vmcnt(3)			; TONGA-NEXT: s_waitcnt vmcnt(3)
	; TONGA-NEXT: v_lshlrev_b32_e32 v0, 16, v0			; TONGA-NEXT: v_lshlrev_b32_e32 v0, 16, v0
				; TONGA-NEXT: s_waitcnt vmcnt(2)
				; TONGA-NEXT: v_or_b32_e32 v1, v1, v0
				; TONGA-NEXT: v_cvt_f32_i32_e32 v1, v1
	; TONGA-NEXT: s_waitcnt vmcnt(1)			; TONGA-NEXT: s_waitcnt vmcnt(1)
	; TONGA-NEXT: v_lshlrev_b32_e32 v2, 16, v2			; TONGA-NEXT: v_lshlrev_b32_e32 v2, 16, v2
	; TONGA-NEXT: v_or_b32_e32 v1, v1, v2
	; TONGA-NEXT: v_cvt_f32_i32_e32 v1, v1
	; TONGA-NEXT: s_waitcnt vmcnt(0)			; TONGA-NEXT: s_waitcnt vmcnt(0)
	; TONGA-NEXT: v_or_b32_e32 v3, v3, v0			; TONGA-NEXT: v_or_b32_e32 v3, v3, v2
	; TONGA-NEXT: v_cvt_f32_i32_e32 v3, v3			; TONGA-NEXT: v_cvt_f32_i32_e32 v3, v3
	; TONGA-NEXT: v_xor_b32_e32 v0, v0, v2
	; TONGA-NEXT: v_rcp_iflag_f32_e32 v4, v1			; TONGA-NEXT: v_rcp_iflag_f32_e32 v4, v1
				; TONGA-NEXT: v_xor_b32_e32 v0, v2, v0
	; TONGA-NEXT: v_ashrrev_i32_e32 v0, 30, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v0, 30, v0
	; TONGA-NEXT: v_or_b32_e32 v0, 1, v0			; TONGA-NEXT: v_or_b32_e32 v0, 1, v0
	; TONGA-NEXT: v_mul_f32_e32 v2, v3, v4			; TONGA-NEXT: v_mul_f32_e32 v2, v3, v4
	; TONGA-NEXT: v_trunc_f32_e32 v2, v2			; TONGA-NEXT: v_trunc_f32_e32 v2, v2
	; TONGA-NEXT: v_mad_f32 v3, -v2, v1, v3			; TONGA-NEXT: v_mad_f32 v3, -v2, v1, v3
	; TONGA-NEXT: v_cvt_i32_f32_e32 v2, v2			; TONGA-NEXT: v_cvt_i32_f32_e32 v2, v2
	; TONGA-NEXT: v_cmp_ge_f32_e64 vcc, \|v3\|, \|v1\|			; TONGA-NEXT: v_cmp_ge_f32_e64 vcc, \|v3\|, \|v1\|
	; TONGA-NEXT: v_cndmask_b32_e32 v0, 0, v0, vcc			; TONGA-NEXT: v_cndmask_b32_e32 v0, 0, v0, vcc
	▲ Show 20 Lines • Show All 391 Lines • ▼ Show 20 Lines
	; TONGA: ; %bb.0:			; TONGA: ; %bb.0:
	; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; TONGA-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; TONGA-NEXT: s_mov_b32 s3, 0xf000			; TONGA-NEXT: s_mov_b32 s3, 0xf000
	; TONGA-NEXT: s_mov_b32 s2, -1			; TONGA-NEXT: s_mov_b32 s2, -1
	; TONGA-NEXT: s_waitcnt lgkmcnt(0)			; TONGA-NEXT: s_waitcnt lgkmcnt(0)
	; TONGA-NEXT: s_mov_b32 s0, s4			; TONGA-NEXT: s_mov_b32 s0, s4
	; TONGA-NEXT: s_mov_b32 s1, s5			; TONGA-NEXT: s_mov_b32 s1, s5
	; TONGA-NEXT: buffer_load_dwordx4 v[0:3], off, s[0:3], 0			; TONGA-NEXT: buffer_load_dwordx4 v[0:3], off, s[0:3], 0
	; TONGA-NEXT: s_mov_b32 s0, 0x1389c755			; TONGA-NEXT: s_mov_b32 s4, 0x1389c755
	; TONGA-NEXT: s_mov_b32 s4, s6			; TONGA-NEXT: s_mov_b32 s0, s6
	; TONGA-NEXT: s_mov_b32 s5, s7			; TONGA-NEXT: s_mov_b32 s1, s7
	; TONGA-NEXT: s_mov_b32 s6, s2
	; TONGA-NEXT: s_mov_b32 s7, s3
	; TONGA-NEXT: s_waitcnt vmcnt(0)			; TONGA-NEXT: s_waitcnt vmcnt(0)
	; TONGA-NEXT: v_mul_hi_i32 v0, v0, s0			; TONGA-NEXT: v_mul_hi_i32 v0, v0, s4
	; TONGA-NEXT: v_mul_hi_i32 v1, v1, s0			; TONGA-NEXT: v_mul_hi_i32 v1, v1, s4
	; TONGA-NEXT: v_mul_hi_i32 v2, v2, s0			; TONGA-NEXT: v_mul_hi_i32 v2, v2, s4
	; TONGA-NEXT: v_mul_hi_i32 v3, v3, s0			; TONGA-NEXT: v_mul_hi_i32 v3, v3, s4
	; TONGA-NEXT: v_lshrrev_b32_e32 v4, 31, v0			; TONGA-NEXT: v_lshrrev_b32_e32 v4, 31, v0
	; TONGA-NEXT: v_ashrrev_i32_e32 v0, 12, v0			; TONGA-NEXT: v_ashrrev_i32_e32 v0, 12, v0
	; TONGA-NEXT: v_lshrrev_b32_e32 v5, 31, v1			; TONGA-NEXT: v_lshrrev_b32_e32 v5, 31, v1
	; TONGA-NEXT: v_ashrrev_i32_e32 v1, 12, v1			; TONGA-NEXT: v_ashrrev_i32_e32 v1, 12, v1
	; TONGA-NEXT: v_lshrrev_b32_e32 v6, 31, v2			; TONGA-NEXT: v_lshrrev_b32_e32 v6, 31, v2
	; TONGA-NEXT: v_ashrrev_i32_e32 v2, 12, v2			; TONGA-NEXT: v_ashrrev_i32_e32 v2, 12, v2
	; TONGA-NEXT: v_lshrrev_b32_e32 v7, 31, v3			; TONGA-NEXT: v_lshrrev_b32_e32 v7, 31, v3
	; TONGA-NEXT: v_ashrrev_i32_e32 v3, 12, v3			; TONGA-NEXT: v_ashrrev_i32_e32 v3, 12, v3
	; TONGA-NEXT: v_add_u32_e32 v0, vcc, v0, v4			; TONGA-NEXT: v_add_u32_e32 v0, vcc, v0, v4
	; TONGA-NEXT: v_add_u32_e32 v1, vcc, v1, v5			; TONGA-NEXT: v_add_u32_e32 v1, vcc, v1, v5
	; TONGA-NEXT: v_add_u32_e32 v2, vcc, v2, v6			; TONGA-NEXT: v_add_u32_e32 v2, vcc, v2, v6
	; TONGA-NEXT: v_add_u32_e32 v3, vcc, v3, v7			; TONGA-NEXT: v_add_u32_e32 v3, vcc, v3, v7
	; TONGA-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0			; TONGA-NEXT: buffer_store_dwordx4 v[0:3], off, s[0:3], 0
	; TONGA-NEXT: s_endpgm			; TONGA-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: scalarize_mulhs_4xi32:			; GFX9-LABEL: scalarize_mulhs_4xi32:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; GFX9-NEXT: s_mov_b32 s3, 0xf000			; GFX9-NEXT: s_mov_b32 s3, 0xf000
	; GFX9-NEXT: s_mov_b32 s2, -1			; GFX9-NEXT: s_mov_b32 s2, -1
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: s_mov_b32 s0, s4			; GFX9-NEXT: s_mov_b32 s0, s4
	; GFX9-NEXT: s_mov_b32 s1, s5			; GFX9-NEXT: s_mov_b32 s1, s5
	; GFX9-NEXT: buffer_load_dwordx4 v[0:3], off, s[0:3], 0			; GFX9-NEXT: buffer_load_dwordx4 v[0:3], off, s[0:3], 0
	; GFX9-NEXT: s_mov_b32 s0, 0x1389c755			; GFX9-NEXT: s_mov_b32 s4, 0x1389c755
	; GFX9-NEXT: s_mov_b32 s4, s6			; GFX9-NEXT: s_mov_b32 s0, s6
	; GFX9-NEXT: s_mov_b32 s5, s7			; GFX9-NEXT: s_mov_b32 s1, s7
	; GFX9-NEXT: s_mov_b32 s6, s2
	; GFX9-NEXT: s_mov_b32 s7, s3
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_mul_hi_i32 v0, v0, s0			; GFX9-NEXT: v_mul_hi_i32 v0, v0, s4
	; GFX9-NEXT: v_mul_hi_i32 v1, v1, s0			; GFX9-NEXT: v_mul_hi_i32 v1, v1, s4
	; GFX9-NEXT: v_mul_hi_i32 v2, v2, s0			; GFX9-NEXT: v_mul_hi_i32 v2, v2, s4
	; GFX9-NEXT: v_mul_hi_i32 v3, v3, s0			; GFX9-NEXT: v_mul_hi_i32 v3, v3, s4
	; GFX9-NEXT: v_lshrrev_b32_e32 v4, 31, v0			; GFX9-NEXT: v_lshrrev_b32_e32 v4, 31, v0
	; GFX9-NEXT: v_ashrrev_i32_e32 v0, 12, v0			; GFX9-NEXT: v_ashrrev_i32_e32 v0, 12, v0
	; GFX9-NEXT: v_lshrrev_b32_e32 v5, 31, v1			; GFX9-NEXT: v_lshrrev_b32_e32 v5, 31, v1
	; GFX9-NEXT: v_ashrrev_i32_e32 v1, 12, v1			; GFX9-NEXT: v_ashrrev_i32_e32 v1, 12, v1
	; GFX9-NEXT: v_lshrrev_b32_e32 v6, 31, v2			; GFX9-NEXT: v_lshrrev_b32_e32 v6, 31, v2
	; GFX9-NEXT: v_ashrrev_i32_e32 v2, 12, v2			; GFX9-NEXT: v_ashrrev_i32_e32 v2, 12, v2
	; GFX9-NEXT: v_lshrrev_b32_e32 v7, 31, v3			; GFX9-NEXT: v_lshrrev_b32_e32 v7, 31, v3
	; GFX9-NEXT: v_ashrrev_i32_e32 v3, 12, v3			; GFX9-NEXT: v_ashrrev_i32_e32 v3, 12, v3
	; GFX9-NEXT: v_add_u32_e32 v0, v0, v4			; GFX9-NEXT: v_add_u32_e32 v0, v0, v4
	; GFX9-NEXT: v_add_u32_e32 v1, v1, v5			; GFX9-NEXT: v_add_u32_e32 v1, v1, v5
	; GFX9-NEXT: v_add_u32_e32 v2, v2, v6			; GFX9-NEXT: v_add_u32_e32 v2, v2, v6
	; GFX9-NEXT: v_add_u32_e32 v3, v3, v7			; GFX9-NEXT: v_add_u32_e32 v3, v3, v7
	; GFX9-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0			; GFX9-NEXT: buffer_store_dwordx4 v[0:3], off, s[0:3], 0
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; EG-LABEL: scalarize_mulhs_4xi32:			; EG-LABEL: scalarize_mulhs_4xi32:
	; EG: ; %bb.0:			; EG: ; %bb.0:
	; EG-NEXT: ALU 0, @8, KC0[CB0:0-32], KC1[]			; EG-NEXT: ALU 0, @8, KC0[CB0:0-32], KC1[]
	; EG-NEXT: TEX 0 @6			; EG-NEXT: TEX 0 @6
	; EG-NEXT: ALU 25, @9, KC0[CB0:0-32], KC1[]			; EG-NEXT: ALU 25, @9, KC0[CB0:0-32], KC1[]
	; EG-NEXT: MEM_RAT_CACHELESS STORE_RAW T0.XYZW, T1.X, 1			; EG-NEXT: MEM_RAT_CACHELESS STORE_RAW T0.XYZW, T1.X, 1
	Show All 38 Lines

llvm/test/CodeGen/AMDGPU/sdwa-peephole.ll

Show First 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	entry:
%mul = mul i16 %a, %b		%mul = mul i16 %a, %b
store i16 %mul, i16 addrspace(1)* %out, align 4		store i16 %mul, i16 addrspace(1)* %out, align 4
ret void		ret void
}		}

; GCN-LABEL: {{^}}mul_v2i16:		; GCN-LABEL: {{^}}mul_v2i16:
; NOSDWA: v_lshrrev_b32_e32 v[[DST0:[0-9]+]], 16, v{{[0-9]+}}		; NOSDWA: v_lshrrev_b32_e32 v[[DST0:[0-9]+]], 16, v{{[0-9]+}}
; NOSDWA: v_lshrrev_b32_e32 v[[DST1:[0-9]+]], 16, v{{[0-9]+}}		; NOSDWA: v_lshrrev_b32_e32 v[[DST1:[0-9]+]], 16, v{{[0-9]+}}
; NOSDWA: v_mul_u32_u24_e32 v[[DST_MUL:[0-9]+]], v[[DST1]], v[[DST0]]		; NOSDWA: v_mul_u32_u24_e32 v[[DST_MUL:[0-9]+]], v[[DST0]], v[[DST1]]
; NOSDWA: v_lshlrev_b32_e32 v[[DST_SHL:[0-9]+]], 16, v[[DST_MUL]]		; NOSDWA: v_lshlrev_b32_e32 v[[DST_SHL:[0-9]+]], 16, v[[DST_MUL]]
; NOSDWA: v_or_b32_e32 v{{[0-9]+}}, v{{[0-9]+}}, v[[DST_SHL]]		; NOSDWA: v_or_b32_e32 v{{[0-9]+}}, v{{[0-9]+}}, v[[DST_SHL]]
; NOSDWA-NOT: v_mul_u32_u24_sdwa		; NOSDWA-NOT: v_mul_u32_u24_sdwa

; VI-DAG: v_mul_u32_u24_sdwa v[[DST_MUL_LO:[0-9]+]], v{{[0-9]+}}, v{{[0-9]+}} dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:WORD_0		; VI-DAG: v_mul_u32_u24_sdwa v[[DST_MUL_LO:[0-9]+]], v{{[0-9]+}}, v{{[0-9]+}} dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:WORD_0
; VI-DAG: v_mul_u32_u24_sdwa v[[DST_MUL_HI:[0-9]+]], v{{[0-9]+}}, v{{[0-9]+}} dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1		; VI-DAG: v_mul_u32_u24_sdwa v[[DST_MUL_HI:[0-9]+]], v{{[0-9]+}}, v{{[0-9]+}} dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
; VI: v_or_b32_sdwa v{{[0-9]+}}, v[[DST_MUL_LO]], v[[DST_MUL_HI]] dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD		; VI: v_or_b32_sdwa v{{[0-9]+}}, v[[DST_MUL_LO]], v[[DST_MUL_HI]] dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD

▲ Show 20 Lines • Show All 482 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/select.f16.ll

	Show All 39 Lines
	; SI-NEXT: v_cndmask_b32_e32 v0, v3, v2, vcc			; SI-NEXT: v_cndmask_b32_e32 v0, v3, v2, vcc
	; SI-NEXT: v_cvt_f16_f32_e32 v0, v0			; SI-NEXT: v_cvt_f16_f32_e32 v0, v0
	; SI-NEXT: buffer_store_short v0, off, s[12:15], 0			; SI-NEXT: buffer_store_short v0, off, s[12:15], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_f16:			; VI-LABEL: select_f16:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[4:11], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[4:11], s[0:1], 0x24
	; VI-NEXT: s_load_dwordx2 s[12:13], s[0:1], 0x44			; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x44
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s15, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s14, -1
	; VI-NEXT: s_mov_b32 s14, s2			; VI-NEXT: s_mov_b32 s22, s14
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s0, s4
	; VI-NEXT: s_mov_b32 s1, s5
	; VI-NEXT: s_mov_b32 s16, s10			; VI-NEXT: s_mov_b32 s16, s10
	; VI-NEXT: s_mov_b32 s17, s11			; VI-NEXT: s_mov_b32 s17, s11
	; VI-NEXT: s_mov_b32 s4, s6			; VI-NEXT: s_mov_b32 s10, s14
	; VI-NEXT: s_mov_b32 s5, s7			; VI-NEXT: s_mov_b32 s11, s15
	; VI-NEXT: s_mov_b32 s10, s2			; VI-NEXT: s_mov_b32 s20, s6
	; VI-NEXT: s_mov_b32 s11, s3			; VI-NEXT: s_mov_b32 s21, s7
	; VI-NEXT: s_mov_b32 s6, s2			; VI-NEXT: s_mov_b32 s23, s15
	; VI-NEXT: s_mov_b32 s7, s3			; VI-NEXT: s_mov_b32 s2, s14
	; VI-NEXT: s_mov_b32 s15, s3			; VI-NEXT: s_mov_b32 s3, s15
	; VI-NEXT: s_mov_b32 s18, s2			; VI-NEXT: s_mov_b32 s18, s14
	; VI-NEXT: s_mov_b32 s19, s3			; VI-NEXT: s_mov_b32 s19, s15
	; VI-NEXT: buffer_load_ushort v0, off, s[4:7], 0			; VI-NEXT: buffer_load_ushort v0, off, s[20:23], 0
	; VI-NEXT: buffer_load_ushort v1, off, s[8:11], 0			; VI-NEXT: buffer_load_ushort v1, off, s[8:11], 0
	; VI-NEXT: buffer_load_ushort v2, off, s[16:19], 0			; VI-NEXT: buffer_load_ushort v2, off, s[16:19], 0
	; VI-NEXT: buffer_load_ushort v3, off, s[12:15], 0			; VI-NEXT: buffer_load_ushort v3, off, s[0:3], 0
				; VI-NEXT: s_mov_b32 s12, s4
				; VI-NEXT: s_mov_b32 s13, s5
	; VI-NEXT: s_waitcnt vmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2)
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, v0, v1			; VI-NEXT: v_cmp_lt_f16_e32 vcc, v0, v1
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v3, v2, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v3, v2, vcc
	; VI-NEXT: buffer_store_short v0, off, s[0:3], 0			; VI-NEXT: buffer_store_short v0, off, s[12:15], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	half addrspace(1)* %r,			half addrspace(1)* %r,
	half addrspace(1)* %a,			half addrspace(1)* %a,
	half addrspace(1)* %b,			half addrspace(1)* %b,
	half addrspace(1)* %c,			half addrspace(1)* %c,
	half addrspace(1)* %d) {			half addrspace(1)* %d) {
	entry:			entry:
	%a.val = load volatile half, half addrspace(1)* %a			%a.val = load volatile half, half addrspace(1)* %a
	Show All 40 Lines
	; SI-NEXT: buffer_store_short v0, off, s[8:11], 0			; SI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_f16_imm_a:			; VI-LABEL: select_f16_imm_a:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s18, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s19, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s8, s0			; VI-NEXT: s_mov_b32 s16, s2
	; VI-NEXT: s_mov_b32 s9, s1			; VI-NEXT: s_mov_b32 s17, s3
	; VI-NEXT: s_mov_b32 s0, s2
	; VI-NEXT: s_mov_b32 s1, s3
	; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_mov_b32 s12, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s13, s7			; VI-NEXT: s_mov_b32 s13, s7
				; VI-NEXT: s_mov_b32 s14, s10
				; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: s_mov_b32 s6, s10			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: buffer_load_ushort v0, off, s[0:3], 0			; VI-NEXT: buffer_load_ushort v0, off, s[16:19], 0
	; VI-NEXT: buffer_load_ushort v1, off, s[4:7], 0			; VI-NEXT: buffer_load_ushort v1, off, s[4:7], 0
	; VI-NEXT: buffer_load_ushort v2, off, s[12:15], 0			; VI-NEXT: buffer_load_ushort v2, off, s[12:15], 0
				; VI-NEXT: s_mov_b32 s8, s0
				; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_waitcnt vmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2)
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, 0.5, v0			; VI-NEXT: v_cmp_lt_f16_e32 vcc, 0.5, v0
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc
	; VI-NEXT: buffer_store_short v0, off, s[8:11], 0			; VI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	half addrspace(1)* %r,			half addrspace(1)* %r,
	half addrspace(1)* %b,			half addrspace(1)* %b,
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SI-NEXT: buffer_store_short v0, off, s[8:11], 0			; SI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_f16_imm_b:			; VI-LABEL: select_f16_imm_b:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s18, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s19, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s8, s0			; VI-NEXT: s_mov_b32 s16, s2
	; VI-NEXT: s_mov_b32 s9, s1			; VI-NEXT: s_mov_b32 s17, s3
	; VI-NEXT: s_mov_b32 s0, s2
	; VI-NEXT: s_mov_b32 s1, s3
	; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_mov_b32 s12, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s13, s7			; VI-NEXT: s_mov_b32 s13, s7
				; VI-NEXT: s_mov_b32 s14, s10
				; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: s_mov_b32 s6, s10			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: buffer_load_ushort v0, off, s[0:3], 0			; VI-NEXT: buffer_load_ushort v0, off, s[16:19], 0
	; VI-NEXT: buffer_load_ushort v1, off, s[4:7], 0			; VI-NEXT: buffer_load_ushort v1, off, s[4:7], 0
	; VI-NEXT: buffer_load_ushort v2, off, s[12:15], 0			; VI-NEXT: buffer_load_ushort v2, off, s[12:15], 0
				; VI-NEXT: s_mov_b32 s8, s0
				; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_waitcnt vmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2)
	; VI-NEXT: v_cmp_gt_f16_e32 vcc, 0.5, v0			; VI-NEXT: v_cmp_gt_f16_e32 vcc, 0.5, v0
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc
	; VI-NEXT: buffer_store_short v0, off, s[8:11], 0			; VI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	half addrspace(1)* %r,			half addrspace(1)* %r,
	half addrspace(1)* %a,			half addrspace(1)* %a,
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SI-NEXT: buffer_store_short v0, off, s[8:11], 0			; SI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_f16_imm_c:			; VI-LABEL: select_f16_imm_c:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s18, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s19, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s8, s0
	; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_mov_b32 s12, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s13, s7			; VI-NEXT: s_mov_b32 s13, s7
	; VI-NEXT: s_mov_b32 s0, s2
	; VI-NEXT: s_mov_b32 s1, s3
	; VI-NEXT: s_mov_b32 s6, s10			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: s_mov_b32 s2, s10			; VI-NEXT: s_mov_b32 s16, s2
	; VI-NEXT: s_mov_b32 s3, s11			; VI-NEXT: s_mov_b32 s17, s3
	; VI-NEXT: buffer_load_ushort v0, off, s[0:3], 0			; VI-NEXT: s_mov_b32 s14, s10
				; VI-NEXT: s_mov_b32 s15, s11
				; VI-NEXT: buffer_load_ushort v0, off, s[16:19], 0
	; VI-NEXT: buffer_load_ushort v1, off, s[4:7], 0			; VI-NEXT: buffer_load_ushort v1, off, s[4:7], 0
	; VI-NEXT: buffer_load_ushort v3, off, s[12:15], 0			; VI-NEXT: buffer_load_ushort v2, off, s[12:15], 0
	; VI-NEXT: v_mov_b32_e32 v2, 0x3800			; VI-NEXT: v_mov_b32_e32 v3, 0x3800
				; VI-NEXT: s_mov_b32 s8, s0
				; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_waitcnt vmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1)
	; VI-NEXT: v_cmp_nlt_f16_e32 vcc, v0, v1			; VI-NEXT: v_cmp_nlt_f16_e32 vcc, v0, v1
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v3, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v3, v2, vcc
	; VI-NEXT: buffer_store_short v0, off, s[8:11], 0			; VI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	half addrspace(1)* %r,			half addrspace(1)* %r,
	half addrspace(1)* %a,			half addrspace(1)* %a,
	half addrspace(1)* %b,			half addrspace(1)* %b,
	half addrspace(1)* %d) {			half addrspace(1)* %d) {
	entry:			entry:
	%a.val = load volatile half, half addrspace(1)* %a			%a.val = load volatile half, half addrspace(1)* %a
	Show All 39 Lines
	; SI-NEXT: buffer_store_short v0, off, s[8:11], 0			; SI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_f16_imm_d:			; VI-LABEL: select_f16_imm_d:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s18, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s19, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s8, s0
	; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_mov_b32 s12, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s13, s7			; VI-NEXT: s_mov_b32 s13, s7
	; VI-NEXT: s_mov_b32 s0, s2
	; VI-NEXT: s_mov_b32 s1, s3
	; VI-NEXT: s_mov_b32 s6, s10			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: s_mov_b32 s2, s10			; VI-NEXT: s_mov_b32 s16, s2
	; VI-NEXT: s_mov_b32 s3, s11			; VI-NEXT: s_mov_b32 s17, s3
	; VI-NEXT: buffer_load_ushort v0, off, s[0:3], 0			; VI-NEXT: s_mov_b32 s14, s10
				; VI-NEXT: s_mov_b32 s15, s11
				; VI-NEXT: buffer_load_ushort v0, off, s[16:19], 0
	; VI-NEXT: buffer_load_ushort v1, off, s[4:7], 0			; VI-NEXT: buffer_load_ushort v1, off, s[4:7], 0
	; VI-NEXT: buffer_load_ushort v3, off, s[12:15], 0			; VI-NEXT: buffer_load_ushort v2, off, s[12:15], 0
	; VI-NEXT: v_mov_b32_e32 v2, 0x3800			; VI-NEXT: v_mov_b32_e32 v3, 0x3800
				; VI-NEXT: s_mov_b32 s8, s0
				; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_waitcnt vmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1)
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, v0, v1			; VI-NEXT: v_cmp_lt_f16_e32 vcc, v0, v1
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v3, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v3, v2, vcc
	; VI-NEXT: buffer_store_short v0, off, s[8:11], 0			; VI-NEXT: buffer_store_short v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	half addrspace(1)* %r,			half addrspace(1)* %r,
	half addrspace(1)* %a,			half addrspace(1)* %a,
	half addrspace(1)* %b,			half addrspace(1)* %b,
	half addrspace(1)* %c) {			half addrspace(1)* %c) {
	entry:			entry:
	%a.val = load volatile half, half addrspace(1)* %a			%a.val = load volatile half, half addrspace(1)* %a
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; SI-NEXT: v_lshlrev_b32_e32 v1, 16, v2			; SI-NEXT: v_lshlrev_b32_e32 v1, 16, v2
	; SI-NEXT: v_or_b32_e32 v0, v0, v1			; SI-NEXT: v_or_b32_e32 v0, v0, v1
	; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_v2f16:			; VI-LABEL: select_v2f16:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[4:11], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[4:11], s[0:1], 0x24
	; VI-NEXT: s_load_dwordx2 s[12:13], s[0:1], 0x44			; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x44
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s15, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s14, -1
	; VI-NEXT: s_mov_b32 s14, s2			; VI-NEXT: s_mov_b32 s22, s14
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s0, s4
	; VI-NEXT: s_mov_b32 s1, s5
	; VI-NEXT: s_mov_b32 s16, s10			; VI-NEXT: s_mov_b32 s16, s10
	; VI-NEXT: s_mov_b32 s17, s11			; VI-NEXT: s_mov_b32 s17, s11
	; VI-NEXT: s_mov_b32 s4, s6			; VI-NEXT: s_mov_b32 s10, s14
	; VI-NEXT: s_mov_b32 s5, s7			; VI-NEXT: s_mov_b32 s11, s15
	; VI-NEXT: s_mov_b32 s10, s2			; VI-NEXT: s_mov_b32 s20, s6
	; VI-NEXT: s_mov_b32 s11, s3			; VI-NEXT: s_mov_b32 s21, s7
	; VI-NEXT: s_mov_b32 s6, s2			; VI-NEXT: s_mov_b32 s23, s15
	; VI-NEXT: s_mov_b32 s7, s3			; VI-NEXT: s_mov_b32 s2, s14
	; VI-NEXT: s_mov_b32 s15, s3			; VI-NEXT: s_mov_b32 s3, s15
	; VI-NEXT: buffer_load_dword v0, off, s[4:7], 0			; VI-NEXT: buffer_load_dword v0, off, s[20:23], 0
	; VI-NEXT: s_mov_b32 s18, s2			; VI-NEXT: s_mov_b32 s18, s14
	; VI-NEXT: s_mov_b32 s19, s3			; VI-NEXT: s_mov_b32 s19, s15
	; VI-NEXT: buffer_load_dword v1, off, s[8:11], 0			; VI-NEXT: buffer_load_dword v1, off, s[8:11], 0
	; VI-NEXT: buffer_load_dword v2, off, s[12:15], 0			; VI-NEXT: buffer_load_dword v2, off, s[0:3], 0
	; VI-NEXT: buffer_load_dword v3, off, s[16:19], 0			; VI-NEXT: buffer_load_dword v3, off, s[16:19], 0
				; VI-NEXT: s_mov_b32 s12, s4
				; VI-NEXT: s_mov_b32 s13, s5
	; VI-NEXT: s_waitcnt vmcnt(3)			; VI-NEXT: s_waitcnt vmcnt(3)
	; VI-NEXT: v_lshrrev_b32_e32 v6, 16, v0			; VI-NEXT: v_lshrrev_b32_e32 v6, 16, v0
	; VI-NEXT: s_waitcnt vmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2)
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, v0, v1			; VI-NEXT: v_cmp_lt_f16_e32 vcc, v0, v1
	; VI-NEXT: v_lshrrev_b32_e32 v5, 16, v1			; VI-NEXT: v_lshrrev_b32_e32 v5, 16, v1
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v3, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v2, v3, vcc
	; VI-NEXT: v_lshrrev_b32_e32 v4, 16, v2			; VI-NEXT: v_lshrrev_b32_e32 v4, 16, v2
	; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v3			; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v3
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, v6, v5			; VI-NEXT: v_cmp_lt_f16_e32 vcc, v6, v5
	; VI-NEXT: v_cndmask_b32_e32 v1, v4, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v1, v4, v1, vcc
	; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[12:15], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a,			<2 x half> addrspace(1)* %a,
	<2 x half> addrspace(1)* %b,			<2 x half> addrspace(1)* %b,
	<2 x half> addrspace(1)* %c,			<2 x half> addrspace(1)* %c,
	<2 x half> addrspace(1)* %d) {			<2 x half> addrspace(1)* %d) {
	entry:			entry:
	%a.val = load <2 x half>, <2 x half> addrspace(1)* %a			%a.val = load <2 x half>, <2 x half> addrspace(1)* %a
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_v2f16_imm_a:			; VI-LABEL: select_v2f16_imm_a:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s18, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s19, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s8, s0			; VI-NEXT: s_mov_b32 s16, s2
	; VI-NEXT: s_mov_b32 s9, s1			; VI-NEXT: s_mov_b32 s17, s3
	; VI-NEXT: s_mov_b32 s0, s2
	; VI-NEXT: s_mov_b32 s1, s3
	; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_mov_b32 s12, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s13, s7			; VI-NEXT: s_mov_b32 s13, s7
				; VI-NEXT: s_mov_b32 s14, s10
				; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: s_mov_b32 s6, s10			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: buffer_load_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_load_dword v0, off, s[16:19], 0
	; VI-NEXT: buffer_load_dword v1, off, s[4:7], 0			; VI-NEXT: buffer_load_dword v1, off, s[4:7], 0
	; VI-NEXT: buffer_load_dword v2, off, s[12:15], 0			; VI-NEXT: buffer_load_dword v2, off, s[12:15], 0
	; VI-NEXT: s_movk_i32 s0, 0x3900			; VI-NEXT: s_movk_i32 s2, 0x3900
				; VI-NEXT: s_mov_b32 s8, s0
				; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_waitcnt vmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2)
	; VI-NEXT: v_lshrrev_b32_e32 v3, 16, v0			; VI-NEXT: v_lshrrev_b32_e32 v3, 16, v0
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, 0.5, v0			; VI-NEXT: v_cmp_lt_f16_e32 vcc, 0.5, v0
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc
	; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v1
	; VI-NEXT: v_lshrrev_b32_e32 v2, 16, v2			; VI-NEXT: v_lshrrev_b32_e32 v2, 16, v2
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, s0, v3			; VI-NEXT: v_cmp_lt_f16_e32 vcc, s2, v3
	; VI-NEXT: v_cndmask_b32_e32 v1, v2, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v1, v2, v1, vcc
	; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %b,			<2 x half> addrspace(1)* %b,
	<2 x half> addrspace(1)* %c,			<2 x half> addrspace(1)* %c,
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_v2f16_imm_b:			; VI-LABEL: select_v2f16_imm_b:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s18, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s19, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s8, s0			; VI-NEXT: s_mov_b32 s16, s2
	; VI-NEXT: s_mov_b32 s9, s1			; VI-NEXT: s_mov_b32 s17, s3
	; VI-NEXT: s_mov_b32 s0, s2
	; VI-NEXT: s_mov_b32 s1, s3
	; VI-NEXT: s_mov_b32 s2, s10
	; VI-NEXT: s_mov_b32 s3, s11
	; VI-NEXT: s_mov_b32 s12, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s13, s7			; VI-NEXT: s_mov_b32 s13, s7
				; VI-NEXT: s_mov_b32 s14, s10
				; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: s_mov_b32 s6, s10			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: buffer_load_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_load_dword v0, off, s[16:19], 0
	; VI-NEXT: buffer_load_dword v1, off, s[4:7], 0			; VI-NEXT: buffer_load_dword v1, off, s[4:7], 0
	; VI-NEXT: buffer_load_dword v2, off, s[12:15], 0			; VI-NEXT: buffer_load_dword v2, off, s[12:15], 0
	; VI-NEXT: s_movk_i32 s0, 0x3900			; VI-NEXT: s_movk_i32 s2, 0x3900
				; VI-NEXT: s_mov_b32 s8, s0
				; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_waitcnt vmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2)
	; VI-NEXT: v_lshrrev_b32_e32 v3, 16, v0			; VI-NEXT: v_lshrrev_b32_e32 v3, 16, v0
	; VI-NEXT: v_cmp_gt_f16_e32 vcc, 0.5, v0			; VI-NEXT: v_cmp_gt_f16_e32 vcc, 0.5, v0
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc
	; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v1
	; VI-NEXT: v_lshrrev_b32_e32 v2, 16, v2			; VI-NEXT: v_lshrrev_b32_e32 v2, 16, v2
	; VI-NEXT: v_cmp_gt_f16_e32 vcc, s0, v3			; VI-NEXT: v_cmp_gt_f16_e32 vcc, s2, v3
	; VI-NEXT: v_cndmask_b32_e32 v1, v2, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v1, v2, v1, vcc
	; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a,			<2 x half> addrspace(1)* %a,
	<2 x half> addrspace(1)* %c,			<2 x half> addrspace(1)* %c,
	Show All 18 Lines
	; SI-NEXT: s_mov_b32 s19, s11			; SI-NEXT: s_mov_b32 s19, s11
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
	; SI-NEXT: s_mov_b32 s12, s6			; SI-NEXT: s_mov_b32 s12, s6
	; SI-NEXT: s_mov_b32 s13, s7			; SI-NEXT: s_mov_b32 s13, s7
	; SI-NEXT: s_mov_b32 s6, s10			; SI-NEXT: s_mov_b32 s6, s10
	; SI-NEXT: s_mov_b32 s7, s11			; SI-NEXT: s_mov_b32 s7, s11
	; SI-NEXT: s_mov_b32 s16, s2			; SI-NEXT: s_mov_b32 s16, s2
	; SI-NEXT: s_mov_b32 s17, s3			; SI-NEXT: s_mov_b32 s17, s3
	; SI-NEXT: buffer_load_dword v3, off, s[4:7], 0
	; SI-NEXT: s_mov_b32 s14, s10			; SI-NEXT: s_mov_b32 s14, s10
	; SI-NEXT: s_mov_b32 s15, s11			; SI-NEXT: s_mov_b32 s15, s11
	; SI-NEXT: buffer_load_dword v0, off, s[16:19], 0			; SI-NEXT: buffer_load_dword v0, off, s[16:19], 0
	; SI-NEXT: buffer_load_dword v1, off, s[12:15], 0			; SI-NEXT: buffer_load_dword v1, off, s[4:7], 0
	; SI-NEXT: v_mov_b32_e32 v2, 0x3f200000			; SI-NEXT: buffer_load_dword v2, off, s[12:15], 0
				; SI-NEXT: v_mov_b32_e32 v3, 0x3f200000
	; SI-NEXT: s_mov_b32 s8, s0			; SI-NEXT: s_mov_b32 s8, s0
	; SI-NEXT: s_mov_b32 s9, s1			; SI-NEXT: s_mov_b32 s9, s1
	; SI-NEXT: s_waitcnt vmcnt(2)			; SI-NEXT: s_waitcnt vmcnt(2)
	; SI-NEXT: v_lshrrev_b32_e32 v5, 16, v3
	; SI-NEXT: v_cvt_f32_f16_e32 v5, v5
	; SI-NEXT: v_cvt_f32_f16_e32 v3, v3
	; SI-NEXT: s_waitcnt vmcnt(1)
	; SI-NEXT: v_cvt_f32_f16_e32 v4, v0			; SI-NEXT: v_cvt_f32_f16_e32 v4, v0
				; SI-NEXT: s_waitcnt vmcnt(1)
				; SI-NEXT: v_lshrrev_b32_e32 v5, 16, v1
	; SI-NEXT: v_lshrrev_b32_e32 v0, 16, v0			; SI-NEXT: v_lshrrev_b32_e32 v0, 16, v0
	; SI-NEXT: s_waitcnt vmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0)
	; SI-NEXT: v_lshrrev_b32_e32 v6, 16, v1			; SI-NEXT: v_lshrrev_b32_e32 v6, 16, v2
	; SI-NEXT: v_cvt_f32_f16_e32 v0, v0			; SI-NEXT: v_cvt_f32_f16_e32 v0, v0
				; SI-NEXT: v_cvt_f32_f16_e32 v5, v5
	; SI-NEXT: v_cvt_f32_f16_e32 v6, v6			; SI-NEXT: v_cvt_f32_f16_e32 v6, v6
	; SI-NEXT: v_cvt_f32_f16_e32 v1, v1			; SI-NEXT: v_cvt_f32_f16_e32 v1, v1
				; SI-NEXT: v_cvt_f32_f16_e32 v2, v2
	; SI-NEXT: v_cmp_nlt_f32_e32 vcc, v0, v5			; SI-NEXT: v_cmp_nlt_f32_e32 vcc, v0, v5
	; SI-NEXT: v_cndmask_b32_e32 v0, v2, v6, vcc			; SI-NEXT: v_cndmask_b32_e32 v0, v3, v6, vcc
	; SI-NEXT: v_cmp_nlt_f32_e32 vcc, v4, v3			; SI-NEXT: v_cmp_nlt_f32_e32 vcc, v4, v1
	; SI-NEXT: v_cvt_f16_f32_e32 v0, v0			; SI-NEXT: v_cvt_f16_f32_e32 v0, v0
	; SI-NEXT: v_cndmask_b32_e32 v1, 0.5, v1, vcc			; SI-NEXT: v_cndmask_b32_e32 v1, 0.5, v2, vcc
	; SI-NEXT: v_cvt_f16_f32_e32 v1, v1			; SI-NEXT: v_cvt_f16_f32_e32 v1, v1
	; SI-NEXT: v_lshlrev_b32_e32 v0, 16, v0			; SI-NEXT: v_lshlrev_b32_e32 v0, 16, v0
	; SI-NEXT: v_or_b32_e32 v0, v1, v0			; SI-NEXT: v_or_b32_e32 v0, v1, v0
	; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_v2f16_imm_c:			; VI-LABEL: select_v2f16_imm_c:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s18, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s19, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s8, s0
	; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_mov_b32 s12, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s13, s7			; VI-NEXT: s_mov_b32 s13, s7
	; VI-NEXT: s_mov_b32 s0, s2
	; VI-NEXT: s_mov_b32 s1, s3
	; VI-NEXT: s_mov_b32 s6, s10			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: s_mov_b32 s2, s10			; VI-NEXT: s_mov_b32 s16, s2
	; VI-NEXT: s_mov_b32 s3, s11			; VI-NEXT: s_mov_b32 s17, s3
	; VI-NEXT: buffer_load_dword v0, off, s[0:3], 0			; VI-NEXT: s_mov_b32 s14, s10
	; VI-NEXT: buffer_load_dword v4, off, s[4:7], 0			; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: buffer_load_dword v1, off, s[12:15], 0			; VI-NEXT: buffer_load_dword v0, off, s[16:19], 0
	; VI-NEXT: v_mov_b32_e32 v2, 0x3800			; VI-NEXT: buffer_load_dword v1, off, s[4:7], 0
	; VI-NEXT: v_mov_b32_e32 v3, 0x3900			; VI-NEXT: buffer_load_dword v2, off, s[12:15], 0
				; VI-NEXT: v_mov_b32_e32 v3, 0x3800
				; VI-NEXT: v_mov_b32_e32 v4, 0x3900
				; VI-NEXT: s_mov_b32 s8, s0
				; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_waitcnt vmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2)
	; VI-NEXT: v_lshrrev_b32_e32 v6, 16, v0			; VI-NEXT: v_lshrrev_b32_e32 v6, 16, v0
	; VI-NEXT: s_waitcnt vmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1)
	; VI-NEXT: v_cmp_nlt_f16_e32 vcc, v0, v4			; VI-NEXT: v_cmp_nlt_f16_e32 vcc, v0, v1
	; VI-NEXT: v_lshrrev_b32_e32 v5, 16, v4			; VI-NEXT: v_lshrrev_b32_e32 v5, 16, v1
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v3, v2, vcc
	; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v2
	; VI-NEXT: v_cmp_nlt_f16_e32 vcc, v6, v5			; VI-NEXT: v_cmp_nlt_f16_e32 vcc, v6, v5
	; VI-NEXT: v_cndmask_b32_e32 v1, v3, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v1, v4, v1, vcc
	; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a,			<2 x half> addrspace(1)* %a,
	<2 x half> addrspace(1)* %b,			<2 x half> addrspace(1)* %b,
	<2 x half> addrspace(1)* %d) {			<2 x half> addrspace(1)* %d) {
	Show All 17 Lines
	; SI-NEXT: s_mov_b32 s19, s11			; SI-NEXT: s_mov_b32 s19, s11
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
	; SI-NEXT: s_mov_b32 s12, s6			; SI-NEXT: s_mov_b32 s12, s6
	; SI-NEXT: s_mov_b32 s13, s7			; SI-NEXT: s_mov_b32 s13, s7
	; SI-NEXT: s_mov_b32 s6, s10			; SI-NEXT: s_mov_b32 s6, s10
	; SI-NEXT: s_mov_b32 s7, s11			; SI-NEXT: s_mov_b32 s7, s11
	; SI-NEXT: s_mov_b32 s16, s2			; SI-NEXT: s_mov_b32 s16, s2
	; SI-NEXT: s_mov_b32 s17, s3			; SI-NEXT: s_mov_b32 s17, s3
	; SI-NEXT: buffer_load_dword v3, off, s[4:7], 0
	; SI-NEXT: s_mov_b32 s14, s10			; SI-NEXT: s_mov_b32 s14, s10
	; SI-NEXT: s_mov_b32 s15, s11			; SI-NEXT: s_mov_b32 s15, s11
	; SI-NEXT: buffer_load_dword v0, off, s[16:19], 0			; SI-NEXT: buffer_load_dword v0, off, s[16:19], 0
	; SI-NEXT: buffer_load_dword v1, off, s[12:15], 0			; SI-NEXT: buffer_load_dword v1, off, s[4:7], 0
	; SI-NEXT: v_mov_b32_e32 v2, 0x3f200000			; SI-NEXT: buffer_load_dword v2, off, s[12:15], 0
				; SI-NEXT: v_mov_b32_e32 v3, 0x3f200000
	; SI-NEXT: s_mov_b32 s8, s0			; SI-NEXT: s_mov_b32 s8, s0
	; SI-NEXT: s_mov_b32 s9, s1			; SI-NEXT: s_mov_b32 s9, s1
	; SI-NEXT: s_waitcnt vmcnt(2)			; SI-NEXT: s_waitcnt vmcnt(2)
	; SI-NEXT: v_lshrrev_b32_e32 v5, 16, v3
	; SI-NEXT: v_cvt_f32_f16_e32 v5, v5
	; SI-NEXT: v_cvt_f32_f16_e32 v3, v3
	; SI-NEXT: s_waitcnt vmcnt(1)
	; SI-NEXT: v_lshrrev_b32_e32 v4, 16, v0			; SI-NEXT: v_lshrrev_b32_e32 v4, 16, v0
				; SI-NEXT: s_waitcnt vmcnt(1)
				; SI-NEXT: v_lshrrev_b32_e32 v5, 16, v1
	; SI-NEXT: s_waitcnt vmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0)
	; SI-NEXT: v_lshrrev_b32_e32 v6, 16, v1			; SI-NEXT: v_lshrrev_b32_e32 v6, 16, v2
	; SI-NEXT: v_cvt_f32_f16_e32 v4, v4			; SI-NEXT: v_cvt_f32_f16_e32 v4, v4
				; SI-NEXT: v_cvt_f32_f16_e32 v5, v5
	; SI-NEXT: v_cvt_f32_f16_e32 v0, v0			; SI-NEXT: v_cvt_f32_f16_e32 v0, v0
	; SI-NEXT: v_cvt_f32_f16_e32 v6, v6			; SI-NEXT: v_cvt_f32_f16_e32 v6, v6
	; SI-NEXT: v_cvt_f32_f16_e32 v1, v1			; SI-NEXT: v_cvt_f32_f16_e32 v1, v1
				; SI-NEXT: v_cvt_f32_f16_e32 v2, v2
	; SI-NEXT: v_cmp_lt_f32_e32 vcc, v4, v5			; SI-NEXT: v_cmp_lt_f32_e32 vcc, v4, v5
	; SI-NEXT: v_cndmask_b32_e32 v2, v2, v6, vcc			; SI-NEXT: v_cndmask_b32_e32 v3, v3, v6, vcc
	; SI-NEXT: v_cmp_lt_f32_e32 vcc, v0, v3			; SI-NEXT: v_cmp_lt_f32_e32 vcc, v0, v1
	; SI-NEXT: v_cndmask_b32_e32 v0, 0.5, v1, vcc			; SI-NEXT: v_cndmask_b32_e32 v0, 0.5, v2, vcc
	; SI-NEXT: v_cvt_f16_f32_e32 v2, v2			; SI-NEXT: v_cvt_f16_f32_e32 v3, v3
	; SI-NEXT: v_cvt_f16_f32_e32 v0, v0			; SI-NEXT: v_cvt_f16_f32_e32 v0, v0
	; SI-NEXT: v_lshlrev_b32_e32 v1, 16, v2			; SI-NEXT: v_lshlrev_b32_e32 v1, 16, v3
	; SI-NEXT: v_or_b32_e32 v0, v0, v1			; SI-NEXT: v_or_b32_e32 v0, v0, v1
	; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; SI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: select_v2f16_imm_d:			; VI-LABEL: select_v2f16_imm_d:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[0:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s11, 0xf000			; VI-NEXT: s_mov_b32 s11, 0xf000
	; VI-NEXT: s_mov_b32 s10, -1			; VI-NEXT: s_mov_b32 s10, -1
	; VI-NEXT: s_mov_b32 s14, s10			; VI-NEXT: s_mov_b32 s18, s10
	; VI-NEXT: s_mov_b32 s15, s11			; VI-NEXT: s_mov_b32 s19, s11
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s8, s0
	; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_mov_b32 s12, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s13, s7			; VI-NEXT: s_mov_b32 s13, s7
	; VI-NEXT: s_mov_b32 s0, s2
	; VI-NEXT: s_mov_b32 s1, s3
	; VI-NEXT: s_mov_b32 s6, s10			; VI-NEXT: s_mov_b32 s6, s10
	; VI-NEXT: s_mov_b32 s7, s11			; VI-NEXT: s_mov_b32 s7, s11
	; VI-NEXT: s_mov_b32 s2, s10			; VI-NEXT: s_mov_b32 s16, s2
	; VI-NEXT: s_mov_b32 s3, s11			; VI-NEXT: s_mov_b32 s17, s3
	; VI-NEXT: buffer_load_dword v0, off, s[0:3], 0			; VI-NEXT: s_mov_b32 s14, s10
	; VI-NEXT: buffer_load_dword v4, off, s[4:7], 0			; VI-NEXT: s_mov_b32 s15, s11
	; VI-NEXT: buffer_load_dword v1, off, s[12:15], 0			; VI-NEXT: buffer_load_dword v0, off, s[16:19], 0
	; VI-NEXT: v_mov_b32_e32 v2, 0x3800			; VI-NEXT: buffer_load_dword v1, off, s[4:7], 0
	; VI-NEXT: v_mov_b32_e32 v3, 0x3900			; VI-NEXT: buffer_load_dword v2, off, s[12:15], 0
				; VI-NEXT: v_mov_b32_e32 v3, 0x3800
				; VI-NEXT: v_mov_b32_e32 v4, 0x3900
				; VI-NEXT: s_mov_b32 s8, s0
				; VI-NEXT: s_mov_b32 s9, s1
	; VI-NEXT: s_waitcnt vmcnt(2)			; VI-NEXT: s_waitcnt vmcnt(2)
	; VI-NEXT: v_lshrrev_b32_e32 v6, 16, v0			; VI-NEXT: v_lshrrev_b32_e32 v6, 16, v0
	; VI-NEXT: s_waitcnt vmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1)
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, v0, v4			; VI-NEXT: v_cmp_lt_f16_e32 vcc, v0, v1
	; VI-NEXT: v_lshrrev_b32_e32 v5, 16, v4			; VI-NEXT: v_lshrrev_b32_e32 v5, 16, v1
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_cndmask_b32_e32 v0, v2, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v0, v3, v2, vcc
	; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshrrev_b32_e32 v1, 16, v2
	; VI-NEXT: v_cmp_lt_f16_e32 vcc, v6, v5			; VI-NEXT: v_cmp_lt_f16_e32 vcc, v6, v5
	; VI-NEXT: v_cndmask_b32_e32 v1, v3, v1, vcc			; VI-NEXT: v_cndmask_b32_e32 v1, v4, v1, vcc
	; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; VI-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD			; VI-NEXT: v_or_b32_sdwa v0, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
	; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0			; VI-NEXT: buffer_store_dword v0, off, s[8:11], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	<2 x half> addrspace(1)* %r,			<2 x half> addrspace(1)* %r,
	<2 x half> addrspace(1)* %a,			<2 x half> addrspace(1)* %a,
	<2 x half> addrspace(1)* %b,			<2 x half> addrspace(1)* %b,
	<2 x half> addrspace(1)* %c) {			<2 x half> addrspace(1)* %c) {
	Show All 9 Lines

llvm/test/CodeGen/AMDGPU/shift-i64-opts.ll

Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	define amdgpu_kernel void @lshr_i64_32(i64 addrspace(1)* %out, i64 addrspace(1)* %in) {
store i64 %shl, i64 addrspace(1)* %out		store i64 %shl, i64 addrspace(1)* %out
ret void		ret void
}		}

; Make sure the and of the constant doesn't prevent bfe from forming		; Make sure the and of the constant doesn't prevent bfe from forming
; after 64-bit shift is split.		; after 64-bit shift is split.

; GCN-LABEL: {{^}}lshr_and_i64_35:		; GCN-LABEL: {{^}}lshr_and_i64_35:
; GCN: v_mov_b32_e32 v[[ZERO:[0-9]+]], 0{{$}}		; GCN-DAG: v_mov_b32_e32 v[[ZERO:[0-9]+]], 0{{$}}
; GCN: buffer_load_dword v[[LO:[0-9]+]]		; GCN-DAG: buffer_load_dword v[[LO:[0-9]+]]
; GCN: v_bfe_u32 v[[BFE:[0-9]+]], v[[LO]], 8, 23		; GCN: v_bfe_u32 v[[BFE:[0-9]+]], v[[LO]], 8, 23
; GCN: buffer_store_dwordx2 v{{\[}}[[BFE]]:[[ZERO]]{{\]}}		; GCN: buffer_store_dwordx2 v{{\[}}[[BFE]]:[[ZERO]]{{\]}}
define amdgpu_kernel void @lshr_and_i64_35(i64 addrspace(1)* %out, i64 addrspace(1)* %in) {		define amdgpu_kernel void @lshr_and_i64_35(i64 addrspace(1)* %out, i64 addrspace(1)* %in) {
%val = load i64, i64 addrspace(1)* %in		%val = load i64, i64 addrspace(1)* %in
%and = and i64 %val, 9223372036854775807 ; 0x7fffffffffffffff		%and = and i64 %val, 9223372036854775807 ; 0x7fffffffffffffff
%shl = lshr i64 %and, 40		%shl = lshr i64 %and, 40
store i64 %shl, i64 addrspace(1)* %out		store i64 %shl, i64 addrspace(1)* %out
ret void		ret void
▲ Show 20 Lines • Show All 253 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/shl.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -amdgpu-scalarize-global-loads=false -march=amdgcn -mtriple=amdgcn-- -mcpu=verde -verify-machineinstrs \| FileCheck %s -allow-deprecated-dag-overlap -check-prefixes=FUNC,GCN,SI			; RUN: llc < %s -amdgpu-scalarize-global-loads=false -march=amdgcn -mtriple=amdgcn-- -mcpu=verde -verify-machineinstrs \| FileCheck %s -allow-deprecated-dag-overlap -check-prefixes=FUNC,GCN,SI
	; XUN: llc < %s -march=amdgcn -mtriple=amdgcn-- -mcpu=tonga -mattr=-flat-for-global -verify-machineinstrs \| FileCheck %s -check-prefixes=FUNC,GCN,VI			; XUN: llc < %s -march=amdgcn -mtriple=amdgcn-- -mcpu=tonga -mattr=-flat-for-global -verify-machineinstrs \| FileCheck %s -check-prefixes=FUNC,GCN,VI
	; RUN: llc < %s -amdgpu-scalarize-global-loads=false -march=r600 -mtriple=r600-- -mcpu=redwood -verify-machineinstrs \| FileCheck %s -allow-deprecated-dag-overlap -check-prefixes=FUNC,EG			; RUN: llc < %s -amdgpu-scalarize-global-loads=false -march=r600 -mtriple=r600-- -mcpu=redwood -verify-machineinstrs \| FileCheck %s -allow-deprecated-dag-overlap -check-prefixes=FUNC,EG

	declare i32 @llvm.r600.read.tidig.x() #0			declare i32 @llvm.r600.read.tidig.x() #0

	declare i32 @llvm.r600.read.tgid.x() #0			declare i32 @llvm.r600.read.tgid.x() #0

	define amdgpu_kernel void @shl_v2i32(<2 x i32> addrspace(1)* %out, <2 x i32> addrspace(1)* %in) {			define amdgpu_kernel void @shl_v2i32(<2 x i32> addrspace(1)* %out, <2 x i32> addrspace(1)* %in) {
	; GCN-LABEL: shl_v2i32:			; GCN-LABEL: shl_v2i32:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GCN-NEXT: s_mov_b32 s3, 0xf000			; GCN-NEXT: s_mov_b32 s3, 0xf000
	; GCN-NEXT: s_mov_b32 s2, -1			; GCN-NEXT: s_mov_b32 s2, -1
				; GCN-NEXT: s_mov_b32 s10, s2
				; GCN-NEXT: s_mov_b32 s11, s3
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
				; GCN-NEXT: s_mov_b32 s8, s6
				; GCN-NEXT: s_mov_b32 s9, s7
				; GCN-NEXT: buffer_load_dwordx4 v[0:3], off, s[8:11], 0
	; GCN-NEXT: s_mov_b32 s0, s4			; GCN-NEXT: s_mov_b32 s0, s4
	; GCN-NEXT: s_mov_b32 s1, s5			; GCN-NEXT: s_mov_b32 s1, s5
	; GCN-NEXT: s_mov_b32 s4, s6
	; GCN-NEXT: s_mov_b32 s5, s7
	; GCN-NEXT: s_mov_b32 s6, s2
	; GCN-NEXT: s_mov_b32 s7, s3
	; GCN-NEXT: buffer_load_dwordx4 v[0:3], off, s[4:7], 0
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_lshl_b32_e32 v1, v1, v3			; GCN-NEXT: v_lshl_b32_e32 v1, v1, v3
	; GCN-NEXT: v_lshl_b32_e32 v0, v0, v2			; GCN-NEXT: v_lshl_b32_e32 v0, v0, v2
	; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0			; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; EG-LABEL: shl_v2i32:			; EG-LABEL: shl_v2i32:
	; EG: ; %bb.0:			; EG: ; %bb.0:
	Show All 22 Lines
	}			}

	define amdgpu_kernel void @shl_v4i32(<4 x i32> addrspace(1)* %out, <4 x i32> addrspace(1)* %in) {			define amdgpu_kernel void @shl_v4i32(<4 x i32> addrspace(1)* %out, <4 x i32> addrspace(1)* %in) {
	; GCN-LABEL: shl_v4i32:			; GCN-LABEL: shl_v4i32:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GCN-NEXT: s_mov_b32 s3, 0xf000			; GCN-NEXT: s_mov_b32 s3, 0xf000
	; GCN-NEXT: s_mov_b32 s2, -1			; GCN-NEXT: s_mov_b32 s2, -1
				; GCN-NEXT: s_mov_b32 s10, s2
				; GCN-NEXT: s_mov_b32 s11, s3
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
				; GCN-NEXT: s_mov_b32 s8, s6
				; GCN-NEXT: s_mov_b32 s9, s7
				; GCN-NEXT: buffer_load_dwordx4 v[0:3], off, s[8:11], 0
				; GCN-NEXT: buffer_load_dwordx4 v[4:7], off, s[8:11], 0 offset:16
	; GCN-NEXT: s_mov_b32 s0, s4			; GCN-NEXT: s_mov_b32 s0, s4
	; GCN-NEXT: s_mov_b32 s1, s5			; GCN-NEXT: s_mov_b32 s1, s5
	; GCN-NEXT: s_mov_b32 s4, s6
	; GCN-NEXT: s_mov_b32 s5, s7
	; GCN-NEXT: s_mov_b32 s6, s2
	; GCN-NEXT: s_mov_b32 s7, s3
	; GCN-NEXT: buffer_load_dwordx4 v[0:3], off, s[4:7], 0
	; GCN-NEXT: buffer_load_dwordx4 v[4:7], off, s[4:7], 0 offset:16
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_lshl_b32_e32 v3, v3, v7			; GCN-NEXT: v_lshl_b32_e32 v3, v3, v7
	; GCN-NEXT: v_lshl_b32_e32 v2, v2, v6			; GCN-NEXT: v_lshl_b32_e32 v2, v2, v6
	; GCN-NEXT: v_lshl_b32_e32 v1, v1, v5			; GCN-NEXT: v_lshl_b32_e32 v1, v1, v5
	; GCN-NEXT: v_lshl_b32_e32 v0, v0, v4			; GCN-NEXT: v_lshl_b32_e32 v0, v0, v4
	; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[0:3], 0			; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[0:3], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	▲ Show 20 Lines • Show All 325 Lines • ▼ Show 20 Lines
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9			; GCN-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
	; GCN-NEXT: s_mov_b32 s7, 0xf000			; GCN-NEXT: s_mov_b32 s7, 0xf000
	; GCN-NEXT: s_mov_b32 s6, -1			; GCN-NEXT: s_mov_b32 s6, -1
	; GCN-NEXT: s_mov_b32 s10, s6			; GCN-NEXT: s_mov_b32 s10, s6
	; GCN-NEXT: s_mov_b32 s11, s7			; GCN-NEXT: s_mov_b32 s11, s7
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s8, s2			; GCN-NEXT: s_mov_b32 s8, s2
				; GCN-NEXT: s_mov_b64 s[12:13], s[2:3]
	; GCN-NEXT: s_mov_b32 s9, s3			; GCN-NEXT: s_mov_b32 s9, s3
	; GCN-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; GCN-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; GCN-NEXT: v_mov_b32_e32 v1, 0			; GCN-NEXT: v_mov_b32_e32 v1, 0
	; GCN-NEXT: s_mov_b32 s14, 0			; GCN-NEXT: s_mov_b32 s14, 0
	; GCN-NEXT: s_mov_b32 s15, s7			; GCN-NEXT: s_mov_b32 s15, s7
	; GCN-NEXT: s_mov_b64 s[12:13], s[2:3]			; GCN-NEXT: buffer_load_dword v2, off, s[8:11], 0
	; GCN-NEXT: buffer_load_dword v0, v[0:1], s[12:15], 0 addr64 offset:4			; GCN-NEXT: buffer_load_dword v0, v[0:1], s[12:15], 0 addr64 offset:4
	; GCN-NEXT: buffer_load_dword v1, off, s[8:11], 0			; GCN-NEXT: s_mov_b32 s2, 0xffff
	; GCN-NEXT: s_mov_b32 s4, s0			; GCN-NEXT: s_mov_b32 s4, s0
	; GCN-NEXT: s_mov_b32 s0, 0xffff
	; GCN-NEXT: s_mov_b32 s5, s1			; GCN-NEXT: s_mov_b32 s5, s1
	; GCN-NEXT: s_waitcnt vmcnt(1)			; GCN-NEXT: s_waitcnt vmcnt(1)
	; GCN-NEXT: v_lshrrev_b32_e32 v3, 16, v0			; GCN-NEXT: v_lshrrev_b32_e32 v1, 16, v2
	; GCN-NEXT: v_and_b32_e32 v0, s0, v0
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_lshrrev_b32_e32 v2, 16, v1			; GCN-NEXT: v_lshrrev_b32_e32 v3, 16, v0
	; GCN-NEXT: v_lshlrev_b32_e32 v0, v0, v1			; GCN-NEXT: v_and_b32_e32 v0, s2, v0
	; GCN-NEXT: v_lshlrev_b32_e32 v1, v3, v2			; GCN-NEXT: v_lshlrev_b32_e32 v0, v0, v2
	; GCN-NEXT: v_and_b32_e32 v0, s0, v0			; GCN-NEXT: v_lshlrev_b32_e32 v1, v3, v1
				; GCN-NEXT: v_and_b32_e32 v0, s2, v0
	; GCN-NEXT: v_lshlrev_b32_e32 v1, 16, v1			; GCN-NEXT: v_lshlrev_b32_e32 v1, 16, v1
	; GCN-NEXT: v_or_b32_e32 v0, v0, v1			; GCN-NEXT: v_or_b32_e32 v0, v0, v1
	; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0			; GCN-NEXT: buffer_store_dword v0, off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; EG-LABEL: shl_v2i16:			; EG-LABEL: shl_v2i16:
	; EG: ; %bb.0:			; EG: ; %bb.0:
	; EG-NEXT: ALU 2, @12, KC0[CB0:0-32], KC1[]			; EG-NEXT: ALU 2, @12, KC0[CB0:0-32], KC1[]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; GCN-NEXT: s_mov_b32 s7, 0xf000			; GCN-NEXT: s_mov_b32 s7, 0xf000
	; GCN-NEXT: s_mov_b32 s6, 0			; GCN-NEXT: s_mov_b32 s6, 0
	; GCN-NEXT: v_lshlrev_b32_e32 v0, 3, v0			; GCN-NEXT: v_lshlrev_b32_e32 v0, 3, v0
	; GCN-NEXT: v_mov_b32_e32 v1, 0			; GCN-NEXT: v_mov_b32_e32 v1, 0
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: s_mov_b64 s[4:5], s[2:3]			; GCN-NEXT: s_mov_b64 s[4:5], s[2:3]
	; GCN-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64			; GCN-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64
	; GCN-NEXT: buffer_load_dwordx2 v[4:5], v[0:1], s[4:7], 0 addr64 offset:8			; GCN-NEXT: buffer_load_dwordx2 v[4:5], v[0:1], s[4:7], 0 addr64 offset:8
	; GCN-NEXT: s_mov_b32 s8, 0xffff			; GCN-NEXT: s_mov_b32 s4, 0xffff
	; GCN-NEXT: s_mov_b64 s[2:3], s[6:7]			; GCN-NEXT: s_mov_b64 s[2:3], s[6:7]
	; GCN-NEXT: s_waitcnt vmcnt(1)			; GCN-NEXT: s_waitcnt vmcnt(1)
	; GCN-NEXT: v_lshrrev_b32_e32 v6, 16, v2			; GCN-NEXT: v_lshrrev_b32_e32 v6, 16, v2
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_and_b32_e32 v8, s8, v4			; GCN-NEXT: v_and_b32_e32 v8, s4, v4
	; GCN-NEXT: v_lshrrev_b32_e32 v4, 16, v4			; GCN-NEXT: v_lshrrev_b32_e32 v4, 16, v4
	; GCN-NEXT: v_and_b32_e32 v9, s8, v5			; GCN-NEXT: v_and_b32_e32 v9, s4, v5
	; GCN-NEXT: v_lshrrev_b32_e32 v7, 16, v3			; GCN-NEXT: v_lshrrev_b32_e32 v7, 16, v3
	; GCN-NEXT: v_lshrrev_b32_e32 v5, 16, v5			; GCN-NEXT: v_lshrrev_b32_e32 v5, 16, v5
	; GCN-NEXT: v_lshlrev_b32_e32 v5, v5, v7			; GCN-NEXT: v_lshlrev_b32_e32 v5, v5, v7
	; GCN-NEXT: v_lshlrev_b32_e32 v3, v9, v3			; GCN-NEXT: v_lshlrev_b32_e32 v3, v9, v3
	; GCN-NEXT: v_lshlrev_b32_e32 v4, v4, v6			; GCN-NEXT: v_lshlrev_b32_e32 v4, v4, v6
	; GCN-NEXT: v_lshlrev_b32_e32 v2, v8, v2			; GCN-NEXT: v_lshlrev_b32_e32 v2, v8, v2
	; GCN-NEXT: v_lshlrev_b32_e32 v5, 16, v5			; GCN-NEXT: v_lshlrev_b32_e32 v5, 16, v5
	; GCN-NEXT: v_and_b32_e32 v3, s8, v3			; GCN-NEXT: v_and_b32_e32 v3, s4, v3
	; GCN-NEXT: v_lshlrev_b32_e32 v4, 16, v4			; GCN-NEXT: v_lshlrev_b32_e32 v4, 16, v4
	; GCN-NEXT: v_and_b32_e32 v2, s8, v2			; GCN-NEXT: v_and_b32_e32 v2, s4, v2
	; GCN-NEXT: v_or_b32_e32 v3, v3, v5			; GCN-NEXT: v_or_b32_e32 v3, v3, v5
	; GCN-NEXT: v_or_b32_e32 v2, v2, v4			; GCN-NEXT: v_or_b32_e32 v2, v2, v4
	; GCN-NEXT: buffer_store_dwordx2 v[2:3], v[0:1], s[0:3], 0 addr64			; GCN-NEXT: buffer_store_dwordx2 v[2:3], v[0:1], s[0:3], 0 addr64
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	;			;
	; EG-LABEL: shl_v4i16:			; EG-LABEL: shl_v4i16:
	; EG: ; %bb.0:			; EG: ; %bb.0:
	; EG-NEXT: ALU 2, @12, KC0[CB0:0-32], KC1[]			; EG-NEXT: ALU 2, @12, KC0[CB0:0-32], KC1[]
	▲ Show 20 Lines • Show All 208 Lines • ▼ Show 20 Lines
	}			}

	define amdgpu_kernel void @shl_v4i64(<4 x i64> addrspace(1)* %out, <4 x i64> addrspace(1)* %in) {			define amdgpu_kernel void @shl_v4i64(<4 x i64> addrspace(1)* %out, <4 x i64> addrspace(1)* %in) {
	; GCN-LABEL: shl_v4i64:			; GCN-LABEL: shl_v4i64:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GCN-NEXT: s_mov_b32 s3, 0xf000			; GCN-NEXT: s_mov_b32 s3, 0xf000
	; GCN-NEXT: s_mov_b32 s2, -1			; GCN-NEXT: s_mov_b32 s2, -1
				; GCN-NEXT: s_mov_b32 s10, s2
				; GCN-NEXT: s_mov_b32 s11, s3
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
				; GCN-NEXT: s_mov_b32 s8, s6
				; GCN-NEXT: s_mov_b32 s9, s7
				; GCN-NEXT: buffer_load_dwordx4 v[0:3], off, s[8:11], 0
				; GCN-NEXT: buffer_load_dwordx4 v[4:7], off, s[8:11], 0 offset:16
				; GCN-NEXT: buffer_load_dwordx4 v[8:11], off, s[8:11], 0 offset:32
				; GCN-NEXT: s_waitcnt vmcnt(0)
				; GCN-NEXT: buffer_load_dwordx4 v[11:14], off, s[8:11], 0 offset:48
	; GCN-NEXT: s_mov_b32 s0, s4			; GCN-NEXT: s_mov_b32 s0, s4
	; GCN-NEXT: s_mov_b32 s1, s5			; GCN-NEXT: s_mov_b32 s1, s5
	; GCN-NEXT: s_mov_b32 s4, s6
	; GCN-NEXT: s_mov_b32 s5, s7
	; GCN-NEXT: s_mov_b32 s6, s2
	; GCN-NEXT: s_mov_b32 s7, s3
	; GCN-NEXT: buffer_load_dwordx4 v[0:3], off, s[4:7], 0
	; GCN-NEXT: buffer_load_dwordx4 v[4:7], off, s[4:7], 0 offset:16
	; GCN-NEXT: buffer_load_dwordx4 v[8:11], off, s[4:7], 0 offset:32
	; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: buffer_load_dwordx4 v[11:14], off, s[4:7], 0 offset:48
	; GCN-NEXT: v_lshl_b64 v[2:3], v[2:3], v10			; GCN-NEXT: v_lshl_b64 v[2:3], v[2:3], v10
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_lshl_b64 v[6:7], v[6:7], v13			; GCN-NEXT: v_lshl_b64 v[6:7], v[6:7], v13
	; GCN-NEXT: v_lshl_b64 v[4:5], v[4:5], v11			; GCN-NEXT: v_lshl_b64 v[4:5], v[4:5], v11
	; GCN-NEXT: v_lshl_b64 v[0:1], v[0:1], v8			; GCN-NEXT: v_lshl_b64 v[0:1], v[0:1], v8
	; GCN-NEXT: buffer_store_dwordx4 v[4:7], off, s[0:3], 0 offset:16			; GCN-NEXT: buffer_store_dwordx4 v[4:7], off, s[0:3], 0 offset:16
	; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[0:3], 0			; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[0:3], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	▲ Show 20 Lines • Show All 973 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/shl.v2i16.ll

	Show First 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_mov_b32 s7, 0xf000			; CI-NEXT: s_mov_b32 s7, 0xf000
	; CI-NEXT: s_mov_b32 s6, 0			; CI-NEXT: s_mov_b32 s6, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[4:5], s[2:3]			; CI-NEXT: s_mov_b64 s[4:5], s[2:3]
	; CI-NEXT: buffer_load_dword v2, v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_load_dword v2, v[0:1], s[4:7], 0 addr64
	; CI-NEXT: buffer_load_dword v3, v[0:1], s[4:7], 0 addr64 offset:4			; CI-NEXT: buffer_load_dword v3, v[0:1], s[4:7], 0 addr64 offset:4
	; CI-NEXT: s_mov_b32 s8, 0xffff			; CI-NEXT: s_mov_b32 s4, 0xffff
	; CI-NEXT: s_mov_b64 s[2:3], s[6:7]			; CI-NEXT: s_mov_b64 s[2:3], s[6:7]
	; CI-NEXT: s_waitcnt vmcnt(1)			; CI-NEXT: s_waitcnt vmcnt(1)
	; CI-NEXT: v_lshrrev_b32_e32 v4, 16, v2			; CI-NEXT: v_lshrrev_b32_e32 v4, 16, v2
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_and_b32_e32 v5, s8, v3			; CI-NEXT: v_and_b32_e32 v5, s4, v3
	; CI-NEXT: v_lshrrev_b32_e32 v3, 16, v3			; CI-NEXT: v_lshrrev_b32_e32 v3, 16, v3
	; CI-NEXT: v_lshlrev_b32_e32 v3, v3, v4			; CI-NEXT: v_lshlrev_b32_e32 v3, v3, v4
	; CI-NEXT: v_lshlrev_b32_e32 v2, v5, v2			; CI-NEXT: v_lshlrev_b32_e32 v2, v5, v2
	; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3			; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3
	; CI-NEXT: v_and_b32_e32 v2, s8, v2			; CI-NEXT: v_and_b32_e32 v2, s4, v2
	; CI-NEXT: v_or_b32_e32 v2, v2, v3			; CI-NEXT: v_or_b32_e32 v2, v2, v3
	; CI-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64			; CI-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%tid.ext = sext i32 %tid to i64			%tid.ext = sext i32 %tid to i64
	%in.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %in, i64 %tid.ext			%in.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %in, i64 %tid.ext
	%out.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %out, i64 %tid.ext			%out.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %out, i64 %tid.ext
	%b_ptr = getelementptr <2 x i16>, <2 x i16> addrspace(1)* %in.gep, i32 1			%b_ptr = getelementptr <2 x i16>, <2 x i16> addrspace(1)* %in.gep, i32 1
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_load_dword s8, s[0:1], 0xd			; CI-NEXT: s_load_dword s8, s[0:1], 0xd
	; CI-NEXT: s_mov_b32 s3, 0xf000			; CI-NEXT: s_mov_b32 s3, 0xf000
	; CI-NEXT: s_mov_b32 s2, 0			; CI-NEXT: s_mov_b32 s2, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[0:1], s[6:7]			; CI-NEXT: s_mov_b64 s[0:1], s[6:7]
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: buffer_load_dword v2, v[0:1], s[0:3], 0 addr64			; CI-NEXT: buffer_load_dword v2, v[0:1], s[0:3], 0 addr64
	; CI-NEXT: s_mov_b32 s9, 0xffff			; CI-NEXT: s_mov_b32 s0, 0xffff
	; CI-NEXT: s_lshr_b32 s10, s8, 16			; CI-NEXT: s_lshr_b32 s1, s8, 16
	; CI-NEXT: s_and_b32 s8, s8, s9			; CI-NEXT: s_and_b32 s8, s8, s0
	; CI-NEXT: s_mov_b64 s[6:7], s[2:3]			; CI-NEXT: s_mov_b64 s[6:7], s[2:3]
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_lshrrev_b32_e32 v3, 16, v2			; CI-NEXT: v_lshrrev_b32_e32 v3, 16, v2
	; CI-NEXT: v_lshlrev_b32_e32 v2, s8, v2			; CI-NEXT: v_lshlrev_b32_e32 v2, s8, v2
	; CI-NEXT: v_lshlrev_b32_e32 v3, s10, v3			; CI-NEXT: v_lshlrev_b32_e32 v3, s1, v3
	; CI-NEXT: v_and_b32_e32 v2, s9, v2			; CI-NEXT: v_and_b32_e32 v2, s0, v2
	; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3			; CI-NEXT: v_lshlrev_b32_e32 v3, 16, v3
	; CI-NEXT: v_or_b32_e32 v2, v2, v3			; CI-NEXT: v_or_b32_e32 v2, v2, v3
	; CI-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%tid.ext = sext i32 %tid to i64			%tid.ext = sext i32 %tid to i64
	%in.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %in, i64 %tid.ext			%in.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %in, i64 %tid.ext
	%out.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %out, i64 %tid.ext			%out.gep = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %out, i64 %tid.ext
	▲ Show 20 Lines • Show All 262 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_mov_b32 s7, 0xf000			; CI-NEXT: s_mov_b32 s7, 0xf000
	; CI-NEXT: s_mov_b32 s6, 0			; CI-NEXT: s_mov_b32 s6, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 3, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 3, v0
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[4:5], s[2:3]			; CI-NEXT: s_mov_b64 s[4:5], s[2:3]
	; CI-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64
	; CI-NEXT: buffer_load_dwordx2 v[4:5], v[0:1], s[4:7], 0 addr64 offset:8			; CI-NEXT: buffer_load_dwordx2 v[4:5], v[0:1], s[4:7], 0 addr64 offset:8
	; CI-NEXT: s_mov_b32 s8, 0xffff			; CI-NEXT: s_mov_b32 s4, 0xffff
	; CI-NEXT: s_mov_b64 s[2:3], s[6:7]			; CI-NEXT: s_mov_b64 s[2:3], s[6:7]
	; CI-NEXT: s_waitcnt vmcnt(1)			; CI-NEXT: s_waitcnt vmcnt(1)
	; CI-NEXT: v_lshrrev_b32_e32 v6, 16, v2			; CI-NEXT: v_lshrrev_b32_e32 v6, 16, v2
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_and_b32_e32 v8, s8, v4			; CI-NEXT: v_and_b32_e32 v8, s4, v4
	; CI-NEXT: v_lshrrev_b32_e32 v4, 16, v4			; CI-NEXT: v_lshrrev_b32_e32 v4, 16, v4
	; CI-NEXT: v_and_b32_e32 v9, s8, v5			; CI-NEXT: v_and_b32_e32 v9, s4, v5
	; CI-NEXT: v_lshrrev_b32_e32 v7, 16, v3			; CI-NEXT: v_lshrrev_b32_e32 v7, 16, v3
	; CI-NEXT: v_lshrrev_b32_e32 v5, 16, v5			; CI-NEXT: v_lshrrev_b32_e32 v5, 16, v5
	; CI-NEXT: v_lshlrev_b32_e32 v5, v5, v7			; CI-NEXT: v_lshlrev_b32_e32 v5, v5, v7
	; CI-NEXT: v_lshlrev_b32_e32 v3, v9, v3			; CI-NEXT: v_lshlrev_b32_e32 v3, v9, v3
	; CI-NEXT: v_lshlrev_b32_e32 v4, v4, v6			; CI-NEXT: v_lshlrev_b32_e32 v4, v4, v6
	; CI-NEXT: v_lshlrev_b32_e32 v2, v8, v2			; CI-NEXT: v_lshlrev_b32_e32 v2, v8, v2
	; CI-NEXT: v_lshlrev_b32_e32 v5, 16, v5			; CI-NEXT: v_lshlrev_b32_e32 v5, 16, v5
	; CI-NEXT: v_and_b32_e32 v3, s8, v3			; CI-NEXT: v_and_b32_e32 v3, s4, v3
	; CI-NEXT: v_lshlrev_b32_e32 v4, 16, v4			; CI-NEXT: v_lshlrev_b32_e32 v4, 16, v4
	; CI-NEXT: v_and_b32_e32 v2, s8, v2			; CI-NEXT: v_and_b32_e32 v2, s4, v2
	; CI-NEXT: v_or_b32_e32 v3, v3, v5			; CI-NEXT: v_or_b32_e32 v3, v3, v5
	; CI-NEXT: v_or_b32_e32 v2, v2, v4			; CI-NEXT: v_or_b32_e32 v2, v2, v4
	; CI-NEXT: buffer_store_dwordx2 v[2:3], v[0:1], s[0:3], 0 addr64			; CI-NEXT: buffer_store_dwordx2 v[2:3], v[0:1], s[0:3], 0 addr64
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%tid.ext = sext i32 %tid to i64			%tid.ext = sext i32 %tid to i64
	%in.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %in, i64 %tid.ext			%in.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %in, i64 %tid.ext
	%out.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %out, i64 %tid.ext			%out.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %out, i64 %tid.ext
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9			; CI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
	; CI-NEXT: s_mov_b32 s7, 0xf000			; CI-NEXT: s_mov_b32 s7, 0xf000
	; CI-NEXT: s_mov_b32 s6, 0			; CI-NEXT: s_mov_b32 s6, 0
	; CI-NEXT: v_lshlrev_b32_e32 v0, 3, v0			; CI-NEXT: v_lshlrev_b32_e32 v0, 3, v0
	; CI-NEXT: v_mov_b32_e32 v1, 0			; CI-NEXT: v_mov_b32_e32 v1, 0
	; CI-NEXT: s_waitcnt lgkmcnt(0)			; CI-NEXT: s_waitcnt lgkmcnt(0)
	; CI-NEXT: s_mov_b64 s[4:5], s[2:3]			; CI-NEXT: s_mov_b64 s[4:5], s[2:3]
	; CI-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64			; CI-NEXT: buffer_load_dwordx2 v[2:3], v[0:1], s[4:7], 0 addr64
	; CI-NEXT: s_mov_b32 s8, 0xff00			; CI-NEXT: s_mov_b32 s4, 0xff00
	; CI-NEXT: s_mov_b64 s[2:3], s[6:7]			; CI-NEXT: s_mov_b64 s[2:3], s[6:7]
	; CI-NEXT: s_waitcnt vmcnt(0)			; CI-NEXT: s_waitcnt vmcnt(0)
	; CI-NEXT: v_lshrrev_b32_e32 v4, 8, v3			; CI-NEXT: v_lshrrev_b32_e32 v4, 8, v3
	; CI-NEXT: v_lshlrev_b32_e32 v3, 8, v3			; CI-NEXT: v_lshlrev_b32_e32 v3, 8, v3
	; CI-NEXT: v_and_b32_e32 v4, s8, v4			; CI-NEXT: v_and_b32_e32 v4, s4, v4
	; CI-NEXT: v_lshlrev_b32_e32 v2, 8, v2			; CI-NEXT: v_lshlrev_b32_e32 v2, 8, v2
	; CI-NEXT: v_and_b32_e32 v3, s8, v3			; CI-NEXT: v_and_b32_e32 v3, s4, v3
	; CI-NEXT: v_lshlrev_b32_e32 v4, 16, v4			; CI-NEXT: v_lshlrev_b32_e32 v4, 16, v4
	; CI-NEXT: v_or_b32_e32 v3, v3, v4			; CI-NEXT: v_or_b32_e32 v3, v3, v4
	; CI-NEXT: v_and_b32_e32 v2, 0xff00ff00, v2			; CI-NEXT: v_and_b32_e32 v2, 0xff00ff00, v2
	; CI-NEXT: buffer_store_dwordx2 v[2:3], v[0:1], s[0:3], 0 addr64			; CI-NEXT: buffer_store_dwordx2 v[2:3], v[0:1], s[0:3], 0 addr64
	; CI-NEXT: s_endpgm			; CI-NEXT: s_endpgm
	%tid = call i32 @llvm.amdgcn.workitem.id.x()			%tid = call i32 @llvm.amdgcn.workitem.id.x()
	%tid.ext = sext i32 %tid to i64			%tid.ext = sext i32 %tid to i64
	%in.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %in, i64 %tid.ext			%in.gep = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %in, i64 %tid.ext
	Show All 11 Lines

llvm/test/CodeGen/AMDGPU/shrink-add-sub-constant.ll

	Show First 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; VI-LABEL: v_test_i32_x_sub_64_multi_use:			; VI-LABEL: v_test_i32_x_sub_64_multi_use:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; VI-NEXT: v_lshlrev_b32_e32 v2, 2, v0			; VI-NEXT: v_lshlrev_b32_e32 v2, 2, v0
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v1, s3			; VI-NEXT: v_mov_b32_e32 v1, s3
	; VI-NEXT: v_add_u32_e32 v0, vcc, s2, v2			; VI-NEXT: v_add_u32_e32 v0, vcc, s2, v2
	; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
				; VI-NEXT: flat_load_dword v3, v[0:1]
	; VI-NEXT: flat_load_dword v4, v[0:1]			; VI-NEXT: flat_load_dword v4, v[0:1]
	; VI-NEXT: flat_load_dword v0, v[0:1]			; VI-NEXT: v_mov_b32_e32 v1, s1
	; VI-NEXT: v_mov_b32_e32 v3, s1			; VI-NEXT: v_add_u32_e32 v0, vcc, s0, v2
	; VI-NEXT: v_add_u32_e32 v2, vcc, s0, v2			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v3, vcc
	; VI-NEXT: s_waitcnt vmcnt(1) lgkmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1) lgkmcnt(1)
	; VI-NEXT: v_subrev_u32_e32 v1, vcc, 64, v4			; VI-NEXT: v_subrev_u32_e32 v2, vcc, 64, v3
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: v_subrev_u32_e32 v0, vcc, 64, v0			; VI-NEXT: v_subrev_u32_e32 v3, vcc, 64, v4
	; VI-NEXT: flat_store_dword v[2:3], v1			; VI-NEXT: flat_store_dword v[0:1], v2
	; VI-NEXT: flat_store_dword v[2:3], v0			; VI-NEXT: flat_store_dword v[0:1], v3
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: v_test_i32_x_sub_64_multi_use:			; GFX9-LABEL: v_test_i32_x_sub_64_multi_use:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 2, v0			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 2, v0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s3			; GFX9-NEXT: v_mov_b32_e32 v1, s3
	; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s2, v2			; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s2, v2
	; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc			; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc
				; GFX9-NEXT: global_load_dword v3, v[0:1], off
	; GFX9-NEXT: global_load_dword v4, v[0:1], off			; GFX9-NEXT: global_load_dword v4, v[0:1], off
	; GFX9-NEXT: global_load_dword v0, v[0:1], off			; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s0, v2
	; GFX9-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NEXT: v_add_co_u32_e32 v2, vcc, s0, v2			; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc
	; GFX9-NEXT: v_addc_co_u32_e32 v3, vcc, 0, v3, vcc
	; GFX9-NEXT: s_waitcnt vmcnt(1)			; GFX9-NEXT: s_waitcnt vmcnt(1)
	; GFX9-NEXT: v_subrev_u32_e32 v1, 64, v4			; GFX9-NEXT: v_subrev_u32_e32 v2, 64, v3
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_subrev_u32_e32 v0, 64, v0			; GFX9-NEXT: v_subrev_u32_e32 v3, 64, v4
	; GFX9-NEXT: global_store_dword v[2:3], v1, off			; GFX9-NEXT: global_store_dword v[0:1], v2, off
	; GFX9-NEXT: global_store_dword v[2:3], v0, off			; GFX9-NEXT: global_store_dword v[0:1], v3, off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX10-LABEL: v_test_i32_x_sub_64_multi_use:			; GFX10-LABEL: v_test_i32_x_sub_64_multi_use:
	; GFX10: ; %bb.0:			; GFX10: ; %bb.0:
	; GFX10-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX10-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX10-NEXT: v_lshlrev_b32_e32 v2, 2, v0			; GFX10-NEXT: v_lshlrev_b32_e32 v2, 2, v0
	; GFX10-NEXT: ; implicit-def: $vcc_hi			; GFX10-NEXT: ; implicit-def: $vcc_hi
	; GFX10-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-NEXT: s_waitcnt lgkmcnt(0)
	▲ Show 20 Lines • Show All 784 Lines • ▼ Show 20 Lines
	; VI-LABEL: v_test_i16_x_sub_64_multi_use:			; VI-LABEL: v_test_i16_x_sub_64_multi_use:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; VI-NEXT: v_lshlrev_b32_e32 v2, 1, v0			; VI-NEXT: v_lshlrev_b32_e32 v2, 1, v0
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: v_mov_b32_e32 v1, s3			; VI-NEXT: v_mov_b32_e32 v1, s3
	; VI-NEXT: v_add_u32_e32 v0, vcc, s2, v2			; VI-NEXT: v_add_u32_e32 v0, vcc, s2, v2
	; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
				; VI-NEXT: flat_load_ushort v3, v[0:1]
	; VI-NEXT: flat_load_ushort v4, v[0:1]			; VI-NEXT: flat_load_ushort v4, v[0:1]
	; VI-NEXT: flat_load_ushort v0, v[0:1]			; VI-NEXT: v_add_u32_e32 v0, vcc, s0, v2
	; VI-NEXT: v_mov_b32_e32 v3, s1			; VI-NEXT: v_mov_b32_e32 v1, s1
	; VI-NEXT: v_add_u32_e32 v2, vcc, s0, v2			; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; VI-NEXT: v_addc_u32_e32 v3, vcc, 0, v3, vcc
	; VI-NEXT: s_waitcnt vmcnt(1) lgkmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1) lgkmcnt(1)
	; VI-NEXT: v_subrev_u16_e32 v1, 64, v4			; VI-NEXT: v_subrev_u16_e32 v2, 64, v3
	; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0) lgkmcnt(0)
	; VI-NEXT: v_subrev_u16_e32 v0, 64, v0			; VI-NEXT: v_subrev_u16_e32 v3, 64, v4
	; VI-NEXT: flat_store_short v[2:3], v1			; VI-NEXT: flat_store_short v[0:1], v2
	; VI-NEXT: flat_store_short v[2:3], v0			; VI-NEXT: flat_store_short v[0:1], v3
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: v_test_i16_x_sub_64_multi_use:			; GFX9-LABEL: v_test_i16_x_sub_64_multi_use:
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX9-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX9-NEXT: v_lshlrev_b32_e32 v2, 1, v0			; GFX9-NEXT: v_lshlrev_b32_e32 v2, 1, v0
	; GFX9-NEXT: s_waitcnt lgkmcnt(0)			; GFX9-NEXT: s_waitcnt lgkmcnt(0)
	; GFX9-NEXT: v_mov_b32_e32 v1, s3			; GFX9-NEXT: v_mov_b32_e32 v1, s3
	; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s2, v2			; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s2, v2
	; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc			; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc
				; GFX9-NEXT: global_load_ushort v3, v[0:1], off
	; GFX9-NEXT: global_load_ushort v4, v[0:1], off			; GFX9-NEXT: global_load_ushort v4, v[0:1], off
	; GFX9-NEXT: global_load_ushort v0, v[0:1], off			; GFX9-NEXT: v_add_co_u32_e32 v0, vcc, s0, v2
	; GFX9-NEXT: v_mov_b32_e32 v3, s1			; GFX9-NEXT: v_mov_b32_e32 v1, s1
	; GFX9-NEXT: v_add_co_u32_e32 v2, vcc, s0, v2			; GFX9-NEXT: v_addc_co_u32_e32 v1, vcc, 0, v1, vcc
	; GFX9-NEXT: v_addc_co_u32_e32 v3, vcc, 0, v3, vcc
	; GFX9-NEXT: s_waitcnt vmcnt(1)			; GFX9-NEXT: s_waitcnt vmcnt(1)
	; GFX9-NEXT: v_subrev_u16_e32 v1, 64, v4			; GFX9-NEXT: v_subrev_u16_e32 v2, 64, v3
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_subrev_u16_e32 v0, 64, v0			; GFX9-NEXT: v_subrev_u16_e32 v3, 64, v4
	; GFX9-NEXT: global_store_short v[2:3], v1, off			; GFX9-NEXT: global_store_short v[0:1], v2, off
	; GFX9-NEXT: global_store_short v[2:3], v0, off			; GFX9-NEXT: global_store_short v[0:1], v3, off
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX10-LABEL: v_test_i16_x_sub_64_multi_use:			; GFX10-LABEL: v_test_i16_x_sub_64_multi_use:
	; GFX10: ; %bb.0:			; GFX10: ; %bb.0:
	; GFX10-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24			; GFX10-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x24
	; GFX10-NEXT: v_lshlrev_b32_e32 v2, 1, v0			; GFX10-NEXT: v_lshlrev_b32_e32 v2, 1, v0
	; GFX10-NEXT: ; implicit-def: $vcc_hi			; GFX10-NEXT: ; implicit-def: $vcc_hi
	; GFX10-NEXT: s_waitcnt lgkmcnt(0)			; GFX10-NEXT: s_waitcnt lgkmcnt(0)
	▲ Show 20 Lines • Show All 1,571 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/si-triv-disjoint-mem-access.ll

	Show First 20 Lines • Show All 259 Lines • ▼ Show 20 Lines
	; CI: v_add_i32			; CI: v_add_i32
	; CI: v_add_i32			; CI: v_add_i32

	; CI: buffer_store_dword v{{[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:20{{$}}			; CI: buffer_store_dword v{{[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:20{{$}}

	; CI: buffer_store_dword v{{[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:36{{$}}			; CI: buffer_store_dword v{{[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:36{{$}}
	; CI-NEXT: buffer_store_dword v{{[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:52{{$}}			; CI-NEXT: buffer_store_dword v{{[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:52{{$}}

	; GFX9: global_store_dword v{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]}}{{$}}
	; GFX9: global_store_dword v{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]}} offset:20
	; GFX9: global_load_dword {{v[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:12			; GFX9: global_load_dword {{v[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:12
	; GFX9: global_load_dword {{v[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:28			; GFX9: global_load_dword {{v[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:28
	; GFX9: global_load_dword {{v[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:44			; GFX9: global_load_dword {{v[0-9]+}}, v{{\[[0-9]+:[0-9]+\]}}, s{{\[[0-9]+:[0-9]+\]}} offset:44

				; GFX9: global_store_dword v{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]}}{{$}}
				; GFX9: global_store_dword v{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]}} offset:20
	; GFX9: global_store_dword v{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]}} offset:36			; GFX9: global_store_dword v{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]}} offset:36
	; GFX9: global_store_dword v{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]}} offset:52			; GFX9: global_store_dword v{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]}} offset:52

	define amdgpu_kernel void @reorder_global_offsets_addr64_soffset0(i32 addrspace(1)* noalias nocapture %ptr.base) #0 {			define amdgpu_kernel void @reorder_global_offsets_addr64_soffset0(i32 addrspace(1)* noalias nocapture %ptr.base) #0 {
	%id = call i32 @llvm.amdgcn.workitem.id.x()			%id = call i32 @llvm.amdgcn.workitem.id.x()
	%id.ext = sext i32 %id to i64			%id.ext = sext i32 %id to i64

	%ptr0 = getelementptr inbounds i32, i32 addrspace(1)* %ptr.base, i64 %id.ext			%ptr0 = getelementptr inbounds i32, i32 addrspace(1)* %ptr.base, i64 %id.ext
	▲ Show 20 Lines • Show All 46 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/sign_extend.ll

	Show First 20 Lines • Show All 393 Lines • ▼ Show 20 Lines
	; FIXME: need to optimize same sequence as above test to avoid			; FIXME: need to optimize same sequence as above test to avoid
	; this shift.			; this shift.
	define amdgpu_kernel void @v_sext_v4i8_to_v4i32(i32 addrspace(1)* %out, i32 addrspace(1)* %in) nounwind {			define amdgpu_kernel void @v_sext_v4i8_to_v4i32(i32 addrspace(1)* %out, i32 addrspace(1)* %in) nounwind {
	; SI-LABEL: v_sext_v4i8_to_v4i32:			; SI-LABEL: v_sext_v4i8_to_v4i32:
	; SI: ; %bb.0:			; SI: ; %bb.0:
	; SI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; SI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; SI-NEXT: s_mov_b32 s3, 0xf000			; SI-NEXT: s_mov_b32 s3, 0xf000
	; SI-NEXT: s_mov_b32 s2, -1			; SI-NEXT: s_mov_b32 s2, -1
				; SI-NEXT: s_mov_b32 s10, s2
				; SI-NEXT: s_mov_b32 s11, s3
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
				; SI-NEXT: s_mov_b32 s8, s6
				; SI-NEXT: s_mov_b32 s9, s7
				; SI-NEXT: buffer_load_dword v0, off, s[8:11], 0
	; SI-NEXT: s_mov_b32 s0, s4			; SI-NEXT: s_mov_b32 s0, s4
	; SI-NEXT: s_mov_b32 s1, s5			; SI-NEXT: s_mov_b32 s1, s5
	; SI-NEXT: s_mov_b32 s4, s6
	; SI-NEXT: s_mov_b32 s5, s7
	; SI-NEXT: s_mov_b32 s6, s2
	; SI-NEXT: s_mov_b32 s7, s3
	; SI-NEXT: buffer_load_dword v0, off, s[4:7], 0
	; SI-NEXT: s_waitcnt vmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0)
	; SI-NEXT: v_ashrrev_i32_e32 v1, 24, v0			; SI-NEXT: v_ashrrev_i32_e32 v1, 24, v0
	; SI-NEXT: v_bfe_i32 v2, v0, 16, 8			; SI-NEXT: v_bfe_i32 v2, v0, 16, 8
	; SI-NEXT: v_bfe_i32 v3, v0, 8, 8			; SI-NEXT: v_bfe_i32 v3, v0, 8, 8
	; SI-NEXT: v_bfe_i32 v0, v0, 0, 8			; SI-NEXT: v_bfe_i32 v0, v0, 0, 8
	; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; SI-NEXT: buffer_store_dword v3, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v3, off, s[0:3], 0
	; SI-NEXT: buffer_store_dword v2, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v2, off, s[0:3], 0
	; SI-NEXT: buffer_store_dword v1, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v1, off, s[0:3], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: v_sext_v4i8_to_v4i32:			; VI-LABEL: v_sext_v4i8_to_v4i32:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s3, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s2, -1
				; VI-NEXT: s_mov_b32 s10, s2
				; VI-NEXT: s_mov_b32 s11, s3
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
				; VI-NEXT: s_mov_b32 s8, s6
				; VI-NEXT: s_mov_b32 s9, s7
				; VI-NEXT: buffer_load_dword v0, off, s[8:11], 0
	; VI-NEXT: s_mov_b32 s0, s4			; VI-NEXT: s_mov_b32 s0, s4
	; VI-NEXT: s_mov_b32 s1, s5			; VI-NEXT: s_mov_b32 s1, s5
	; VI-NEXT: s_mov_b32 s4, s6
	; VI-NEXT: s_mov_b32 s5, s7
	; VI-NEXT: s_mov_b32 s6, s2
	; VI-NEXT: s_mov_b32 s7, s3
	; VI-NEXT: buffer_load_dword v0, off, s[4:7], 0
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_lshrrev_b16_e32 v1, 8, v0			; VI-NEXT: v_lshrrev_b16_e32 v1, 8, v0
	; VI-NEXT: v_ashrrev_i32_e32 v2, 24, v0			; VI-NEXT: v_ashrrev_i32_e32 v2, 24, v0
	; VI-NEXT: v_bfe_i32 v3, v0, 16, 8			; VI-NEXT: v_bfe_i32 v3, v0, 16, 8
	; VI-NEXT: v_bfe_i32 v0, v0, 0, 8			; VI-NEXT: v_bfe_i32 v0, v0, 0, 8
	; VI-NEXT: v_bfe_i32 v1, v1, 0, 8			; VI-NEXT: v_bfe_i32 v1, v1, 0, 8
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: buffer_store_dword v1, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v1, off, s[0:3], 0
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	}			}

	define amdgpu_kernel void @v_sext_v4i16_to_v4i32(i32 addrspace(1)* %out, i64 addrspace(1)* %in) nounwind {			define amdgpu_kernel void @v_sext_v4i16_to_v4i32(i32 addrspace(1)* %out, i64 addrspace(1)* %in) nounwind {
	; SI-LABEL: v_sext_v4i16_to_v4i32:			; SI-LABEL: v_sext_v4i16_to_v4i32:
	; SI: ; %bb.0:			; SI: ; %bb.0:
	; SI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; SI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; SI-NEXT: s_mov_b32 s3, 0xf000			; SI-NEXT: s_mov_b32 s3, 0xf000
	; SI-NEXT: s_mov_b32 s2, -1			; SI-NEXT: s_mov_b32 s2, -1
				; SI-NEXT: s_mov_b32 s10, s2
				; SI-NEXT: s_mov_b32 s11, s3
	; SI-NEXT: s_waitcnt lgkmcnt(0)			; SI-NEXT: s_waitcnt lgkmcnt(0)
				; SI-NEXT: s_mov_b32 s8, s6
				; SI-NEXT: s_mov_b32 s9, s7
				; SI-NEXT: buffer_load_dwordx2 v[0:1], off, s[8:11], 0
	; SI-NEXT: s_mov_b32 s0, s4			; SI-NEXT: s_mov_b32 s0, s4
	; SI-NEXT: s_mov_b32 s1, s5			; SI-NEXT: s_mov_b32 s1, s5
	; SI-NEXT: s_mov_b32 s4, s6
	; SI-NEXT: s_mov_b32 s5, s7
	; SI-NEXT: s_mov_b32 s6, s2
	; SI-NEXT: s_mov_b32 s7, s3
	; SI-NEXT: buffer_load_dwordx2 v[0:1], off, s[4:7], 0
	; SI-NEXT: s_waitcnt vmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0)
	; SI-NEXT: v_ashr_i64 v[2:3], v[0:1], 48			; SI-NEXT: v_ashr_i64 v[2:3], v[0:1], 48
	; SI-NEXT: v_ashrrev_i32_e32 v3, 16, v0			; SI-NEXT: v_ashrrev_i32_e32 v3, 16, v0
	; SI-NEXT: v_bfe_i32 v0, v0, 0, 16			; SI-NEXT: v_bfe_i32 v0, v0, 0, 16
	; SI-NEXT: v_bfe_i32 v1, v1, 0, 16			; SI-NEXT: v_bfe_i32 v1, v1, 0, 16
	; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; SI-NEXT: buffer_store_dword v3, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v3, off, s[0:3], 0
	; SI-NEXT: buffer_store_dword v1, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v1, off, s[0:3], 0
	; SI-NEXT: buffer_store_dword v2, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v2, off, s[0:3], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: v_sext_v4i16_to_v4i32:			; VI-LABEL: v_sext_v4i16_to_v4i32:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s3, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s2, -1
				; VI-NEXT: s_mov_b32 s10, s2
				; VI-NEXT: s_mov_b32 s11, s3
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
				; VI-NEXT: s_mov_b32 s8, s6
				; VI-NEXT: s_mov_b32 s9, s7
				; VI-NEXT: buffer_load_dwordx2 v[0:1], off, s[8:11], 0
	; VI-NEXT: s_mov_b32 s0, s4			; VI-NEXT: s_mov_b32 s0, s4
	; VI-NEXT: s_mov_b32 s1, s5			; VI-NEXT: s_mov_b32 s1, s5
	; VI-NEXT: s_mov_b32 s4, s6
	; VI-NEXT: s_mov_b32 s5, s7
	; VI-NEXT: s_mov_b32 s6, s2
	; VI-NEXT: s_mov_b32 s7, s3
	; VI-NEXT: buffer_load_dwordx2 v[0:1], off, s[4:7], 0
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_ashrrev_i32_e32 v2, 16, v1			; VI-NEXT: v_ashrrev_i32_e32 v2, 16, v1
	; VI-NEXT: v_ashrrev_i32_e32 v3, 16, v0			; VI-NEXT: v_ashrrev_i32_e32 v3, 16, v0
	; VI-NEXT: v_bfe_i32 v0, v0, 0, 16			; VI-NEXT: v_bfe_i32 v0, v0, 0, 16
	; VI-NEXT: v_bfe_i32 v1, v1, 0, 16			; VI-NEXT: v_bfe_i32 v1, v1, 0, 16
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: buffer_store_dword v3, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v3, off, s[0:3], 0
	; VI-NEXT: buffer_store_dword v1, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v1, off, s[0:3], 0
	Show All 19 Lines

llvm/test/CodeGen/AMDGPU/sub.v2i16.ll

	Show First 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	; VI-LABEL: s_test_sub_v2i16:			; VI-LABEL: s_test_sub_v2i16:
	; VI: ; %bb.0:			; VI: ; %bb.0:
	; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; VI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34			; VI-NEXT: s_load_dwordx2 s[8:9], s[0:1], 0x34
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s3, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s2, -1
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s0, s4			; VI-NEXT: s_mov_b32 s0, s4
	; VI-NEXT: s_mov_b32 s1, s5
	; VI-NEXT: s_load_dword s4, s[6:7], 0x0			; VI-NEXT: s_load_dword s4, s[6:7], 0x0
	; VI-NEXT: s_load_dword s5, s[8:9], 0x0			; VI-NEXT: s_load_dword s6, s[8:9], 0x0
				; VI-NEXT: s_mov_b32 s1, s5
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_lshr_b32 s6, s4, 16			; VI-NEXT: s_lshr_b32 s5, s4, 16
	; VI-NEXT: s_lshr_b32 s7, s5, 16			; VI-NEXT: s_lshr_b32 s7, s6, 16
	; VI-NEXT: s_sub_i32 s4, s4, s5			; VI-NEXT: s_sub_i32 s4, s4, s6
	; VI-NEXT: s_sub_i32 s5, s6, s7			; VI-NEXT: s_sub_i32 s5, s5, s7
	; VI-NEXT: s_and_b32 s4, s4, 0xffff			; VI-NEXT: s_and_b32 s4, s4, 0xffff
	; VI-NEXT: s_lshl_b32 s5, s5, 16			; VI-NEXT: s_lshl_b32 s5, s5, 16
	; VI-NEXT: s_or_b32 s4, s4, s5			; VI-NEXT: s_or_b32 s4, s4, s5
	; VI-NEXT: v_mov_b32_e32 v0, s4			; VI-NEXT: v_mov_b32_e32 v0, s4
	; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; VI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	%a = load <2 x i16>, <2 x i16> addrspace(4)* %in0			%a = load <2 x i16>, <2 x i16> addrspace(4)* %in0
	%b = load <2 x i16>, <2 x i16> addrspace(4)* %in1			%b = load <2 x i16>, <2 x i16> addrspace(4)* %in1
	▲ Show 20 Lines • Show All 567 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/trunc-combine.ll

	Show First 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0			; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: truncate_high_elt_extract_vector:			; VI-LABEL: truncate_high_elt_extract_vector:
	; VI: ; %bb.0: ; %bb			; VI: ; %bb.0: ; %bb
	; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24			; VI-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24
	; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34			; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x34
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
				; VI-NEXT: s_load_dword s2, s[4:5], 0x0
				; VI-NEXT: s_load_dword s3, s[6:7], 0x0
	; VI-NEXT: v_mov_b32_e32 v0, s0			; VI-NEXT: v_mov_b32_e32 v0, s0
	; VI-NEXT: v_mov_b32_e32 v1, s1			; VI-NEXT: v_mov_b32_e32 v1, s1
	; VI-NEXT: s_load_dword s0, s[4:5], 0x0
	; VI-NEXT: s_load_dword s1, s[6:7], 0x0
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_sext_i32_i16 s0, s0			; VI-NEXT: s_sext_i32_i16 s0, s2
	; VI-NEXT: s_sext_i32_i16 s1, s1			; VI-NEXT: s_sext_i32_i16 s1, s3
	; VI-NEXT: v_mov_b32_e32 v2, s0			; VI-NEXT: v_mov_b32_e32 v2, s0
	; VI-NEXT: v_mul_i32_i24_e32 v2, s1, v2			; VI-NEXT: v_mul_i32_i24_e32 v2, s1, v2
	; VI-NEXT: v_lshrrev_b32_e32 v2, 16, v2			; VI-NEXT: v_lshrrev_b32_e32 v2, 16, v2
	; VI-NEXT: flat_store_dword v[0:1], v2			; VI-NEXT: flat_store_dword v[0:1], v2
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	bb:			bb:
	%tmp = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %arg, i64 undef			%tmp = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %arg, i64 undef
	%tmp3 = load <2 x i16>, <2 x i16> addrspace(1)* %tmp, align 4			%tmp3 = load <2 x i16>, <2 x i16> addrspace(1)* %tmp, align 4
	Show All 35 Lines

llvm/test/CodeGen/AMDGPU/v_madak_f16.ll

	Show First 20 Lines • Show All 99 Lines • ▼ Show 20 Lines
	; SI-NEXT: v_cvt_f16_f32_e32 v1, v3			; SI-NEXT: v_cvt_f16_f32_e32 v1, v3
	; SI-NEXT: buffer_store_short v0, off, s[4:7], 0			; SI-NEXT: buffer_store_short v0, off, s[4:7], 0
	; SI-NEXT: buffer_store_short v1, off, s[12:15], 0			; SI-NEXT: buffer_store_short v1, off, s[12:15], 0
	; SI-NEXT: s_endpgm			; SI-NEXT: s_endpgm
	;			;
	; VI-LABEL: madak_f16_use_2:			; VI-LABEL: madak_f16_use_2:
	; VI: ; %bb.0: ; %entry			; VI: ; %bb.0: ; %entry
	; VI-NEXT: s_load_dwordx8 s[4:11], s[0:1], 0x24			; VI-NEXT: s_load_dwordx8 s[4:11], s[0:1], 0x24
	; VI-NEXT: s_load_dwordx2 s[12:13], s[0:1], 0x44			; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x44
	; VI-NEXT: s_mov_b32 s3, 0xf000			; VI-NEXT: s_mov_b32 s15, 0xf000
	; VI-NEXT: s_mov_b32 s2, -1			; VI-NEXT: s_mov_b32 s14, -1
	; VI-NEXT: s_mov_b32 s14, s2			; VI-NEXT: s_mov_b32 s2, s14
	; VI-NEXT: s_waitcnt lgkmcnt(0)			; VI-NEXT: s_waitcnt lgkmcnt(0)
	; VI-NEXT: s_mov_b32 s16, s10			; VI-NEXT: s_mov_b32 s16, s10
	; VI-NEXT: s_mov_b32 s17, s11			; VI-NEXT: s_mov_b32 s17, s11
	; VI-NEXT: s_mov_b32 s15, s3			; VI-NEXT: s_mov_b32 s3, s15
	; VI-NEXT: s_mov_b32 s18, s2			; VI-NEXT: s_mov_b32 s18, s14
	; VI-NEXT: s_mov_b32 s19, s3			; VI-NEXT: s_mov_b32 s19, s15
	; VI-NEXT: s_mov_b32 s10, s2			; VI-NEXT: s_mov_b32 s10, s14
	; VI-NEXT: s_mov_b32 s11, s3			; VI-NEXT: s_mov_b32 s11, s15
	; VI-NEXT: buffer_load_ushort v0, off, s[8:11], 0			; VI-NEXT: buffer_load_ushort v0, off, s[8:11], 0
	; VI-NEXT: buffer_load_ushort v1, off, s[16:19], 0			; VI-NEXT: buffer_load_ushort v1, off, s[16:19], 0
	; VI-NEXT: buffer_load_ushort v3, off, s[12:15], 0			; VI-NEXT: buffer_load_ushort v2, off, s[0:3], 0
	; VI-NEXT: v_mov_b32_e32 v2, 0x4900			; VI-NEXT: v_mov_b32_e32 v3, 0x4900
	; VI-NEXT: s_mov_b32 s0, s6			; VI-NEXT: s_mov_b32 s12, s6
	; VI-NEXT: s_mov_b32 s1, s7			; VI-NEXT: s_mov_b32 s13, s7
	; VI-NEXT: s_mov_b32 s6, s2			; VI-NEXT: s_mov_b32 s6, s14
	; VI-NEXT: s_mov_b32 s7, s3			; VI-NEXT: s_mov_b32 s7, s15
	; VI-NEXT: s_waitcnt vmcnt(1)			; VI-NEXT: s_waitcnt vmcnt(1)
	; VI-NEXT: v_madak_f16 v1, v0, v1, 0x4900			; VI-NEXT: v_madak_f16 v1, v0, v1, 0x4900
	; VI-NEXT: s_waitcnt vmcnt(0)			; VI-NEXT: s_waitcnt vmcnt(0)
	; VI-NEXT: v_mac_f16_e32 v2, v0, v3			; VI-NEXT: v_mac_f16_e32 v3, v0, v2
	; VI-NEXT: buffer_store_short v1, off, s[4:7], 0			; VI-NEXT: buffer_store_short v1, off, s[4:7], 0
	; VI-NEXT: buffer_store_short v2, off, s[0:3], 0			; VI-NEXT: buffer_store_short v3, off, s[12:15], 0
	; VI-NEXT: s_endpgm			; VI-NEXT: s_endpgm
	half addrspace(1)* %r0,			half addrspace(1)* %r0,
	half addrspace(1)* %r1,			half addrspace(1)* %r1,
	half addrspace(1)* %a,			half addrspace(1)* %a,
	half addrspace(1)* %b,			half addrspace(1)* %b,
	half addrspace(1)* %c) {			half addrspace(1)* %c) {
	entry:			entry:
	%a.val = load volatile half, half addrspace(1)* %a			%a.val = load volatile half, half addrspace(1)* %a
	Show All 12 Lines

llvm/test/CodeGen/AMDGPU/widen-smrd-loads.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -amdgpu-codegenprepare-widen-constant-loads=0 -mtriple=amdgcn -mcpu=tahiti -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GCN,SI %s		; RUN: llc -amdgpu-codegenprepare-widen-constant-loads=0 -mtriple=amdgcn -mcpu=tahiti -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GCN,SI %s
; RUN: llc -amdgpu-codegenprepare-widen-constant-loads=0 -mtriple=amdgcn -mcpu=tonga -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GCN,VI %s		; RUN: llc -amdgpu-codegenprepare-widen-constant-loads=0 -mtriple=amdgcn -mcpu=tonga -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GCN,VI %s

define amdgpu_kernel void @widen_i16_constant_load(i16 addrspace(4)* %arg) {		define amdgpu_kernel void @widen_i16_constant_load(i16 addrspace(4)* %arg) {
; SI-LABEL: widen_i16_constant_load:		; SI-LABEL: widen_i16_constant_load:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_mov_b32 s4, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_mov_b32 s6, -1
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[0:1], 0x0
		; SI-NEXT: s_mov_b32 s1, 0
		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_addk_i32 s0, 0x3e7		; SI-NEXT: s_addk_i32 s2, 0x3e7
; SI-NEXT: s_or_b32 s0, s0, 4		; SI-NEXT: s_or_b32 s4, s2, 4
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_short v0, off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v0, s4
		; SI-NEXT: buffer_store_short v0, off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_i16_constant_load:		; VI-LABEL: widen_i16_constant_load:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; VI-NEXT: v_mov_b32_e32 v0, 0		; VI-NEXT: v_mov_b32_e32 v0, 0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
Show All 10 Lines	; VI-NEXT: s_endpgm
store i16 %or, i16 addrspace(1)* null		store i16 %or, i16 addrspace(1)* null
ret void		ret void
}		}

define amdgpu_kernel void @widen_i16_constant_load_zext_i32(i16 addrspace(4)* %arg) {		define amdgpu_kernel void @widen_i16_constant_load_zext_i32(i16 addrspace(4)* %arg) {
; SI-LABEL: widen_i16_constant_load_zext_i32:		; SI-LABEL: widen_i16_constant_load_zext_i32:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_mov_b32 s4, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_mov_b32 s6, -1
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[0:1], 0x0
		; SI-NEXT: s_mov_b32 s1, 0
		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_and_b32 s0, s0, 0xffff		; SI-NEXT: s_and_b32 s2, s2, 0xffff
; SI-NEXT: s_addk_i32 s0, 0x3e7		; SI-NEXT: s_addk_i32 s2, 0x3e7
; SI-NEXT: s_or_b32 s0, s0, 4		; SI-NEXT: s_or_b32 s4, s2, 4
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_dword v0, off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v0, s4
		; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_i16_constant_load_zext_i32:		; VI-LABEL: widen_i16_constant_load_zext_i32:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; VI-NEXT: v_mov_b32_e32 v0, 0		; VI-NEXT: v_mov_b32_e32 v0, 0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
Show All 12 Lines	; VI-NEXT: s_endpgm
store i32 %or, i32 addrspace(1)* null		store i32 %or, i32 addrspace(1)* null
ret void		ret void
}		}

define amdgpu_kernel void @widen_i16_constant_load_sext_i32(i16 addrspace(4)* %arg) {		define amdgpu_kernel void @widen_i16_constant_load_sext_i32(i16 addrspace(4)* %arg) {
; SI-LABEL: widen_i16_constant_load_sext_i32:		; SI-LABEL: widen_i16_constant_load_sext_i32:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_mov_b32 s4, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_mov_b32 s6, -1
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[0:1], 0x0
		; SI-NEXT: s_mov_b32 s1, 0
		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_sext_i32_i16 s0, s0		; SI-NEXT: s_sext_i32_i16 s2, s2
; SI-NEXT: s_addk_i32 s0, 0x3e7		; SI-NEXT: s_addk_i32 s2, 0x3e7
; SI-NEXT: s_or_b32 s0, s0, 4		; SI-NEXT: s_or_b32 s4, s2, 4
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_dword v0, off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v0, s4
		; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_i16_constant_load_sext_i32:		; VI-LABEL: widen_i16_constant_load_sext_i32:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; VI-NEXT: v_mov_b32_e32 v0, 0		; VI-NEXT: v_mov_b32_e32 v0, 0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines	; VI-NEXT: s_endpgm
store half %add, half addrspace(1)* null		store half %add, half addrspace(1)* null
ret void		ret void
}		}

; FIXME: valu usage on VI		; FIXME: valu usage on VI
define amdgpu_kernel void @widen_v2i8_constant_load(<2 x i8> addrspace(4)* %arg) {		define amdgpu_kernel void @widen_v2i8_constant_load(<2 x i8> addrspace(4)* %arg) {
; SI-LABEL: widen_v2i8_constant_load:		; SI-LABEL: widen_v2i8_constant_load:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x9
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s1, 0
; SI-NEXT: s_mov_b32 s4, 0		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_mov_b32 s6, -1
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[2:3], 0x0
		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_and_b32 s1, s0, 0xff00		; SI-NEXT: s_and_b32 s4, s2, 0xff00
; SI-NEXT: s_add_i32 s0, s0, 12		; SI-NEXT: s_add_i32 s2, s2, 12
; SI-NEXT: s_or_b32 s0, s0, 4		; SI-NEXT: s_or_b32 s2, s2, 4
; SI-NEXT: s_and_b32 s0, s0, 0xff		; SI-NEXT: s_and_b32 s2, s2, 0xff
; SI-NEXT: s_or_b32 s0, s1, s0		; SI-NEXT: s_or_b32 s2, s4, s2
; SI-NEXT: s_addk_i32 s0, 0x2c00		; SI-NEXT: s_addk_i32 s2, 0x2c00
; SI-NEXT: s_or_b32 s0, s0, 0x300		; SI-NEXT: s_or_b32 s4, s2, 0x300
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_short v0, off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v0, s4
		; SI-NEXT: buffer_store_short v0, off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_v2i8_constant_load:		; VI-LABEL: widen_v2i8_constant_load:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; VI-NEXT: v_mov_b32_e32 v0, 44		; VI-NEXT: v_mov_b32_e32 v0, 44
; VI-NEXT: v_mov_b32_e32 v1, 3		; VI-NEXT: v_mov_b32_e32 v1, 3
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	; VI-NEXT: s_endpgm
store i16 %or, i16 addrspace(1)* null		store i16 %or, i16 addrspace(1)* null
ret void		ret void
}		}

define amdgpu_kernel void @widen_i1_constant_load(i1 addrspace(4)* %arg) {		define amdgpu_kernel void @widen_i1_constant_load(i1 addrspace(4)* %arg) {
; SI-LABEL: widen_i1_constant_load:		; SI-LABEL: widen_i1_constant_load:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_mov_b32 s4, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_mov_b32 s6, -1
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[0:1], 0x0
		; SI-NEXT: s_mov_b32 s1, 0
		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_and_b32 s0, s0, 1		; SI-NEXT: s_and_b32 s4, s2, 1
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_byte v0, off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v0, s4
		; SI-NEXT: buffer_store_byte v0, off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_i1_constant_load:		; VI-LABEL: widen_i1_constant_load:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; VI-NEXT: v_mov_b32_e32 v0, 0		; VI-NEXT: v_mov_b32_e32 v0, 0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
; VI-NEXT: s_load_dword s0, s[0:1], 0x0		; VI-NEXT: s_load_dword s0, s[0:1], 0x0
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
; VI-NEXT: s_and_b32 s0, s0, 1		; VI-NEXT: s_and_b32 s0, s0, 1
; VI-NEXT: v_mov_b32_e32 v2, s0		; VI-NEXT: v_mov_b32_e32 v2, s0
; VI-NEXT: flat_store_byte v[0:1], v2		; VI-NEXT: flat_store_byte v[0:1], v2
; VI-NEXT: s_endpgm		; VI-NEXT: s_endpgm
%load = load i1, i1 addrspace(4)* %arg, align 4		%load = load i1, i1 addrspace(4)* %arg, align 4
%and = and i1 %load, true		%and = and i1 %load, true
store i1 %and, i1 addrspace(1)* null		store i1 %and, i1 addrspace(1)* null
ret void		ret void
}		}

define amdgpu_kernel void @widen_i16_zextload_i64_constant_load(i16 addrspace(4)* %arg) {		define amdgpu_kernel void @widen_i16_zextload_i64_constant_load(i16 addrspace(4)* %arg) {
; SI-LABEL: widen_i16_zextload_i64_constant_load:		; SI-LABEL: widen_i16_zextload_i64_constant_load:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_mov_b32 s4, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_mov_b32 s6, -1
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[0:1], 0x0
		; SI-NEXT: s_mov_b32 s1, 0
		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_and_b32 s0, s0, 0xffff		; SI-NEXT: s_and_b32 s2, s2, 0xffff
; SI-NEXT: s_addk_i32 s0, 0x3e7		; SI-NEXT: s_addk_i32 s2, 0x3e7
; SI-NEXT: s_or_b32 s0, s0, 4		; SI-NEXT: s_or_b32 s4, s2, 4
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_dword v0, off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v0, s4
		; SI-NEXT: buffer_store_dword v0, off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_i16_zextload_i64_constant_load:		; VI-LABEL: widen_i16_zextload_i64_constant_load:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; VI-NEXT: v_mov_b32_e32 v0, 0		; VI-NEXT: v_mov_b32_e32 v0, 0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
Show All 12 Lines	; VI-NEXT: s_endpgm
store i32 %or, i32 addrspace(1)* null		store i32 %or, i32 addrspace(1)* null
ret void		ret void
}		}

define amdgpu_kernel void @widen_i1_zext_to_i64_constant_load(i1 addrspace(4)* %arg) {		define amdgpu_kernel void @widen_i1_zext_to_i64_constant_load(i1 addrspace(4)* %arg) {
; SI-LABEL: widen_i1_zext_to_i64_constant_load:		; SI-LABEL: widen_i1_zext_to_i64_constant_load:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_mov_b32 s4, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_mov_b32 s6, -1
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[0:1], 0x0
		; SI-NEXT: s_mov_b32 s1, 0
		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_and_b32 s0, s0, 1		; SI-NEXT: s_and_b32 s2, s2, 1
; SI-NEXT: s_add_u32 s0, s0, 0x3e7		; SI-NEXT: s_add_u32 s4, s2, 0x3e7
; SI-NEXT: s_addc_u32 s1, 0, 0		; SI-NEXT: s_addc_u32 s5, 0, 0
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: v_mov_b32_e32 v0, s4
; SI-NEXT: v_mov_b32_e32 v1, s1		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_dwordx2 v[0:1], off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v1, s5
		; SI-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_i1_zext_to_i64_constant_load:		; VI-LABEL: widen_i1_zext_to_i64_constant_load:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; VI-NEXT: v_mov_b32_e32 v0, 0		; VI-NEXT: v_mov_b32_e32 v0, 0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
Show All 13 Lines	; VI-NEXT: s_endpgm
ret void		ret void
}		}

define amdgpu_kernel void @widen_i16_constant32_load(i16 addrspace(6)* %arg) {		define amdgpu_kernel void @widen_i16_constant32_load(i16 addrspace(6)* %arg) {
; SI-LABEL: widen_i16_constant32_load:		; SI-LABEL: widen_i16_constant32_load:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dword s0, s[0:1], 0x9		; SI-NEXT: s_load_dword s0, s[0:1], 0x9
; SI-NEXT: s_mov_b32 s1, 0		; SI-NEXT: s_mov_b32 s1, 0
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_mov_b32 s4, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[0:1], 0x0
; SI-NEXT: s_mov_b32 s6, -1		; SI-NEXT: s_mov_b32 s1, 0
		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_addk_i32 s0, 0x3e7		; SI-NEXT: s_addk_i32 s2, 0x3e7
; SI-NEXT: s_or_b32 s0, s0, 4		; SI-NEXT: s_or_b32 s4, s2, 4
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_short v0, off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v0, s4
		; SI-NEXT: buffer_store_short v0, off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_i16_constant32_load:		; VI-LABEL: widen_i16_constant32_load:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dword s0, s[0:1], 0x24		; VI-NEXT: s_load_dword s0, s[0:1], 0x24
; VI-NEXT: s_mov_b32 s1, 0		; VI-NEXT: s_mov_b32 s1, 0
; VI-NEXT: v_mov_b32_e32 v0, 0		; VI-NEXT: v_mov_b32_e32 v0, 0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
Show All 11 Lines	; VI-NEXT: s_endpgm
store i16 %or, i16 addrspace(1)* null		store i16 %or, i16 addrspace(1)* null
ret void		ret void
}		}

define amdgpu_kernel void @widen_i16_global_invariant_load(i16 addrspace(1)* %arg) {		define amdgpu_kernel void @widen_i16_global_invariant_load(i16 addrspace(1)* %arg) {
; SI-LABEL: widen_i16_global_invariant_load:		; SI-LABEL: widen_i16_global_invariant_load:
; SI: ; %bb.0:		; SI: ; %bb.0:
; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; SI-NEXT: s_mov_b32 s5, 0		; SI-NEXT: s_mov_b32 s3, 0xf000
; SI-NEXT: s_mov_b32 s4, 0
; SI-NEXT: s_mov_b32 s7, 0xf000
; SI-NEXT: s_mov_b32 s6, -1
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_load_dword s0, s[0:1], 0x0		; SI-NEXT: s_load_dword s2, s[0:1], 0x0
		; SI-NEXT: s_mov_b32 s1, 0
		; SI-NEXT: s_mov_b32 s0, 0
; SI-NEXT: s_waitcnt lgkmcnt(0)		; SI-NEXT: s_waitcnt lgkmcnt(0)
; SI-NEXT: s_addk_i32 s0, 0x3e7		; SI-NEXT: s_addk_i32 s2, 0x3e7
; SI-NEXT: s_or_b32 s0, s0, 1		; SI-NEXT: s_or_b32 s4, s2, 1
; SI-NEXT: v_mov_b32_e32 v0, s0		; SI-NEXT: s_mov_b32 s2, -1
; SI-NEXT: buffer_store_short v0, off, s[4:7], 0		; SI-NEXT: v_mov_b32_e32 v0, s4
		; SI-NEXT: buffer_store_short v0, off, s[0:3], 0
; SI-NEXT: s_endpgm		; SI-NEXT: s_endpgm
;		;
; VI-LABEL: widen_i16_global_invariant_load:		; VI-LABEL: widen_i16_global_invariant_load:
; VI: ; %bb.0:		; VI: ; %bb.0:
; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; VI-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; VI-NEXT: v_mov_b32_e32 v0, 0		; VI-NEXT: v_mov_b32_e32 v0, 0
; VI-NEXT: v_mov_b32_e32 v1, 0		; VI-NEXT: v_mov_b32_e32 v1, 0
; VI-NEXT: s_waitcnt lgkmcnt(0)		; VI-NEXT: s_waitcnt lgkmcnt(0)
Show All 17 Lines

llvm/test/CodeGen/PowerPC/PR33671.ll

Show All 20 Lines	entry:
%0 = bitcast i32* %arrayidx to <4 x i32>*		%0 = bitcast i32* %arrayidx to <4 x i32>*
%arrayidx1 = getelementptr inbounds i32, i32* %arr, i64 2		%arrayidx1 = getelementptr inbounds i32, i32* %arr, i64 2
%1 = bitcast i32* %arrayidx1 to <4 x i32>*		%1 = bitcast i32* %arrayidx1 to <4 x i32>*
%2 = load <4 x i32>, <4 x i32>* %1, align 16		%2 = load <4 x i32>, <4 x i32>* %1, align 16
store <4 x i32> %2, <4 x i32>* %0, align 16		store <4 x i32> %2, <4 x i32>* %0, align 16
ret void		ret void
; CHECK-LABEL: test2		; CHECK-LABEL: test2
; CHECK: addi 3, 3, 8		; CHECK: addi 3, 3, 8
; CHECK: lxvx [[LD:[0-9]+]], 0, 3
; CHECK: addi [[REG:[0-9]+]], 4, 4		; CHECK: addi [[REG:[0-9]+]], 4, 4
		; CHECK: lxvx [[LD:[0-9]+]], 0, 3
; CHECK: stxvx [[LD]], 0, [[REG]]		; CHECK: stxvx [[LD]], 0, [[REG]]
}		}

llvm/test/CodeGen/PowerPC/botheightreduce.mir

This file was added.

				# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
				# RUN: llc -mtriple=powerpc64le-unknown-linux-gnu -mcpu=pwr9 -run-pass=machine-scheduler -o - %s \| FileCheck %s
				---
				# Check that machine-scheduler's BotHeightReduce heuristic puts the LD 8 in
				# between the final run of MULLDs and the LDXs that feed them, to try to hide
				# the latency of the LDXs.
				name: test
				tracksRegLiveness: true
				body: \|
				; CHECK-LABEL: name: test
				; CHECK: bb.0:
				; CHECK: successors: %bb.1(0x80000000)
				; CHECK: liveins: $x3, $x4
				; CHECK: [[COPY:%[0-9]+]]:g8rc_and_g8rc_nox0 = COPY $x4
				; CHECK: [[COPY1:%[0-9]+]]:g8rc_and_g8rc_nox0 = COPY $x3
				; CHECK: [[ADDI8_:%[0-9]+]]:g8rc_and_g8rc_nox0 = ADDI8 [[COPY1]], 1
				; CHECK: [[CMPLDI:%[0-9]+]]:crrc = CMPLDI [[COPY]], 1
				; CHECK: [[LI8_:%[0-9]+]]:g8rc_and_g8rc_nox0 = LI8 1
				; CHECK: [[ISEL8_:%[0-9]+]]:g8rc = ISEL8 [[COPY]], [[LI8_]], [[CMPLDI]].sub_gt
				; CHECK: MTCTR8loop [[ISEL8_]], implicit-def dead $ctr8
				; CHECK: [[LI8_1:%[0-9]+]]:g8rc = LI8 0
				; CHECK: [[LI8_2:%[0-9]+]]:g8rc = LI8 2
				; CHECK: [[LI8_3:%[0-9]+]]:g8rc = LI8 3
				; CHECK: [[LI8_4:%[0-9]+]]:g8rc = LI8 5
				; CHECK: [[LI8_5:%[0-9]+]]:g8rc = LI8 6
				; CHECK: [[LI8_6:%[0-9]+]]:g8rc = LI8 7
				; CHECK: bb.1:
				; CHECK: successors: %bb.1(0x40000000), %bb.2(0x40000000)
				; CHECK: [[ADDI8_1:%[0-9]+]]:g8rc = ADDI8 [[ADDI8_]], 1
				; CHECK: [[LD:%[0-9]+]]:g8rc = LD 0, [[ADDI8_]] :: (load 8)
				; CHECK: [[LDX:%[0-9]+]]:g8rc = LDX [[ADDI8_]], [[LI8_]] :: (load 8)
				; CHECK: [[LDX1:%[0-9]+]]:g8rc = LDX [[ADDI8_]], [[LI8_3]] :: (load 8)
				; CHECK: [[LD1:%[0-9]+]]:g8rc = LD 4, [[ADDI8_]] :: (load 8)
				; CHECK: [[LDX2:%[0-9]+]]:g8rc = LDX [[ADDI8_]], [[LI8_4]] :: (load 8)
				; CHECK: [[LDX3:%[0-9]+]]:g8rc = LDX [[ADDI8_]], [[LI8_5]] :: (load 8)
				; CHECK: [[LDX4:%[0-9]+]]:g8rc = LDX [[ADDI8_]], [[LI8_6]] :: (load 8)
				; CHECK: [[LDX5:%[0-9]+]]:g8rc = LDX [[ADDI8_]], [[LI8_2]] :: (load 8)
				; CHECK: [[MULLD:%[0-9]+]]:g8rc = MULLD [[LDX]], [[LD]]
				; CHECK: [[LD2:%[0-9]+]]:g8rc = LD 8, [[ADDI8_]] :: (load 8)
				; CHECK: [[MULLD1:%[0-9]+]]:g8rc = MULLD [[MULLD]], [[LDX5]]
				; CHECK: [[MULLD2:%[0-9]+]]:g8rc = MULLD [[MULLD1]], [[LDX1]]
				; CHECK: [[MULLD3:%[0-9]+]]:g8rc = MULLD [[MULLD2]], [[LD1]]
				; CHECK: [[MULLD4:%[0-9]+]]:g8rc = MULLD [[MULLD3]], [[LDX2]]
				; CHECK: [[MULLD5:%[0-9]+]]:g8rc = MULLD [[MULLD4]], [[LDX3]]
				; CHECK: [[MULLD6:%[0-9]+]]:g8rc = MULLD [[MULLD5]], [[LDX4]]
				; CHECK: [[MADDLD8_:%[0-9]+]]:g8rc = MADDLD8 [[MULLD6]], [[LD2]], [[MADDLD8_]]
				; CHECK: [[COPY2:%[0-9]+]]:g8rc_and_g8rc_nox0 = COPY [[ADDI8_1]]
				; CHECK: BDNZ8 %bb.1, implicit-def dead $ctr8, implicit $ctr8
				; CHECK: B %bb.2
				; CHECK: bb.2:
				bb.0:
				liveins: $x3, $x4

				%0:g8rc_and_g8rc_nox0 = COPY $x4
				%1:g8rc_and_g8rc_nox0 = COPY $x3
				%2:g8rc_and_g8rc_nox0 = ADDI8 %1, 1
				%3:crrc = CMPLDI %0, 1
				%4:g8rc_and_g8rc_nox0 = LI8 1
				%5:g8rc = ISEL8 %0, %4, %3.sub_gt
				MTCTR8loop %5, implicit-def dead $ctr8
				%6:g8rc = LI8 0
				%7:g8rc = LI8 2
				%8:g8rc = LI8 3
				%9:g8rc = LI8 5
				%10:g8rc = LI8 6
				%11:g8rc = LI8 7

				bb.1:
				%12:g8rc = ADDI8 %2, 1
				%13:g8rc = LD 0, %2 :: (load 8)
				%14:g8rc = LDX %2, %4 :: (load 8)
				%16:g8rc = LDX %2, %8 :: (load 8)
				%17:g8rc = LD 4, %2 :: (load 8)
				%18:g8rc = LDX %2, %9 :: (load 8)
				%19:g8rc = LDX %2, %10 :: (load 8)
				%20:g8rc = LDX %2, %11 :: (load 8)
				%21:g8rc = LD 8, %2 :: (load 8)
				%22:g8rc = MULLD %14, %13
				%15:g8rc = LDX %2, %7 :: (load 8)
				%23:g8rc = MULLD %22, %15
				%24:g8rc = MULLD %23, %16
				%25:g8rc = MULLD %24, %17
				%26:g8rc = MULLD %25, %18
				%27:g8rc = MULLD %26, %19
				%28:g8rc = MULLD %27, %20
				%6:g8rc = MADDLD8 %28, %21, %6
				%2:g8rc_and_g8rc_nox0 = COPY %12
				BDNZ8 %bb.1, implicit-def dead $ctr8, implicit $ctr8
				B %bb.2

				bb.2:
				...

llvm/test/CodeGen/PowerPC/dform-adjust.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu \			; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu \
	; RUN: -mcpu=pwr9 < %s \| FileCheck %s			; RUN: -mcpu=pwr9 < %s \| FileCheck %s
	define dso_local i64 @test1(i8* nocapture readonly %p, i32 signext %count) local_unnamed_addr #0 {			define dso_local i64 @test1(i8* nocapture readonly %p, i32 signext %count) local_unnamed_addr #0 {
	; CHECK-LABEL: test1:			; CHECK-LABEL: test1:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 5, -13			; CHECK-NEXT: li 5, -13
	; CHECK-NEXT: lxvx 0, 3, 5
	; CHECK-NEXT: li 5, 19
	; CHECK-NEXT: lxvx 1, 3, 5
	; CHECK-NEXT: li 5, 3
	; CHECK-NEXT: li 6, 7			; CHECK-NEXT: li 6, 7
	; CHECK-NEXT: li 7, 11			; CHECK-NEXT: li 7, 11
	; CHECK-NEXT: li 8, 15			; CHECK-NEXT: li 8, 15
	; CHECK-NEXT: mfvsrld 9, 0			; CHECK-NEXT: lxvx 0, 3, 5
	; CHECK-NEXT: ldx 5, 3, 5			; CHECK-NEXT: li 5, 19
	; CHECK-NEXT: ldx 6, 3, 6			; CHECK-NEXT: ldx 6, 3, 6
	; CHECK-NEXT: ldx 7, 3, 7			; CHECK-NEXT: ldx 7, 3, 7
				; CHECK-NEXT: lxvx 1, 3, 5
				; CHECK-NEXT: li 5, 3
				; CHECK-NEXT: ldx 5, 3, 5
	; CHECK-NEXT: ldx 3, 3, 8			; CHECK-NEXT: ldx 3, 3, 8
				; CHECK-NEXT: mfvsrld 9, 0
	; CHECK-NEXT: mffprd 8, 0			; CHECK-NEXT: mffprd 8, 0
	; CHECK-NEXT: mfvsrld 10, 1			; CHECK-NEXT: mfvsrld 10, 1
	; CHECK-NEXT: mfvsrd 11, 1			; CHECK-NEXT: mfvsrd 11, 1
	; CHECK-NEXT: mulld 8, 9, 8			; CHECK-NEXT: mulld 8, 9, 8
	; CHECK-NEXT: mulld 5, 8, 5			; CHECK-NEXT: mulld 5, 8, 5
	; CHECK-NEXT: mulld 5, 5, 10			; CHECK-NEXT: mulld 5, 5, 10
	; CHECK-NEXT: mulld 5, 5, 11			; CHECK-NEXT: mulld 5, 5, 11
	; CHECK-NEXT: mulld 5, 5, 6			; CHECK-NEXT: mulld 5, 5, 6
	▲ Show 20 Lines • Show All 98 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/extract-and-store.ll

	Show First 20 Lines • Show All 502 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: li r3, 4			; CHECK-P9-NEXT: li r3, 4
	; CHECK-P9-NEXT: stxsiwx vs34, r5, r3			; CHECK-P9-NEXT: stxsiwx vs34, r5, r3
	; CHECK-P9-NEXT: stfiwx f0, 0, r5			; CHECK-P9-NEXT: stfiwx f0, 0, r5
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: test_consecutive_i32:			; CHECK-P9-BE-LABEL: test_consecutive_i32:
	; CHECK-P9-BE: # %bb.0: # %entry			; CHECK-P9-BE: # %bb.0: # %entry
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 3			; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 3
				; CHECK-P9-BE-NEXT: li r3, 4
	; CHECK-P9-BE-NEXT: stfiwx f0, 0, r5			; CHECK-P9-BE-NEXT: stfiwx f0, 0, r5
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 1			; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 1
	; CHECK-P9-BE-NEXT: li r3, 4
	; CHECK-P9-BE-NEXT: stfiwx f0, r5, r3			; CHECK-P9-BE-NEXT: stfiwx f0, r5, r3
	; CHECK-P9-BE-NEXT: blr			; CHECK-P9-BE-NEXT: blr
	entry:			entry:

	%vecext = extractelement <4 x i32> %a, i32 0			%vecext = extractelement <4 x i32> %a, i32 0
	store i32 %vecext, i32* %b, align 4			store i32 %vecext, i32* %b, align 4
	%vecext1 = extractelement <4 x i32> %a, i32 2			%vecext1 = extractelement <4 x i32> %a, i32 2
	%arrayidx2 = getelementptr inbounds i32, i32* %b, i64 1			%arrayidx2 = getelementptr inbounds i32, i32* %b, i64 1
	Show All 17 Lines
	; CHECK-BE-NEXT: li r3, 4			; CHECK-BE-NEXT: li r3, 4
	; CHECK-BE-NEXT: stxsiwx vs34, 0, r5			; CHECK-BE-NEXT: stxsiwx vs34, 0, r5
	; CHECK-BE-NEXT: stfiwx f0, r5, r3			; CHECK-BE-NEXT: stfiwx f0, r5, r3
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test_consecutive_float:			; CHECK-P9-LABEL: test_consecutive_float:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: xxsldwi vs0, vs34, vs34, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs34, vs34, 1
				; CHECK-P9-NEXT: li r3, 4
	; CHECK-P9-NEXT: stfiwx f0, 0, r5			; CHECK-P9-NEXT: stfiwx f0, 0, r5
	; CHECK-P9-NEXT: xxsldwi vs0, vs34, vs34, 3			; CHECK-P9-NEXT: xxsldwi vs0, vs34, vs34, 3
	; CHECK-P9-NEXT: li r3, 4
	; CHECK-P9-NEXT: stfiwx f0, r5, r3			; CHECK-P9-NEXT: stfiwx f0, r5, r3
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: test_consecutive_float:			; CHECK-P9-BE-LABEL: test_consecutive_float:
	; CHECK-P9-BE: # %bb.0: # %entry			; CHECK-P9-BE: # %bb.0: # %entry
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 2			; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 2
	; CHECK-P9-BE-NEXT: li r3, 4			; CHECK-P9-BE-NEXT: li r3, 4
	; CHECK-P9-BE-NEXT: stxsiwx vs34, 0, r5			; CHECK-P9-BE-NEXT: stxsiwx vs34, 0, r5
	Show All 34 Lines
	; CHECK-BE-NEXT: xxsldwi vs0, vs34, vs0, 2			; CHECK-BE-NEXT: xxsldwi vs0, vs34, vs0, 2
	; CHECK-BE-NEXT: stfiwx f1, r5, r4			; CHECK-BE-NEXT: stfiwx f1, r5, r4
	; CHECK-BE-NEXT: stxvw4x vs0, 0, r5			; CHECK-BE-NEXT: stxvw4x vs0, 0, r5
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test_stores_exceed_vec_size:			; CHECK-P9-LABEL: test_stores_exceed_vec_size:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: addis r3, r2, .LCPI16_0@toc@ha			; CHECK-P9-NEXT: addis r3, r2, .LCPI16_0@toc@ha
				; CHECK-P9-NEXT: xxsldwi vs0, vs34, vs34, 1
	; CHECK-P9-NEXT: addi r3, r3, .LCPI16_0@toc@l			; CHECK-P9-NEXT: addi r3, r3, .LCPI16_0@toc@l
	; CHECK-P9-NEXT: lxvx vs35, 0, r3			; CHECK-P9-NEXT: lxvx vs35, 0, r3
	; CHECK-P9-NEXT: xxsldwi vs0, vs34, vs34, 1
	; CHECK-P9-NEXT: li r3, 16			; CHECK-P9-NEXT: li r3, 16
	; CHECK-P9-NEXT: stfiwx f0, r5, r3			; CHECK-P9-NEXT: stfiwx f0, r5, r3
	; CHECK-P9-NEXT: li r3, 20			; CHECK-P9-NEXT: li r3, 20
	; CHECK-P9-NEXT: stxsiwx vs34, r5, r3			; CHECK-P9-NEXT: stxsiwx vs34, r5, r3
	; CHECK-P9-NEXT: vperm v3, v2, v2, v3			; CHECK-P9-NEXT: vperm v3, v2, v2, v3
	; CHECK-P9-NEXT: stxv vs35, 0(r5)			; CHECK-P9-NEXT: stxv vs35, 0(r5)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: test_stores_exceed_vec_size:			; CHECK-P9-BE-LABEL: test_stores_exceed_vec_size:
	; CHECK-P9-BE: # %bb.0: # %entry			; CHECK-P9-BE: # %bb.0: # %entry
	; CHECK-P9-BE-NEXT: xxspltw vs0, vs34, 0			; CHECK-P9-BE-NEXT: xxspltw vs0, vs34, 0
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs0, 2
	; CHECK-P9-BE-NEXT: li r3, 16			; CHECK-P9-BE-NEXT: li r3, 16
	; CHECK-P9-BE-NEXT: stxsiwx vs34, r5, r3			; CHECK-P9-BE-NEXT: stxsiwx vs34, r5, r3
	; CHECK-P9-BE-NEXT: li r3, 20			; CHECK-P9-BE-NEXT: li r3, 20
				; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs0, 2
	; CHECK-P9-BE-NEXT: stxv vs0, 0(r5)			; CHECK-P9-BE-NEXT: stxv vs0, 0(r5)
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 1			; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 1
	; CHECK-P9-BE-NEXT: stfiwx f0, r5, r3			; CHECK-P9-BE-NEXT: stfiwx f0, r5, r3
	; CHECK-P9-BE-NEXT: blr			; CHECK-P9-BE-NEXT: blr
	entry:			entry:
	%vecext = extractelement <4 x i32> %a, i32 2			%vecext = extractelement <4 x i32> %a, i32 2
	store i32 %vecext, i32* %b, align 4			store i32 %vecext, i32* %b, align 4
	%vecext1 = extractelement <4 x i32> %a, i32 3			%vecext1 = extractelement <4 x i32> %a, i32 3
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; CHECK-BE-NEXT: stb r4, 2(r5)			; CHECK-BE-NEXT: stb r4, 2(r5)
	; CHECK-BE-NEXT: stb r6, 3(r5)			; CHECK-BE-NEXT: stb r6, 3(r5)
	; CHECK-BE-NEXT: stb r3, 4(r5)			; CHECK-BE-NEXT: stb r3, 4(r5)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test_5_consecutive_stores_of_bytes:			; CHECK-P9-LABEL: test_5_consecutive_stores_of_bytes:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 4			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 4
				; CHECK-P9-NEXT: li r3, 1
	; CHECK-P9-NEXT: stxsibx vs35, 0, r5			; CHECK-P9-NEXT: stxsibx vs35, 0, r5
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 12			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 12
	; CHECK-P9-NEXT: li r3, 1
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 15			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 15
	; CHECK-P9-NEXT: li r3, 2			; CHECK-P9-NEXT: li r3, 2
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 1			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 1
	; CHECK-P9-NEXT: li r3, 3			; CHECK-P9-NEXT: li r3, 3
	; CHECK-P9-NEXT: vsldoi v2, v2, v2, 2			; CHECK-P9-NEXT: vsldoi v2, v2, v2, 2
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: li r3, 4			; CHECK-P9-NEXT: li r3, 4
	; CHECK-P9-NEXT: stxsibx vs34, r5, r3			; CHECK-P9-NEXT: stxsibx vs34, r5, r3
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: test_5_consecutive_stores_of_bytes:			; CHECK-P9-BE-LABEL: test_5_consecutive_stores_of_bytes:
	; CHECK-P9-BE: # %bb.0: # %entry			; CHECK-P9-BE: # %bb.0: # %entry
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 13			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 13
				; CHECK-P9-BE-NEXT: li r3, 1
	; CHECK-P9-BE-NEXT: stxsibx vs35, 0, r5			; CHECK-P9-BE-NEXT: stxsibx vs35, 0, r5
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 5			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 5
	; CHECK-P9-BE-NEXT: li r3, 1
	; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 2			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 2
	; CHECK-P9-BE-NEXT: li r3, 2			; CHECK-P9-BE-NEXT: li r3, 2
	; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-BE-NEXT: li r3, 3			; CHECK-P9-BE-NEXT: li r3, 3
	; CHECK-P9-BE-NEXT: stxsibx vs34, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs34, r5, r3
	; CHECK-P9-BE-NEXT: vsldoi v2, v2, v2, 15			; CHECK-P9-BE-NEXT: vsldoi v2, v2, v2, 15
	; CHECK-P9-BE-NEXT: li r3, 4			; CHECK-P9-BE-NEXT: li r3, 4
	▲ Show 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 1			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 1
	; CHECK-P9-NEXT: li r3, 3			; CHECK-P9-NEXT: li r3, 3
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 2			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 2
	; CHECK-P9-NEXT: li r3, 4			; CHECK-P9-NEXT: li r3, 4
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 4			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 4
				; CHECK-P9-NEXT: li r3, 5
	; CHECK-P9-NEXT: stxsibx vs35, 0, r5			; CHECK-P9-NEXT: stxsibx vs35, 0, r5
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 8			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 8
	; CHECK-P9-NEXT: li r3, 5
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 13			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 13
	; CHECK-P9-NEXT: li r3, 6			; CHECK-P9-NEXT: li r3, 6
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 11			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 11
	; CHECK-P9-NEXT: li r3, 7			; CHECK-P9-NEXT: li r3, 7
	; CHECK-P9-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-NEXT: vsldoi v3, v2, v2, 6			; CHECK-P9-NEXT: vsldoi v3, v2, v2, 6
	Show All 22 Lines
	; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 2			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 2
	; CHECK-P9-BE-NEXT: li r3, 2			; CHECK-P9-BE-NEXT: li r3, 2
	; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 15			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 15
	; CHECK-P9-BE-NEXT: li r3, 4			; CHECK-P9-BE-NEXT: li r3, 4
	; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 13			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 13
				; CHECK-P9-BE-NEXT: li r3, 5
	; CHECK-P9-BE-NEXT: stxsibx vs35, 0, r5			; CHECK-P9-BE-NEXT: stxsibx vs35, 0, r5
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 9			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 9
	; CHECK-P9-BE-NEXT: li r3, 5
	; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 4			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 4
	; CHECK-P9-BE-NEXT: li r3, 6			; CHECK-P9-BE-NEXT: li r3, 6
	; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 6			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 6
	; CHECK-P9-BE-NEXT: li r3, 7			; CHECK-P9-BE-NEXT: li r3, 7
	; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3			; CHECK-P9-BE-NEXT: stxsibx vs35, r5, r3
	; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 11			; CHECK-P9-BE-NEXT: vsldoi v3, v2, v2, 11
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: xxsldwi vs0, vs35, vs35, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs35, vs35, 1
	; CHECK-P9-NEXT: stfiwx f0, 0, r7			; CHECK-P9-NEXT: stfiwx f0, 0, r7
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: test_elements_from_two_vec:			; CHECK-P9-BE-LABEL: test_elements_from_two_vec:
	; CHECK-P9-BE: # %bb.0: # %entry			; CHECK-P9-BE: # %bb.0: # %entry
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 3			; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 3
	; CHECK-P9-BE-NEXT: li r3, 4			; CHECK-P9-BE-NEXT: li r3, 4
	; CHECK-P9-BE-NEXT: stfiwx f0, r7, r3
	; CHECK-P9-BE-NEXT: stxsiwx vs35, 0, r7			; CHECK-P9-BE-NEXT: stxsiwx vs35, 0, r7
				; CHECK-P9-BE-NEXT: stfiwx f0, r7, r3
	; CHECK-P9-BE-NEXT: blr			; CHECK-P9-BE-NEXT: blr
	entry:			entry:
	%vecext = extractelement <4 x i32> %a, i32 0			%vecext = extractelement <4 x i32> %a, i32 0
	%arrayidx = getelementptr inbounds i32, i32* %c, i64 1			%arrayidx = getelementptr inbounds i32, i32* %c, i64 1
	store i32 %vecext, i32* %arrayidx, align 4			store i32 %vecext, i32* %arrayidx, align 4
	%vecext1 = extractelement <4 x i32> %b, i32 1			%vecext1 = extractelement <4 x i32> %b, i32 1
	store i32 %vecext1, i32* %c, align 4			store i32 %vecext1, i32* %c, align 4
	ret void			ret void
	Show All 31 Lines
	; CHECK-P9-NEXT: stfiwx f0, 0, r9			; CHECK-P9-NEXT: stfiwx f0, 0, r9
	; CHECK-P9-NEXT: xxsldwi vs0, vs36, vs36, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs36, vs36, 1
	; CHECK-P9-NEXT: stfiwx f0, r9, r3			; CHECK-P9-NEXT: stfiwx f0, r9, r3
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: test_elements_from_three_vec:			; CHECK-P9-BE-LABEL: test_elements_from_three_vec:
	; CHECK-P9-BE: # %bb.0: # %entry			; CHECK-P9-BE: # %bb.0: # %entry
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 2			; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 2
				; CHECK-P9-BE-NEXT: li r3, 4
	; CHECK-P9-BE-NEXT: stfiwx f0, 0, r9			; CHECK-P9-BE-NEXT: stfiwx f0, 0, r9
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs35, vs35, 1			; CHECK-P9-BE-NEXT: xxsldwi vs0, vs35, vs35, 1
	; CHECK-P9-BE-NEXT: li r3, 4
	; CHECK-P9-BE-NEXT: stfiwx f0, r9, r3			; CHECK-P9-BE-NEXT: stfiwx f0, r9, r3
	; CHECK-P9-BE-NEXT: li r3, 8			; CHECK-P9-BE-NEXT: li r3, 8
	; CHECK-P9-BE-NEXT: stxsiwx vs36, r9, r3			; CHECK-P9-BE-NEXT: stxsiwx vs36, r9, r3
	; CHECK-P9-BE-NEXT: blr			; CHECK-P9-BE-NEXT: blr
	entry:			entry:
	%vecext = extractelement <4 x float> %a, i32 3			%vecext = extractelement <4 x float> %a, i32 3
	store float %vecext, float* %d, align 4			store float %vecext, float* %d, align 4
	%vecext1 = extractelement <4 x float> %b, i32 2			%vecext1 = extractelement <4 x float> %b, i32 2
	%arrayidx2 = getelementptr inbounds float, float* %d, i64 1			%arrayidx2 = getelementptr inbounds float, float* %d, i64 1
	store float %vecext1, float* %arrayidx2, align 4			store float %vecext1, float* %arrayidx2, align 4
	%vecext3 = extractelement <4 x float> %c, i32 1			%vecext3 = extractelement <4 x float> %c, i32 1
	%arrayidx4 = getelementptr inbounds float, float* %d, i64 2			%arrayidx4 = getelementptr inbounds float, float* %d, i64 2
	store float %vecext3, float* %arrayidx4, align 4			store float %vecext3, float* %arrayidx4, align 4
	ret void			ret void
	}			}

llvm/test/CodeGen/PowerPC/f128-aggregates.ll

Show First 20 Lines • Show All 223 Lines • ▼ Show 20 Lines	entry:
ret fp128 %0		ret fp128 %0
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define fp128 @testMixedAggregate_03([4 x i128] %sa.coerce) {		define fp128 @testMixedAggregate_03([4 x i128] %sa.coerce) {
; CHECK-LABEL: testMixedAggregate_03:		; CHECK-LABEL: testMixedAggregate_03:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK: mtvsrwa v2, r3		; CHECK: mtvsrwa v2, r3
; CHECK: xscvsdqp v2, v2		; CHECK-DAG: xscvsdqp v2, v2
; CHECK: mtvsrdd v3, r6, r5		; CHECK-DAG: mtvsrdd v3, r6, r5
; CHECK: xsaddqp v2, v3, v2		; CHECK: xsaddqp v2, v3, v2
; CHECK: mtvsrd v[[REG1:[0-9]+]], r10		; CHECK: mtvsrd v[[REG1:[0-9]+]], r10
; CHECK: xscvsdqp v[[REG:[0-9]+]], v[[REG1]]		; CHECK: xscvsdqp v[[REG:[0-9]+]], v[[REG1]]
; CHECK: xsaddqp v2, v2, v[[REG]]		; CHECK: xsaddqp v2, v2, v[[REG]]
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%sa.coerce.fca.0.extract = extractvalue [4 x i128] %sa.coerce, 0		%sa.coerce.fca.0.extract = extractvalue [4 x i128] %sa.coerce, 0
%sa.sroa.0.0.extract.trunc = trunc i128 %sa.coerce.fca.0.extract to i32		%sa.sroa.0.0.extract.trunc = trunc i128 %sa.coerce.fca.0.extract to i32
▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
; CHECK-DAG: cmpwi cr0, r3, 1		; CHECK-DAG: cmpwi cr0, r3, 1
; CHECK-DAG: std r5, 48(r1)		; CHECK-DAG: std r5, 48(r1)
; CHECK-DAG: addis [[REG:r[0-9]+]], r2, .LCPI17_0@toc@ha		; CHECK-DAG: addis [[REG:r[0-9]+]], r2, .LCPI17_0@toc@ha
; CHECK-DAG: addi [[REG1:r[0-9]+]], [[REG]], .LCPI17_0@toc@l		; CHECK-DAG: addi [[REG1:r[0-9]+]], [[REG]], .LCPI17_0@toc@l
; CHECK-DAG: lxvx v2, 0, [[REG1]]		; CHECK-DAG: lxvx v2, 0, [[REG1]]
; CHECK-NEXT: bltlr cr0		; CHECK-NEXT: bltlr cr0
; CHECK-NEXT: # %bb.1: # %if.end		; CHECK-NEXT: # %bb.1: # %if.end
; CHECK-NEXT: addi r3, r1, 40		; CHECK-NEXT: addi r3, r1, 40
		; CHECK-NEXT: addi [[REG2:r[0-9]+]], r1, 72
; CHECK-NEXT: lxvx v3, 0, r3		; CHECK-NEXT: lxvx v3, 0, r3
		; CHECK-NEXT: std [[REG2]], -8(r1)
; CHECK-NEXT: xsaddqp v2, v3, v2		; CHECK-NEXT: xsaddqp v2, v3, v2
; CHECK-NEXT: lxv v3, 16(r3)		; CHECK-NEXT: lxv v3, 16(r3)
; CHECK-NEXT: xsaddqp v2, v2, v3		; CHECK-NEXT: xsaddqp v2, v2, v3
; CHECK-NEXT: addi [[REG2:r[0-9]+]], r1, 72
; CHECK-NEXT: std [[REG2]], -8(r1)
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%ap = alloca i8*, align 8		%ap = alloca i8*, align 8
%0 = bitcast i8** %ap to i8*		%0 = bitcast i8** %ap to i8*
call void @llvm.lifetime.start.p0i8(i64 8, i8* nonnull %0) #2		call void @llvm.lifetime.start.p0i8(i64 8, i8* nonnull %0) #2
%cmp = icmp slt i32 %count, 1		%cmp = icmp slt i32 %count, 1
br i1 %cmp, label %cleanup, label %if.end		br i1 %cmp, label %cleanup, label %if.end

Show All 25 Lines

llvm/test/CodeGen/PowerPC/f128-conv.ll

Show First 20 Lines • Show All 438 Lines • ▼ Show 20 Lines	entry:
ret void		ret void
}		}

; Function Attrs: norecurse nounwind		; Function Attrs: norecurse nounwind
define void @qpConv2dp_03(double* nocapture %res, i32 signext %idx) {		define void @qpConv2dp_03(double* nocapture %res, i32 signext %idx) {
; CHECK-LABEL: qpConv2dp_03:		; CHECK-LABEL: qpConv2dp_03:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: addis r5, r2, .LC7@toc@ha		; CHECK-NEXT: addis r5, r2, .LC7@toc@ha
		; CHECK-NEXT: sldi r4, r4, 3
; CHECK-NEXT: ld r5, .LC7@toc@l(r5)		; CHECK-NEXT: ld r5, .LC7@toc@l(r5)
; CHECK-NEXT: lxvx v2, 0, r5		; CHECK-NEXT: lxvx v2, 0, r5
; CHECK-NEXT: xscvqpdp v2, v2		; CHECK-NEXT: xscvqpdp v2, v2
; CHECK-NEXT: sldi r4, r4, 3
; CHECK-NEXT: stxsdx v2, r3, r4		; CHECK-NEXT: stxsdx v2, r3, r4
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%0 = load fp128, fp128* getelementptr inbounds ([4 x fp128], [4 x fp128]* @f128Array, i64 0, i64 0), align 16		%0 = load fp128, fp128* getelementptr inbounds ([4 x fp128], [4 x fp128]* @f128Array, i64 0, i64 0), align 16
%conv = fptrunc fp128 %0 to double		%conv = fptrunc fp128 %0 to double
%idxprom = sext i32 %idx to i64		%idxprom = sext i32 %idx to i64
%arrayidx = getelementptr inbounds double, double* %res, i64 %idxprom		%arrayidx = getelementptr inbounds double, double* %res, i64 %idxprom
store double %conv, double* %arrayidx, align 8		store double %conv, double* %arrayidx, align 8
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	entry:
ret void		ret void
}		}

; Function Attrs: norecurse nounwind		; Function Attrs: norecurse nounwind
define void @qpConv2sp_03(float* nocapture %res, i32 signext %idx) {		define void @qpConv2sp_03(float* nocapture %res, i32 signext %idx) {
; CHECK-LABEL: qpConv2sp_03:		; CHECK-LABEL: qpConv2sp_03:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: addis r5, r2, .LC7@toc@ha		; CHECK-NEXT: addis r5, r2, .LC7@toc@ha
		; CHECK-NEXT: sldi r4, r4, 2
; CHECK-NEXT: ld r5, .LC7@toc@l(r5)		; CHECK-NEXT: ld r5, .LC7@toc@l(r5)
; CHECK-NEXT: lxv v2, 48(r5)		; CHECK-NEXT: lxv v2, 48(r5)
; CHECK-NEXT: xscvqpdpo v2, v2		; CHECK-NEXT: xscvqpdpo v2, v2
; CHECK-NEXT: xsrsp f0, v2		; CHECK-NEXT: xsrsp f0, v2
; CHECK-NEXT: sldi r4, r4, 2
; CHECK-NEXT: stfsx f0, r3, r4		; CHECK-NEXT: stfsx f0, r3, r4
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%0 = load fp128, fp128* getelementptr inbounds ([4 x fp128], [4 x fp128]* @f128Array, i64 0, i64 3), align 16		%0 = load fp128, fp128* getelementptr inbounds ([4 x fp128], [4 x fp128]* @f128Array, i64 0, i64 3), align 16
%conv = fptrunc fp128 %0 to float		%conv = fptrunc fp128 %0 to float
%idxprom = sext i32 %idx to i64		%idxprom = sext i32 %idx to i64
%arrayidx = getelementptr inbounds float, float* %res, i64 %idxprom		%arrayidx = getelementptr inbounds float, float* %res, i64 %idxprom
store float %conv, float* %arrayidx, align 4		store float %conv, float* %arrayidx, align 4
▲ Show 20 Lines • Show All 310 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/f128-passByValue.ll

Show First 20 Lines • Show All 148 Lines • ▼ Show 20 Lines
}		}

; Function Attrs: norecurse nounwind		; Function Attrs: norecurse nounwind
define fp128 @mixParam_02(fp128 %p1, double %p2, i64* nocapture %p3,		define fp128 @mixParam_02(fp128 %p1, double %p2, i64* nocapture %p3,
; CHECK-LABEL: mixParam_02:		; CHECK-LABEL: mixParam_02:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK: lwz r3, 96(r1)		; CHECK: lwz r3, 96(r1)
; CHECK: add r4, r7, r9		; CHECK: add r4, r7, r9
		; CHECK: xscpsgndp v[[REG0:[0-9]+]], f1, f1
; CHECK: add r4, r4, r10		; CHECK: add r4, r4, r10
		; CHECK: xscvdpqp v[[REG0]], v[[REG0]]
; CHECK: add r3, r4, r3		; CHECK: add r3, r4, r3
; CHECK: clrldi r3, r3, 32		; CHECK: clrldi r3, r3, 32
; CHECK: std r3, 0(r6)		; CHECK: std r3, 0(r6)
; CHECK: lxv v[[REG1:[0-9]+]], 0(r8)		; CHECK: lxv v[[REG1:[0-9]+]], 0(r8)
; CHECK: xscpsgndp v[[REG0:[0-9]+]], f1, f1
; CHECK: xscvdpqp v[[REG0]], v[[REG0]]
; CHECK: xsaddqp v2, v[[REG1]], v2		; CHECK: xsaddqp v2, v[[REG1]], v2
; CHECK: xsaddqp v2, v2, v3		; CHECK: xsaddqp v2, v2, v3
; CHECK-NEXT: blr		; CHECK-NEXT: blr
i16 signext %p4, fp128* nocapture readonly %p5,		i16 signext %p4, fp128* nocapture readonly %p5,
i32 signext %p6, i8 zeroext %p7, i32 zeroext %p8) {		i32 signext %p6, i8 zeroext %p7, i32 zeroext %p8) {
entry:		entry:
%conv = sext i16 %p4 to i32		%conv = sext i16 %p4 to i32
%add = add nsw i32 %conv, %p6		%add = add nsw i32 %conv, %p6
Show All 9 Lines	entry:
ret fp128 %add7		ret fp128 %add7
}		}

; Function Attrs: norecurse nounwind		; Function Attrs: norecurse nounwind
define fastcc fp128 @mixParam_02f(fp128 %p1, double %p2, i64* nocapture %p3,		define fastcc fp128 @mixParam_02f(fp128 %p1, double %p2, i64* nocapture %p3,
; CHECK-LABEL: mixParam_02f:		; CHECK-LABEL: mixParam_02f:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: add r4, r4, r6		; CHECK-NEXT: add r4, r4, r6
		; CHECK-NEXT: xscpsgndp v[[REG0:[0-9]+]], f1, f1
; CHECK-NEXT: add r4, r4, r7		; CHECK-NEXT: add r4, r4, r7
		; CHECK-NEXT: xscvdpqp v[[REG0]], v[[REG0]]
; CHECK-NEXT: add r4, r4, r8		; CHECK-NEXT: add r4, r4, r8
; CHECK-NEXT: clrldi r4, r4, 32		; CHECK-NEXT: clrldi r4, r4, 32
; CHECK-DAG: std r4, 0(r3)		; CHECK-DAG: std r4, 0(r3)
; CHECK-DAG: lxv v[[REG1:[0-9]+]], 0(r5)		; CHECK-DAG: lxv v[[REG1:[0-9]+]], 0(r5)
; CHECK-NEXT: xscpsgndp v[[REG0:[0-9]+]], f1, f1
; CHECK-NEXT: xscvdpqp v[[REG0]], v[[REG0]]
; CHECK-NEXT: xsaddqp v2, v[[REG1]], v2		; CHECK-NEXT: xsaddqp v2, v[[REG1]], v2
; CHECK-NEXT: xsaddqp v2, v2, v[[REG0]]		; CHECK-NEXT: xsaddqp v2, v2, v[[REG0]]
; CHECK-NEXT: blr		; CHECK-NEXT: blr
i16 signext %p4, fp128* nocapture readonly %p5,		i16 signext %p4, fp128* nocapture readonly %p5,
i32 signext %p6, i8 zeroext %p7, i32 zeroext %p8) {		i32 signext %p6, i8 zeroext %p7, i32 zeroext %p8) {
entry:		entry:
%conv = sext i16 %p4 to i32		%conv = sext i16 %p4 to i32
%add = add nsw i32 %conv, %p6		%add = add nsw i32 %conv, %p6
▲ Show 20 Lines • Show All 65 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/float-load-store-pair.ll

	Show All 26 Lines
	; so the fpr is only used to load/store float argument			; so the fpr is only used to load/store float argument
	define signext i32 @test() nounwind {			define signext i32 @test() nounwind {
	; CHECK-LABEL: test:			; CHECK-LABEL: test:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: mflr 0			; CHECK-NEXT: mflr 0
	; CHECK-NEXT: std 0, 16(1)			; CHECK-NEXT: std 0, 16(1)
	; CHECK-NEXT: stdu 1, -192(1)			; CHECK-NEXT: stdu 1, -192(1)
	; CHECK-NEXT: addis 3, 2, a1@toc@ha			; CHECK-NEXT: addis 3, 2, a1@toc@ha
				; CHECK-NEXT: addis 6, 2, a17@toc@ha
				; CHECK-NEXT: addis 5, 2, a16@toc@ha
				; CHECK-NEXT: addis 4, 2, a15@toc@ha
	; CHECK-NEXT: lfd 1, a1@toc@l(3)			; CHECK-NEXT: lfd 1, a1@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a2@toc@ha			; CHECK-NEXT: addis 3, 2, a2@toc@ha
				; CHECK-NEXT: addi 6, 6, a17@toc@l
				; CHECK-NEXT: addi 5, 5, a16@toc@l
				; CHECK-NEXT: ld 4, a15@toc@l(4)
	; CHECK-NEXT: lfd 2, a2@toc@l(3)			; CHECK-NEXT: lfd 2, a2@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a3@toc@ha			; CHECK-NEXT: addis 3, 2, a3@toc@ha
				; CHECK-NEXT: lxvx 34, 0, 6
				; CHECK-NEXT: lxvx 0, 0, 5
				; CHECK-NEXT: li 5, 168
	; CHECK-NEXT: lfd 3, a3@toc@l(3)			; CHECK-NEXT: lfd 3, a3@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a4@toc@ha			; CHECK-NEXT: addis 3, 2, a4@toc@ha
	; CHECK-NEXT: lfd 4, a4@toc@l(3)			; CHECK-NEXT: lfd 4, a4@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a5@toc@ha			; CHECK-NEXT: addis 3, 2, a5@toc@ha
	; CHECK-NEXT: lfd 5, a5@toc@l(3)			; CHECK-NEXT: lfd 5, a5@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a6@toc@ha			; CHECK-NEXT: addis 3, 2, a6@toc@ha
	; CHECK-NEXT: lfd 6, a6@toc@l(3)			; CHECK-NEXT: lfd 6, a6@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a7@toc@ha			; CHECK-NEXT: addis 3, 2, a7@toc@ha
	; CHECK-NEXT: lfd 7, a7@toc@l(3)			; CHECK-NEXT: lfd 7, a7@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a8@toc@ha			; CHECK-NEXT: addis 3, 2, a8@toc@ha
	; CHECK-NEXT: lfd 8, a8@toc@l(3)			; CHECK-NEXT: lfd 8, a8@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a9@toc@ha			; CHECK-NEXT: addis 3, 2, a9@toc@ha
	; CHECK-NEXT: lfd 9, a9@toc@l(3)			; CHECK-NEXT: lfd 9, a9@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a10@toc@ha			; CHECK-NEXT: addis 3, 2, a10@toc@ha
	; CHECK-NEXT: lfd 10, a10@toc@l(3)			; CHECK-NEXT: lfd 10, a10@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a11@toc@ha			; CHECK-NEXT: addis 3, 2, a11@toc@ha
	; CHECK-NEXT: addis 6, 2, a17@toc@ha
	; CHECK-NEXT: addis 5, 2, a16@toc@ha
	; CHECK-NEXT: addi 6, 6, a17@toc@l
	; CHECK-NEXT: addi 5, 5, a16@toc@l
	; CHECK-NEXT: lxvx 34, 0, 6
	; CHECK-NEXT: addis 4, 2, a15@toc@ha
	; CHECK-NEXT: lxvx 0, 0, 5
	; CHECK-NEXT: ld 4, a15@toc@l(4)
	; CHECK-NEXT: li 5, 168
	; CHECK-NEXT: lfd 11, a11@toc@l(3)			; CHECK-NEXT: lfd 11, a11@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a12@toc@ha			; CHECK-NEXT: addis 3, 2, a12@toc@ha
	; CHECK-NEXT: lfd 12, a12@toc@l(3)			; CHECK-NEXT: lfd 12, a12@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a13@toc@ha			; CHECK-NEXT: addis 3, 2, a13@toc@ha
	; CHECK-NEXT: lfd 13, a13@toc@l(3)			; CHECK-NEXT: lfd 13, a13@toc@l(3)
	; CHECK-NEXT: addis 3, 2, a14@toc@ha			; CHECK-NEXT: addis 3, 2, a14@toc@ha
	; CHECK-NEXT: ld 3, a14@toc@l(3)			; CHECK-NEXT: ld 3, a14@toc@l(3)
	; CHECK-NEXT: stxvx 34, 1, 5			; CHECK-NEXT: stxvx 34, 1, 5
	Show All 33 Lines

llvm/test/CodeGen/PowerPC/load-shuffle-and-shuffle-store.ll

	Show First 20 Lines • Show All 126 Lines • ▼ Show 20 Lines
	; CHECK-P8-BE-NEXT: addi r3, r3, .LCPI3_0@toc@l			; CHECK-P8-BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; CHECK-P8-BE-NEXT: lxvw4x v3, 0, r3			; CHECK-P8-BE-NEXT: lxvw4x v3, 0, r3
	; CHECK-P8-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-P8-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-P8-BE-NEXT: blr			; CHECK-P8-BE-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: load_swap11:			; CHECK-P9-BE-LABEL: load_swap11:
	; CHECK-P9-BE: # %bb.0:			; CHECK-P9-BE: # %bb.0:
	; CHECK-P9-BE-NEXT: addis r3, r2, .LCPI3_0@toc@ha			; CHECK-P9-BE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; CHECK-P9-BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; CHECK-P9-BE-NEXT: lxv v2, 0(r4)			; CHECK-P9-BE-NEXT: lxv v2, 0(r4)
				; CHECK-P9-BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; CHECK-P9-BE-NEXT: lxvx v3, 0, r3			; CHECK-P9-BE-NEXT: lxvx v3, 0, r3
	; CHECK-P9-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-P9-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-P9-BE-NEXT: blr			; CHECK-P9-BE-NEXT: blr
	%v1 = load <4 x i32>, <4 x i32>* %vp1			%v1 = load <4 x i32>, <4 x i32>* %vp1
	%v2 = load <4 x i32>, <4 x i32>* %vp2			%v2 = load <4 x i32>, <4 x i32>* %vp2
	%v3 = shufflevector <4 x i32> %v1, <4 x i32> %v2, <4 x i32> <i32 7, i32 6, i32 5, i32 4>			%v3 = shufflevector <4 x i32> %v1, <4 x i32> %v2, <4 x i32> <i32 7, i32 6, i32 5, i32 4>
	ret <4 x i32> %v3			ret <4 x i32> %v3
	}			}
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; CHECK-P8-BE-NEXT: addi r3, r3, .LCPI5_0@toc@l			; CHECK-P8-BE-NEXT: addi r3, r3, .LCPI5_0@toc@l
	; CHECK-P8-BE-NEXT: lxvw4x v3, 0, r3			; CHECK-P8-BE-NEXT: lxvw4x v3, 0, r3
	; CHECK-P8-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-P8-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-P8-BE-NEXT: blr			; CHECK-P8-BE-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: load_swap21:			; CHECK-P9-BE-LABEL: load_swap21:
	; CHECK-P9-BE: # %bb.0:			; CHECK-P9-BE: # %bb.0:
	; CHECK-P9-BE-NEXT: addis r3, r2, .LCPI5_0@toc@ha			; CHECK-P9-BE-NEXT: addis r3, r2, .LCPI5_0@toc@ha
	; CHECK-P9-BE-NEXT: addi r3, r3, .LCPI5_0@toc@l
	; CHECK-P9-BE-NEXT: lxv v2, 0(r4)			; CHECK-P9-BE-NEXT: lxv v2, 0(r4)
				; CHECK-P9-BE-NEXT: addi r3, r3, .LCPI5_0@toc@l
	; CHECK-P9-BE-NEXT: lxvx v3, 0, r3			; CHECK-P9-BE-NEXT: lxvx v3, 0, r3
	; CHECK-P9-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-P9-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-P9-BE-NEXT: blr			; CHECK-P9-BE-NEXT: blr
	%v1 = load <8 x i16>, <8 x i16>* %vp1			%v1 = load <8 x i16>, <8 x i16>* %vp1
	%v2 = load <8 x i16>, <8 x i16>* %vp2			%v2 = load <8 x i16>, <8 x i16>* %vp2
	%v3 = shufflevector <8 x i16> %v1, <8 x i16> %v2, <8 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8>			%v3 = shufflevector <8 x i16> %v1, <8 x i16> %v2, <8 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8>
	ret <8 x i16> %v3			ret <8 x i16> %v3
	}			}
	▲ Show 20 Lines • Show All 156 Lines • ▼ Show 20 Lines
	; CHECK-P8-BE-NEXT: addi r3, r3, .LCPI10_0@toc@l			; CHECK-P8-BE-NEXT: addi r3, r3, .LCPI10_0@toc@l
	; CHECK-P8-BE-NEXT: lxvw4x v3, 0, r3			; CHECK-P8-BE-NEXT: lxvw4x v3, 0, r3
	; CHECK-P8-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-P8-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-P8-BE-NEXT: blr			; CHECK-P8-BE-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: load_swap51:			; CHECK-P9-BE-LABEL: load_swap51:
	; CHECK-P9-BE: # %bb.0:			; CHECK-P9-BE: # %bb.0:
	; CHECK-P9-BE-NEXT: addis r3, r2, .LCPI10_0@toc@ha			; CHECK-P9-BE-NEXT: addis r3, r2, .LCPI10_0@toc@ha
	; CHECK-P9-BE-NEXT: addi r3, r3, .LCPI10_0@toc@l
	; CHECK-P9-BE-NEXT: lxv v2, 0(r4)			; CHECK-P9-BE-NEXT: lxv v2, 0(r4)
				; CHECK-P9-BE-NEXT: addi r3, r3, .LCPI10_0@toc@l
	; CHECK-P9-BE-NEXT: lxvx v3, 0, r3			; CHECK-P9-BE-NEXT: lxvx v3, 0, r3
	; CHECK-P9-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-P9-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-P9-BE-NEXT: blr			; CHECK-P9-BE-NEXT: blr
	%v1 = load <4 x float>, <4 x float>* %vp1			%v1 = load <4 x float>, <4 x float>* %vp1
	%v2 = load <4 x float>, <4 x float>* %vp2			%v2 = load <4 x float>, <4 x float>* %vp2
	%v3 = shufflevector <4 x float> %v1, <4 x float> %v2, <4 x i32> <i32 7, i32 6, i32 5, i32 4>			%v3 = shufflevector <4 x float> %v1, <4 x float> %v2, <4 x i32> <i32 7, i32 6, i32 5, i32 4>
	ret <4 x float> %v3			ret <4 x float> %v3
	}			}
	▲ Show 20 Lines • Show All 398 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/loop-instr-form-prepare.ll

	Show All 17 Lines
	; }			; }

	define i64 @test_no_prep(i8* %0, i32 signext %1) {			define i64 @test_no_prep(i8* %0, i32 signext %1) {
	; CHECK-LABEL: test_no_prep:			; CHECK-LABEL: test_no_prep:
	; CHECK: addi r3, r3, 4004			; CHECK: addi r3, r3, 4004
	; CHECK: .LBB0_2: #			; CHECK: .LBB0_2: #
	; CHECK-NEXT: ldx r9, r3, r6			; CHECK-NEXT: ldx r9, r3, r6
	; CHECK-NEXT: ldx r10, r3, r7			; CHECK-NEXT: ldx r10, r3, r7
	; CHECK-NEXT: mulld r9, r10, r9
	; CHECK-NEXT: ldx r11, r3, r8			; CHECK-NEXT: ldx r11, r3, r8
	; CHECK-NEXT: mulld r9, r9, r11
	; CHECK-NEXT: ld r12, 0(r3)			; CHECK-NEXT: ld r12, 0(r3)
	; CHECK-NEXT: addi r3, r3, 1			; CHECK-NEXT: addi r3, r3, 1
				; CHECK-NEXT: mulld r9, r10, r9
				; CHECK-NEXT: mulld r9, r9, r11
	; CHECK-NEXT: maddld r5, r9, r12, r5			; CHECK-NEXT: maddld r5, r9, r12, r5
	; CHECK-NEXT: bdnz .LBB0_2			; CHECK-NEXT: bdnz .LBB0_2
	%3 = sext i32 %1 to i64			%3 = sext i32 %1 to i64
	%4 = icmp eq i32 %1, 0			%4 = icmp eq i32 %1, 0
	br i1 %4, label %27, label %5			br i1 %4, label %27, label %5

	5: ; preds = %2, %5			5: ; preds = %2, %5
	%6 = phi i64 [ %25, %5 ], [ 0, %2 ]			%6 = phi i64 [ %25, %5 ], [ 0, %2 ]
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; }			; }

	define i64 @test_ds_prep(i8* %0, i32 signext %1) {			define i64 @test_ds_prep(i8* %0, i32 signext %1) {
	; CHECK-LABEL: test_ds_prep:			; CHECK-LABEL: test_ds_prep:
	; CHECK: addi r6, r3, 4002			; CHECK: addi r6, r3, 4002
	; CHECK: .LBB1_2: #			; CHECK: .LBB1_2: #
	; CHECK-NEXT: ldx r9, r6, r7			; CHECK-NEXT: ldx r9, r6, r7
	; CHECK-NEXT: ld r10, 0(r6)			; CHECK-NEXT: ld r10, 0(r6)
	; CHECK-NEXT: mulld r9, r10, r9
	; CHECK-NEXT: ldx r11, r6, r5			; CHECK-NEXT: ldx r11, r6, r5
	; CHECK-NEXT: mulld r9, r9, r11
	; CHECK-NEXT: addi r8, r6, 1			; CHECK-NEXT: addi r8, r6, 1
	; CHECK-NEXT: ld r6, 4(r6)			; CHECK-NEXT: ld r6, 4(r6)
				; CHECK-NEXT: mulld r9, r10, r9
				; CHECK-NEXT: mulld r9, r9, r11
	; CHECK-NEXT: maddld r3, r9, r6, r3			; CHECK-NEXT: maddld r3, r9, r6, r3
	; CHECK-NEXT: mr r6, r8			; CHECK-NEXT: mr r6, r8
	; CHECK-NEXT: bdnz .LBB1_2			; CHECK-NEXT: bdnz .LBB1_2
	%3 = sext i32 %1 to i64			%3 = sext i32 %1 to i64
	%4 = icmp eq i32 %1, 0			%4 = icmp eq i32 %1, 0
	br i1 %4, label %27, label %5			br i1 %4, label %27, label %5

	5: ; preds = %2, %5			5: ; preds = %2, %5
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	;}			;}

	define i64 @test_max_number_reminder(i8* %0, i32 signext %1) {			define i64 @test_max_number_reminder(i8* %0, i32 signext %1) {
	; CHECK-LABEL: test_max_number_reminder:			; CHECK-LABEL: test_max_number_reminder:
	; CHECK: addi r9, r3, 4002			; CHECK: addi r9, r3, 4002
	; CHECK: .LBB2_2: #			; CHECK: .LBB2_2: #
	; CHECK-NEXT: ldx r12, r9, r6			; CHECK-NEXT: ldx r12, r9, r6
	; CHECK-NEXT: ld r0, 0(r9)			; CHECK-NEXT: ld r0, 0(r9)
	; CHECK-NEXT: mulld r12, r0, r12			; CHECK-NEXT: ldx r30, r9, r5
				; CHECK-NEXT: ldx r29, r9, r7
	; CHECK-NEXT: addi r11, r9, 1			; CHECK-NEXT: addi r11, r9, 1
	; CHECK-NEXT: ldx r30, r9, r7			; CHECK-NEXT: mulld r12, r0, r12
	; CHECK-NEXT: ld r29, 4(r9)			; CHECK-NEXT: ld r28, 4(r9)
	; CHECK-NEXT: ldx r28, r9, r8			; CHECK-NEXT: ldx r27, r9, r8
	; CHECK-NEXT: ld r27, 12(r9)			; CHECK-NEXT: ld r26, 12(r9)
	; CHECK-NEXT: ld r26, 8(r9)			; CHECK-NEXT: ld r25, 8(r9)
	; CHECK-NEXT: ldx r25, r9, r10			; CHECK-NEXT: ldx r9, r9, r10
	; CHECK-NEXT: ldx r9, r9, r5			; CHECK-NEXT: mulld r12, r12, r30
	; CHECK-NEXT: mulld r9, r12, r9			; CHECK-NEXT: mulld r12, r12, r29
	; CHECK-NEXT: mulld r9, r9, r30			; CHECK-NEXT: mulld r12, r12, r28
	; CHECK-NEXT: mulld r9, r9, r29			; CHECK-NEXT: mulld r12, r12, r27
	; CHECK-NEXT: mulld r9, r9, r28			; CHECK-NEXT: mulld r12, r12, r26
	; CHECK-NEXT: mulld r9, r9, r27			; CHECK-NEXT: mulld r12, r12, r25
	; CHECK-NEXT: mulld r9, r9, r26			; CHECK-NEXT: maddld r3, r12, r9, r3
	; CHECK-NEXT: maddld r3, r9, r25, r3
	; CHECK-NEXT: mr r9, r11			; CHECK-NEXT: mr r9, r11
	; CHECK-NEXT: bdnz .LBB2_2			; CHECK-NEXT: bdnz .LBB2_2
	%3 = sext i32 %1 to i64			%3 = sext i32 %1 to i64
	%4 = icmp eq i32 %1, 0			%4 = icmp eq i32 %1, 0
	br i1 %4, label %47, label %5			br i1 %4, label %47, label %5

	5: ; preds = %2, %5			5: ; preds = %2, %5
	%6 = phi i64 [ %45, %5 ], [ 0, %2 ]			%6 = phi i64 [ %45, %5 ], [ 0, %2 ]
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; }			; }

	define dso_local i64 @test_update_ds_prep_interact(i8* %0, i32 signext %1) {			define dso_local i64 @test_update_ds_prep_interact(i8* %0, i32 signext %1) {
	; CHECK-LABEL: test_update_ds_prep_interact:			; CHECK-LABEL: test_update_ds_prep_interact:
	; CHECK: addi r3, r3, 3998			; CHECK: addi r3, r3, 3998
	; CHECK: .LBB3_2: #			; CHECK: .LBB3_2: #
	; CHECK-NEXT: ldu r8, 4(r3)			; CHECK-NEXT: ldu r8, 4(r3)
	; CHECK-NEXT: ldx r9, r3, r7			; CHECK-NEXT: ldx r9, r3, r7
	; CHECK-NEXT: mulld r8, r8, r9
	; CHECK-NEXT: ldx r10, r3, r6			; CHECK-NEXT: ldx r10, r3, r6
	; CHECK-NEXT: mulld r8, r8, r10
	; CHECK-NEXT: ld r11, 4(r3)			; CHECK-NEXT: ld r11, 4(r3)
				; CHECK-NEXT: mulld r8, r8, r9
				; CHECK-NEXT: mulld r8, r8, r10
	; CHECK-NEXT: maddld r5, r8, r11, r5			; CHECK-NEXT: maddld r5, r8, r11, r5
	; CHECK-NEXT: bdnz .LBB3_2			; CHECK-NEXT: bdnz .LBB3_2
	%3 = sext i32 %1 to i64			%3 = sext i32 %1 to i64
	%4 = icmp eq i32 %1, 0			%4 = icmp eq i32 %1, 0
	br i1 %4, label %28, label %5			br i1 %4, label %28, label %5

	5: ; preds = %2, %5			5: ; preds = %2, %5
	%6 = phi i64 [ %26, %5 ], [ 0, %2 ]			%6 = phi i64 [ %26, %5 ], [ 0, %2 ]
	▲ Show 20 Lines • Show All 114 Lines • ▼ Show 20 Lines

	define dso_local i64 @test_ds_multiple_chains(i8* %0, i8* %1, i32 signext %2) {			define dso_local i64 @test_ds_multiple_chains(i8* %0, i8* %1, i32 signext %2) {
	; CHECK-LABEL: test_ds_multiple_chains:			; CHECK-LABEL: test_ds_multiple_chains:
	; CHECK: addi r3, r3, 4001			; CHECK: addi r3, r3, 4001
	; CHECK: addi r4, r4, 4001			; CHECK: addi r4, r4, 4001
	; CHECK: .LBB5_2: #			; CHECK: .LBB5_2: #
	; CHECK-NEXT: ld r8, 0(r3)			; CHECK-NEXT: ld r8, 0(r3)
	; CHECK-NEXT: ldx r9, r3, r7			; CHECK-NEXT: ldx r9, r3, r7
	; CHECK-NEXT: mulld r8, r9, r8			; CHECK-NEXT: ld r10, 4(r3)
	; CHECK-NEXT: ld r9, 4(r3)			; CHECK-NEXT: ld r11, 8(r3)
	; CHECK-NEXT: mulld r8, r8, r9
	; CHECK-NEXT: ld r10, 8(r3)
	; CHECK-NEXT: addi r3, r3, 1			; CHECK-NEXT: addi r3, r3, 1
				; CHECK-NEXT: mulld r8, r9, r8
				; CHECK-NEXT: ld r12, 0(r4)
				; CHECK-NEXT: ldx r0, r4, r7
				; CHECK-NEXT: ld r30, 4(r4)
				; CHECK-NEXT: ld r9, 8(r4)
				; CHECK-NEXT: addi r4, r4, 1
	; CHECK-NEXT: mulld r8, r8, r10			; CHECK-NEXT: mulld r8, r8, r10
	; CHECK-NEXT: ld r11, 0(r4)
	; CHECK-NEXT: mulld r8, r8, r11			; CHECK-NEXT: mulld r8, r8, r11
	; CHECK-NEXT: ldx r12, r4, r7
	; CHECK-NEXT: mulld r8, r8, r12			; CHECK-NEXT: mulld r8, r8, r12
	; CHECK-NEXT: ld r0, 4(r4)
	; CHECK-NEXT: mulld r8, r8, r0			; CHECK-NEXT: mulld r8, r8, r0
	; CHECK-NEXT: ld r30, 8(r4)			; CHECK-NEXT: mulld r8, r8, r30
	; CHECK-NEXT: addi r4, r4, 1			; CHECK-NEXT: maddld r6, r8, r9, r6
	; CHECK-NEXT: maddld r6, r8, r30, r6
	; CHECK-NEXT: bdnz .LBB5_2			; CHECK-NEXT: bdnz .LBB5_2
	%4 = sext i32 %2 to i64			%4 = sext i32 %2 to i64
	%5 = icmp eq i32 %2, 0			%5 = icmp eq i32 %2, 0
	br i1 %5, label %45, label %6			br i1 %5, label %45, label %6

	6: ; preds = %3, %6			6: ; preds = %3, %6
	%7 = phi i64 [ %43, %6 ], [ 0, %3 ]			%7 = phi i64 [ %43, %6 ], [ 0, %3 ]
	%8 = phi i64 [ %42, %6 ], [ 0, %3 ]			%8 = phi i64 [ %42, %6 ], [ 0, %3 ]
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	; CHECK: addi r6, r3, 4009			; CHECK: addi r6, r3, 4009
	; CHECK: .LBB6_2: #			; CHECK: .LBB6_2: #
	; CHECK-NEXT: ldx r0, r6, r8			; CHECK-NEXT: ldx r0, r6, r8
	; CHECK-NEXT: add r28, r0, r28			; CHECK-NEXT: add r28, r0, r28
	; CHECK-NEXT: ld r0, -8(r6)			; CHECK-NEXT: ld r0, -8(r6)
	; CHECK-NEXT: add r29, r0, r29			; CHECK-NEXT: add r29, r0, r29
	; CHECK-NEXT: .LBB6_3: #			; CHECK-NEXT: .LBB6_3: #
	; CHECK-NEXT: mulld r0, r29, r28			; CHECK-NEXT: mulld r0, r29, r28
				; CHECK-NEXT: addi r6, r6, 1
	; CHECK-NEXT: mulld r0, r0, r30			; CHECK-NEXT: mulld r0, r0, r30
	; CHECK-NEXT: mulld r0, r0, r12			; CHECK-NEXT: mulld r0, r0, r12
	; CHECK-NEXT: mulld r0, r0, r11			; CHECK-NEXT: mulld r0, r0, r11
	; CHECK-NEXT: maddld r3, r0, r7, r3			; CHECK-NEXT: maddld r3, r0, r7, r3
	; CHECK-NEXT: addi r6, r6, 1
	; CHECK-NEXT: bdz .LBB6_9			; CHECK-NEXT: bdz .LBB6_9
	; CHECK-NEXT: .LBB6_4: #			; CHECK-NEXT: .LBB6_4: #
	; CHECK-NEXT: lbzu r0, 1(r5)			; CHECK-NEXT: lbzu r0, 1(r5)
	; CHECK-NEXT: clrldi r27, r0, 32			; CHECK-NEXT: clrldi r27, r0, 32
	; CHECK-NEXT: mulld r27, r27, r4			; CHECK-NEXT: mulld r27, r27, r4
	; CHECK-NEXT: rldicl r27, r27, 31, 33			; CHECK-NEXT: rldicl r27, r27, 31, 33
	; CHECK-NEXT: slwi r26, r27, 1			; CHECK-NEXT: slwi r26, r27, 1
	; CHECK-NEXT: add r27, r27, r26			; CHECK-NEXT: add r27, r27, r26
	▲ Show 20 Lines • Show All 189 Lines • ▼ Show 20 Lines
	define float @test_ds_combine_float_int(i8* %0, i32 signext %1) {			define float @test_ds_combine_float_int(i8* %0, i32 signext %1) {
	; CHECK-LABEL: test_ds_combine_float_int:			; CHECK-LABEL: test_ds_combine_float_int:
	; CHECK: addi r3, r3, 4002			; CHECK: addi r3, r3, 4002
	; CHECK: .LBB8_2: #			; CHECK: .LBB8_2: #
	; CHECK-NEXT: lfd f4, 0(r3)			; CHECK-NEXT: lfd f4, 0(r3)
	; CHECK-NEXT: lfsx f0, r3, r4			; CHECK-NEXT: lfsx f0, r3, r4
	; CHECK-NEXT: xscvuxdsp f4, f4			; CHECK-NEXT: xscvuxdsp f4, f4
	; CHECK-NEXT: lfs f2, 20(r3)			; CHECK-NEXT: lfs f2, 20(r3)
	; CHECK-NEXT: xsmulsp f0, f0, f4
	; CHECK-NEXT: xsmulsp f0, f2, f0
	; CHECK-NEXT: lfs f3, 60(r3)			; CHECK-NEXT: lfs f3, 60(r3)
	; CHECK-NEXT: addi r3, r3, 1			; CHECK-NEXT: addi r3, r3, 1
				; CHECK-NEXT: xsmulsp f0, f0, f4
				; CHECK-NEXT: xsmulsp f0, f2, f0
	; CHECK-NEXT: xsmulsp f0, f3, f0			; CHECK-NEXT: xsmulsp f0, f3, f0
	; CHECK-NEXT: xsaddsp f1, f1, f0			; CHECK-NEXT: xsaddsp f1, f1, f0
	; CHECK-NEXT: bdnz .LBB8_2			; CHECK-NEXT: bdnz .LBB8_2
	%3 = icmp sgt i32 %1, 0			%3 = icmp sgt i32 %1, 0
	br i1 %3, label %4, label %29			br i1 %3, label %4, label %29

	4: ; preds = %2			4: ; preds = %2
	%5 = zext i32 %1 to i64			%5 = zext i32 %1 to i64
	▲ Show 20 Lines • Show All 102 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/machine-pre.ll

	Show First 20 Lines • Show All 105 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: cmplwi r3, 0			; CHECK-P9-NEXT: cmplwi r3, 0
	; CHECK-P9-NEXT: bne cr0, .LBB1_3			; CHECK-P9-NEXT: bne cr0, .LBB1_3
	; CHECK-P9-NEXT: # %bb.6: # %sw.bb			; CHECK-P9-NEXT: # %bb.6: # %sw.bb
	; CHECK-P9-NEXT: #			; CHECK-P9-NEXT: #
	; CHECK-P9-NEXT: mulli r3, r29, 13			; CHECK-P9-NEXT: mulli r3, r29, 13
	; CHECK-P9-NEXT: b .LBB1_2			; CHECK-P9-NEXT: b .LBB1_2
	; CHECK-P9-NEXT: .LBB1_7: # %while.end			; CHECK-P9-NEXT: .LBB1_7: # %while.end
	; CHECK-P9-NEXT: lis r3, -13108			; CHECK-P9-NEXT: lis r3, -13108
	; CHECK-P9-NEXT: ori r3, r3, 52429
	; CHECK-P9-NEXT: mullw r3, r28, r3
	; CHECK-P9-NEXT: lis r4, 13107			; CHECK-P9-NEXT: lis r4, 13107
				; CHECK-P9-NEXT: ori r3, r3, 52429
	; CHECK-P9-NEXT: ori r4, r4, 13108			; CHECK-P9-NEXT: ori r4, r4, 13108
				; CHECK-P9-NEXT: mullw r3, r28, r3
	; CHECK-P9-NEXT: cmplw r3, r4			; CHECK-P9-NEXT: cmplw r3, r4
	; CHECK-P9-NEXT: blt cr0, .LBB1_9			; CHECK-P9-NEXT: blt cr0, .LBB1_9
	; CHECK-P9-NEXT: # %bb.8: # %if.then8			; CHECK-P9-NEXT: # %bb.8: # %if.then8
	; CHECK-P9-NEXT: mulli r3, r29, 13			; CHECK-P9-NEXT: mulli r3, r29, 13
	; CHECK-P9-NEXT: mulli r5, r30, 23			; CHECK-P9-NEXT: mulli r5, r30, 23
	; CHECK-P9-NEXT: extsw r4, r28			; CHECK-P9-NEXT: extsw r4, r28
	; CHECK-P9-NEXT: extsw r3, r3			; CHECK-P9-NEXT: extsw r3, r3
	; CHECK-P9-NEXT: extsw r5, r5			; CHECK-P9-NEXT: extsw r5, r5
	▲ Show 20 Lines • Show All 67 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/mi-peephole-splat.ll

	Show First 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; CHECK-P9LE-NEXT: # kill: def $f1 killed $f1 def $vsl1			; CHECK-P9LE-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; CHECK-P9LE-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; CHECK-P9LE-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; CHECK-P9LE-NEXT: xxswapd 1, 63			; CHECK-P9LE-NEXT: xxswapd 1, 63
	; CHECK-P9LE-NEXT: # kill: def $f1 killed $f1 killed $vsl1			; CHECK-P9LE-NEXT: # kill: def $f1 killed $f1 killed $vsl1
	; CHECK-P9LE-NEXT: bl rint			; CHECK-P9LE-NEXT: bl rint
	; CHECK-P9LE-NEXT: nop			; CHECK-P9LE-NEXT: nop
	; CHECK-P9LE-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; CHECK-P9LE-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; CHECK-P9LE-NEXT: # kill: def $f1 killed $f1 def $vsl1			; CHECK-P9LE-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; CHECK-P9LE-NEXT: xxmrghd 0, 0, 1
	; CHECK-P9LE-NEXT: lxv 63, 48(1) # 16-byte Folded Reload			; CHECK-P9LE-NEXT: lxv 63, 48(1) # 16-byte Folded Reload
				; CHECK-P9LE-NEXT: xxmrghd 0, 0, 1
	; CHECK-P9LE-NEXT: xxswapd 1, 0			; CHECK-P9LE-NEXT: xxswapd 1, 0
	; CHECK-P9LE-NEXT: xssubdp 1, 1, 0			; CHECK-P9LE-NEXT: xssubdp 1, 1, 0
	; CHECK-P9LE-NEXT: addi 1, 1, 64			; CHECK-P9LE-NEXT: addi 1, 1, 64
	; CHECK-P9LE-NEXT: ld 0, 16(1)			; CHECK-P9LE-NEXT: ld 0, 16(1)
	; CHECK-P9LE-NEXT: mtlr 0			; CHECK-P9LE-NEXT: mtlr 0
	; CHECK-P9LE-NEXT: blr			; CHECK-P9LE-NEXT: blr
	;			;
	; CHECK-P9BE-LABEL: splat_swap:			; CHECK-P9BE-LABEL: splat_swap:
	Show All 9 Lines
	; CHECK-P9BE-NEXT: # kill: def $f1 killed $f1 def $vsl1			; CHECK-P9BE-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; CHECK-P9BE-NEXT: stxv 1, 112(1) # 16-byte Folded Spill			; CHECK-P9BE-NEXT: stxv 1, 112(1) # 16-byte Folded Spill
	; CHECK-P9BE-NEXT: xxswapd 1, 63			; CHECK-P9BE-NEXT: xxswapd 1, 63
	; CHECK-P9BE-NEXT: # kill: def $f1 killed $f1 killed $vsl1			; CHECK-P9BE-NEXT: # kill: def $f1 killed $f1 killed $vsl1
	; CHECK-P9BE-NEXT: bl rint			; CHECK-P9BE-NEXT: bl rint
	; CHECK-P9BE-NEXT: nop			; CHECK-P9BE-NEXT: nop
	; CHECK-P9BE-NEXT: lxv 0, 112(1) # 16-byte Folded Reload			; CHECK-P9BE-NEXT: lxv 0, 112(1) # 16-byte Folded Reload
	; CHECK-P9BE-NEXT: # kill: def $f1 killed $f1 def $vsl1			; CHECK-P9BE-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; CHECK-P9BE-NEXT: xxmrghd 0, 0, 1
	; CHECK-P9BE-NEXT: lxv 63, 128(1) # 16-byte Folded Reload			; CHECK-P9BE-NEXT: lxv 63, 128(1) # 16-byte Folded Reload
				; CHECK-P9BE-NEXT: xxmrghd 0, 0, 1
	; CHECK-P9BE-NEXT: xxswapd 1, 0			; CHECK-P9BE-NEXT: xxswapd 1, 0
	; CHECK-P9BE-NEXT: xssubdp 1, 0, 1			; CHECK-P9BE-NEXT: xssubdp 1, 0, 1
	; CHECK-P9BE-NEXT: addi 1, 1, 144			; CHECK-P9BE-NEXT: addi 1, 1, 144
	; CHECK-P9BE-NEXT: ld 0, 16(1)			; CHECK-P9BE-NEXT: ld 0, 16(1)
	; CHECK-P9BE-NEXT: mtlr 0			; CHECK-P9BE-NEXT: mtlr 0
	; CHECK-P9BE-NEXT: blr			; CHECK-P9BE-NEXT: blr
	%added = fadd <2 x double> %x, %y			%added = fadd <2 x double> %x, %y
	%call = tail call <2 x double> @llvm.rint.v2f64(<2 x double> %added) nounwind readnone			%call = tail call <2 x double> @llvm.rint.v2f64(<2 x double> %added) nounwind readnone
	%res1 = extractelement <2 x double> %call, i32 0			%res1 = extractelement <2 x double> %call, i32 0
	%res2 = extractelement <2 x double> %call, i32 1			%res2 = extractelement <2 x double> %call, i32 1
	%ret = fsub double %res1, %res2			%ret = fsub double %res1, %res2
	ret double %ret			ret double %ret
	}			}

	declare <2 x double> @llvm.rint.v2f64(<2 x double>)			declare <2 x double> @llvm.rint.v2f64(<2 x double>)

llvm/test/CodeGen/PowerPC/ppcf128-constrained-fp-intrinsics.ll

	Show First 20 Lines • Show All 1,392 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: stfd 31, -8(1) # 8-byte Folded Spill			; PC64LE9-NEXT: stfd 31, -8(1) # 8-byte Folded Spill
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -80(1)			; PC64LE9-NEXT: stdu 1, -80(1)
	; PC64LE9-NEXT: lfs 31, 0(3)			; PC64LE9-NEXT: lfs 31, 0(3)
	; PC64LE9-NEXT: mr 29, 3			; PC64LE9-NEXT: mr 29, 3
	; PC64LE9-NEXT: li 3, 0			; PC64LE9-NEXT: li 3, 0
	; PC64LE9-NEXT: xxlxor 2, 2, 2			; PC64LE9-NEXT: xxlxor 2, 2, 2
	; PC64LE9-NEXT: xxlxor 4, 4, 4			; PC64LE9-NEXT: xxlxor 4, 4, 4
				; PC64LE9-NEXT: mr 30, 4
	; PC64LE9-NEXT: std 3, 8(4)			; PC64LE9-NEXT: std 3, 8(4)
	; PC64LE9-NEXT: fmr 1, 31			; PC64LE9-NEXT: fmr 1, 31
	; PC64LE9-NEXT: fmr 3, 31			; PC64LE9-NEXT: fmr 3, 31
	; PC64LE9-NEXT: mr 30, 4
	; PC64LE9-NEXT: stfd 31, 0(4)			; PC64LE9-NEXT: stfd 31, 0(4)
	; PC64LE9-NEXT: bl __gcc_qadd			; PC64LE9-NEXT: bl __gcc_qadd
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: fmr 3, 1			; PC64LE9-NEXT: fmr 3, 1
	; PC64LE9-NEXT: fmr 4, 2			; PC64LE9-NEXT: fmr 4, 2
	; PC64LE9-NEXT: fmr 30, 2			; PC64LE9-NEXT: fmr 30, 2
	; PC64LE9-NEXT: fmr 29, 1			; PC64LE9-NEXT: fmr 29, 1
	; PC64LE9-NEXT: stfd 2, 24(30)			; PC64LE9-NEXT: stfd 2, 24(30)
	▲ Show 20 Lines • Show All 151 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/pre-inc-disable.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mcpu=pwr9 -O3 -verify-machineinstrs -ppc-vsr-nums-as-vr \		; RUN: llc -mcpu=pwr9 -O3 -verify-machineinstrs -ppc-vsr-nums-as-vr \
; RUN: -ppc-asm-full-reg-names -mtriple=powerpc64le-unknown-linux-gnu \		; RUN: -ppc-asm-full-reg-names -mtriple=powerpc64le-unknown-linux-gnu \
; RUN: < %s \| FileCheck %s		; RUN: < %s \| FileCheck %s

; RUN: llc -mcpu=pwr9 -O3 -verify-machineinstrs -ppc-vsr-nums-as-vr \		; RUN: llc -mcpu=pwr9 -O3 -verify-machineinstrs -ppc-vsr-nums-as-vr \
; RUN: -ppc-asm-full-reg-names -mtriple=powerpc64-unknown-linux-gnu \		; RUN: -ppc-asm-full-reg-names -mtriple=powerpc64-unknown-linux-gnu \
; RUN: < %s \| FileCheck %s --check-prefix=P9BE		; RUN: < %s \| FileCheck %s --check-prefix=P9BE

; Function Attrs: norecurse nounwind readonly		; Function Attrs: norecurse nounwind readonly
define signext i32 @test_pre_inc_disable_1(i8* nocapture readonly %pix1, i32 signext %i_stride_pix1, i8* nocapture readonly %pix2) {		define signext i32 @test_pre_inc_disable_1(i8* nocapture readonly %pix1, i32 signext %i_stride_pix1, i8* nocapture readonly %pix2) {
; CHECK-LABEL: test_pre_inc_disable_1:		; CHECK-LABEL: test_pre_inc_disable_1:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: lfd f0, 0(r5)		; CHECK-NEXT: lfd f0, 0(r5)
; CHECK-NEXT: addis r5, r2, .LCPI0_0@toc@ha		; CHECK-NEXT: addis r5, r2, .LCPI0_0@toc@ha
		; CHECK-NEXT: xxlxor v3, v3, v3
		; CHECK-NEXT: li r6, 0
		; CHECK-NEXT: xxpermdi v5, f0, f0, 2
; CHECK-NEXT: addi r5, r5, .LCPI0_0@toc@l		; CHECK-NEXT: addi r5, r5, .LCPI0_0@toc@l
; CHECK-NEXT: lxvx v2, 0, r5		; CHECK-NEXT: lxvx v2, 0, r5
; CHECK-NEXT: addis r5, r2, .LCPI0_1@toc@ha		; CHECK-NEXT: addis r5, r2, .LCPI0_1@toc@ha
; CHECK-NEXT: addi r5, r5, .LCPI0_1@toc@l		; CHECK-NEXT: addi r5, r5, .LCPI0_1@toc@l
; CHECK-NEXT: lxvx v4, 0, r5		; CHECK-NEXT: lxvx v4, 0, r5
; CHECK-NEXT: xxpermdi v5, f0, f0, 2
; CHECK-NEXT: xxlxor v3, v3, v3
; CHECK-NEXT: li r5, 4		; CHECK-NEXT: li r5, 4
; CHECK-NEXT: vperm v0, v3, v5, v2		; CHECK-NEXT: vperm v0, v3, v5, v2
; CHECK-NEXT: mtctr r5		; CHECK-NEXT: mtctr r5
; CHECK-NEXT: li r5, 0		; CHECK-NEXT: li r5, 0
; CHECK-NEXT: vperm v1, v5, v3, v4		; CHECK-NEXT: vperm v1, v5, v3, v4
; CHECK-NEXT: li r6, 0
; CHECK-NEXT: xvnegsp v5, v0		; CHECK-NEXT: xvnegsp v5, v0
; CHECK-NEXT: xvnegsp v0, v1		; CHECK-NEXT: xvnegsp v0, v1
; CHECK-NEXT: .p2align 4		; CHECK-NEXT: .p2align 4
; CHECK-NEXT: .LBB0_1: # %for.cond1.preheader		; CHECK-NEXT: .LBB0_1: # %for.cond1.preheader
; CHECK-NEXT: #		; CHECK-NEXT: #
; CHECK-NEXT: lfd f0, 0(r3)		; CHECK-NEXT: lfd f0, 0(r3)
		; CHECK-NEXT: add r7, r3, r4
; CHECK-NEXT: xxpermdi v1, f0, f0, 2		; CHECK-NEXT: xxpermdi v1, f0, f0, 2
; CHECK-NEXT: lfdx f0, r3, r4		; CHECK-NEXT: lfdx f0, r3, r4
; CHECK-NEXT: vperm v6, v1, v3, v4		; CHECK-NEXT: vperm v6, v1, v3, v4
; CHECK-NEXT: vperm v1, v3, v1, v2		; CHECK-NEXT: vperm v1, v3, v1, v2
; CHECK-NEXT: xvnegsp v1, v1		; CHECK-NEXT: xvnegsp v1, v1
; CHECK-NEXT: add r7, r3, r4
; CHECK-NEXT: xvnegsp v6, v6		; CHECK-NEXT: xvnegsp v6, v6
; CHECK-NEXT: vabsduw v1, v1, v5		; CHECK-NEXT: vabsduw v1, v1, v5
; CHECK-NEXT: vabsduw v6, v6, v0		; CHECK-NEXT: vabsduw v6, v6, v0
; CHECK-NEXT: vadduwm v1, v6, v1		; CHECK-NEXT: vadduwm v1, v6, v1
; CHECK-NEXT: xxswapd v6, v1		; CHECK-NEXT: xxswapd v6, v1
; CHECK-NEXT: vadduwm v1, v1, v6		; CHECK-NEXT: vadduwm v1, v1, v6
; CHECK-NEXT: xxspltw v6, v1, 2		; CHECK-NEXT: xxspltw v6, v1, 2
; CHECK-NEXT: vadduwm v1, v1, v6		; CHECK-NEXT: vadduwm v1, v1, v6
Show All 18 Lines
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: extsw r3, r6		; CHECK-NEXT: extsw r3, r6
; CHECK-NEXT: blr		; CHECK-NEXT: blr
;		;
; P9BE-LABEL: test_pre_inc_disable_1:		; P9BE-LABEL: test_pre_inc_disable_1:
; P9BE: # %bb.0: # %entry		; P9BE: # %bb.0: # %entry
; P9BE-NEXT: lfd f0, 0(r5)		; P9BE-NEXT: lfd f0, 0(r5)
; P9BE-NEXT: addis r5, r2, .LCPI0_0@toc@ha		; P9BE-NEXT: addis r5, r2, .LCPI0_0@toc@ha
		; P9BE-NEXT: xxlxor v3, v3, v3
		; P9BE-NEXT: li r6, 0
; P9BE-NEXT: addi r5, r5, .LCPI0_0@toc@l		; P9BE-NEXT: addi r5, r5, .LCPI0_0@toc@l
; P9BE-NEXT: lxvx v2, 0, r5		; P9BE-NEXT: lxvx v2, 0, r5
; P9BE-NEXT: addis r5, r2, .LCPI0_1@toc@ha		; P9BE-NEXT: addis r5, r2, .LCPI0_1@toc@ha
		; P9BE-NEXT: xxlor v5, vs0, vs0
; P9BE-NEXT: addi r5, r5, .LCPI0_1@toc@l		; P9BE-NEXT: addi r5, r5, .LCPI0_1@toc@l
; P9BE-NEXT: lxvx v4, 0, r5		; P9BE-NEXT: lxvx v4, 0, r5
; P9BE-NEXT: li r5, 4		; P9BE-NEXT: li r5, 4
; P9BE-NEXT: xxlor v5, vs0, vs0
; P9BE-NEXT: xxlxor v3, v3, v3
; P9BE-NEXT: vperm v0, v3, v5, v2		; P9BE-NEXT: vperm v0, v3, v5, v2
; P9BE-NEXT: mtctr r5		; P9BE-NEXT: mtctr r5
; P9BE-NEXT: li r5, 0		; P9BE-NEXT: li r5, 0
; P9BE-NEXT: vperm v1, v3, v5, v4		; P9BE-NEXT: vperm v1, v3, v5, v4
; P9BE-NEXT: li r6, 0
; P9BE-NEXT: xvnegsp v5, v0		; P9BE-NEXT: xvnegsp v5, v0
; P9BE-NEXT: xvnegsp v0, v1		; P9BE-NEXT: xvnegsp v0, v1
; P9BE-NEXT: .p2align 4		; P9BE-NEXT: .p2align 4
; P9BE-NEXT: .LBB0_1: # %for.cond1.preheader		; P9BE-NEXT: .LBB0_1: # %for.cond1.preheader
; P9BE-NEXT: #		; P9BE-NEXT: #
; P9BE-NEXT: lfd f0, 0(r3)		; P9BE-NEXT: lfd f0, 0(r3)
		; P9BE-NEXT: add r7, r3, r4
; P9BE-NEXT: xxlor v1, vs0, vs0		; P9BE-NEXT: xxlor v1, vs0, vs0
; P9BE-NEXT: lfdx f0, r3, r4		; P9BE-NEXT: lfdx f0, r3, r4
; P9BE-NEXT: vperm v6, v3, v1, v4		; P9BE-NEXT: vperm v6, v3, v1, v4
; P9BE-NEXT: vperm v1, v3, v1, v2		; P9BE-NEXT: vperm v1, v3, v1, v2
; P9BE-NEXT: xvnegsp v1, v1		; P9BE-NEXT: xvnegsp v1, v1
; P9BE-NEXT: xvnegsp v6, v6		; P9BE-NEXT: xvnegsp v6, v6
; P9BE-NEXT: vabsduw v1, v1, v5		; P9BE-NEXT: vabsduw v1, v1, v5
; P9BE-NEXT: vabsduw v6, v6, v0		; P9BE-NEXT: vabsduw v6, v6, v0
; P9BE-NEXT: vadduwm v1, v6, v1		; P9BE-NEXT: vadduwm v1, v6, v1
; P9BE-NEXT: xxswapd v6, v1		; P9BE-NEXT: xxswapd v6, v1
; P9BE-NEXT: vadduwm v1, v1, v6		; P9BE-NEXT: vadduwm v1, v1, v6
; P9BE-NEXT: xxspltw v6, v1, 1		; P9BE-NEXT: xxspltw v6, v1, 1
; P9BE-NEXT: vadduwm v1, v1, v6		; P9BE-NEXT: vadduwm v1, v1, v6
; P9BE-NEXT: xxlor v6, vs0, vs0		; P9BE-NEXT: xxlor v6, vs0, vs0
; P9BE-NEXT: vperm v7, v3, v6, v4		; P9BE-NEXT: vperm v7, v3, v6, v4
; P9BE-NEXT: vperm v6, v3, v6, v2		; P9BE-NEXT: vperm v6, v3, v6, v2
; P9BE-NEXT: add r7, r3, r4
; P9BE-NEXT: vextuwlx r3, r5, v1		; P9BE-NEXT: vextuwlx r3, r5, v1
; P9BE-NEXT: xvnegsp v6, v6		; P9BE-NEXT: xvnegsp v6, v6
		; P9BE-NEXT: add r6, r3, r6
; P9BE-NEXT: xvnegsp v1, v7		; P9BE-NEXT: xvnegsp v1, v7
; P9BE-NEXT: vabsduw v1, v1, v0		; P9BE-NEXT: add r3, r7, r4
; P9BE-NEXT: vabsduw v6, v6, v5		; P9BE-NEXT: vabsduw v6, v6, v5
		; P9BE-NEXT: vabsduw v1, v1, v0
; P9BE-NEXT: vadduwm v1, v1, v6		; P9BE-NEXT: vadduwm v1, v1, v6
; P9BE-NEXT: xxswapd v6, v1		; P9BE-NEXT: xxswapd v6, v1
; P9BE-NEXT: add r6, r3, r6
; P9BE-NEXT: vadduwm v1, v1, v6		; P9BE-NEXT: vadduwm v1, v1, v6
; P9BE-NEXT: xxspltw v6, v1, 1		; P9BE-NEXT: xxspltw v6, v1, 1
; P9BE-NEXT: vadduwm v1, v1, v6		; P9BE-NEXT: vadduwm v1, v1, v6
; P9BE-NEXT: vextuwlx r8, r5, v1		; P9BE-NEXT: vextuwlx r8, r5, v1
; P9BE-NEXT: add r3, r7, r4
; P9BE-NEXT: add r6, r8, r6		; P9BE-NEXT: add r6, r8, r6
; P9BE-NEXT: bdnz .LBB0_1		; P9BE-NEXT: bdnz .LBB0_1
; P9BE-NEXT: # %bb.2: # %for.cond.cleanup		; P9BE-NEXT: # %bb.2: # %for.cond.cleanup
; P9BE-NEXT: extsw r3, r6		; P9BE-NEXT: extsw r3, r6
; P9BE-NEXT: blr		; P9BE-NEXT: blr
entry:		entry:
%idx.ext = sext i32 %i_stride_pix1 to i64		%idx.ext = sext i32 %i_stride_pix1 to i64
%0 = bitcast i8* %pix2 to <8 x i8>*		%0 = bitcast i8* %pix2 to <8 x i8>*
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
}		}

; Function Attrs: norecurse nounwind readonly		; Function Attrs: norecurse nounwind readonly
define signext i32 @test_pre_inc_disable_2(i8* nocapture readonly %pix1, i8* nocapture readonly %pix2) {		define signext i32 @test_pre_inc_disable_2(i8* nocapture readonly %pix1, i8* nocapture readonly %pix2) {
; CHECK-LABEL: test_pre_inc_disable_2:		; CHECK-LABEL: test_pre_inc_disable_2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: lfd f0, 0(r3)		; CHECK-NEXT: lfd f0, 0(r3)
; CHECK-NEXT: addis r3, r2, .LCPI1_0@toc@ha		; CHECK-NEXT: addis r3, r2, .LCPI1_0@toc@ha
		; CHECK-NEXT: xxlxor v3, v3, v3
; CHECK-NEXT: addi r3, r3, .LCPI1_0@toc@l		; CHECK-NEXT: addi r3, r3, .LCPI1_0@toc@l
; CHECK-NEXT: lxvx v4, 0, r3		; CHECK-NEXT: lxvx v4, 0, r3
; CHECK-NEXT: addis r3, r2, .LCPI1_1@toc@ha		; CHECK-NEXT: addis r3, r2, .LCPI1_1@toc@ha
; CHECK-NEXT: xxpermdi v2, f0, f0, 2		; CHECK-NEXT: xxpermdi v2, f0, f0, 2
; CHECK-NEXT: lfd f0, 0(r4)		; CHECK-NEXT: lfd f0, 0(r4)
; CHECK-NEXT: addi r3, r3, .LCPI1_1@toc@l		; CHECK-NEXT: addi r3, r3, .LCPI1_1@toc@l
; CHECK-NEXT: xxlxor v3, v3, v3
; CHECK-NEXT: lxvx v0, 0, r3		; CHECK-NEXT: lxvx v0, 0, r3
; CHECK-NEXT: xxpermdi v1, f0, f0, 2		; CHECK-NEXT: xxpermdi v1, f0, f0, 2
		; CHECK-NEXT: li r3, 0
; CHECK-NEXT: vperm v5, v2, v3, v4		; CHECK-NEXT: vperm v5, v2, v3, v4
; CHECK-NEXT: vperm v2, v3, v2, v0		; CHECK-NEXT: vperm v2, v3, v2, v0
; CHECK-NEXT: vperm v0, v3, v1, v0		; CHECK-NEXT: vperm v0, v3, v1, v0
; CHECK-NEXT: vperm v3, v1, v3, v4		; CHECK-NEXT: vperm v3, v1, v3, v4
; CHECK-NEXT: vabsduw v2, v2, v0		; CHECK-NEXT: vabsduw v2, v2, v0
; CHECK-NEXT: vabsduw v3, v5, v3		; CHECK-NEXT: vabsduw v3, v5, v3
; CHECK-NEXT: vadduwm v2, v3, v2		; CHECK-NEXT: vadduwm v2, v3, v2
; CHECK-NEXT: xxswapd v3, v2		; CHECK-NEXT: xxswapd v3, v2
; CHECK-NEXT: li r3, 0
; CHECK-NEXT: vadduwm v2, v2, v3		; CHECK-NEXT: vadduwm v2, v2, v3
; CHECK-NEXT: xxspltw v3, v2, 2		; CHECK-NEXT: xxspltw v3, v2, 2
; CHECK-NEXT: vadduwm v2, v2, v3		; CHECK-NEXT: vadduwm v2, v2, v3
; CHECK-NEXT: vextuwrx r3, r3, v2		; CHECK-NEXT: vextuwrx r3, r3, v2
; CHECK-NEXT: extsw r3, r3		; CHECK-NEXT: extsw r3, r3
; CHECK-NEXT: blr		; CHECK-NEXT: blr
;		;
; P9BE-LABEL: test_pre_inc_disable_2:		; P9BE-LABEL: test_pre_inc_disable_2:
; P9BE: # %bb.0: # %entry		; P9BE: # %bb.0: # %entry
; P9BE-NEXT: lfd f0, 0(r3)		; P9BE-NEXT: lfd f0, 0(r3)
; P9BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha		; P9BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
		; P9BE-NEXT: xxlxor v3, v3, v3
; P9BE-NEXT: addi r3, r3, .LCPI1_0@toc@l		; P9BE-NEXT: addi r3, r3, .LCPI1_0@toc@l
; P9BE-NEXT: lxvx v4, 0, r3		; P9BE-NEXT: lxvx v4, 0, r3
; P9BE-NEXT: addis r3, r2, .LCPI1_1@toc@ha		; P9BE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
; P9BE-NEXT: addi r3, r3, .LCPI1_1@toc@l		; P9BE-NEXT: addi r3, r3, .LCPI1_1@toc@l
; P9BE-NEXT: xxlor v2, vs0, vs0		; P9BE-NEXT: xxlor v2, vs0, vs0
; P9BE-NEXT: lfd f0, 0(r4)		; P9BE-NEXT: lfd f0, 0(r4)
; P9BE-NEXT: lxvx v0, 0, r3		; P9BE-NEXT: lxvx v0, 0, r3
; P9BE-NEXT: xxlxor v3, v3, v3
; P9BE-NEXT: xxlor v1, vs0, vs0		; P9BE-NEXT: xxlor v1, vs0, vs0
		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vperm v5, v3, v2, v4		; P9BE-NEXT: vperm v5, v3, v2, v4
; P9BE-NEXT: vperm v2, v3, v2, v0		; P9BE-NEXT: vperm v2, v3, v2, v0
; P9BE-NEXT: vperm v0, v3, v1, v0		; P9BE-NEXT: vperm v0, v3, v1, v0
; P9BE-NEXT: vperm v3, v3, v1, v4		; P9BE-NEXT: vperm v3, v3, v1, v4
; P9BE-NEXT: vabsduw v2, v2, v0		; P9BE-NEXT: vabsduw v2, v2, v0
; P9BE-NEXT: vabsduw v3, v5, v3		; P9BE-NEXT: vabsduw v3, v5, v3
; P9BE-NEXT: vadduwm v2, v3, v2		; P9BE-NEXT: vadduwm v2, v3, v2
; P9BE-NEXT: xxswapd v3, v2		; P9BE-NEXT: xxswapd v3, v2
; P9BE-NEXT: vadduwm v2, v2, v3		; P9BE-NEXT: vadduwm v2, v2, v3
; P9BE-NEXT: xxspltw v3, v2, 1		; P9BE-NEXT: xxspltw v3, v2, 1
; P9BE-NEXT: vadduwm v2, v2, v3		; P9BE-NEXT: vadduwm v2, v2, v3
; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vextuwlx r3, r3, v2		; P9BE-NEXT: vextuwlx r3, r3, v2
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: blr		; P9BE-NEXT: blr
entry:		entry:
%0 = bitcast i8* %pix1 to <8 x i8>*		%0 = bitcast i8* %pix1 to <8 x i8>*
%1 = load <8 x i8>, <8 x i8>* %0, align 1		%1 = load <8 x i8>, <8 x i8>* %0, align 1
%2 = zext <8 x i8> %1 to <8 x i32>		%2 = zext <8 x i8> %1 to <8 x i32>
%3 = bitcast i8* %pix2 to <8 x i8>*		%3 = bitcast i8* %pix2 to <8 x i8>*
Show All 39 Lines
;}		;}

define void @test32(i8* nocapture readonly %pix2, i32 signext %i_pix2) {		define void @test32(i8* nocapture readonly %pix2, i32 signext %i_pix2) {
; CHECK-LABEL: test32:		; CHECK-LABEL: test32:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: add r5, r3, r4		; CHECK-NEXT: add r5, r3, r4
; CHECK-NEXT: lfiwzx f0, r3, r4		; CHECK-NEXT: lfiwzx f0, r3, r4
; CHECK-NEXT: addis r3, r2, .LCPI2_0@toc@ha		; CHECK-NEXT: addis r3, r2, .LCPI2_0@toc@ha
		; CHECK-NEXT: xxlxor v3, v3, v3
		; CHECK-NEXT: xxpermdi v2, f0, f0, 2
; CHECK-NEXT: addi r3, r3, .LCPI2_0@toc@l		; CHECK-NEXT: addi r3, r3, .LCPI2_0@toc@l
; CHECK-NEXT: lxvx v4, 0, r3		; CHECK-NEXT: lxvx v4, 0, r3
; CHECK-NEXT: li r3, 4		; CHECK-NEXT: li r3, 4
; CHECK-NEXT: xxpermdi v2, f0, f0, 2
; CHECK-NEXT: lfiwzx f0, r5, r3		; CHECK-NEXT: lfiwzx f0, r5, r3
; CHECK-NEXT: xxlxor v3, v3, v3
; CHECK-NEXT: vperm v2, v2, v3, v4		; CHECK-NEXT: vperm v2, v2, v3, v4
; CHECK-NEXT: xxpermdi v5, f0, f0, 2		; CHECK-NEXT: xxpermdi v5, f0, f0, 2
; CHECK-NEXT: vperm v3, v5, v3, v4		; CHECK-NEXT: vperm v3, v5, v3, v4
; CHECK-NEXT: vspltisw v4, 8		; CHECK-NEXT: vspltisw v4, 8
; CHECK-NEXT: vnegw v3, v3		; CHECK-NEXT: vnegw v3, v3
; CHECK-NEXT: vadduwm v4, v4, v4		; CHECK-NEXT: vadduwm v4, v4, v4
; CHECK-NEXT: vslw v3, v3, v4		; CHECK-NEXT: vslw v3, v3, v4
; CHECK-NEXT: vsubuwm v2, v3, v2		; CHECK-NEXT: vsubuwm v2, v3, v2
; CHECK-NEXT: xxswapd vs0, v2		; CHECK-NEXT: xxswapd vs0, v2
; CHECK-NEXT: stxvx vs0, 0, r3		; CHECK-NEXT: stxvx vs0, 0, r3
; CHECK-NEXT: blr		; CHECK-NEXT: blr
;		;
; P9BE-LABEL: test32:		; P9BE-LABEL: test32:
; P9BE: # %bb.0: # %entry		; P9BE: # %bb.0: # %entry
; P9BE-NEXT: add r5, r3, r4		; P9BE-NEXT: add r5, r3, r4
; P9BE-NEXT: lfiwzx f0, r3, r4		; P9BE-NEXT: lfiwzx f0, r3, r4
; P9BE-NEXT: addis r3, r2, .LCPI2_0@toc@ha		; P9BE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
		; P9BE-NEXT: xxlxor v3, v3, v3
		; P9BE-NEXT: xxsldwi v2, f0, f0, 1
; P9BE-NEXT: addi r3, r3, .LCPI2_0@toc@l		; P9BE-NEXT: addi r3, r3, .LCPI2_0@toc@l
; P9BE-NEXT: lxvx v4, 0, r3		; P9BE-NEXT: lxvx v4, 0, r3
; P9BE-NEXT: li r3, 4		; P9BE-NEXT: li r3, 4
; P9BE-NEXT: xxsldwi v2, f0, f0, 1
; P9BE-NEXT: lfiwzx f0, r5, r3		; P9BE-NEXT: lfiwzx f0, r5, r3
; P9BE-NEXT: xxlxor v3, v3, v3
; P9BE-NEXT: vperm v2, v3, v2, v4		; P9BE-NEXT: vperm v2, v3, v2, v4
; P9BE-NEXT: xxsldwi v5, f0, f0, 1		; P9BE-NEXT: xxsldwi v5, f0, f0, 1
; P9BE-NEXT: vperm v3, v3, v5, v4		; P9BE-NEXT: vperm v3, v3, v5, v4
; P9BE-NEXT: vspltisw v4, 8		; P9BE-NEXT: vspltisw v4, 8
; P9BE-NEXT: vnegw v3, v3		; P9BE-NEXT: vnegw v3, v3
; P9BE-NEXT: vadduwm v4, v4, v4		; P9BE-NEXT: vadduwm v4, v4, v4
; P9BE-NEXT: vslw v3, v3, v4		; P9BE-NEXT: vslw v3, v3, v4
; P9BE-NEXT: vsubuwm v2, v3, v2		; P9BE-NEXT: vsubuwm v2, v3, v2
Show All 23 Lines	entry:
store <4 x i32> %13, <4 x i32>* undef, align 16		store <4 x i32> %13, <4 x i32>* undef, align 16
ret void		ret void
}		}

define void @test16(i16* nocapture readonly %sums, i32 signext %delta, i32 signext %thresh) {		define void @test16(i16* nocapture readonly %sums, i32 signext %delta, i32 signext %thresh) {
; CHECK-LABEL: test16:		; CHECK-LABEL: test16:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: sldi r4, r4, 1		; CHECK-NEXT: sldi r4, r4, 1
; CHECK-NEXT: lxsihzx v2, r3, r4
; CHECK-NEXT: vsplth v2, v2, 3
; CHECK-NEXT: xxlxor v3, v3, v3		; CHECK-NEXT: xxlxor v3, v3, v3
; CHECK-NEXT: vmrglh v2, v3, v2		; CHECK-NEXT: lxsihzx v2, r3, r4
; CHECK-NEXT: vsplth v4, v3, 7		; CHECK-NEXT: vsplth v4, v3, 7
; CHECK-NEXT: add r6, r3, r4		; CHECK-NEXT: add r6, r3, r4
; CHECK-NEXT: li r3, 16		; CHECK-NEXT: li r3, 16
		; CHECK-NEXT: vsplth v2, v2, 3
		; CHECK-NEXT: vmrglh v2, v3, v2
; CHECK-NEXT: vmrglw v2, v2, v4		; CHECK-NEXT: vmrglw v2, v2, v4
; CHECK-NEXT: lxsihzx v4, r6, r3		; CHECK-NEXT: lxsihzx v4, r6, r3
; CHECK-NEXT: addis r3, r2, .LCPI3_0@toc@ha		; CHECK-NEXT: addis r3, r2, .LCPI3_0@toc@ha
; CHECK-NEXT: addi r3, r3, .LCPI3_0@toc@l		; CHECK-NEXT: addi r3, r3, .LCPI3_0@toc@l
; CHECK-NEXT: vsplth v4, v4, 3		; CHECK-NEXT: vsplth v4, v4, 3
; CHECK-NEXT: vmrglh v3, v3, v4		; CHECK-NEXT: vmrglh v3, v3, v4
; CHECK-NEXT: lxvx v4, 0, r3		; CHECK-NEXT: lxvx v4, 0, r3
; CHECK-NEXT: li r3, 0		; CHECK-NEXT: li r3, 0
; CHECK-NEXT: vperm v2, v3, v2, v4		; CHECK-NEXT: vperm v2, v3, v2, v4
; CHECK-NEXT: xxspltw v3, v2, 2		; CHECK-NEXT: xxspltw v3, v2, 2
; CHECK-NEXT: vadduwm v2, v2, v3		; CHECK-NEXT: vadduwm v2, v2, v3
; CHECK-NEXT: vextuwrx r3, r3, v2		; CHECK-NEXT: vextuwrx r3, r3, v2
; CHECK-NEXT: cmpw cr0, r3, r5		; CHECK-NEXT: cmpw cr0, r3, r5
; CHECK-NEXT: bgelr+ cr0		; CHECK-NEXT: bgelr+ cr0
; CHECK-NEXT: # %bb.1: # %if.then		; CHECK-NEXT: # %bb.1: # %if.then
;		;
; P9BE-LABEL: test16:		; P9BE-LABEL: test16:
; P9BE: # %bb.0: # %entry		; P9BE: # %bb.0: # %entry
; P9BE-NEXT: sldi r4, r4, 1		; P9BE-NEXT: sldi r4, r4, 1
; P9BE-NEXT: add r6, r3, r4
; P9BE-NEXT: li r7, 16		; P9BE-NEXT: li r7, 16
; P9BE-NEXT: lxsihzx v2, r6, r7		; P9BE-NEXT: add r6, r3, r4
; P9BE-NEXT: lxsihzx v4, r3, r4		; P9BE-NEXT: lxsihzx v4, r3, r4
		; P9BE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
		; P9BE-NEXT: lxsihzx v2, r6, r7
; P9BE-NEXT: li r6, 0		; P9BE-NEXT: li r6, 0
		; P9BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
; P9BE-NEXT: sldi r6, r6, 48		; P9BE-NEXT: sldi r6, r6, 48
; P9BE-NEXT: vsplth v4, v4, 3		; P9BE-NEXT: vsplth v4, v4, 3
; P9BE-NEXT: mtvsrd v3, r6		; P9BE-NEXT: mtvsrd v3, r6
; P9BE-NEXT: vsplth v2, v2, 3		; P9BE-NEXT: vsplth v2, v2, 3
; P9BE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
; P9BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
; P9BE-NEXT: vmrghh v4, v3, v4		; P9BE-NEXT: vmrghh v4, v3, v4
; P9BE-NEXT: vmrghh v2, v3, v2		; P9BE-NEXT: vmrghh v2, v3, v2
; P9BE-NEXT: vsplth v3, v3, 0		; P9BE-NEXT: vsplth v3, v3, 0
; P9BE-NEXT: vmrghw v3, v3, v4		; P9BE-NEXT: vmrghw v3, v3, v4
; P9BE-NEXT: lxvx v4, 0, r3		; P9BE-NEXT: lxvx v4, 0, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vperm v2, v3, v2, v4		; P9BE-NEXT: vperm v2, v3, v2, v4
; P9BE-NEXT: xxspltw v3, v2, 1		; P9BE-NEXT: xxspltw v3, v2, 1
Show All 39 Lines
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: add r6, r3, r4		; CHECK-NEXT: add r6, r3, r4
; CHECK-NEXT: lxsibzx v2, r3, r4		; CHECK-NEXT: lxsibzx v2, r3, r4
; CHECK-NEXT: li r3, 0		; CHECK-NEXT: li r3, 0
; CHECK-NEXT: mtvsrd f0, r3		; CHECK-NEXT: mtvsrd f0, r3
; CHECK-NEXT: li r3, 8		; CHECK-NEXT: li r3, 8
; CHECK-NEXT: lxsibzx v5, r6, r3		; CHECK-NEXT: lxsibzx v5, r6, r3
; CHECK-NEXT: xxswapd v3, vs0		; CHECK-NEXT: xxswapd v3, vs0
; CHECK-NEXT: vspltb v4, v3, 15
; CHECK-NEXT: vspltb v2, v2, 7
; CHECK-NEXT: vmrglb v2, v3, v2
; CHECK-NEXT: addis r3, r2, .LCPI4_0@toc@ha		; CHECK-NEXT: addis r3, r2, .LCPI4_0@toc@ha
		; CHECK-NEXT: vspltb v2, v2, 7
; CHECK-NEXT: addi r3, r3, .LCPI4_0@toc@l		; CHECK-NEXT: addi r3, r3, .LCPI4_0@toc@l
		; CHECK-NEXT: vspltb v4, v3, 15
		; CHECK-NEXT: vmrglb v2, v3, v2
; CHECK-NEXT: vspltb v5, v5, 7		; CHECK-NEXT: vspltb v5, v5, 7
; CHECK-NEXT: vmrglh v2, v2, v4		; CHECK-NEXT: vmrglh v2, v2, v4
; CHECK-NEXT: vmrglb v3, v3, v5		; CHECK-NEXT: vmrglb v3, v3, v5
; CHECK-NEXT: vmrglw v2, v2, v4		; CHECK-NEXT: vmrglw v2, v2, v4
; CHECK-NEXT: vmrglh v3, v3, v4		; CHECK-NEXT: vmrglh v3, v3, v4
; CHECK-NEXT: vmrglw v3, v4, v3		; CHECK-NEXT: vmrglw v3, v4, v3
; CHECK-NEXT: lxvx v4, 0, r3		; CHECK-NEXT: lxvx v4, 0, r3
; CHECK-NEXT: li r3, 0		; CHECK-NEXT: li r3, 0
; CHECK-NEXT: vperm v2, v3, v2, v4		; CHECK-NEXT: vperm v2, v3, v2, v4
; CHECK-NEXT: xxspltw v3, v2, 2		; CHECK-NEXT: xxspltw v3, v2, 2
; CHECK-NEXT: vadduwm v2, v2, v3		; CHECK-NEXT: vadduwm v2, v2, v3
; CHECK-NEXT: vextuwrx r3, r3, v2		; CHECK-NEXT: vextuwrx r3, r3, v2
; CHECK-NEXT: cmpw cr0, r3, r5		; CHECK-NEXT: cmpw cr0, r3, r5
; CHECK-NEXT: bgelr+ cr0		; CHECK-NEXT: bgelr+ cr0
; CHECK-NEXT: # %bb.1: # %if.then		; CHECK-NEXT: # %bb.1: # %if.then
;		;
; P9BE-LABEL: test8:		; P9BE-LABEL: test8:
; P9BE: # %bb.0: # %entry		; P9BE: # %bb.0: # %entry
; P9BE-NEXT: add r6, r3, r4		; P9BE-NEXT: add r6, r3, r4
; P9BE-NEXT: li r7, 8		; P9BE-NEXT: li r7, 8
; P9BE-NEXT: lxsibzx v2, r6, r7
; P9BE-NEXT: lxsibzx v4, r3, r4		; P9BE-NEXT: lxsibzx v4, r3, r4
		; P9BE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
		; P9BE-NEXT: lxsibzx v2, r6, r7
; P9BE-NEXT: li r6, 0		; P9BE-NEXT: li r6, 0
		; P9BE-NEXT: addi r3, r3, .LCPI4_0@toc@l
; P9BE-NEXT: sldi r6, r6, 56		; P9BE-NEXT: sldi r6, r6, 56
; P9BE-NEXT: vspltb v4, v4, 7		; P9BE-NEXT: vspltb v4, v4, 7
; P9BE-NEXT: mtvsrd v3, r6		; P9BE-NEXT: mtvsrd v3, r6
; P9BE-NEXT: vspltb v2, v2, 7		; P9BE-NEXT: vspltb v2, v2, 7
; P9BE-NEXT: vmrghb v4, v3, v4		; P9BE-NEXT: vmrghb v4, v3, v4
; P9BE-NEXT: vmrghb v2, v3, v2		; P9BE-NEXT: vmrghb v2, v3, v2
; P9BE-NEXT: vspltb v3, v3, 0		; P9BE-NEXT: vspltb v3, v3, 0
; P9BE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
; P9BE-NEXT: addi r3, r3, .LCPI4_0@toc@l
; P9BE-NEXT: vmrghh v4, v4, v3		; P9BE-NEXT: vmrghh v4, v4, v3
; P9BE-NEXT: xxspltw v3, v3, 0		; P9BE-NEXT: xxspltw v3, v3, 0
; P9BE-NEXT: vmrghw v2, v4, v2		; P9BE-NEXT: vmrghw v2, v4, v2
; P9BE-NEXT: lxvx v4, 0, r3		; P9BE-NEXT: lxvx v4, 0, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vperm v2, v3, v2, v4		; P9BE-NEXT: vperm v2, v3, v2, v4
; P9BE-NEXT: xxspltw v3, v2, 1		; P9BE-NEXT: xxspltw v3, v2, 1
; P9BE-NEXT: vadduwm v2, v2, v3		; P9BE-NEXT: vadduwm v2, v2, v3
Show All 35 Lines

llvm/test/CodeGen/PowerPC/remove-redundant-load-imm.ll

	Show All 34 Lines

	define void @redundancy_on_ppc_and_other_targets() nounwind {			define void @redundancy_on_ppc_and_other_targets() nounwind {
	; PPC64LE-LABEL: redundancy_on_ppc_and_other_targets:			; PPC64LE-LABEL: redundancy_on_ppc_and_other_targets:
	; PPC64LE: # %bb.0:			; PPC64LE: # %bb.0:
	; PPC64LE-NEXT: mflr 0			; PPC64LE-NEXT: mflr 0
	; PPC64LE-NEXT: std 0, 16(1)			; PPC64LE-NEXT: std 0, 16(1)
	; PPC64LE-NEXT: stdu 1, -32(1)			; PPC64LE-NEXT: stdu 1, -32(1)
	; PPC64LE-NEXT: addis 3, 2, .LC0@toc@ha			; PPC64LE-NEXT: addis 3, 2, .LC0@toc@ha
	; PPC64LE-NEXT: ld 3, .LC0@toc@l(3)
	; PPC64LE-NEXT: li 4, 0			; PPC64LE-NEXT: li 4, 0
				; PPC64LE-NEXT: ld 3, .LC0@toc@l(3)
	; PPC64LE-NEXT: std 4, 0(3)			; PPC64LE-NEXT: std 4, 0(3)
	; PPC64LE-NEXT: bl barney.94			; PPC64LE-NEXT: bl barney.94
	; PPC64LE-NEXT: nop			; PPC64LE-NEXT: nop
	store i32* null, i32** @global.6			store i32* null, i32** @global.6
	call void @barney.94(i8* undef, i32 0)			call void @barney.94(i8* undef, i32 0)
	unreachable			unreachable
	}			}

llvm/test/CodeGen/PowerPC/scalar_vector_test_2.ll

Show First 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
ret void		ret void
}		}

define <1 x float>* @test_liwzx2(<1 x float>* %A, <1 x float>* %B, <1 x float>* %C) {		define <1 x float>* @test_liwzx2(<1 x float>* %A, <1 x float>* %B, <1 x float>* %C) {
; P9LE-LABEL: test_liwzx2:		; P9LE-LABEL: test_liwzx2:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: lfiwzx f0, 0, r3		; P9LE-NEXT: lfiwzx f0, 0, r3
; P9LE-NEXT: lfiwzx f1, 0, r4		; P9LE-NEXT: lfiwzx f1, 0, r4
		; P9LE-NEXT: mr r3, r5
; P9LE-NEXT: xxpermdi vs0, f0, f0, 2		; P9LE-NEXT: xxpermdi vs0, f0, f0, 2
; P9LE-NEXT: xxpermdi vs1, f1, f1, 2		; P9LE-NEXT: xxpermdi vs1, f1, f1, 2
; P9LE-NEXT: xvsubsp vs0, vs0, vs1		; P9LE-NEXT: xvsubsp vs0, vs0, vs1
; P9LE-NEXT: xxsldwi vs0, vs0, vs0, 2		; P9LE-NEXT: xxsldwi vs0, vs0, vs0, 2
; P9LE-NEXT: mr r3, r5
; P9LE-NEXT: stfiwx f0, 0, r5		; P9LE-NEXT: stfiwx f0, 0, r5
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: test_liwzx2:		; P9BE-LABEL: test_liwzx2:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: lfiwzx f0, 0, r3		; P9BE-NEXT: lfiwzx f0, 0, r3
; P9BE-NEXT: lfiwzx f1, 0, r4		; P9BE-NEXT: lfiwzx f1, 0, r4
		; P9BE-NEXT: mr r3, r5
; P9BE-NEXT: xxsldwi vs0, f0, f0, 1		; P9BE-NEXT: xxsldwi vs0, f0, f0, 1
; P9BE-NEXT: xxsldwi vs1, f1, f1, 1		; P9BE-NEXT: xxsldwi vs1, f1, f1, 1
; P9BE-NEXT: xvsubsp vs0, vs0, vs1		; P9BE-NEXT: xvsubsp vs0, vs0, vs1
; P9BE-NEXT: xxsldwi vs0, vs0, vs0, 3		; P9BE-NEXT: xxsldwi vs0, vs0, vs0, 3
; P9BE-NEXT: mr r3, r5
; P9BE-NEXT: stfiwx f0, 0, r5		; P9BE-NEXT: stfiwx f0, 0, r5
; P9BE-NEXT: blr		; P9BE-NEXT: blr
;		;
; P8LE-LABEL: test_liwzx2:		; P8LE-LABEL: test_liwzx2:
; P8LE: # %bb.0:		; P8LE: # %bb.0:
; P8LE-NEXT: lfiwzx f0, 0, r3		; P8LE-NEXT: lfiwzx f0, 0, r3
; P8LE-NEXT: lfiwzx f1, 0, r4		; P8LE-NEXT: lfiwzx f1, 0, r4
; P8LE-NEXT: mr r3, r5		; P8LE-NEXT: mr r3, r5
Show All 29 Lines

llvm/test/CodeGen/PowerPC/scalar_vector_test_4.ll

Show First 20 Lines • Show All 210 Lines • ▼ Show 20 Lines	entry:
ret <2 x float> %vecins		ret <2 x float> %vecins
}		}

; Function Attrs: norecurse nounwind readonly		; Function Attrs: norecurse nounwind readonly
define <2 x float> @s2v_test_f3(float* nocapture readonly %f64, <2 x float> %vec, i32 signext %Idx) {		define <2 x float> @s2v_test_f3(float* nocapture readonly %f64, <2 x float> %vec, i32 signext %Idx) {
; P9LE-LABEL: s2v_test_f3:		; P9LE-LABEL: s2v_test_f3:
; P9LE: # %bb.0: # %entry		; P9LE: # %bb.0: # %entry
; P9LE-NEXT: sldi r4, r7, 2		; P9LE-NEXT: sldi r4, r7, 2
; P9LE-NEXT: lfiwzx f0, r3, r4		; P9LE-DAG: lfiwzx [[F0:f0]], r3, r4
; P9LE-DAG: xxspltw v2, v2, 2		; P9LE-DAG: xxspltw v2, v2, 2
; P9LE-DAG: xxpermdi v3, f0, f0, 2		; P9LE-DAG: xxpermdi v3, [[F0]], [[F0]], 2
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr

; P9BE-LABEL: s2v_test_f3:		; P9BE-LABEL: s2v_test_f3:
; P9BE: # %bb.0: # %entry		; P9BE: # %bb.0: # %entry
; P9BE: sldi r4, r7, 2		; P9BE: sldi r4, r7, 2
; P9BE: lfiwzx f0, r3, r4		; P9BE-DAG: lfiwzx [[F0:f0]], r3, r4
; P9BE-DAG: xxspltw v2, v2, 1		; P9BE-DAG: xxspltw v2, v2, 1
; P9BE-DAG: xxsldwi v3, f0, f0, 1		; P9BE-DAG: xxsldwi v3, [[F0]], [[F0]], 1
; P9BE: vmrghw v2, v3, v2		; P9BE: vmrghw v2, v3, v2
; P9BE-NEXT: blr		; P9BE-NEXT: blr

; P8LE-LABEL: s2v_test_f3:		; P8LE-LABEL: s2v_test_f3:
; P8LE: # %bb.0: # %entry		; P8LE: # %bb.0: # %entry
; P8LE-NEXT: sldi r4, r7, 2		; P8LE-NEXT: sldi r4, r7, 2
; P8LE-NEXT: xxspltw v2, v2, 2		; P8LE-NEXT: xxspltw v2, v2, 2
; P8LE-NEXT: lfiwzx f0, r3, r4		; P8LE-NEXT: lfiwzx f0, r3, r4
Show All 17 Lines	entry:
ret <2 x float> %vecins		ret <2 x float> %vecins
}		}

; Function Attrs: norecurse nounwind readonly		; Function Attrs: norecurse nounwind readonly
define <2 x float> @s2v_test_f4(float* nocapture readonly %f64, <2 x float> %vec) {		define <2 x float> @s2v_test_f4(float* nocapture readonly %f64, <2 x float> %vec) {
; P9LE-LABEL: s2v_test_f4:		; P9LE-LABEL: s2v_test_f4:
; P9LE: # %bb.0: # %entry		; P9LE: # %bb.0: # %entry
; P9LE-NEXT: addi r3, r3, 4		; P9LE-NEXT: addi r3, r3, 4
; P9LE-NEXT: lfiwzx f0, 0, r3		; P9LE-DAG: lfiwzx [[F0:f0]], 0, r3
; P9LE-DAG: xxspltw v2, v2, 2		; P9LE-DAG: xxspltw v2, v2, 2
; P9LE-DAG: xxpermdi v3, f0, f0, 2		; P9LE-DAG: xxpermdi v3, [[F0]], [[F0]], 2
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr

; P9BE-LABEL: s2v_test_f4:		; P9BE-LABEL: s2v_test_f4:
; P9BE: # %bb.0: # %entry		; P9BE: # %bb.0: # %entry
; P9BE: addi r3, r3, 4		; P9BE: addi r3, r3, 4
; P9BE: lfiwzx f0, 0, r3		; P9BE-DAG: lfiwzx [[F0:f0]], 0, r3
; P9BE-DAG: xxspltw v2, v2, 1		; P9BE-DAG: xxspltw v2, v2, 1
; P9BE-DAG: xxsldwi v3, f0, f0, 1		; P9BE-DAG: xxsldwi v3, [[F0]], [[F0]], 1
; P9BE: vmrghw v2, v3, v2		; P9BE: vmrghw v2, v3, v2
; P9BE-NEXT: blr		; P9BE-NEXT: blr

; P8LE-LABEL: s2v_test_f4:		; P8LE-LABEL: s2v_test_f4:
; P8LE: # %bb.0: # %entry		; P8LE: # %bb.0: # %entry
; P8LE-NEXT: addi r3, r3, 4		; P8LE-NEXT: addi r3, r3, 4
; P8LE-NEXT: xxspltw v2, v2, 2		; P8LE-NEXT: xxspltw v2, v2, 2
; P8LE-NEXT: lfiwzx f0, 0, r3		; P8LE-NEXT: lfiwzx f0, 0, r3
▲ Show 20 Lines • Show All 58 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/sms-cpy-1.ll

	Show All 25 Lines
	; CHECK-NEXT: li 7, -1			; CHECK-NEXT: li 7, -1
	; CHECK-NEXT: mtctr 3			; CHECK-NEXT: mtctr 3
	; CHECK-NEXT: lbz 5, 0(5)			; CHECK-NEXT: lbz 5, 0(5)
	; CHECK-NEXT: li 3, 1			; CHECK-NEXT: li 3, 1
	; CHECK-NEXT: bdz .LBB0_6			; CHECK-NEXT: bdz .LBB0_6
	; CHECK-NEXT: # %bb.1:			; CHECK-NEXT: # %bb.1:
	; CHECK-NEXT: xori 6, 5, 84			; CHECK-NEXT: xori 6, 5, 84
	; CHECK-NEXT: clrldi 5, 7, 32			; CHECK-NEXT: clrldi 5, 7, 32
	; CHECK-NEXT: lbz 5, 0(5)
	; CHECK-NEXT: addi 3, 3, 1			; CHECK-NEXT: addi 3, 3, 1
	; CHECK-NEXT: addi 8, 7, -1			; CHECK-NEXT: addi 8, 7, -1
				; CHECK-NEXT: lbz 5, 0(5)
	; CHECK-NEXT: bdz .LBB0_5			; CHECK-NEXT: bdz .LBB0_5
	; CHECK-NEXT: # %bb.2:			; CHECK-NEXT: # %bb.2:
	; CHECK-NEXT: cntlzw 6, 6			; CHECK-NEXT: cntlzw 6, 6
				; CHECK-NEXT: addi 3, 3, 1
	; CHECK-NEXT: srwi 7, 6, 5			; CHECK-NEXT: srwi 7, 6, 5
	; CHECK-NEXT: xori 6, 5, 84			; CHECK-NEXT: xori 6, 5, 84
	; CHECK-NEXT: clrldi 5, 8, 32			; CHECK-NEXT: clrldi 5, 8, 32
	; CHECK-NEXT: addi 8, 8, -1			; CHECK-NEXT: addi 8, 8, -1
	; CHECK-NEXT: lbz 5, 0(5)			; CHECK-NEXT: lbz 5, 0(5)
	; CHECK-NEXT: addi 3, 3, 1
	; CHECK-NEXT: bdz .LBB0_4			; CHECK-NEXT: bdz .LBB0_4
	; CHECK-NEXT: .LBB0_3: #			; CHECK-NEXT: .LBB0_3: #
	; CHECK-NEXT: clrldi 10, 8, 32			; CHECK-NEXT: clrldi 10, 8, 32
	; CHECK-NEXT: cntlzw 9, 6			; CHECK-NEXT: cntlzw 9, 6
	; CHECK-NEXT: xori 6, 5, 84			; CHECK-NEXT: xori 6, 5, 84
	; CHECK-NEXT: lbz 5, 0(10)
	; CHECK-NEXT: addi 8, 8, -1			; CHECK-NEXT: addi 8, 8, -1
				; CHECK-NEXT: lbz 5, 0(10)
	; CHECK-NEXT: addi 3, 3, 1			; CHECK-NEXT: addi 3, 3, 1
	; CHECK-NEXT: add 4, 4, 7			; CHECK-NEXT: add 4, 4, 7
	; CHECK-NEXT: srwi 7, 9, 5			; CHECK-NEXT: srwi 7, 9, 5
	; CHECK-NEXT: bdnz .LBB0_3			; CHECK-NEXT: bdnz .LBB0_3
	; CHECK-NEXT: .LBB0_4:			; CHECK-NEXT: .LBB0_4:
	; CHECK-NEXT: add 4, 4, 7			; CHECK-NEXT: add 4, 4, 7
	; CHECK-NEXT: .LBB0_5:			; CHECK-NEXT: .LBB0_5:
	; CHECK-NEXT: cntlzw 6, 6			; CHECK-NEXT: cntlzw 6, 6
	; CHECK-NEXT: srwi 6, 6, 5			; CHECK-NEXT: srwi 6, 6, 5
	; CHECK-NEXT: add 4, 4, 6			; CHECK-NEXT: add 4, 4, 6
	; CHECK-NEXT: .LBB0_6:			; CHECK-NEXT: .LBB0_6:
	; CHECK-NEXT: xori 5, 5, 84			; CHECK-NEXT: xori 5, 5, 84
	; CHECK-NEXT: cntlzw 5, 5
	; CHECK-NEXT: clrldi 3, 3, 32			; CHECK-NEXT: clrldi 3, 3, 32
				; CHECK-NEXT: li 7, 0
				; CHECK-NEXT: li 8, 3
	; CHECK-NEXT: std 3, 104(1)			; CHECK-NEXT: std 3, 104(1)
				; CHECK-NEXT: cntlzw 5, 5
	; CHECK-NEXT: addis 3, 2, .LC0@toc@ha			; CHECK-NEXT: addis 3, 2, .LC0@toc@ha
				; CHECK-NEXT: li 10, 0
	; CHECK-NEXT: ld 3, .LC0@toc@l(3)			; CHECK-NEXT: ld 3, .LC0@toc@l(3)
	; CHECK-NEXT: li 7, 0
	; CHECK-NEXT: li 8, 3
	; CHECK-NEXT: srwi 5, 5, 5			; CHECK-NEXT: srwi 5, 5, 5
	; CHECK-NEXT: add 4, 4, 5			; CHECK-NEXT: add 4, 4, 5
	; CHECK-NEXT: li 5, 0			; CHECK-NEXT: li 5, 0
	; CHECK-NEXT: std 5, 120(1)			; CHECK-NEXT: std 5, 120(1)
	; CHECK-NEXT: li 5, 3			; CHECK-NEXT: li 5, 3
	; CHECK-NEXT: std 5, 96(1)
	; CHECK-NEXT: clrldi 6, 4, 32			; CHECK-NEXT: clrldi 6, 4, 32
	; CHECK-NEXT: li 4, 3			; CHECK-NEXT: li 4, 3
				; CHECK-NEXT: std 5, 96(1)
	; CHECK-NEXT: li 5, 0			; CHECK-NEXT: li 5, 0
	; CHECK-NEXT: li 10, 0
	; CHECK-NEXT: bl printf			; CHECK-NEXT: bl printf
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	%1 = load i32, i32* undef, align 4			%1 = load i32, i32* undef, align 4
	%2 = add i32 %1, -1			%2 = add i32 %1, -1
	%3 = zext i32 %2 to i64			%3 = zext i32 %2 to i64
	%4 = zext i32 3 to i64			%4 = zext i32 3 to i64
	br label %5			br label %5

	Show All 24 Lines

llvm/test/CodeGen/PowerPC/sms-grp-order.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs\			; RUN: llc < %s -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs\
	; RUN: -mcpu=pwr9 --ppc-enable-pipeliner \| FileCheck %s			; RUN: -mcpu=pwr9 --ppc-enable-pipeliner \| FileCheck %s

	define void @lame_encode_buffer_interleaved() local_unnamed_addr {			define void @lame_encode_buffer_interleaved() local_unnamed_addr {
	; CHECK-LABEL: lame_encode_buffer_interleaved:			; CHECK-LABEL: lame_encode_buffer_interleaved:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lha 3, 0(3)			; CHECK-NEXT: lha 3, 0(3)
	; CHECK-NEXT: li 5, 1			; CHECK-NEXT: li 5, 1
	; CHECK-NEXT: sldi 5, 5, 62
	; CHECK-NEXT: lhz 4, 0(0)			; CHECK-NEXT: lhz 4, 0(0)
				; CHECK-NEXT: sldi 5, 5, 62
	; CHECK-NEXT: mtctr 5			; CHECK-NEXT: mtctr 5
	; CHECK-NEXT: srawi 3, 3, 1			; CHECK-NEXT: srawi 3, 3, 1
	; CHECK-NEXT: addze 3, 3			; CHECK-NEXT: addze 3, 3
	; CHECK-NEXT: .p2align 4			; CHECK-NEXT: .p2align 4
	; CHECK-NEXT: .LBB0_1:			; CHECK-NEXT: .LBB0_1:
	; CHECK-NEXT: extsh 4, 4			; CHECK-NEXT: extsh 4, 4
	; CHECK-NEXT: srawi 4, 4, 1			; CHECK-NEXT: srawi 4, 4, 1
	; CHECK-NEXT: addze 4, 4			; CHECK-NEXT: addze 4, 4
	Show All 28 Lines

llvm/test/CodeGen/PowerPC/sms-phi-3.ll

	Show All 15 Lines
	; CHECK-NEXT: mr 30, 3			; CHECK-NEXT: mr 30, 3
	; CHECK-NEXT: bl malloc			; CHECK-NEXT: bl malloc
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: mr 29, 3			; CHECK-NEXT: mr 29, 3
	; CHECK-NEXT: bl malloc			; CHECK-NEXT: bl malloc
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: addi 7, 30, -4			; CHECK-NEXT: addi 7, 30, -4
	; CHECK-NEXT: mtctr 3			; CHECK-NEXT: mtctr 3
	; CHECK-NEXT: lwzu 8, 4(7)
	; CHECK-NEXT: addi 4, 29, -8			; CHECK-NEXT: addi 4, 29, -8
	; CHECK-NEXT: li 5, 0			; CHECK-NEXT: li 5, 0
				; CHECK-NEXT: lwzu 8, 4(7)
	; CHECK-NEXT: bdz .LBB0_5			; CHECK-NEXT: bdz .LBB0_5
	; CHECK-NEXT: # %bb.1:			; CHECK-NEXT: # %bb.1:
	; CHECK-NEXT: extswsli 6, 5, 5			; CHECK-NEXT: extswsli 6, 5, 5
	; CHECK-NEXT: add 5, 8, 5			; CHECK-NEXT: add 5, 8, 5
	; CHECK-NEXT: lwzu 8, 4(7)			; CHECK-NEXT: lwzu 8, 4(7)
	; CHECK-NEXT: bdz .LBB0_4			; CHECK-NEXT: bdz .LBB0_4
	; CHECK-NEXT: # %bb.2:			; CHECK-NEXT: # %bb.2:
	; CHECK-NEXT: add 6, 3, 6			; CHECK-NEXT: add 6, 3, 6
	▲ Show 20 Lines • Show All 51 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/sms-simple.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -ppc-vsr-nums-as-vr -mtriple=powerpc64-unknown-linux-gnu \			; RUN: llc < %s -ppc-vsr-nums-as-vr -mtriple=powerpc64-unknown-linux-gnu \
	; RUN: -verify-machineinstrs -ppc-asm-full-reg-names -mcpu=pwr9 --ppc-enable-pipeliner \			; RUN: -verify-machineinstrs -ppc-asm-full-reg-names -mcpu=pwr9 --ppc-enable-pipeliner \
	; RUN: \| FileCheck %s			; RUN: \| FileCheck %s

	@x = dso_local local_unnamed_addr global <{ i32, i32, i32, i32, [1020 x i32] }> <{ i32 1, i32 2, i32 3, i32 4, [1020 x i32] zeroinitializer }>, align 4			@x = dso_local local_unnamed_addr global <{ i32, i32, i32, i32, [1020 x i32] }> <{ i32 1, i32 2, i32 3, i32 4, [1020 x i32] zeroinitializer }>, align 4
	@y = dso_local global [1024 x i32] zeroinitializer, align 4			@y = dso_local global [1024 x i32] zeroinitializer, align 4

	define dso_local i32* @foo() local_unnamed_addr {			define dso_local i32* @foo() local_unnamed_addr {
	; CHECK-LABEL: foo:			; CHECK-LABEL: foo:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: addis r5, r2, x@toc@ha			; CHECK-NEXT: addis r5, r2, x@toc@ha
	; CHECK-NEXT: addi r5, r5, x@toc@l
	; CHECK-NEXT: addis r6, r2, y@toc@ha			; CHECK-NEXT: addis r6, r2, y@toc@ha
	; CHECK-NEXT: li r7, 340			; CHECK-NEXT: li r7, 340
				; CHECK-NEXT: addi r5, r5, x@toc@l
	; CHECK-NEXT: addi r3, r6, y@toc@l			; CHECK-NEXT: addi r3, r6, y@toc@l
	; CHECK-NEXT: lwz r6, y@toc@l(r6)			; CHECK-NEXT: lwz r6, y@toc@l(r6)
	; CHECK-NEXT: mtctr r7			; CHECK-NEXT: mtctr r7
	; CHECK-NEXT: addi r5, r5, -8			; CHECK-NEXT: addi r5, r5, -8
				; CHECK-NEXT: addi r4, r3, -8
	; CHECK-NEXT: lwzu r7, 12(r5)			; CHECK-NEXT: lwzu r7, 12(r5)
	; CHECK-NEXT: maddld r6, r7, r7, r6			; CHECK-NEXT: maddld r6, r7, r7, r6
	; CHECK-NEXT: lwz r7, 4(r5)			; CHECK-NEXT: lwz r7, 4(r5)
	; CHECK-NEXT: addi r4, r3, -8
	; CHECK-NEXT: stwu r6, 12(r4)			; CHECK-NEXT: stwu r6, 12(r4)
	; CHECK-NEXT: maddld r6, r7, r7, r6			; CHECK-NEXT: maddld r6, r7, r7, r6
	; CHECK-NEXT: lwz r7, 8(r5)			; CHECK-NEXT: lwz r7, 8(r5)
	; CHECK-NEXT: .p2align 4			; CHECK-NEXT: .p2align 4
	; CHECK-NEXT: .LBB0_1: # %for.body			; CHECK-NEXT: .LBB0_1: # %for.body
	; CHECK-NEXT: #			; CHECK-NEXT: #
	; CHECK-NEXT: maddld r7, r7, r7, r6			; CHECK-NEXT: maddld r7, r7, r7, r6
	; CHECK-NEXT: lwzu r8, 12(r5)			; CHECK-NEXT: lwzu r8, 12(r5)
	; CHECK-NEXT: maddld r8, r8, r8, r7
	; CHECK-NEXT: stw r6, 4(r4)			; CHECK-NEXT: stw r6, 4(r4)
	; CHECK-NEXT: lwz r6, 4(r5)			; CHECK-NEXT: lwz r6, 4(r5)
	; CHECK-NEXT: maddld r6, r6, r6, r8			; CHECK-NEXT: maddld r8, r8, r8, r7
	; CHECK-NEXT: stw r7, 8(r4)			; CHECK-NEXT: stw r7, 8(r4)
	; CHECK-NEXT: lwz r7, 8(r5)			; CHECK-NEXT: lwz r7, 8(r5)
				; CHECK-NEXT: maddld r6, r6, r6, r8
	; CHECK-NEXT: stwu r8, 12(r4)			; CHECK-NEXT: stwu r8, 12(r4)
	; CHECK-NEXT: bdnz .LBB0_1			; CHECK-NEXT: bdnz .LBB0_1
	; CHECK-NEXT: # %bb.2:			; CHECK-NEXT: # %bb.2:
	; CHECK-NEXT: maddld r5, r7, r7, r6			; CHECK-NEXT: maddld r5, r7, r7, r6
	; CHECK-NEXT: stw r6, 4(r4)			; CHECK-NEXT: stw r6, 4(r4)
	; CHECK-NEXT: stw r5, 8(r4)			; CHECK-NEXT: stw r5, 8(r4)
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	Show All 33 Lines

llvm/test/CodeGen/PowerPC/srem-vector-lkk.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \		; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9LE		; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9LE
; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \		; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9BE		; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9BE
; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \		; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8LE		; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8LE
; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \		; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8BE		; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8BE

define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {		define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {
; P9LE-LABEL: fold_srem_vec_1:		; P9LE-LABEL: fold_srem_vec_1:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 0		; P9LE-NEXT: li r3, 0
; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: lis r5, -21386		; P9LE-NEXT: lis r5, -21386
		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: ori r5, r5, 37253		; P9LE-NEXT: ori r5, r5, 37253
		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r5, r4, r5		; P9LE-NEXT: mulld r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: add r4, r5, r4		; P9LE-NEXT: add r4, r5, r4
; P9LE-NEXT: srwi r5, r4, 31		; P9LE-NEXT: srwi r5, r4, 31
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: lis r5, 31710		; P9LE-NEXT: lis r5, 31710
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
		; P9LE-NEXT: ori r5, r5, 63421
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: ori r5, r5, 63421
; P9LE-NEXT: mulld r5, r4, r5		; P9LE-NEXT: mulld r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: subf r4, r4, r5		; P9LE-NEXT: subf r4, r4, r5
; P9LE-NEXT: srwi r5, r4, 31		; P9LE-NEXT: srwi r5, r4, 31
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: lis r5, 21399		; P9LE-NEXT: lis r5, 21399
; P9LE-NEXT: mulli r4, r4, -124		; P9LE-NEXT: mulli r4, r4, -124
		; P9LE-NEXT: ori r5, r5, 33437
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: ori r5, r5, 33437
; P9LE-NEXT: mulld r4, r4, r5		; P9LE-NEXT: mulld r4, r4, r5
; P9LE-NEXT: rldicl r5, r4, 1, 63		; P9LE-NEXT: rldicl r5, r4, 1, 63
; P9LE-NEXT: rldicl r4, r4, 32, 32		; P9LE-NEXT: rldicl r4, r4, 32, 32
; P9LE-NEXT: srawi r4, r4, 5		; P9LE-NEXT: srawi r4, r4, 5
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: lis r5, -16728		; P9LE-NEXT: lis r5, -16728
; P9LE-NEXT: mulli r4, r4, 98		; P9LE-NEXT: mulli r4, r4, 98
		; P9LE-NEXT: ori r5, r5, 63249
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: ori r5, r5, 63249
; P9LE-NEXT: mulld r4, r4, r5		; P9LE-NEXT: mulld r4, r4, r5
; P9LE-NEXT: rldicl r5, r4, 1, 63		; P9LE-NEXT: rldicl r5, r4, 1, 63
; P9LE-NEXT: rldicl r4, r4, 32, 32		; P9LE-NEXT: rldicl r4, r4, 32, 32
; P9LE-NEXT: srawi r4, r4, 8		; P9LE-NEXT: srawi r4, r4, 8
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: mulli r4, r4, -1003		; P9LE-NEXT: mulli r4, r4, -1003
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v2, v2, v4		; P9LE-NEXT: vmrglh v2, v2, v4
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: fold_srem_vec_1:		; P9BE-LABEL: fold_srem_vec_1:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: lis r4, 31710		; P9BE-NEXT: lis r4, 31710
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r4, r4, 63421		; P9BE-NEXT: ori r4, r4, 63421
		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: subf r4, r3, r4		; P9BE-NEXT: subf r4, r3, r4
; P9BE-NEXT: srwi r5, r4, 31		; P9BE-NEXT: srwi r5, r4, 31
; P9BE-NEXT: srawi r4, r4, 6		; P9BE-NEXT: srawi r4, r4, 6
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, -124		; P9BE-NEXT: mulli r4, r4, -124
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: lis r4, -21386		; P9BE-NEXT: lis r4, -21386
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
		; P9BE-NEXT: ori r4, r4, 37253
; P9BE-NEXT: mtvsrd v3, r3		; P9BE-NEXT: mtvsrd v3, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: ori r4, r4, 37253
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: add r4, r4, r3		; P9BE-NEXT: add r4, r4, r3
; P9BE-NEXT: srwi r5, r4, 31		; P9BE-NEXT: srwi r5, r4, 31
; P9BE-NEXT: srawi r4, r4, 6		; P9BE-NEXT: srawi r4, r4, 6
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 95		; P9BE-NEXT: mulli r4, r4, 95
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: lis r4, -16728		; P9BE-NEXT: lis r4, -16728
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
		; P9BE-NEXT: ori r4, r4, 63249
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: ori r4, r4, 63249
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r5, r4, 1, 63		; P9BE-NEXT: rldicl r5, r4, 1, 63
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: srawi r4, r4, 8		; P9BE-NEXT: srawi r4, r4, 8
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, -1003		; P9BE-NEXT: mulli r4, r4, -1003
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: lis r4, 21399		; P9BE-NEXT: lis r4, 21399
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v4, v3		; P9BE-NEXT: ori r4, r4, 33437
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 4		; P9BE-NEXT: li r3, 4
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: ori r4, r4, 33437
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r5, r4, 1, 63		; P9BE-NEXT: rldicl r5, r4, 1, 63
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: srawi r4, r4, 5		; P9BE-NEXT: srawi r4, r4, 5
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 98		; P9BE-NEXT: mulli r4, r4, 98
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
▲ Show 20 Lines • Show All 139 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>		%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>
ret <4 x i16> %1		ret <4 x i16> %1
}		}

define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {		define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {
; P9LE-LABEL: fold_srem_vec_2:		; P9LE-LABEL: fold_srem_vec_2:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 0		; P9LE-NEXT: li r3, 0
; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: lis r5, -21386		; P9LE-NEXT: lis r5, -21386
		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: ori r5, r5, 37253		; P9LE-NEXT: ori r5, r5, 37253
		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r6, r4, r5		; P9LE-NEXT: mulld r6, r4, r5
; P9LE-NEXT: rldicl r6, r6, 32, 32		; P9LE-NEXT: rldicl r6, r6, 32, 32
; P9LE-NEXT: add r4, r6, r4		; P9LE-NEXT: add r4, r6, r4
; P9LE-NEXT: srwi r6, r4, 31		; P9LE-NEXT: srwi r6, r4, 31
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: add r4, r4, r6		; P9LE-NEXT: add r4, r4, r6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r6, r4, r5		; P9LE-NEXT: mulld r6, r4, r5
; P9LE-NEXT: rldicl r6, r6, 32, 32		; P9LE-NEXT: rldicl r6, r6, 32, 32
; P9LE-NEXT: add r4, r6, r4		; P9LE-NEXT: add r4, r6, r4
; P9LE-NEXT: srwi r6, r4, 31		; P9LE-NEXT: srwi r6, r4, 31
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: add r4, r4, r6		; P9LE-NEXT: add r4, r4, r6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r6, r4, r5		; P9LE-NEXT: mulld r6, r4, r5
; P9LE-NEXT: rldicl r6, r6, 32, 32		; P9LE-NEXT: rldicl r6, r6, 32, 32
; P9LE-NEXT: add r4, r6, r4		; P9LE-NEXT: add r4, r6, r4
; P9LE-NEXT: srwi r6, r4, 31		; P9LE-NEXT: srwi r6, r4, 31
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: add r4, r4, r6		; P9LE-NEXT: add r4, r4, r6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r5, r4, r5		; P9LE-NEXT: mulld r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: add r4, r5, r4		; P9LE-NEXT: add r4, r5, r4
; P9LE-NEXT: srwi r5, r4, 31		; P9LE-NEXT: srwi r5, r4, 31
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v2, v2, v4		; P9LE-NEXT: vmrglh v2, v2, v4
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: fold_srem_vec_2:		; P9BE-LABEL: fold_srem_vec_2:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: lis r4, -21386		; P9BE-NEXT: lis r4, -21386
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r4, r4, 37253		; P9BE-NEXT: ori r4, r4, 37253
		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: mulld r5, r3, r4		; P9BE-NEXT: mulld r5, r3, r4
; P9BE-NEXT: rldicl r5, r5, 32, 32		; P9BE-NEXT: rldicl r5, r5, 32, 32
; P9BE-NEXT: add r5, r5, r3		; P9BE-NEXT: add r5, r5, r3
; P9BE-NEXT: srwi r6, r5, 31		; P9BE-NEXT: srwi r6, r5, 31
; P9BE-NEXT: srawi r5, r5, 6		; P9BE-NEXT: srawi r5, r5, 6
; P9BE-NEXT: add r5, r5, r6		; P9BE-NEXT: add r5, r5, r6
; P9BE-NEXT: mulli r5, r5, 95		; P9BE-NEXT: mulli r5, r5, 95
Show All 11 Lines
; P9BE-NEXT: srawi r5, r5, 6		; P9BE-NEXT: srawi r5, r5, 6
; P9BE-NEXT: add r5, r5, r6		; P9BE-NEXT: add r5, r5, r6
; P9BE-NEXT: mulli r5, r5, 95		; P9BE-NEXT: mulli r5, r5, 95
; P9BE-NEXT: subf r3, r5, r3		; P9BE-NEXT: subf r3, r5, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: mulld r5, r3, r4		; P9BE-NEXT: mulld r5, r3, r4
; P9BE-NEXT: rldicl r5, r5, 32, 32		; P9BE-NEXT: rldicl r5, r5, 32, 32
; P9BE-NEXT: add r5, r5, r3		; P9BE-NEXT: add r5, r5, r3
; P9BE-NEXT: srwi r6, r5, 31		; P9BE-NEXT: srwi r6, r5, 31
; P9BE-NEXT: srawi r5, r5, 6		; P9BE-NEXT: srawi r5, r5, 6
; P9BE-NEXT: add r5, r5, r6		; P9BE-NEXT: add r5, r5, r6
; P9BE-NEXT: mulli r5, r5, 95		; P9BE-NEXT: mulli r5, r5, 95
; P9BE-NEXT: subf r3, r5, r3		; P9BE-NEXT: subf r3, r5, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: add r4, r4, r3		; P9BE-NEXT: add r4, r4, r3
▲ Show 20 Lines • Show All 139 Lines • ▼ Show 20 Lines
}		}


; Don't fold if we can combine srem with sdiv.		; Don't fold if we can combine srem with sdiv.
define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {		define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {
; P9LE-LABEL: combine_srem_sdiv:		; P9LE-LABEL: combine_srem_sdiv:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 0		; P9LE-NEXT: li r3, 0
; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: lis r5, -21386		; P9LE-NEXT: lis r5, -21386
		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: ori r5, r5, 37253		; P9LE-NEXT: ori r5, r5, 37253
		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r6, r4, r5		; P9LE-NEXT: mulld r6, r4, r5
; P9LE-NEXT: rldicl r6, r6, 32, 32		; P9LE-NEXT: rldicl r6, r6, 32, 32
; P9LE-NEXT: add r4, r6, r4		; P9LE-NEXT: add r4, r6, r4
; P9LE-NEXT: srwi r6, r4, 31		; P9LE-NEXT: srwi r6, r4, 31
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: add r4, r4, r6		; P9LE-NEXT: add r4, r4, r6
; P9LE-NEXT: mulli r6, r4, 95		; P9LE-NEXT: mulli r6, r4, 95
; P9LE-NEXT: subf r3, r6, r3		; P9LE-NEXT: subf r3, r6, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: extsh r6, r3		; P9LE-NEXT: extsh r6, r3
; P9LE-NEXT: extsw r6, r6		; P9LE-NEXT: extsw r6, r6
; P9LE-NEXT: mulld r7, r6, r5		; P9LE-NEXT: mulld r7, r6, r5
; P9LE-NEXT: rldicl r7, r7, 32, 32		; P9LE-NEXT: rldicl r7, r7, 32, 32
; P9LE-NEXT: add r6, r7, r6		; P9LE-NEXT: add r6, r7, r6
; P9LE-NEXT: srwi r7, r6, 31		; P9LE-NEXT: srwi r7, r6, 31
; P9LE-NEXT: srawi r6, r6, 6		; P9LE-NEXT: srawi r6, r6, 6
; P9LE-NEXT: add r6, r6, r7		; P9LE-NEXT: add r6, r6, r7
; P9LE-NEXT: mulli r7, r6, 95		; P9LE-NEXT: mulli r7, r6, 95
; P9LE-NEXT: subf r3, r7, r3		; P9LE-NEXT: subf r3, r7, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r7, r3		; P9LE-NEXT: extsh r7, r3
		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: extsw r7, r7		; P9LE-NEXT: extsw r7, r7
; P9LE-NEXT: mulld r8, r7, r5		; P9LE-NEXT: mulld r8, r7, r5
; P9LE-NEXT: rldicl r8, r8, 32, 32		; P9LE-NEXT: rldicl r8, r8, 32, 32
; P9LE-NEXT: add r7, r8, r7		; P9LE-NEXT: add r7, r8, r7
; P9LE-NEXT: srwi r8, r7, 31		; P9LE-NEXT: srwi r8, r7, 31
; P9LE-NEXT: srawi r7, r7, 6		; P9LE-NEXT: srawi r7, r7, 6
; P9LE-NEXT: add r7, r7, r8		; P9LE-NEXT: add r7, r7, r8
; P9LE-NEXT: mulli r8, r7, 95		; P9LE-NEXT: mulli r8, r7, 95
; P9LE-NEXT: subf r3, r8, r3		; P9LE-NEXT: subf r3, r8, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r8, r3		; P9LE-NEXT: extsh r8, r3
; P9LE-NEXT: extsw r8, r8		; P9LE-NEXT: extsw r8, r8
; P9LE-NEXT: mulld r5, r8, r5		; P9LE-NEXT: mulld r5, r8, r5
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: add r5, r5, r8		; P9LE-NEXT: add r5, r5, r8
; P9LE-NEXT: srwi r8, r5, 31		; P9LE-NEXT: srwi r8, r5, 31
; P9LE-NEXT: srawi r5, r5, 6		; P9LE-NEXT: srawi r5, r5, 6
; P9LE-NEXT: add r5, r5, r8		; P9LE-NEXT: add r5, r5, r8
; P9LE-NEXT: mulli r8, r5, 95		; P9LE-NEXT: mulli r8, r5, 95
; P9LE-NEXT: subf r3, r8, r3		; P9LE-NEXT: subf r3, r8, r3
; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: mtvsrd f0, r4		; P9LE-NEXT: mtvsrd f0, r4
; P9LE-NEXT: vmrglh v2, v2, v4		; P9LE-NEXT: vmrglh v2, v2, v4
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: xxswapd v3, vs0		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r6		; P9LE-NEXT: mtvsrd f0, r6
; P9LE-NEXT: xxswapd v4, vs0		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r7		; P9LE-NEXT: mtvsrd f0, r7
; P9LE-NEXT: vmrglh v3, v4, v3		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxswapd v4, vs0		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r5		; P9LE-NEXT: mtvsrd f0, r5
; P9LE-NEXT: xxswapd v5, vs0		; P9LE-NEXT: xxswapd v5, vs0
; P9LE-NEXT: vmrglh v4, v5, v4		; P9LE-NEXT: vmrglh v4, v5, v4
; P9LE-NEXT: vmrglw v3, v4, v3		; P9LE-NEXT: vmrglw v3, v4, v3
; P9LE-NEXT: vadduhm v2, v2, v3		; P9LE-NEXT: vadduhm v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: combine_srem_sdiv:		; P9BE-LABEL: combine_srem_sdiv:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r4, r3
; P9BE-NEXT: lis r5, -21386		; P9BE-NEXT: lis r5, -21386
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r5, r5, 37253		; P9BE-NEXT: ori r5, r5, 37253
		; P9BE-NEXT: extsh r4, r3
; P9BE-NEXT: extsw r4, r4		; P9BE-NEXT: extsw r4, r4
; P9BE-NEXT: mulld r6, r4, r5		; P9BE-NEXT: mulld r6, r4, r5
; P9BE-NEXT: rldicl r6, r6, 32, 32		; P9BE-NEXT: rldicl r6, r6, 32, 32
; P9BE-NEXT: add r4, r6, r4		; P9BE-NEXT: add r4, r6, r4
; P9BE-NEXT: srwi r6, r4, 31		; P9BE-NEXT: srwi r6, r4, 31
; P9BE-NEXT: srawi r4, r4, 6		; P9BE-NEXT: srawi r4, r4, 6
; P9BE-NEXT: add r4, r4, r6		; P9BE-NEXT: add r4, r4, r6
; P9BE-NEXT: mulli r6, r4, 95		; P9BE-NEXT: mulli r6, r4, 95
Show All 11 Lines
; P9BE-NEXT: srawi r6, r6, 6		; P9BE-NEXT: srawi r6, r6, 6
; P9BE-NEXT: add r6, r6, r7		; P9BE-NEXT: add r6, r6, r7
; P9BE-NEXT: mulli r7, r6, 95		; P9BE-NEXT: mulli r7, r6, 95
; P9BE-NEXT: subf r3, r7, r3		; P9BE-NEXT: subf r3, r7, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: extsh r7, r3		; P9BE-NEXT: extsh r7, r3
; P9BE-NEXT: extsw r7, r7		; P9BE-NEXT: extsw r7, r7
; P9BE-NEXT: mulld r8, r7, r5		; P9BE-NEXT: mulld r8, r7, r5
; P9BE-NEXT: rldicl r8, r8, 32, 32		; P9BE-NEXT: rldicl r8, r8, 32, 32
; P9BE-NEXT: add r7, r8, r7		; P9BE-NEXT: add r7, r8, r7
; P9BE-NEXT: srwi r8, r7, 31		; P9BE-NEXT: srwi r8, r7, 31
; P9BE-NEXT: srawi r7, r7, 6		; P9BE-NEXT: srawi r7, r7, 6
; P9BE-NEXT: add r7, r7, r8		; P9BE-NEXT: add r7, r7, r8
; P9BE-NEXT: mulli r8, r7, 95		; P9BE-NEXT: mulli r8, r7, 95
; P9BE-NEXT: subf r3, r8, r3		; P9BE-NEXT: subf r3, r8, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: mulld r5, r3, r5		; P9BE-NEXT: mulld r5, r3, r5
; P9BE-NEXT: rldicl r5, r5, 32, 32		; P9BE-NEXT: rldicl r5, r5, 32, 32
; P9BE-NEXT: add r5, r5, r3		; P9BE-NEXT: add r5, r5, r3
▲ Show 20 Lines • Show All 176 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
ret <4 x i16> %3		ret <4 x i16> %3
}		}

; Don't fold for divisors that are a power of two.		; Don't fold for divisors that are a power of two.
define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {		define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {
; P9LE-LABEL: dont_fold_srem_power_of_two:		; P9LE-LABEL: dont_fold_srem_power_of_two:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 0		; P9LE-NEXT: li r3, 0
		; P9LE-NEXT: lis r5, -21386
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: ori r5, r5, 37253
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: addze r4, r4		; P9LE-NEXT: addze r4, r4
; P9LE-NEXT: slwi r4, r4, 6		; P9LE-NEXT: slwi r4, r4, 6
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: srawi r4, r4, 5		; P9LE-NEXT: srawi r4, r4, 5
; P9LE-NEXT: addze r4, r4		; P9LE-NEXT: addze r4, r4
; P9LE-NEXT: slwi r4, r4, 5		; P9LE-NEXT: slwi r4, r4, 5
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: lis r5, -21386
; P9LE-NEXT: ori r5, r5, 37253
; P9LE-NEXT: xxswapd v4, vs0		; P9LE-NEXT: xxswapd v4, vs0
		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: vmrglh v3, v4, v3		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r5, r4, r5		; P9LE-NEXT: mulld r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: add r4, r5, r4		; P9LE-NEXT: add r4, r5, r4
; P9LE-NEXT: srwi r5, r4, 31		; P9LE-NEXT: srwi r5, r4, 31
; P9LE-NEXT: srawi r4, r4, 6		; P9LE-NEXT: srawi r4, r4, 6
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: srawi r4, r4, 3		; P9LE-NEXT: srawi r4, r4, 3
; P9LE-NEXT: addze r4, r4		; P9LE-NEXT: addze r4, r4
; P9LE-NEXT: slwi r4, r4, 3		; P9LE-NEXT: slwi r4, r4, 3
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v2, v4, v2		; P9LE-NEXT: vmrglh v2, v4, v2
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_srem_power_of_two:		; P9BE-LABEL: dont_fold_srem_power_of_two:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
Show All 10 Lines
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: srawi r4, r3, 6		; P9BE-NEXT: srawi r4, r3, 6
; P9BE-NEXT: addze r4, r4		; P9BE-NEXT: addze r4, r4
; P9BE-NEXT: slwi r4, r4, 6		; P9BE-NEXT: slwi r4, r4, 6
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: lis r4, -21386		; P9BE-NEXT: lis r4, -21386
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
		; P9BE-NEXT: ori r4, r4, 37253
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: ori r4, r4, 37253
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: add r4, r4, r3		; P9BE-NEXT: add r4, r4, r3
; P9BE-NEXT: srwi r5, r4, 31		; P9BE-NEXT: srwi r5, r4, 31
; P9BE-NEXT: srawi r4, r4, 6		; P9BE-NEXT: srawi r4, r4, 6
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 95		; P9BE-NEXT: mulli r4, r4, 95
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 4		; P9BE-NEXT: li r3, 4
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: srawi r4, r3, 3		; P9BE-NEXT: srawi r4, r3, 3
; P9BE-NEXT: addze r4, r4		; P9BE-NEXT: addze r4, r4
; P9BE-NEXT: slwi r4, r4, 3		; P9BE-NEXT: slwi r4, r4, 3
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
ret <4 x i16> %1		ret <4 x i16> %1
}		}

; Don't fold if the divisor is one.		; Don't fold if the divisor is one.
define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {		define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
; P9LE-LABEL: dont_fold_srem_one:		; P9LE-LABEL: dont_fold_srem_one:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: lis r5, -14230		; P9LE-NEXT: lis r5, -14230
		; P9LE-NEXT: xxlxor v4, v4, v4
		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: ori r5, r5, 30865		; P9LE-NEXT: ori r5, r5, 30865
		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r5, r4, r5		; P9LE-NEXT: mulld r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: xxlxor v4, v4, v4
; P9LE-NEXT: add r4, r5, r4		; P9LE-NEXT: add r4, r5, r4
; P9LE-NEXT: srwi r5, r4, 31		; P9LE-NEXT: srwi r5, r4, 31
; P9LE-NEXT: srawi r4, r4, 9		; P9LE-NEXT: srawi r4, r4, 9
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: lis r5, -19946		; P9LE-NEXT: lis r5, -19946
; P9LE-NEXT: mulli r4, r4, 654		; P9LE-NEXT: mulli r4, r4, 654
		; P9LE-NEXT: ori r5, r5, 17097
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
		; P9LE-NEXT: vmrglh v3, v3, v4
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: ori r5, r5, 17097
; P9LE-NEXT: mulld r5, r4, r5		; P9LE-NEXT: mulld r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: add r4, r5, r4		; P9LE-NEXT: add r4, r5, r4
; P9LE-NEXT: srwi r5, r4, 31		; P9LE-NEXT: srwi r5, r4, 31
; P9LE-NEXT: srawi r4, r4, 4		; P9LE-NEXT: srawi r4, r4, 4
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: lis r5, 24749		; P9LE-NEXT: lis r5, 24749
; P9LE-NEXT: mulli r4, r4, 23		; P9LE-NEXT: mulli r4, r4, 23
		; P9LE-NEXT: ori r5, r5, 47143
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: ori r5, r5, 47143
; P9LE-NEXT: mulld r4, r4, r5		; P9LE-NEXT: mulld r4, r4, r5
; P9LE-NEXT: rldicl r5, r4, 1, 63		; P9LE-NEXT: rldicl r5, r4, 1, 63
; P9LE-NEXT: rldicl r4, r4, 32, 32		; P9LE-NEXT: rldicl r4, r4, 32, 32
; P9LE-NEXT: srawi r4, r4, 11		; P9LE-NEXT: srawi r4, r4, 11
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: mulli r4, r4, 5423		; P9LE-NEXT: mulli r4, r4, 5423
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: vmrglh v3, v3, v4
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v2, v2, v4		; P9LE-NEXT: vmrglh v2, v2, v4
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_srem_one:		; P9BE-LABEL: dont_fold_srem_one:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 4		; P9BE-NEXT: li r3, 4
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: lis r4, -19946		; P9BE-NEXT: lis r4, -19946
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r4, r4, 17097		; P9BE-NEXT: ori r4, r4, 17097
		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: add r4, r4, r3		; P9BE-NEXT: add r4, r4, r3
; P9BE-NEXT: srwi r5, r4, 31		; P9BE-NEXT: srwi r5, r4, 31
; P9BE-NEXT: srawi r4, r4, 4		; P9BE-NEXT: srawi r4, r4, 4
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 23		; P9BE-NEXT: mulli r4, r4, 23
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: lis r4, 24749		; P9BE-NEXT: lis r4, 24749
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
		; P9BE-NEXT: ori r4, r4, 47143
; P9BE-NEXT: mtvsrd v3, r3		; P9BE-NEXT: mtvsrd v3, r3
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: ori r4, r4, 47143
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r5, r4, 1, 63		; P9BE-NEXT: rldicl r5, r4, 1, 63
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: srawi r4, r4, 11		; P9BE-NEXT: srawi r4, r4, 11
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 5423		; P9BE-NEXT: mulli r4, r4, 5423
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: lis r4, -14230		; P9BE-NEXT: lis r4, -14230
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
		; P9BE-NEXT: ori r4, r4, 30865
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v3, v4
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: ori r4, r4, 30865
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: add r4, r4, r3		; P9BE-NEXT: add r4, r4, r3
; P9BE-NEXT: srwi r5, r4, 31		; P9BE-NEXT: srwi r5, r4, 31
; P9BE-NEXT: srawi r4, r4, 9		; P9BE-NEXT: srawi r4, r4, 9
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 654		; P9BE-NEXT: mulli r4, r4, 654
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v2, r3		; P9BE-NEXT: mtvsrd v2, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v3, v4
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: vmrghh v2, v4, v2		; P9BE-NEXT: vmrghh v2, v4, v2
; P9BE-NEXT: vmrghw v2, v2, v3		; P9BE-NEXT: vmrghw v2, v2, v3
; P9BE-NEXT: blr		; P9BE-NEXT: blr
;		;
; P8LE-LABEL: dont_fold_srem_one:		; P8LE-LABEL: dont_fold_srem_one:
; P8LE: # %bb.0:		; P8LE: # %bb.0:
; P8LE-NEXT: xxswapd vs0, v2		; P8LE-NEXT: xxswapd vs0, v2
▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
ret <4 x i16> %1		ret <4 x i16> %1
}		}

; Don't fold if the divisor is 2^15.		; Don't fold if the divisor is 2^15.
define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {		define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {
; P9LE-LABEL: dont_fold_urem_i16_smax:		; P9LE-LABEL: dont_fold_urem_i16_smax:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: lis r5, -19946		; P9LE-NEXT: lis r5, -19946
		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: ori r5, r5, 17097		; P9LE-NEXT: ori r5, r5, 17097
		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: mulld r5, r4, r5		; P9LE-NEXT: mulld r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: add r4, r5, r4		; P9LE-NEXT: add r4, r5, r4
; P9LE-NEXT: srwi r5, r4, 31		; P9LE-NEXT: srwi r5, r4, 31
; P9LE-NEXT: srawi r4, r4, 4		; P9LE-NEXT: srawi r4, r4, 4
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: lis r5, 24749		; P9LE-NEXT: lis r5, 24749
; P9LE-NEXT: mulli r4, r4, 23		; P9LE-NEXT: mulli r4, r4, 23
		; P9LE-NEXT: ori r5, r5, 47143
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
; P9LE-NEXT: extsw r4, r4		; P9LE-NEXT: extsw r4, r4
; P9LE-NEXT: ori r5, r5, 47143
; P9LE-NEXT: mulld r4, r4, r5		; P9LE-NEXT: mulld r4, r4, r5
; P9LE-NEXT: rldicl r5, r4, 1, 63		; P9LE-NEXT: rldicl r5, r4, 1, 63
; P9LE-NEXT: rldicl r4, r4, 32, 32		; P9LE-NEXT: rldicl r4, r4, 32, 32
; P9LE-NEXT: srawi r4, r4, 11		; P9LE-NEXT: srawi r4, r4, 11
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: mulli r4, r4, 5423		; P9LE-NEXT: mulli r4, r4, 5423
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: extsh r4, r3		; P9LE-NEXT: extsh r4, r3
		; P9LE-NEXT: vmrglh v3, v4, v3
		; P9LE-NEXT: xxlxor v4, v4, v4
; P9LE-NEXT: srawi r4, r4, 15		; P9LE-NEXT: srawi r4, r4, 15
; P9LE-NEXT: addze r4, r4		; P9LE-NEXT: addze r4, r4
; P9LE-NEXT: slwi r4, r4, 15		; P9LE-NEXT: slwi r4, r4, 15
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxlxor v4, v4, v4
; P9LE-NEXT: vmrglh v2, v2, v4		; P9LE-NEXT: vmrglh v2, v2, v4
; P9LE-NEXT: vmrglw v2, v3, v2		; P9LE-NEXT: vmrglw v2, v3, v2
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_urem_i16_smax:		; P9BE-LABEL: dont_fold_urem_i16_smax:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 4		; P9BE-NEXT: li r3, 4
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: lis r4, -19946		; P9BE-NEXT: lis r4, -19946
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r4, r4, 17097		; P9BE-NEXT: ori r4, r4, 17097
		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: add r4, r4, r3		; P9BE-NEXT: add r4, r4, r3
; P9BE-NEXT: srwi r5, r4, 31		; P9BE-NEXT: srwi r5, r4, 31
; P9BE-NEXT: srawi r4, r4, 4		; P9BE-NEXT: srawi r4, r4, 4
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 23		; P9BE-NEXT: mulli r4, r4, 23
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: lis r4, 24749		; P9BE-NEXT: lis r4, 24749
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
		; P9BE-NEXT: ori r4, r4, 47143
; P9BE-NEXT: mtvsrd v3, r3		; P9BE-NEXT: mtvsrd v3, r3
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: extsw r3, r3		; P9BE-NEXT: extsw r3, r3
; P9BE-NEXT: ori r4, r4, 47143
; P9BE-NEXT: mulld r4, r3, r4		; P9BE-NEXT: mulld r4, r3, r4
; P9BE-NEXT: rldicl r5, r4, 1, 63		; P9BE-NEXT: rldicl r5, r4, 1, 63
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: srawi r4, r4, 11		; P9BE-NEXT: srawi r4, r4, 11
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 5423		; P9BE-NEXT: mulli r4, r4, 5423
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v3, v4
; P9BE-NEXT: extsh r3, r3		; P9BE-NEXT: extsh r3, r3
; P9BE-NEXT: srawi r4, r3, 15		; P9BE-NEXT: srawi r4, r3, 15
; P9BE-NEXT: addze r4, r4		; P9BE-NEXT: addze r4, r4
; P9BE-NEXT: slwi r4, r4, 15		; P9BE-NEXT: slwi r4, r4, 15
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v2, r3		; P9BE-NEXT: mtvsrd v2, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v3, v4
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: vmrghh v2, v4, v2		; P9BE-NEXT: vmrghh v2, v4, v2
; P9BE-NEXT: vmrghw v2, v2, v3		; P9BE-NEXT: vmrghw v2, v2, v3
; P9BE-NEXT: blr		; P9BE-NEXT: blr
;		;
; P8LE-LABEL: dont_fold_urem_i16_smax:		; P8LE-LABEL: dont_fold_urem_i16_smax:
; P8LE: # %bb.0:		; P8LE: # %bb.0:
; P8LE-NEXT: xxswapd vs0, v2		; P8LE-NEXT: xxswapd vs0, v2
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
ret <4 x i16> %1		ret <4 x i16> %1
}		}

; Don't fold i64 srem.		; Don't fold i64 srem.
define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {		define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {
; P9LE-LABEL: dont_fold_srem_i64:		; P9LE-LABEL: dont_fold_srem_i64:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: lis r4, 24749		; P9LE-NEXT: lis r4, 24749
		; P9LE-NEXT: mfvsrd r3, v3
; P9LE-NEXT: ori r4, r4, 47142		; P9LE-NEXT: ori r4, r4, 47142
; P9LE-NEXT: sldi r4, r4, 32		; P9LE-NEXT: sldi r4, r4, 32
; P9LE-NEXT: oris r4, r4, 58853		; P9LE-NEXT: oris r4, r4, 58853
; P9LE-NEXT: mfvsrd r3, v3
; P9LE-NEXT: ori r4, r4, 6055		; P9LE-NEXT: ori r4, r4, 6055
; P9LE-NEXT: mulhd r4, r3, r4		; P9LE-NEXT: mulhd r4, r3, r4
; P9LE-NEXT: rldicl r5, r4, 1, 63		; P9LE-NEXT: rldicl r5, r4, 1, 63
; P9LE-NEXT: sradi r4, r4, 11		; P9LE-NEXT: sradi r4, r4, 11
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: lis r5, -19946		; P9LE-NEXT: lis r5, -19946
; P9LE-NEXT: mulli r4, r4, 5423		; P9LE-NEXT: mulli r4, r4, 5423
; P9LE-NEXT: ori r5, r5, 17096		; P9LE-NEXT: ori r5, r5, 17096
; P9LE-NEXT: sldi r5, r5, 32		; P9LE-NEXT: sldi r5, r5, 32
; P9LE-NEXT: oris r5, r5, 22795		; P9LE-NEXT: oris r5, r5, 22795
; P9LE-NEXT: sub r3, r3, r4		; P9LE-NEXT: sub r3, r3, r4
; P9LE-NEXT: mfvsrld r4, v3		; P9LE-NEXT: mfvsrld r4, v3
; P9LE-NEXT: ori r5, r5, 8549		; P9LE-NEXT: ori r5, r5, 8549
; P9LE-NEXT: mulhd r5, r4, r5		; P9LE-NEXT: mulhd r5, r4, r5
; P9LE-NEXT: add r5, r5, r4		; P9LE-NEXT: add r5, r5, r4
; P9LE-NEXT: rldicl r6, r5, 1, 63		; P9LE-NEXT: rldicl r6, r5, 1, 63
; P9LE-NEXT: sradi r5, r5, 4		; P9LE-NEXT: sradi r5, r5, 4
; P9LE-NEXT: add r5, r5, r6		; P9LE-NEXT: add r5, r5, r6
; P9LE-NEXT: mulli r5, r5, 23		; P9LE-NEXT: mulli r5, r5, 23
; P9LE-NEXT: sub r4, r4, r5		; P9LE-NEXT: sub r4, r4, r5
; P9LE-NEXT: mtvsrdd v3, r3, r4		; P9LE-NEXT: mtvsrdd v3, r3, r4
; P9LE-NEXT: lis r4, 25653		; P9LE-NEXT: lis r4, 25653
		; P9LE-NEXT: mfvsrd r3, v2
; P9LE-NEXT: ori r4, r4, 15432		; P9LE-NEXT: ori r4, r4, 15432
; P9LE-NEXT: sldi r4, r4, 32		; P9LE-NEXT: sldi r4, r4, 32
; P9LE-NEXT: oris r4, r4, 1603		; P9LE-NEXT: oris r4, r4, 1603
; P9LE-NEXT: mfvsrd r3, v2
; P9LE-NEXT: ori r4, r4, 21445		; P9LE-NEXT: ori r4, r4, 21445
; P9LE-NEXT: mulhd r4, r3, r4		; P9LE-NEXT: mulhd r4, r3, r4
; P9LE-NEXT: rldicl r5, r4, 1, 63		; P9LE-NEXT: rldicl r5, r4, 1, 63
; P9LE-NEXT: sradi r4, r4, 8		; P9LE-NEXT: sradi r4, r4, 8
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: mulli r4, r4, 654		; P9LE-NEXT: mulli r4, r4, 654
; P9LE-NEXT: sub r3, r3, r4		; P9LE-NEXT: sub r3, r3, r4
; P9LE-NEXT: li r4, 0		; P9LE-NEXT: li r4, 0
; P9LE-NEXT: mtvsrdd v2, r3, r4		; P9LE-NEXT: mtvsrdd v2, r3, r4
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_srem_i64:		; P9BE-LABEL: dont_fold_srem_i64:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: lis r4, 24749		; P9BE-NEXT: lis r4, 24749
		; P9BE-NEXT: mfvsrld r3, v3
; P9BE-NEXT: ori r4, r4, 47142		; P9BE-NEXT: ori r4, r4, 47142
; P9BE-NEXT: sldi r4, r4, 32		; P9BE-NEXT: sldi r4, r4, 32
; P9BE-NEXT: oris r4, r4, 58853		; P9BE-NEXT: oris r4, r4, 58853
; P9BE-NEXT: mfvsrld r3, v3
; P9BE-NEXT: ori r4, r4, 6055		; P9BE-NEXT: ori r4, r4, 6055
; P9BE-NEXT: mulhd r4, r3, r4		; P9BE-NEXT: mulhd r4, r3, r4
; P9BE-NEXT: rldicl r5, r4, 1, 63		; P9BE-NEXT: rldicl r5, r4, 1, 63
; P9BE-NEXT: sradi r4, r4, 11		; P9BE-NEXT: sradi r4, r4, 11
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: lis r5, -19946		; P9BE-NEXT: lis r5, -19946
; P9BE-NEXT: ori r5, r5, 17096		; P9BE-NEXT: ori r5, r5, 17096
; P9BE-NEXT: mulli r4, r4, 5423		; P9BE-NEXT: mulli r4, r4, 5423
; P9BE-NEXT: sldi r5, r5, 32		; P9BE-NEXT: sldi r5, r5, 32
; P9BE-NEXT: oris r5, r5, 22795		; P9BE-NEXT: oris r5, r5, 22795
; P9BE-NEXT: sub r3, r3, r4		; P9BE-NEXT: sub r3, r3, r4
; P9BE-NEXT: mfvsrd r4, v3		; P9BE-NEXT: mfvsrd r4, v3
; P9BE-NEXT: ori r5, r5, 8549		; P9BE-NEXT: ori r5, r5, 8549
; P9BE-NEXT: mulhd r5, r4, r5		; P9BE-NEXT: mulhd r5, r4, r5
; P9BE-NEXT: add r5, r5, r4		; P9BE-NEXT: add r5, r5, r4
; P9BE-NEXT: rldicl r6, r5, 1, 63		; P9BE-NEXT: rldicl r6, r5, 1, 63
; P9BE-NEXT: sradi r5, r5, 4		; P9BE-NEXT: sradi r5, r5, 4
; P9BE-NEXT: add r5, r5, r6		; P9BE-NEXT: add r5, r5, r6
; P9BE-NEXT: mulli r5, r5, 23		; P9BE-NEXT: mulli r5, r5, 23
; P9BE-NEXT: sub r4, r4, r5		; P9BE-NEXT: sub r4, r4, r5
; P9BE-NEXT: mtvsrdd v3, r4, r3		; P9BE-NEXT: mtvsrdd v3, r4, r3
; P9BE-NEXT: lis r4, 25653		; P9BE-NEXT: lis r4, 25653
		; P9BE-NEXT: mfvsrld r3, v2
; P9BE-NEXT: ori r4, r4, 15432		; P9BE-NEXT: ori r4, r4, 15432
; P9BE-NEXT: sldi r4, r4, 32		; P9BE-NEXT: sldi r4, r4, 32
; P9BE-NEXT: oris r4, r4, 1603		; P9BE-NEXT: oris r4, r4, 1603
; P9BE-NEXT: mfvsrld r3, v2
; P9BE-NEXT: ori r4, r4, 21445		; P9BE-NEXT: ori r4, r4, 21445
; P9BE-NEXT: mulhd r4, r3, r4		; P9BE-NEXT: mulhd r4, r3, r4
; P9BE-NEXT: rldicl r5, r4, 1, 63		; P9BE-NEXT: rldicl r5, r4, 1, 63
; P9BE-NEXT: sradi r4, r4, 8		; P9BE-NEXT: sradi r4, r4, 8
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 654		; P9BE-NEXT: mulli r4, r4, 654
; P9BE-NEXT: sub r3, r3, r4		; P9BE-NEXT: sub r3, r3, r4
; P9BE-NEXT: mtvsrdd v2, 0, r3		; P9BE-NEXT: mtvsrdd v2, 0, r3
▲ Show 20 Lines • Show All 103 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/topdepthreduce-postra.mir

This file was added.

				# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
				# RUN: llc -mtriple=powerpc64le-unknown-linux-gnu -mcpu=pwr9 -run-pass=postmisched -o - %s \| FileCheck %s
				---
				# Check that postmisched's TopDepthReduce heuristic moves the MULLD later
				# because of the dependency on x5
				name: test
				body: \|
				bb.0:
				; CHECK-LABEL: name: test
				; CHECK: renamable $x5 = LD 0, killed renamable $x5 :: (load 8)
				; CHECK: renamable $x4 = LD 0, killed renamable $x4 :: (load 8)
				; CHECK: renamable $x5 = MULLD killed renamable $x5, renamable $x3
				; CHECK: renamable $x3 = MADDLD8 killed renamable $x4, killed renamable $x3, killed renamable $x5
				renamable $x5 = LD 0, killed renamable $x5 :: (load 8)
				renamable $x5 = MULLD killed renamable $x5, renamable $x3
				renamable $x4 = LD 0, killed renamable $x4 :: (load 8)
				renamable $x3 = MADDLD8 killed renamable $x4, killed renamable $x3, killed renamable $x5
				...

llvm/test/CodeGen/PowerPC/uint-to-fp-v4i32.ll

	Show All 14 Lines
	; P9BE-LABEL: test1:			; P9BE-LABEL: test1:
	; P9BE: # %bb.0: # %entry			; P9BE: # %bb.0: # %entry
	; P9BE-NEXT: li r3, 0			; P9BE-NEXT: li r3, 0
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31			; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
	; P9BE-NEXT: mtfprwz f0, r3			; P9BE-NEXT: mtfprwz f0, r3
	; P9BE-NEXT: li r3, 2			; P9BE-NEXT: li r3, 2
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vextuhlx r3, r3, v2
				; P9BE-NEXT: xscvuxddp f0, f0
	; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31			; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
	; P9BE-NEXT: mtfprwz f1, r3			; P9BE-NEXT: mtfprwz f1, r3
	; P9BE-NEXT: xscvuxddp f0, f0
	; P9BE-NEXT: xscvuxddp f1, f1			; P9BE-NEXT: xscvuxddp f1, f1
	; P9BE-NEXT: xxmrghd v2, vs0, vs1			; P9BE-NEXT: xxmrghd v2, vs0, vs1
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P9LE-LABEL: test1:			; P9LE-LABEL: test1:
	; P9LE: # %bb.0: # %entry			; P9LE: # %bb.0: # %entry
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: li r3, 0
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: rlwinm r3, r3, 0, 16, 31			; P9LE-NEXT: rlwinm r3, r3, 0, 16, 31
	; P9LE-NEXT: mtfprwz f0, r3			; P9LE-NEXT: mtfprwz f0, r3
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: li r3, 2
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vextuhrx r3, r3, v2
				; P9LE-NEXT: xscvuxddp f0, f0
	; P9LE-NEXT: rlwinm r3, r3, 0, 16, 31			; P9LE-NEXT: rlwinm r3, r3, 0, 16, 31
	; P9LE-NEXT: mtfprwz f1, r3			; P9LE-NEXT: mtfprwz f1, r3
	; P9LE-NEXT: xscvuxddp f0, f0
	; P9LE-NEXT: xscvuxddp f1, f1			; P9LE-NEXT: xscvuxddp f1, f1
	; P9LE-NEXT: xxmrghd v2, vs1, vs0			; P9LE-NEXT: xxmrghd v2, vs1, vs0
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P8BE-LABEL: test1:			; P8BE-LABEL: test1:
	; P8BE: # %bb.0: # %entry			; P8BE: # %bb.0: # %entry
	; P8BE-NEXT: mfvsrd r3, v2			; P8BE-NEXT: mfvsrd r3, v2
	; P8BE-NEXT: rldicl r4, r3, 16, 48			; P8BE-NEXT: rldicl r4, r3, 16, 48
	▲ Show 20 Lines • Show All 86 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/unaligned-addressing-mode.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu -mcpu=pwr9 -ppc-convert-rr-to-ri=false -ppc-asm-full-reg-names < %s \| FileCheck %s		; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu -mcpu=pwr9 -ppc-convert-rr-to-ri=false -ppc-asm-full-reg-names < %s \| FileCheck %s

; ISEL matches address mode xaddr.		; ISEL matches address mode xaddr.
define i8 @test_xaddr(i8* %p) {		define i8 @test_xaddr(i8* %p) {
; CHECK-LABEL: test_xaddr:		; CHECK-LABEL: test_xaddr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li r4, 0		; CHECK-NEXT: li r4, 0
; CHECK-NEXT: ori r4, r4, 40000
; CHECK-NEXT: std r3, -8(r1)		; CHECK-NEXT: std r3, -8(r1)
		; CHECK-NEXT: ori r4, r4, 40000
; CHECK-NEXT: lbzx r3, r3, r4		; CHECK-NEXT: lbzx r3, r3, r4
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%p.addr = alloca i8*, align 8		%p.addr = alloca i8*, align 8
store i8* %p, i8** %p.addr, align 8		store i8* %p, i8** %p.addr, align 8
%0 = load i8, i8* %p.addr, align 8		%0 = load i8, i8* %p.addr, align 8
%add.ptr = getelementptr inbounds i8, i8* %0, i64 40000		%add.ptr = getelementptr inbounds i8, i8* %0, i64 40000
%1 = load i8, i8* %add.ptr, align 1		%1 = load i8, i8* %add.ptr, align 1
Show All 32 Lines	entry:
ret <2 x double> %1		ret <2 x double> %1
}		}

; ISEL matches address mode xoaddr.		; ISEL matches address mode xoaddr.
define void @test_xoaddr(i32* %arr, i32* %arrTo) {		define void @test_xoaddr(i32* %arr, i32* %arrTo) {
; CHECK-LABEL: test_xoaddr:		; CHECK-LABEL: test_xoaddr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: addi r3, r3, 8		; CHECK-NEXT: addi r3, r3, 8
; CHECK-NEXT: lxvx vs0, 0, r3
; CHECK-NEXT: addi r4, r4, 4		; CHECK-NEXT: addi r4, r4, 4
		; CHECK-NEXT: lxvx vs0, 0, r3
; CHECK-NEXT: stxvx vs0, 0, r4		; CHECK-NEXT: stxvx vs0, 0, r4
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%arrayidx = getelementptr inbounds i32, i32* %arrTo, i64 1		%arrayidx = getelementptr inbounds i32, i32* %arrTo, i64 1
%0 = bitcast i32* %arrayidx to <4 x i32>*		%0 = bitcast i32* %arrayidx to <4 x i32>*
%arrayidx1 = getelementptr inbounds i32, i32* %arr, i64 2		%arrayidx1 = getelementptr inbounds i32, i32* %arr, i64 2
%1 = bitcast i32* %arrayidx1 to <4 x i32>*		%1 = bitcast i32* %arrayidx1 to <4 x i32>*
%2 = load <4 x i32>, <4 x i32>* %1, align 8		%2 = load <4 x i32>, <4 x i32>* %1, align 8
store <4 x i32> %2, <4 x i32>* %0, align 8		store <4 x i32> %2, <4 x i32>* %0, align 8
ret void		ret void
}		}

; ISEL matches address mode xaddrX4 and generates LI which can be moved outside of		; ISEL matches address mode xaddrX4 and generates LI which can be moved outside of
; loop.		; loop.
define i64 @test_xaddrX4_loop(i8* %p) {		define i64 @test_xaddrX4_loop(i8* %p) {
; CHECK-LABEL: test_xaddrX4_loop:		; CHECK-LABEL: test_xaddrX4_loop:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: addi r4, r3, -8		; CHECK-NEXT: addi r4, r3, -8
; CHECK-NEXT: li r3, 8		; CHECK-NEXT: li r3, 8
		; CHECK-NEXT: li r5, 3
; CHECK-NEXT: mtctr r3		; CHECK-NEXT: mtctr r3
; CHECK-NEXT: li r3, 0		; CHECK-NEXT: li r3, 0
; CHECK-NEXT: li r5, 3
; loop instruction number is changed from 5 to 4, so its align is changed from 5 to 4.		; loop instruction number is changed from 5 to 4, so its align is changed from 5 to 4.
; CHECK-NEXT: .p2align 4		; CHECK-NEXT: .p2align 4
; CHECK-NEXT: .LBB4_1: # %for.body		; CHECK-NEXT: .LBB4_1: # %for.body
; CHECK: ldu r6, 8(r4)		; CHECK: ldu r6, 8(r4)
; CHECK-NEXT: ldx r7, r4, r5		; CHECK-NEXT: ldx r7, r4, r5
; CHECK-NEXT: maddld r3, r7, r6, r3		; CHECK-NEXT: maddld r3, r7, r6, r3
; CHECK-NEXT: bdnz .LBB4_1		; CHECK-NEXT: bdnz .LBB4_1
; CHECK-NEXT: # %bb.2: # %for.end		; CHECK-NEXT: # %bb.2: # %for.end
Show All 24 Lines

llvm/test/CodeGen/PowerPC/urem-vector-lkk.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \		; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9LE		; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9LE
; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \		; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9BE		; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9BE
; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \		; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8LE		; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8LE
; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \		; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8BE		; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8BE

define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {		define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {
; P9LE-LABEL: fold_urem_vec_1:		; P9LE-LABEL: fold_urem_vec_1:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: lis r5, 21399		; P9LE-NEXT: lis r5, 21399
		; P9LE-NEXT: lis r6, 22765
		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: ori r5, r5, 33437		; P9LE-NEXT: ori r5, r5, 33437
		; P9LE-NEXT: ori r6, r6, 8969
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: mulld r4, r4, r5		; P9LE-NEXT: mulld r4, r4, r5
; P9LE-NEXT: lis r5, 16727		; P9LE-NEXT: lis r5, 16727
; P9LE-NEXT: ori r5, r5, 2287		; P9LE-NEXT: ori r5, r5, 2287
; P9LE-NEXT: rldicl r4, r4, 27, 37		; P9LE-NEXT: rldicl r4, r4, 27, 37
; P9LE-NEXT: mulli r4, r4, 98		; P9LE-NEXT: mulli r4, r4, 98
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: mulld r4, r4, r5		; P9LE-NEXT: mulld r4, r4, r5
; P9LE-NEXT: lis r5, 8456		; P9LE-NEXT: lis r5, 8456
; P9LE-NEXT: ori r5, r5, 16913		; P9LE-NEXT: ori r5, r5, 16913
; P9LE-NEXT: rldicl r4, r4, 24, 40		; P9LE-NEXT: rldicl r4, r4, 24, 40
; P9LE-NEXT: mulli r4, r4, 1003		; P9LE-NEXT: mulli r4, r4, 1003
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: rlwinm r4, r3, 30, 18, 31		; P9LE-NEXT: rlwinm r4, r3, 30, 18, 31
		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: mulld r4, r4, r5		; P9LE-NEXT: mulld r4, r4, r5
; P9LE-NEXT: rldicl r4, r4, 30, 34		; P9LE-NEXT: rldicl r4, r4, 30, 34
; P9LE-NEXT: mulli r4, r4, 124		; P9LE-NEXT: mulli r4, r4, 124
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 0		; P9LE-NEXT: li r3, 0
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: lis r6, 22765
; P9LE-NEXT: ori r6, r6, 8969
; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxswapd v4, vs0		; P9LE-NEXT: xxswapd v4, vs0
		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: clrldi r5, r4, 32		; P9LE-NEXT: clrldi r5, r4, 32
; P9LE-NEXT: mulld r5, r5, r6		; P9LE-NEXT: mulld r5, r5, r6
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: subf r4, r5, r4		; P9LE-NEXT: subf r4, r5, r4
; P9LE-NEXT: srwi r4, r4, 1		; P9LE-NEXT: srwi r4, r4, 1
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: srwi r4, r4, 6		; P9LE-NEXT: srwi r4, r4, 6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v2, v4, v2		; P9LE-NEXT: vmrglh v2, v4, v2
; P9LE-NEXT: vmrglw v2, v3, v2		; P9LE-NEXT: vmrglw v2, v3, v2
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: fold_urem_vec_1:		; P9BE-LABEL: fold_urem_vec_1:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: lis r5, 16727		; P9BE-NEXT: lis r5, 16727
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r5, r5, 2287		; P9BE-NEXT: ori r5, r5, 2287
		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r5		; P9BE-NEXT: mulld r4, r4, r5
; P9BE-NEXT: lis r5, 21399		; P9BE-NEXT: lis r5, 21399
; P9BE-NEXT: ori r5, r5, 33437		; P9BE-NEXT: ori r5, r5, 33437
; P9BE-NEXT: rldicl r4, r4, 24, 40		; P9BE-NEXT: rldicl r4, r4, 24, 40
; P9BE-NEXT: mulli r4, r4, 1003		; P9BE-NEXT: mulli r4, r4, 1003
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v3, r3		; P9BE-NEXT: mtvsrd v3, r3
; P9BE-NEXT: li r3, 4		; P9BE-NEXT: li r3, 4
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r5		; P9BE-NEXT: mulld r4, r4, r5
; P9BE-NEXT: lis r5, 8456		; P9BE-NEXT: lis r5, 8456
; P9BE-NEXT: ori r5, r5, 16913		; P9BE-NEXT: ori r5, r5, 16913
; P9BE-NEXT: rldicl r4, r4, 27, 37		; P9BE-NEXT: rldicl r4, r4, 27, 37
; P9BE-NEXT: mulli r4, r4, 98		; P9BE-NEXT: mulli r4, r4, 98
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: clrlwi r4, r3, 16		; P9BE-NEXT: clrlwi r4, r3, 16
; P9BE-NEXT: rlwinm r3, r3, 30, 18, 31		; P9BE-NEXT: rlwinm r3, r3, 30, 18, 31
; P9BE-NEXT: mulld r3, r3, r5		; P9BE-NEXT: mulld r3, r3, r5
; P9BE-NEXT: lis r5, 22765		; P9BE-NEXT: lis r5, 22765
; P9BE-NEXT: ori r5, r5, 8969		; P9BE-NEXT: ori r5, r5, 8969
; P9BE-NEXT: rldicl r3, r3, 30, 34		; P9BE-NEXT: rldicl r3, r3, 30, 34
; P9BE-NEXT: mulli r3, r3, 124		; P9BE-NEXT: mulli r3, r3, 124
; P9BE-NEXT: subf r3, r3, r4		; P9BE-NEXT: subf r3, r3, r4
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r5		; P9BE-NEXT: mulld r4, r4, r5
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: subf r5, r4, r3		; P9BE-NEXT: subf r5, r4, r3
▲ Show 20 Lines • Show All 120 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>		%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>
ret <4 x i16> %1		ret <4 x i16> %1
}		}

define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {		define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {
; P9LE-LABEL: fold_urem_vec_2:		; P9LE-LABEL: fold_urem_vec_2:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 0		; P9LE-NEXT: li r3, 0
; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: lis r6, 22765		; P9LE-NEXT: lis r6, 22765
		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: ori r6, r6, 8969		; P9LE-NEXT: ori r6, r6, 8969
		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: clrldi r5, r4, 32		; P9LE-NEXT: clrldi r5, r4, 32
; P9LE-NEXT: mulld r5, r5, r6		; P9LE-NEXT: mulld r5, r5, r6
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: subf r4, r5, r4		; P9LE-NEXT: subf r4, r5, r4
; P9LE-NEXT: srwi r4, r4, 1		; P9LE-NEXT: srwi r4, r4, 1
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: srwi r4, r4, 6		; P9LE-NEXT: srwi r4, r4, 6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: clrldi r5, r4, 32		; P9LE-NEXT: clrldi r5, r4, 32
; P9LE-NEXT: mulld r5, r5, r6		; P9LE-NEXT: mulld r5, r5, r6
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: subf r4, r5, r4		; P9LE-NEXT: subf r4, r5, r4
; P9LE-NEXT: srwi r4, r4, 1		; P9LE-NEXT: srwi r4, r4, 1
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: srwi r4, r4, 6		; P9LE-NEXT: srwi r4, r4, 6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: clrldi r5, r4, 32		; P9LE-NEXT: clrldi r5, r4, 32
; P9LE-NEXT: mulld r5, r5, r6		; P9LE-NEXT: mulld r5, r5, r6
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: subf r4, r5, r4		; P9LE-NEXT: subf r4, r5, r4
; P9LE-NEXT: srwi r4, r4, 1		; P9LE-NEXT: srwi r4, r4, 1
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: srwi r4, r4, 6		; P9LE-NEXT: srwi r4, r4, 6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: clrldi r5, r4, 32		; P9LE-NEXT: clrldi r5, r4, 32
; P9LE-NEXT: mulld r5, r5, r6		; P9LE-NEXT: mulld r5, r5, r6
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: subf r4, r5, r4		; P9LE-NEXT: subf r4, r5, r4
; P9LE-NEXT: srwi r4, r4, 1		; P9LE-NEXT: srwi r4, r4, 1
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: srwi r4, r4, 6		; P9LE-NEXT: srwi r4, r4, 6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v2, v2, v4		; P9LE-NEXT: vmrglh v2, v2, v4
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: fold_urem_vec_2:		; P9BE-LABEL: fold_urem_vec_2:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: lis r5, 22765		; P9BE-NEXT: lis r5, 22765
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r5, r5, 8969		; P9BE-NEXT: ori r5, r5, 8969
		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r5		; P9BE-NEXT: mulld r4, r4, r5
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: subf r6, r4, r3		; P9BE-NEXT: subf r6, r4, r3
; P9BE-NEXT: srwi r6, r6, 1		; P9BE-NEXT: srwi r6, r6, 1
; P9BE-NEXT: add r4, r6, r4		; P9BE-NEXT: add r4, r6, r4
; P9BE-NEXT: srwi r4, r4, 6		; P9BE-NEXT: srwi r4, r4, 6
; P9BE-NEXT: mulli r4, r4, 95		; P9BE-NEXT: mulli r4, r4, 95
Show All 11 Lines
; P9BE-NEXT: add r4, r6, r4		; P9BE-NEXT: add r4, r6, r4
; P9BE-NEXT: srwi r4, r4, 6		; P9BE-NEXT: srwi r4, r4, 6
; P9BE-NEXT: mulli r4, r4, 95		; P9BE-NEXT: mulli r4, r4, 95
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r5		; P9BE-NEXT: mulld r4, r4, r5
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: subf r6, r4, r3		; P9BE-NEXT: subf r6, r4, r3
; P9BE-NEXT: srwi r6, r6, 1		; P9BE-NEXT: srwi r6, r6, 1
; P9BE-NEXT: add r4, r6, r4		; P9BE-NEXT: add r4, r6, r4
; P9BE-NEXT: srwi r4, r4, 6		; P9BE-NEXT: srwi r4, r4, 6
; P9BE-NEXT: mulli r4, r4, 95		; P9BE-NEXT: mulli r4, r4, 95
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r5		; P9BE-NEXT: mulld r4, r4, r5
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: subf r5, r4, r3		; P9BE-NEXT: subf r5, r4, r3
▲ Show 20 Lines • Show All 141 Lines • ▼ Show 20 Lines
}		}


; Don't fold if we can combine urem with udiv.		; Don't fold if we can combine urem with udiv.
define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {		define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {
; P9LE-LABEL: combine_urem_udiv:		; P9LE-LABEL: combine_urem_udiv:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 0		; P9LE-NEXT: li r3, 0
; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: lis r6, 22765		; P9LE-NEXT: lis r6, 22765
		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: ori r6, r6, 8969		; P9LE-NEXT: ori r6, r6, 8969
		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: clrldi r5, r4, 32		; P9LE-NEXT: clrldi r5, r4, 32
; P9LE-NEXT: mulld r5, r5, r6		; P9LE-NEXT: mulld r5, r5, r6
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: subf r4, r5, r4		; P9LE-NEXT: subf r4, r5, r4
; P9LE-NEXT: srwi r4, r4, 1		; P9LE-NEXT: srwi r4, r4, 1
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: srwi r4, r4, 6		; P9LE-NEXT: srwi r4, r4, 6
; P9LE-NEXT: mulli r5, r4, 95		; P9LE-NEXT: mulli r5, r4, 95
; P9LE-NEXT: subf r3, r5, r3		; P9LE-NEXT: subf r3, r5, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: rlwinm r5, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r5, r3, 0, 16, 31
; P9LE-NEXT: clrldi r7, r5, 32		; P9LE-NEXT: clrldi r7, r5, 32
; P9LE-NEXT: mulld r7, r7, r6		; P9LE-NEXT: mulld r7, r7, r6
; P9LE-NEXT: rldicl r7, r7, 32, 32		; P9LE-NEXT: rldicl r7, r7, 32, 32
; P9LE-NEXT: subf r5, r7, r5		; P9LE-NEXT: subf r5, r7, r5
; P9LE-NEXT: srwi r5, r5, 1		; P9LE-NEXT: srwi r5, r5, 1
; P9LE-NEXT: add r5, r5, r7		; P9LE-NEXT: add r5, r5, r7
; P9LE-NEXT: srwi r5, r5, 6		; P9LE-NEXT: srwi r5, r5, 6
; P9LE-NEXT: mulli r7, r5, 95		; P9LE-NEXT: mulli r7, r5, 95
; P9LE-NEXT: subf r3, r7, r3		; P9LE-NEXT: subf r3, r7, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: rlwinm r7, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r7, r3, 0, 16, 31
		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: clrldi r8, r7, 32		; P9LE-NEXT: clrldi r8, r7, 32
; P9LE-NEXT: mulld r8, r8, r6		; P9LE-NEXT: mulld r8, r8, r6
; P9LE-NEXT: rldicl r8, r8, 32, 32		; P9LE-NEXT: rldicl r8, r8, 32, 32
; P9LE-NEXT: subf r7, r8, r7		; P9LE-NEXT: subf r7, r8, r7
; P9LE-NEXT: srwi r7, r7, 1		; P9LE-NEXT: srwi r7, r7, 1
; P9LE-NEXT: add r7, r7, r8		; P9LE-NEXT: add r7, r7, r8
; P9LE-NEXT: srwi r7, r7, 6		; P9LE-NEXT: srwi r7, r7, 6
; P9LE-NEXT: mulli r8, r7, 95		; P9LE-NEXT: mulli r8, r7, 95
; P9LE-NEXT: subf r3, r8, r3		; P9LE-NEXT: subf r3, r8, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: rlwinm r8, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r8, r3, 0, 16, 31
; P9LE-NEXT: clrldi r9, r8, 32		; P9LE-NEXT: clrldi r9, r8, 32
; P9LE-NEXT: mulld r6, r9, r6		; P9LE-NEXT: mulld r6, r9, r6
; P9LE-NEXT: rldicl r6, r6, 32, 32		; P9LE-NEXT: rldicl r6, r6, 32, 32
; P9LE-NEXT: subf r8, r6, r8		; P9LE-NEXT: subf r8, r6, r8
; P9LE-NEXT: srwi r8, r8, 1		; P9LE-NEXT: srwi r8, r8, 1
; P9LE-NEXT: add r6, r8, r6		; P9LE-NEXT: add r6, r8, r6
; P9LE-NEXT: srwi r6, r6, 6		; P9LE-NEXT: srwi r6, r6, 6
; P9LE-NEXT: mulli r8, r6, 95		; P9LE-NEXT: mulli r8, r6, 95
; P9LE-NEXT: subf r3, r8, r3		; P9LE-NEXT: subf r3, r8, r3
; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: mtvsrd f0, r4		; P9LE-NEXT: mtvsrd f0, r4
; P9LE-NEXT: vmrglh v2, v2, v4		; P9LE-NEXT: vmrglh v2, v2, v4
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: xxswapd v3, vs0		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r5		; P9LE-NEXT: mtvsrd f0, r5
; P9LE-NEXT: xxswapd v4, vs0		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r7		; P9LE-NEXT: mtvsrd f0, r7
; P9LE-NEXT: vmrglh v3, v4, v3		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxswapd v4, vs0		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r6		; P9LE-NEXT: mtvsrd f0, r6
; P9LE-NEXT: xxswapd v5, vs0		; P9LE-NEXT: xxswapd v5, vs0
; P9LE-NEXT: vmrglh v4, v5, v4		; P9LE-NEXT: vmrglh v4, v5, v4
; P9LE-NEXT: vmrglw v3, v4, v3		; P9LE-NEXT: vmrglw v3, v4, v3
; P9LE-NEXT: vadduhm v2, v2, v3		; P9LE-NEXT: vadduhm v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: combine_urem_udiv:		; P9BE-LABEL: combine_urem_udiv:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9BE-NEXT: lis r6, 22765		; P9BE-NEXT: lis r6, 22765
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r6, r6, 8969		; P9BE-NEXT: ori r6, r6, 8969
		; P9BE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9BE-NEXT: clrldi r5, r4, 32		; P9BE-NEXT: clrldi r5, r4, 32
; P9BE-NEXT: mulld r5, r5, r6		; P9BE-NEXT: mulld r5, r5, r6
; P9BE-NEXT: rldicl r5, r5, 32, 32		; P9BE-NEXT: rldicl r5, r5, 32, 32
; P9BE-NEXT: subf r4, r5, r4		; P9BE-NEXT: subf r4, r5, r4
; P9BE-NEXT: srwi r4, r4, 1		; P9BE-NEXT: srwi r4, r4, 1
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: srwi r4, r4, 6		; P9BE-NEXT: srwi r4, r4, 6
; P9BE-NEXT: mulli r5, r4, 95		; P9BE-NEXT: mulli r5, r4, 95
Show All 11 Lines
; P9BE-NEXT: add r5, r5, r7		; P9BE-NEXT: add r5, r5, r7
; P9BE-NEXT: srwi r5, r5, 6		; P9BE-NEXT: srwi r5, r5, 6
; P9BE-NEXT: mulli r7, r5, 95		; P9BE-NEXT: mulli r7, r5, 95
; P9BE-NEXT: subf r3, r7, r3		; P9BE-NEXT: subf r3, r7, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: rlwinm r7, r3, 0, 16, 31		; P9BE-NEXT: rlwinm r7, r3, 0, 16, 31
; P9BE-NEXT: clrldi r8, r7, 32		; P9BE-NEXT: clrldi r8, r7, 32
; P9BE-NEXT: mulld r8, r8, r6		; P9BE-NEXT: mulld r8, r8, r6
; P9BE-NEXT: rldicl r8, r8, 32, 32		; P9BE-NEXT: rldicl r8, r8, 32, 32
; P9BE-NEXT: subf r7, r8, r7		; P9BE-NEXT: subf r7, r8, r7
; P9BE-NEXT: srwi r7, r7, 1		; P9BE-NEXT: srwi r7, r7, 1
; P9BE-NEXT: add r7, r7, r8		; P9BE-NEXT: add r7, r7, r8
; P9BE-NEXT: srwi r7, r7, 6		; P9BE-NEXT: srwi r7, r7, 6
; P9BE-NEXT: mulli r8, r7, 95		; P9BE-NEXT: mulli r8, r7, 95
; P9BE-NEXT: subf r3, r8, r3		; P9BE-NEXT: subf r3, r8, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r8, r3, 32		; P9BE-NEXT: clrldi r8, r3, 32
; P9BE-NEXT: mulld r6, r8, r6		; P9BE-NEXT: mulld r6, r8, r6
; P9BE-NEXT: rldicl r6, r6, 32, 32		; P9BE-NEXT: rldicl r6, r6, 32, 32
; P9BE-NEXT: subf r8, r6, r3		; P9BE-NEXT: subf r8, r6, r3
▲ Show 20 Lines • Show All 180 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
ret <4 x i16> %3		ret <4 x i16> %3
}		}

; Don't fold for divisors that are a power of two.		; Don't fold for divisors that are a power of two.
define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {		define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {
; P9LE-LABEL: dont_fold_urem_power_of_two:		; P9LE-LABEL: dont_fold_urem_power_of_two:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: li r3, 0		; P9LE-NEXT: li r3, 0
		; P9LE-NEXT: lis r6, 22765
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: ori r6, r6, 8969
; P9LE-NEXT: rlwinm r3, r3, 0, 26, 31		; P9LE-NEXT: rlwinm r3, r3, 0, 26, 31
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: rlwinm r3, r3, 0, 27, 31
; P9LE-NEXT: xxswapd v3, vs0		; P9LE-NEXT: xxswapd v3, vs0
		; P9LE-NEXT: rlwinm r3, r3, 0, 27, 31
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: lis r6, 22765
; P9LE-NEXT: ori r6, r6, 8969
; P9LE-NEXT: xxswapd v4, vs0		; P9LE-NEXT: xxswapd v4, vs0
		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: vmrglh v3, v4, v3		; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: clrldi r5, r4, 32		; P9LE-NEXT: clrldi r5, r4, 32
; P9LE-NEXT: mulld r5, r5, r6		; P9LE-NEXT: mulld r5, r5, r6
; P9LE-NEXT: rldicl r5, r5, 32, 32		; P9LE-NEXT: rldicl r5, r5, 32, 32
; P9LE-NEXT: subf r4, r5, r4		; P9LE-NEXT: subf r4, r5, r4
; P9LE-NEXT: srwi r4, r4, 1		; P9LE-NEXT: srwi r4, r4, 1
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: srwi r4, r4, 6		; P9LE-NEXT: srwi r4, r4, 6
; P9LE-NEXT: mulli r4, r4, 95		; P9LE-NEXT: mulli r4, r4, 95
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 4		; P9LE-NEXT: li r3, 4
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
; P9LE-NEXT: rlwinm r3, r3, 0, 29, 31
; P9LE-NEXT: xxswapd v4, vs0		; P9LE-NEXT: xxswapd v4, vs0
		; P9LE-NEXT: rlwinm r3, r3, 0, 29, 31
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v2, v4, v2		; P9LE-NEXT: vmrglh v2, v4, v2
; P9LE-NEXT: vmrglw v2, v2, v3		; P9LE-NEXT: vmrglw v2, v2, v3
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_urem_power_of_two:		; P9BE-LABEL: dont_fold_urem_power_of_two:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
		; P9BE-NEXT: lis r5, 22765
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: ori r5, r5, 8969
; P9BE-NEXT: rlwinm r3, r3, 0, 27, 31		; P9BE-NEXT: rlwinm r3, r3, 0, 27, 31
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v3, r3		; P9BE-NEXT: mtvsrd v3, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 26, 31		; P9BE-NEXT: rlwinm r3, r3, 0, 26, 31
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: lis r5, 22765
; P9BE-NEXT: ori r5, r5, 8969
; P9BE-NEXT: vmrghh v3, v4, v3		; P9BE-NEXT: vmrghh v3, v4, v3
		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r5		; P9BE-NEXT: mulld r4, r4, r5
; P9BE-NEXT: rldicl r4, r4, 32, 32		; P9BE-NEXT: rldicl r4, r4, 32, 32
; P9BE-NEXT: subf r5, r4, r3		; P9BE-NEXT: subf r5, r4, r3
; P9BE-NEXT: srwi r5, r5, 1		; P9BE-NEXT: srwi r5, r5, 1
; P9BE-NEXT: add r4, r5, r4		; P9BE-NEXT: add r4, r5, r4
; P9BE-NEXT: srwi r4, r4, 6		; P9BE-NEXT: srwi r4, r4, 6
; P9BE-NEXT: mulli r4, r4, 95		; P9BE-NEXT: mulli r4, r4, 95
▲ Show 20 Lines • Show All 99 Lines • ▼ Show 20 Lines
; P9LE-NEXT: lis r6, 24749		; P9LE-NEXT: lis r6, 24749
; P9LE-NEXT: ori r6, r6, 47143		; P9LE-NEXT: ori r6, r6, 47143
; P9LE-NEXT: rldicl r4, r4, 28, 36		; P9LE-NEXT: rldicl r4, r4, 28, 36
; P9LE-NEXT: mulli r4, r4, 23		; P9LE-NEXT: mulli r4, r4, 23
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 6		; P9LE-NEXT: li r3, 6
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31		; P9LE-NEXT: rlwinm r4, r3, 0, 16, 31
; P9LE-NEXT: mulld r4, r4, r6		; P9LE-NEXT: mulld r4, r4, r6
; P9LE-NEXT: rldicl r4, r4, 21, 43		; P9LE-NEXT: rldicl r4, r4, 21, 43
; P9LE-NEXT: mulli r4, r4, 5423		; P9LE-NEXT: mulli r4, r4, 5423
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v3, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: li r3, 2		; P9LE-NEXT: li r3, 2
; P9LE-NEXT: vextuhrx r3, r3, v2		; P9LE-NEXT: vextuhrx r3, r3, v2
		; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: rlwinm r4, r3, 31, 17, 31		; P9LE-NEXT: rlwinm r4, r3, 31, 17, 31
		; P9LE-NEXT: vmrglh v3, v4, v3
		; P9LE-NEXT: xxlxor v4, v4, v4
; P9LE-NEXT: mulld r4, r4, r5		; P9LE-NEXT: mulld r4, r4, r5
; P9LE-NEXT: rldicl r4, r4, 24, 40		; P9LE-NEXT: rldicl r4, r4, 24, 40
; P9LE-NEXT: mulli r4, r4, 654		; P9LE-NEXT: mulli r4, r4, 654
; P9LE-NEXT: subf r3, r4, r3		; P9LE-NEXT: subf r3, r4, r3
; P9LE-NEXT: xxswapd v4, vs0
; P9LE-NEXT: mtvsrd f0, r3		; P9LE-NEXT: mtvsrd f0, r3
; P9LE-NEXT: xxswapd v2, vs0		; P9LE-NEXT: xxswapd v2, vs0
; P9LE-NEXT: vmrglh v3, v4, v3
; P9LE-NEXT: xxlxor v4, v4, v4
; P9LE-NEXT: vmrglh v2, v2, v4		; P9LE-NEXT: vmrglh v2, v2, v4
; P9LE-NEXT: vmrglw v2, v3, v2		; P9LE-NEXT: vmrglw v2, v3, v2
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_urem_one:		; P9BE-LABEL: dont_fold_urem_one:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: li r3, 6		; P9BE-NEXT: li r3, 6
; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: lis r5, 24749		; P9BE-NEXT: lis r5, 24749
		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: ori r5, r5, 47143		; P9BE-NEXT: ori r5, r5, 47143
		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r5		; P9BE-NEXT: mulld r4, r4, r5
; P9BE-NEXT: li r5, 0		; P9BE-NEXT: li r5, 0
; P9BE-NEXT: oris r6, r5, 45590		; P9BE-NEXT: oris r6, r5, 45590
; P9BE-NEXT: oris r5, r5, 51306		; P9BE-NEXT: oris r5, r5, 51306
; P9BE-NEXT: ori r6, r6, 17097		; P9BE-NEXT: ori r6, r6, 17097
; P9BE-NEXT: ori r5, r5, 30865		; P9BE-NEXT: ori r5, r5, 30865
; P9BE-NEXT: rldicl r4, r4, 21, 43		; P9BE-NEXT: rldicl r4, r4, 21, 43
; P9BE-NEXT: mulli r4, r4, 5423		; P9BE-NEXT: mulli r4, r4, 5423
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v3, r3		; P9BE-NEXT: mtvsrd v3, r3
; P9BE-NEXT: li r3, 4		; P9BE-NEXT: li r3, 4
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31		; P9BE-NEXT: rlwinm r3, r3, 0, 16, 31
; P9BE-NEXT: clrldi r4, r3, 32		; P9BE-NEXT: clrldi r4, r3, 32
; P9BE-NEXT: mulld r4, r4, r6		; P9BE-NEXT: mulld r4, r4, r6
; P9BE-NEXT: rldicl r4, r4, 28, 36		; P9BE-NEXT: rldicl r4, r4, 28, 36
; P9BE-NEXT: mulli r4, r4, 23		; P9BE-NEXT: mulli r4, r4, 23
; P9BE-NEXT: subf r3, r4, r3		; P9BE-NEXT: subf r3, r4, r3
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: li r3, 2		; P9BE-NEXT: li r3, 2
; P9BE-NEXT: vextuhlx r3, r3, v2		; P9BE-NEXT: vextuhlx r3, r3, v2
		; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: clrlwi r4, r3, 16		; P9BE-NEXT: clrlwi r4, r3, 16
; P9BE-NEXT: rlwinm r3, r3, 31, 17, 31		; P9BE-NEXT: rlwinm r3, r3, 31, 17, 31
; P9BE-NEXT: mulld r3, r3, r5		; P9BE-NEXT: mulld r3, r3, r5
; P9BE-NEXT: rldicl r3, r3, 24, 40		; P9BE-NEXT: rldicl r3, r3, 24, 40
; P9BE-NEXT: mulli r3, r3, 654		; P9BE-NEXT: mulli r3, r3, 654
; P9BE-NEXT: subf r3, r3, r4		; P9BE-NEXT: subf r3, r3, r4
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: mtvsrd v2, r3		; P9BE-NEXT: mtvsrd v2, r3
; P9BE-NEXT: li r3, 0		; P9BE-NEXT: li r3, 0
; P9BE-NEXT: sldi r3, r3, 48		; P9BE-NEXT: sldi r3, r3, 48
; P9BE-NEXT: vmrghh v3, v4, v3
; P9BE-NEXT: mtvsrd v4, r3		; P9BE-NEXT: mtvsrd v4, r3
; P9BE-NEXT: vmrghh v2, v4, v2		; P9BE-NEXT: vmrghh v2, v4, v2
; P9BE-NEXT: vmrghw v2, v2, v3		; P9BE-NEXT: vmrghw v2, v2, v3
; P9BE-NEXT: blr		; P9BE-NEXT: blr
;		;
; P8LE-LABEL: dont_fold_urem_one:		; P8LE-LABEL: dont_fold_urem_one:
; P8LE: # %bb.0:		; P8LE: # %bb.0:
; P8LE-NEXT: xxswapd vs0, v2		; P8LE-NEXT: xxswapd vs0, v2
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	; CHECK-NEXT: blr
ret <4 x i16> %1		ret <4 x i16> %1
}		}

; Don't fold i64 urem.		; Don't fold i64 urem.
define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {		define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {
; P9LE-LABEL: dont_fold_urem_i64:		; P9LE-LABEL: dont_fold_urem_i64:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: lis r4, 25644		; P9LE-NEXT: lis r4, 25644
		; P9LE-NEXT: mfvsrld r3, v3
; P9LE-NEXT: ori r4, r4, 34192		; P9LE-NEXT: ori r4, r4, 34192
; P9LE-NEXT: sldi r4, r4, 32		; P9LE-NEXT: sldi r4, r4, 32
; P9LE-NEXT: oris r4, r4, 45590		; P9LE-NEXT: oris r4, r4, 45590
; P9LE-NEXT: mfvsrld r3, v3
; P9LE-NEXT: ori r4, r4, 17097		; P9LE-NEXT: ori r4, r4, 17097
; P9LE-NEXT: mulhdu r4, r3, r4		; P9LE-NEXT: mulhdu r4, r3, r4
; P9LE-NEXT: sub r5, r3, r4		; P9LE-NEXT: sub r5, r3, r4
; P9LE-NEXT: rldicl r5, r5, 63, 1		; P9LE-NEXT: rldicl r5, r5, 63, 1
; P9LE-NEXT: add r4, r5, r4		; P9LE-NEXT: add r4, r5, r4
; P9LE-NEXT: lis r5, -16037		; P9LE-NEXT: lis r5, -16037
; P9LE-NEXT: rldicl r4, r4, 60, 4		; P9LE-NEXT: rldicl r4, r4, 60, 4
; P9LE-NEXT: ori r5, r5, 28749		; P9LE-NEXT: ori r5, r5, 28749
; P9LE-NEXT: mulli r4, r4, 23		; P9LE-NEXT: mulli r4, r4, 23
; P9LE-NEXT: sldi r5, r5, 32		; P9LE-NEXT: sldi r5, r5, 32
; P9LE-NEXT: oris r5, r5, 52170		; P9LE-NEXT: oris r5, r5, 52170
; P9LE-NEXT: ori r5, r5, 12109		; P9LE-NEXT: ori r5, r5, 12109
; P9LE-NEXT: sub r3, r3, r4		; P9LE-NEXT: sub r3, r3, r4
; P9LE-NEXT: mfvsrd r4, v3		; P9LE-NEXT: mfvsrd r4, v3
; P9LE-NEXT: mulhdu r5, r4, r5		; P9LE-NEXT: mulhdu r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 52, 12		; P9LE-NEXT: rldicl r5, r5, 52, 12
; P9LE-NEXT: mulli r5, r5, 5423		; P9LE-NEXT: mulli r5, r5, 5423
; P9LE-NEXT: sub r4, r4, r5		; P9LE-NEXT: sub r4, r4, r5
; P9LE-NEXT: lis r5, 25653		; P9LE-NEXT: lis r5, 25653
; P9LE-NEXT: ori r5, r5, 15432		; P9LE-NEXT: ori r5, r5, 15432
; P9LE-NEXT: sldi r5, r5, 32
; P9LE-NEXT: mtvsrdd v3, r4, r3		; P9LE-NEXT: mtvsrdd v3, r4, r3
; P9LE-NEXT: mfvsrd r3, v2		; P9LE-NEXT: mfvsrd r3, v2
		; P9LE-NEXT: sldi r5, r5, 32
; P9LE-NEXT: rldicl r4, r3, 63, 1		; P9LE-NEXT: rldicl r4, r3, 63, 1
; P9LE-NEXT: oris r5, r5, 1603		; P9LE-NEXT: oris r5, r5, 1603
; P9LE-NEXT: ori r5, r5, 21445		; P9LE-NEXT: ori r5, r5, 21445
; P9LE-NEXT: mulhdu r4, r4, r5		; P9LE-NEXT: mulhdu r4, r4, r5
; P9LE-NEXT: rldicl r4, r4, 57, 7		; P9LE-NEXT: rldicl r4, r4, 57, 7
; P9LE-NEXT: mulli r4, r4, 654		; P9LE-NEXT: mulli r4, r4, 654
; P9LE-NEXT: sub r3, r3, r4		; P9LE-NEXT: sub r3, r3, r4
; P9LE-NEXT: li r4, 0		; P9LE-NEXT: li r4, 0
; P9LE-NEXT: mtvsrdd v2, r3, r4		; P9LE-NEXT: mtvsrdd v2, r3, r4
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_urem_i64:		; P9BE-LABEL: dont_fold_urem_i64:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: lis r4, 25644		; P9BE-NEXT: lis r4, 25644
		; P9BE-NEXT: mfvsrd r3, v3
; P9BE-NEXT: ori r4, r4, 34192		; P9BE-NEXT: ori r4, r4, 34192
; P9BE-NEXT: sldi r4, r4, 32		; P9BE-NEXT: sldi r4, r4, 32
; P9BE-NEXT: oris r4, r4, 45590		; P9BE-NEXT: oris r4, r4, 45590
; P9BE-NEXT: mfvsrd r3, v3
; P9BE-NEXT: ori r4, r4, 17097		; P9BE-NEXT: ori r4, r4, 17097
; P9BE-NEXT: mulhdu r4, r3, r4		; P9BE-NEXT: mulhdu r4, r3, r4
; P9BE-NEXT: sub r5, r3, r4		; P9BE-NEXT: sub r5, r3, r4
; P9BE-NEXT: rldicl r5, r5, 63, 1		; P9BE-NEXT: rldicl r5, r5, 63, 1
; P9BE-NEXT: add r4, r5, r4		; P9BE-NEXT: add r4, r5, r4
; P9BE-NEXT: lis r5, -16037		; P9BE-NEXT: lis r5, -16037
; P9BE-NEXT: rldicl r4, r4, 60, 4		; P9BE-NEXT: rldicl r4, r4, 60, 4
; P9BE-NEXT: mulli r4, r4, 23
; P9BE-NEXT: ori r5, r5, 28749		; P9BE-NEXT: ori r5, r5, 28749
		; P9BE-NEXT: mulli r4, r4, 23
; P9BE-NEXT: sldi r5, r5, 32		; P9BE-NEXT: sldi r5, r5, 32
; P9BE-NEXT: oris r5, r5, 52170		; P9BE-NEXT: oris r5, r5, 52170
; P9BE-NEXT: ori r5, r5, 12109		; P9BE-NEXT: ori r5, r5, 12109
; P9BE-NEXT: sub r3, r3, r4		; P9BE-NEXT: sub r3, r3, r4
; P9BE-NEXT: mfvsrld r4, v3		; P9BE-NEXT: mfvsrld r4, v3
; P9BE-NEXT: mulhdu r5, r4, r5		; P9BE-NEXT: mulhdu r5, r4, r5
; P9BE-NEXT: rldicl r5, r5, 52, 12		; P9BE-NEXT: rldicl r5, r5, 52, 12
; P9BE-NEXT: mulli r5, r5, 5423		; P9BE-NEXT: mulli r5, r5, 5423
; P9BE-NEXT: sub r4, r4, r5		; P9BE-NEXT: sub r4, r4, r5
; P9BE-NEXT: lis r5, 25653		; P9BE-NEXT: lis r5, 25653
; P9BE-NEXT: ori r5, r5, 15432		; P9BE-NEXT: ori r5, r5, 15432
; P9BE-NEXT: sldi r5, r5, 32
; P9BE-NEXT: mtvsrdd v3, r3, r4		; P9BE-NEXT: mtvsrdd v3, r3, r4
; P9BE-NEXT: mfvsrld r3, v2		; P9BE-NEXT: mfvsrld r3, v2
		; P9BE-NEXT: sldi r5, r5, 32
; P9BE-NEXT: rldicl r4, r3, 63, 1		; P9BE-NEXT: rldicl r4, r3, 63, 1
; P9BE-NEXT: oris r5, r5, 1603		; P9BE-NEXT: oris r5, r5, 1603
; P9BE-NEXT: ori r5, r5, 21445		; P9BE-NEXT: ori r5, r5, 21445
; P9BE-NEXT: mulhdu r4, r4, r5		; P9BE-NEXT: mulhdu r4, r4, r5
; P9BE-NEXT: rldicl r4, r4, 57, 7		; P9BE-NEXT: rldicl r4, r4, 57, 7
; P9BE-NEXT: mulli r4, r4, 654		; P9BE-NEXT: mulli r4, r4, 654
; P9BE-NEXT: sub r3, r3, r4		; P9BE-NEXT: sub r3, r3, r4
; P9BE-NEXT: mtvsrdd v2, 0, r3		; P9BE-NEXT: mtvsrdd v2, 0, r3
▲ Show 20 Lines • Show All 97 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/vavg.ll

Show First 20 Lines • Show All 132 Lines • ▼ Show 20 Lines	entry:
%shr = ashr <16 x i8> %add1, <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>		%shr = ashr <16 x i8> %add1, <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>
ret <16 x i8> %shr		ret <16 x i8> %shr
}		}

define <8 x i16> @test_v8i16_sign_negative(<8 x i16> %m, <8 x i16> %n) {		define <8 x i16> @test_v8i16_sign_negative(<8 x i16> %m, <8 x i16> %n) {
; CHECK-P9-LABEL: test_v8i16_sign_negative:		; CHECK-P9-LABEL: test_v8i16_sign_negative:
; CHECK-P9: # %bb.0: # %entry		; CHECK-P9: # %bb.0: # %entry
; CHECK-P9-NEXT: addis 3, 2, .LCPI6_0@toc@ha		; CHECK-P9-NEXT: addis 3, 2, .LCPI6_0@toc@ha
; CHECK-P9-NEXT: addi 3, 3, .LCPI6_0@toc@l
; CHECK-P9-NEXT: vadduhm 2, 2, 3		; CHECK-P9-NEXT: vadduhm 2, 2, 3
		; CHECK-P9-NEXT: addi 3, 3, .LCPI6_0@toc@l
; CHECK-P9-NEXT: lxvx 35, 0, 3		; CHECK-P9-NEXT: lxvx 35, 0, 3
; CHECK-P9-NEXT: vadduhm 2, 2, 3		; CHECK-P9-NEXT: vadduhm 2, 2, 3
; CHECK-P9-NEXT: vspltish 3, 1		; CHECK-P9-NEXT: vspltish 3, 1
; CHECK-P9-NEXT: vsrah 2, 2, 3		; CHECK-P9-NEXT: vsrah 2, 2, 3
; CHECK-P9-NEXT: blr		; CHECK-P9-NEXT: blr
;		;
; CHECK-P8-LABEL: test_v8i16_sign_negative:		; CHECK-P8-LABEL: test_v8i16_sign_negative:
; CHECK-P8: # %bb.0: # %entry		; CHECK-P8: # %bb.0: # %entry
▲ Show 20 Lines • Show All 90 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/vec-bswap.ll

	; RUN: llc < %s -mtriple=powerpc64le-unknown-unknown -mcpu=pwr9 \			; RUN: llc < %s -mtriple=powerpc64le-unknown-unknown -mcpu=pwr9 \
	; RUN: -verify-machineinstrs -ppc-asm-full-reg-names \| FileCheck %s			; RUN: -verify-machineinstrs -ppc-asm-full-reg-names \| FileCheck %s
	define dso_local void @test(i32* %Arr, i32 signext %Len) {			define dso_local void @test(i32* %Arr, i32 signext %Len) {
	; CHECK-LABEL: test:			; CHECK-LABEL: test:
	; CHECK: lxvx [[REG:vs[0-9]+]], r{{[0-9]+}}, r{{[0-9]+}}			; CHECK: lxvx [[REG:vs[0-9]+]], r{{[0-9]+}}, r{{[0-9]+}}
	; CHECK-NEXT: xxbrw vs{{[0-9]+}}, [[REG]]			; CHECK-NOT: [[REG]]
				; CHECK: xxbrw vs{{[0-9]+}}, [[REG]]
	entry:			entry:
	%cmp1 = icmp slt i32 0, %Len			%cmp1 = icmp slt i32 0, %Len
	br i1 %cmp1, label %for.body.lr.ph, label %for.cond.cleanup			br i1 %cmp1, label %for.body.lr.ph, label %for.cond.cleanup

	for.body.lr.ph: ; preds = %entry			for.body.lr.ph: ; preds = %entry
	%min.iters.check = icmp ult i32 %Len, 4			%min.iters.check = icmp ult i32 %Len, 4
	br i1 %min.iters.check, label %scalar.ph, label %vector.ph			br i1 %min.iters.check, label %scalar.ph, label %vector.ph

	▲ Show 20 Lines • Show All 101 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/vec_conv_fp32_to_i16_elts.ll

	Show All 30 Lines
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test2elt:			; CHECK-P9-LABEL: test2elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xxsldwi vs1, v2, v2, 3			; CHECK-P9-NEXT: xxsldwi vs1, v2, v2, 3
				; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs1			; CHECK-P9-NEXT: xxswapd v2, vs1
				; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: xxswapd v3, vs0			; CHECK-P9-NEXT: xxswapd v3, vs0
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: vextuwrx r3, r3, v2			; CHECK-P9-NEXT: vextuwrx r3, r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test2elt:			; CHECK-BE-LABEL: test2elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd f0, r3			; CHECK-BE-NEXT: mtvsrd f0, r3
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: xxswapd vs0, v2			; CHECK-P9-NEXT: xxswapd vs0, v2
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, v2			; CHECK-P9-NEXT: xscvspdpn f0, v2
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, v2, v2, 1			; CHECK-P9-NEXT: xxsldwi vs0, v2, v2, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: vmrglh v2, v4, v2			; CHECK-P9-NEXT: vmrglh v2, v4, v2
	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: vmrglw v3, v5, v4			; CHECK-P8-NEXT: vmrglw v3, v5, v4
	; CHECK-P8-NEXT: xxmrgld v2, v3, v2			; CHECK-P8-NEXT: xxmrgld v2, v3, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r3)			; CHECK-P9-NEXT: lxv vs1, 0(r3)
				; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: xxswapd vs2, vs1			; CHECK-P9-NEXT: xxswapd vs2, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xscvspdpn f2, vs1			; CHECK-P9-NEXT: xscvspdpn f2, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
				; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: vmrglh v3, v3, v4			; CHECK-P9-NEXT: vmrglh v3, v3, v4
				; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
	; CHECK-P9-NEXT: xxswapd vs1, vs0			; CHECK-P9-NEXT: xxswapd vs1, vs0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvspdpn f1, vs0			; CHECK-P9-NEXT: xscvspdpn f1, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglh v4, v4, v5			; CHECK-P9-NEXT: vmrglh v4, v4, v5
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld v2, v3, v2			; CHECK-P9-NEXT: xxmrgld v2, v3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs1			; CHECK-BE-NEXT: xxswapd vs2, vs1
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xscvspdpn f2, vs1			; CHECK-BE-NEXT: xscvspdpn f2, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghh v2, v3, v2			; CHECK-BE-NEXT: vmrghh v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: vmrghh v3, v3, v4
				; CHECK-BE-NEXT: vmrghw v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0			; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghh v3, v3, v4
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: vmrghw v2, v3, v2			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	▲ Show 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: xxmrgld v3, v5, v4			; CHECK-P8-NEXT: xxmrgld v3, v5, v4
	; CHECK-P8-NEXT: stvx v3, r3, r5			; CHECK-P8-NEXT: stvx v3, r3, r5
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r4)			; CHECK-P9-NEXT: lxv vs1, 0(r4)
	; CHECK-P9-NEXT: lxv vs3, 16(r4)			; CHECK-P9-NEXT: lxv vs3, 16(r4)
				; CHECK-P9-NEXT: lxv vs0, 32(r4)
	; CHECK-P9-NEXT: xscvspdpn f5, vs1			; CHECK-P9-NEXT: xscvspdpn f5, vs1
	; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f8, vs3			; CHECK-P9-NEXT: xscvspdpn f8, vs3
	; CHECK-P9-NEXT: xxswapd vs4, vs1			; CHECK-P9-NEXT: xxswapd vs4, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f4, vs4			; CHECK-P9-NEXT: xxsldwi vs6, vs3, vs3, 3
				; CHECK-P9-NEXT: xxswapd vs7, vs3
				; CHECK-P9-NEXT: xxsldwi vs3, vs3, vs3, 1
				; CHECK-P9-NEXT: xxsldwi vs9, vs0, vs0, 3
				; CHECK-P9-NEXT: xxswapd vs10, vs0
	; CHECK-P9-NEXT: xscvdpsxws f5, f5			; CHECK-P9-NEXT: xscvdpsxws f5, f5
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f8, f8			; CHECK-P9-NEXT: xscvdpsxws f8, f8
	; CHECK-P9-NEXT: xxsldwi vs6, vs3, vs3, 3			; CHECK-P9-NEXT: xscvspdpn f4, vs4
	; CHECK-P9-NEXT: xxswapd vs7, vs3			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvspdpn f6, vs6			; CHECK-P9-NEXT: xscvspdpn f6, vs6
	; CHECK-P9-NEXT: xxsldwi vs3, vs3, vs3, 1
	; CHECK-P9-NEXT: xscvspdpn f7, vs7			; CHECK-P9-NEXT: xscvspdpn f7, vs7
	; CHECK-P9-NEXT: xscvspdpn f3, vs3			; CHECK-P9-NEXT: xscvspdpn f3, vs3
				; CHECK-P9-NEXT: xscvspdpn f9, vs9
				; CHECK-P9-NEXT: xscvspdpn f10, vs10
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f4, f4			; CHECK-P9-NEXT: xscvdpsxws f4, f4
	; CHECK-P9-NEXT: xscvdpsxws f6, f6
	; CHECK-P9-NEXT: mfvsrwz r5, f5
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: xscvdpsxws f6, f6
	; CHECK-P9-NEXT: xscvdpsxws f7, f7			; CHECK-P9-NEXT: xscvdpsxws f7, f7
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
				; CHECK-P9-NEXT: xscvdpsxws f9, f9
				; CHECK-P9-NEXT: xscvdpsxws f10, f10
				; CHECK-P9-NEXT: mfvsrwz r5, f5
	; CHECK-P9-NEXT: mtvsrd f5, r5			; CHECK-P9-NEXT: mtvsrd f5, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f8			; CHECK-P9-NEXT: mfvsrwz r5, f8
	; CHECK-P9-NEXT: mtvsrd f8, r5			; CHECK-P9-NEXT: mtvsrd f8, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f2			; CHECK-P9-NEXT: mfvsrwz r5, f2
	; CHECK-P9-NEXT: lxv vs0, 32(r4)
	; CHECK-P9-NEXT: xxsldwi vs9, vs0, vs0, 3
	; CHECK-P9-NEXT: xxswapd vs10, vs0
	; CHECK-P9-NEXT: xscvspdpn f9, vs9
	; CHECK-P9-NEXT: xscvspdpn f10, vs10
	; CHECK-P9-NEXT: xscvdpsxws f9, f9
	; CHECK-P9-NEXT: xscvdpsxws f10, f10
	; CHECK-P9-NEXT: mtvsrd f2, r5			; CHECK-P9-NEXT: mtvsrd f2, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f4			; CHECK-P9-NEXT: mfvsrwz r5, f4
	; CHECK-P9-NEXT: mtvsrd f4, r5			; CHECK-P9-NEXT: mtvsrd f4, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f1			; CHECK-P9-NEXT: mfvsrwz r5, f1
	; CHECK-P9-NEXT: mtvsrd f1, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f6
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: xscvspdpn f2, vs0			; CHECK-P9-NEXT: xscvspdpn f2, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
				; CHECK-P9-NEXT: mtvsrd f1, r5
				; CHECK-P9-NEXT: mfvsrwz r5, f6
				; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mtvsrd f6, r5			; CHECK-P9-NEXT: mtvsrd f6, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f7			; CHECK-P9-NEXT: mfvsrwz r5, f7
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: lxv vs1, 48(r4)			; CHECK-P9-NEXT: lxv vs1, 48(r4)
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs5			; CHECK-P9-NEXT: xxswapd v3, vs5
	; CHECK-P9-NEXT: mtvsrd f7, r5			; CHECK-P9-NEXT: mtvsrd f7, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f3			; CHECK-P9-NEXT: mfvsrwz r5, f3
				; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: vmrglh v3, v3, v4			; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs6			; CHECK-P9-NEXT: xxswapd v4, vs6
	; CHECK-P9-NEXT: xxswapd v5, vs7			; CHECK-P9-NEXT: xxswapd v5, vs7
	; CHECK-P9-NEXT: mtvsrd f3, r5			; CHECK-P9-NEXT: mtvsrd f3, r5
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: mfvsrwz r5, f9
	; CHECK-P9-NEXT: xxswapd v0, vs3			; CHECK-P9-NEXT: xxswapd v0, vs3
				; CHECK-P9-NEXT: mfvsrwz r4, f2
				; CHECK-P9-NEXT: mtvsrd f9, r5
				; CHECK-P9-NEXT: mfvsrwz r5, f10
	; CHECK-P9-NEXT: vmrglh v4, v5, v4			; CHECK-P9-NEXT: vmrglh v4, v5, v4
	; CHECK-P9-NEXT: xxswapd v5, vs8			; CHECK-P9-NEXT: xxswapd v5, vs8
	; CHECK-P9-NEXT: vmrglh v5, v5, v0			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r4, f2
	; CHECK-P9-NEXT: mtvsrd f2, r4			; CHECK-P9-NEXT: mtvsrd f2, r4
				; CHECK-P9-NEXT: mtvsrd f10, r5
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglh v5, v5, v0
				; CHECK-P9-NEXT: xxswapd v0, vs9
				; CHECK-P9-NEXT: xxswapd v1, vs10
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: vmrglw v3, v5, v4			; CHECK-P9-NEXT: vmrglw v3, v5, v4
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
				; CHECK-P9-NEXT: vmrglh v0, v1, v0
	; CHECK-P9-NEXT: xxmrgld vs2, v3, v2			; CHECK-P9-NEXT: xxmrgld vs2, v3, v2
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs0, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
				; CHECK-P9-NEXT: vmrglh v2, v4, v2
				; CHECK-P9-NEXT: stxv vs2, 0(r3)
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglw v2, v2, v0
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: xxswapd v3, vs0			; CHECK-P9-NEXT: xxswapd v3, vs0
	; CHECK-P9-NEXT: xxswapd vs0, vs1			; CHECK-P9-NEXT: xxswapd vs0, vs1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: vmrglh v2, v4, v2
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, vs1			; CHECK-P9-NEXT: xscvspdpn f0, vs1
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r5, f9
	; CHECK-P9-NEXT: mtvsrd f9, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f10
	; CHECK-P9-NEXT: mtvsrd f10, r5
	; CHECK-P9-NEXT: xxswapd v0, vs9
	; CHECK-P9-NEXT: xxswapd v1, vs10
	; CHECK-P9-NEXT: vmrglh v0, v1, v0
	; CHECK-P9-NEXT: vmrglw v2, v2, v0
	; CHECK-P9-NEXT: stxv vs2, 0(r3)
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglh v4, v4, v5			; CHECK-P9-NEXT: vmrglh v4, v4, v5
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld vs0, v3, v2			; CHECK-P9-NEXT: xxmrgld vs0, v3, v2
	; CHECK-P9-NEXT: stxv vs0, 16(r3)			; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r4)			; CHECK-BE-NEXT: lxv vs1, 16(r4)
				; CHECK-BE-NEXT: lxv vs0, 0(r4)
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xxswapd vs3, vs1			; CHECK-BE-NEXT: xxswapd vs3, vs1
	; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: mfvsrwz r5, f2
	; CHECK-BE-NEXT: xscvspdpn f4, vs1			; CHECK-BE-NEXT: xscvspdpn f4, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
				; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: xscvdpsxws f2, f2
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: mfvsrwz r5, f2
				; CHECK-BE-NEXT: xxsldwi vs2, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v2, r5			; CHECK-BE-NEXT: mtvsrd v2, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f3			; CHECK-BE-NEXT: mfvsrwz r5, f3
	; CHECK-BE-NEXT: xscvdpsxws f3, f4			; CHECK-BE-NEXT: xscvdpsxws f3, f4
	; CHECK-BE-NEXT: lxv vs0, 0(r4)
	; CHECK-BE-NEXT: xxsldwi vs2, vs0, vs0, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
				; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mtvsrd v3, r5			; CHECK-BE-NEXT: mtvsrd v3, r5
	; CHECK-BE-NEXT: vmrghh v2, v3, v2			; CHECK-BE-NEXT: vmrghh v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r5, f3			; CHECK-BE-NEXT: mfvsrwz r5, f3
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mtvsrd v3, r5			; CHECK-BE-NEXT: mtvsrd v3, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f1			; CHECK-BE-NEXT: mfvsrwz r5, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0			; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r5			; CHECK-BE-NEXT: mtvsrd v4, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f2			; CHECK-BE-NEXT: mfvsrwz r5, f2
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: vmrghh v3, v3, v4			; CHECK-BE-NEXT: vmrghh v3, v3, v4
	; CHECK-BE-NEXT: mtvsrd v4, r5			; CHECK-BE-NEXT: mtvsrd v4, r5
	Show All 10 Lines
	; CHECK-BE-NEXT: mfvsrwz r5, f1			; CHECK-BE-NEXT: mfvsrwz r5, f1
	; CHECK-BE-NEXT: lxv vs1, 48(r4)			; CHECK-BE-NEXT: lxv vs1, 48(r4)
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mtvsrd v5, r5			; CHECK-BE-NEXT: mtvsrd v5, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f0			; CHECK-BE-NEXT: mfvsrwz r5, f0
	; CHECK-BE-NEXT: lxv vs0, 32(r4)			; CHECK-BE-NEXT: lxv vs0, 32(r4)
	; CHECK-BE-NEXT: xscvspdpn f5, vs1			; CHECK-BE-NEXT: xscvspdpn f5, vs1
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xscvdpsxws f5, f5
	; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: xxswapd vs3, vs1			; CHECK-BE-NEXT: xxswapd vs3, vs1
				; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
				; CHECK-BE-NEXT: sldi r5, r5, 48
				; CHECK-BE-NEXT: xscvdpsxws f5, f5
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v0, r5			; CHECK-BE-NEXT: mtvsrd v0, r5
	; CHECK-BE-NEXT: vmrghh v5, v5, v0
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: vmrghh v5, v5, v0
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: vmrghw v3, v5, v4
	; CHECK-BE-NEXT: xscvdpsxws f3, f3			; CHECK-BE-NEXT: xscvdpsxws f3, f3
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: vmrghw v3, v5, v4
	; CHECK-BE-NEXT: mfvsrwz r4, f5			; CHECK-BE-NEXT: mfvsrwz r4, f5
	; CHECK-BE-NEXT: xxmrghd vs4, v3, v2			; CHECK-BE-NEXT: xxmrghd vs4, v3, v2
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f2			; CHECK-BE-NEXT: mfvsrwz r4, f2
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: stxv vs4, 0(r3)			; CHECK-BE-NEXT: stxv vs4, 0(r3)
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v3, r4			; CHECK-BE-NEXT: mtvsrd v3, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f3			; CHECK-BE-NEXT: mfvsrwz r4, f3
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v4, r4			; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f1			; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghh v3, v4, v3			; CHECK-BE-NEXT: vmrghh v3, v4, v3
	; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghh v2, v2, v4			; CHECK-BE-NEXT: vmrghh v2, v2, v4
	; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: vmrghw v2, v2, v3			; CHECK-BE-NEXT: vmrghw v2, v2, v3
				; CHECK-BE-NEXT: mfvsrwz r4, f1
				; CHECK-BE-NEXT: xxswapd vs1, vs0
				; CHECK-BE-NEXT: sldi r4, r4, 48
				; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r4			; CHECK-BE-NEXT: mtvsrd v3, r4
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mfvsrwz r4, f1			; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: mtvsrd v4, r4			; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	Show All 38 Lines
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test2elt_signed:			; CHECK-P9-LABEL: test2elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xxsldwi vs1, v2, v2, 3			; CHECK-P9-NEXT: xxsldwi vs1, v2, v2, 3
				; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs1			; CHECK-P9-NEXT: xxswapd v2, vs1
				; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: xxswapd v3, vs0			; CHECK-P9-NEXT: xxswapd v3, vs0
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: vextuwrx r3, r3, v2			; CHECK-P9-NEXT: vextuwrx r3, r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test2elt_signed:			; CHECK-BE-LABEL: test2elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd f0, r3			; CHECK-BE-NEXT: mtvsrd f0, r3
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: xxswapd vs0, v2			; CHECK-P9-NEXT: xxswapd vs0, v2
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, v2			; CHECK-P9-NEXT: xscvspdpn f0, v2
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, v2, v2, 1			; CHECK-P9-NEXT: xxsldwi vs0, v2, v2, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: vmrglh v2, v4, v2			; CHECK-P9-NEXT: vmrglh v2, v4, v2
	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: vmrglw v3, v5, v4			; CHECK-P8-NEXT: vmrglw v3, v5, v4
	; CHECK-P8-NEXT: xxmrgld v2, v3, v2			; CHECK-P8-NEXT: xxmrgld v2, v3, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r3)			; CHECK-P9-NEXT: lxv vs1, 0(r3)
				; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: xxswapd vs2, vs1			; CHECK-P9-NEXT: xxswapd vs2, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xscvspdpn f2, vs1			; CHECK-P9-NEXT: xscvspdpn f2, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
				; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: vmrglh v3, v3, v4			; CHECK-P9-NEXT: vmrglh v3, v3, v4
				; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
	; CHECK-P9-NEXT: xxswapd vs1, vs0			; CHECK-P9-NEXT: xxswapd vs1, vs0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvspdpn f1, vs0			; CHECK-P9-NEXT: xscvspdpn f1, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglh v4, v4, v5			; CHECK-P9-NEXT: vmrglh v4, v4, v5
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld v2, v3, v2			; CHECK-P9-NEXT: xxmrgld v2, v3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs1			; CHECK-BE-NEXT: xxswapd vs2, vs1
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xscvspdpn f2, vs1			; CHECK-BE-NEXT: xscvspdpn f2, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghh v2, v3, v2			; CHECK-BE-NEXT: vmrghh v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: vmrghh v3, v3, v4
				; CHECK-BE-NEXT: vmrghw v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0			; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghh v3, v3, v4
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: vmrghw v2, v3, v2			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	▲ Show 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: xxmrgld v3, v5, v4			; CHECK-P8-NEXT: xxmrgld v3, v5, v4
	; CHECK-P8-NEXT: stvx v3, r3, r5			; CHECK-P8-NEXT: stvx v3, r3, r5
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r4)			; CHECK-P9-NEXT: lxv vs1, 0(r4)
	; CHECK-P9-NEXT: lxv vs3, 16(r4)			; CHECK-P9-NEXT: lxv vs3, 16(r4)
				; CHECK-P9-NEXT: lxv vs0, 32(r4)
	; CHECK-P9-NEXT: xscvspdpn f5, vs1			; CHECK-P9-NEXT: xscvspdpn f5, vs1
	; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f8, vs3			; CHECK-P9-NEXT: xscvspdpn f8, vs3
	; CHECK-P9-NEXT: xxswapd vs4, vs1			; CHECK-P9-NEXT: xxswapd vs4, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f4, vs4			; CHECK-P9-NEXT: xxsldwi vs6, vs3, vs3, 3
				; CHECK-P9-NEXT: xxswapd vs7, vs3
				; CHECK-P9-NEXT: xxsldwi vs3, vs3, vs3, 1
				; CHECK-P9-NEXT: xxsldwi vs9, vs0, vs0, 3
				; CHECK-P9-NEXT: xxswapd vs10, vs0
	; CHECK-P9-NEXT: xscvdpsxws f5, f5			; CHECK-P9-NEXT: xscvdpsxws f5, f5
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f8, f8			; CHECK-P9-NEXT: xscvdpsxws f8, f8
	; CHECK-P9-NEXT: xxsldwi vs6, vs3, vs3, 3			; CHECK-P9-NEXT: xscvspdpn f4, vs4
	; CHECK-P9-NEXT: xxswapd vs7, vs3			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvspdpn f6, vs6			; CHECK-P9-NEXT: xscvspdpn f6, vs6
	; CHECK-P9-NEXT: xxsldwi vs3, vs3, vs3, 1
	; CHECK-P9-NEXT: xscvspdpn f7, vs7			; CHECK-P9-NEXT: xscvspdpn f7, vs7
	; CHECK-P9-NEXT: xscvspdpn f3, vs3			; CHECK-P9-NEXT: xscvspdpn f3, vs3
				; CHECK-P9-NEXT: xscvspdpn f9, vs9
				; CHECK-P9-NEXT: xscvspdpn f10, vs10
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f4, f4			; CHECK-P9-NEXT: xscvdpsxws f4, f4
	; CHECK-P9-NEXT: xscvdpsxws f6, f6
	; CHECK-P9-NEXT: mfvsrwz r5, f5
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: xscvdpsxws f6, f6
	; CHECK-P9-NEXT: xscvdpsxws f7, f7			; CHECK-P9-NEXT: xscvdpsxws f7, f7
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
				; CHECK-P9-NEXT: xscvdpsxws f9, f9
				; CHECK-P9-NEXT: xscvdpsxws f10, f10
				; CHECK-P9-NEXT: mfvsrwz r5, f5
	; CHECK-P9-NEXT: mtvsrd f5, r5			; CHECK-P9-NEXT: mtvsrd f5, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f8			; CHECK-P9-NEXT: mfvsrwz r5, f8
	; CHECK-P9-NEXT: mtvsrd f8, r5			; CHECK-P9-NEXT: mtvsrd f8, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f2			; CHECK-P9-NEXT: mfvsrwz r5, f2
	; CHECK-P9-NEXT: lxv vs0, 32(r4)
	; CHECK-P9-NEXT: xxsldwi vs9, vs0, vs0, 3
	; CHECK-P9-NEXT: xxswapd vs10, vs0
	; CHECK-P9-NEXT: xscvspdpn f9, vs9
	; CHECK-P9-NEXT: xscvspdpn f10, vs10
	; CHECK-P9-NEXT: xscvdpsxws f9, f9
	; CHECK-P9-NEXT: xscvdpsxws f10, f10
	; CHECK-P9-NEXT: mtvsrd f2, r5			; CHECK-P9-NEXT: mtvsrd f2, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f4			; CHECK-P9-NEXT: mfvsrwz r5, f4
	; CHECK-P9-NEXT: mtvsrd f4, r5			; CHECK-P9-NEXT: mtvsrd f4, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f1			; CHECK-P9-NEXT: mfvsrwz r5, f1
	; CHECK-P9-NEXT: mtvsrd f1, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f6
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: xscvspdpn f2, vs0			; CHECK-P9-NEXT: xscvspdpn f2, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
				; CHECK-P9-NEXT: mtvsrd f1, r5
				; CHECK-P9-NEXT: mfvsrwz r5, f6
				; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mtvsrd f6, r5			; CHECK-P9-NEXT: mtvsrd f6, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f7			; CHECK-P9-NEXT: mfvsrwz r5, f7
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: lxv vs1, 48(r4)			; CHECK-P9-NEXT: lxv vs1, 48(r4)
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs5			; CHECK-P9-NEXT: xxswapd v3, vs5
	; CHECK-P9-NEXT: mtvsrd f7, r5			; CHECK-P9-NEXT: mtvsrd f7, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f3			; CHECK-P9-NEXT: mfvsrwz r5, f3
				; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: vmrglh v3, v3, v4			; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs6			; CHECK-P9-NEXT: xxswapd v4, vs6
	; CHECK-P9-NEXT: xxswapd v5, vs7			; CHECK-P9-NEXT: xxswapd v5, vs7
	; CHECK-P9-NEXT: mtvsrd f3, r5			; CHECK-P9-NEXT: mtvsrd f3, r5
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: mfvsrwz r5, f9
	; CHECK-P9-NEXT: xxswapd v0, vs3			; CHECK-P9-NEXT: xxswapd v0, vs3
				; CHECK-P9-NEXT: mfvsrwz r4, f2
				; CHECK-P9-NEXT: mtvsrd f9, r5
				; CHECK-P9-NEXT: mfvsrwz r5, f10
	; CHECK-P9-NEXT: vmrglh v4, v5, v4			; CHECK-P9-NEXT: vmrglh v4, v5, v4
	; CHECK-P9-NEXT: xxswapd v5, vs8			; CHECK-P9-NEXT: xxswapd v5, vs8
	; CHECK-P9-NEXT: vmrglh v5, v5, v0			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r4, f2
	; CHECK-P9-NEXT: mtvsrd f2, r4			; CHECK-P9-NEXT: mtvsrd f2, r4
				; CHECK-P9-NEXT: mtvsrd f10, r5
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglh v5, v5, v0
				; CHECK-P9-NEXT: xxswapd v0, vs9
				; CHECK-P9-NEXT: xxswapd v1, vs10
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: vmrglw v3, v5, v4			; CHECK-P9-NEXT: vmrglw v3, v5, v4
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
				; CHECK-P9-NEXT: vmrglh v0, v1, v0
	; CHECK-P9-NEXT: xxmrgld vs2, v3, v2			; CHECK-P9-NEXT: xxmrgld vs2, v3, v2
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs0, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
				; CHECK-P9-NEXT: vmrglh v2, v4, v2
				; CHECK-P9-NEXT: stxv vs2, 0(r3)
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglw v2, v2, v0
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: xxswapd v3, vs0			; CHECK-P9-NEXT: xxswapd v3, vs0
	; CHECK-P9-NEXT: xxswapd vs0, vs1			; CHECK-P9-NEXT: xxswapd vs0, vs1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: vmrglh v2, v4, v2
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, vs1			; CHECK-P9-NEXT: xscvspdpn f0, vs1
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r5, f9
	; CHECK-P9-NEXT: mtvsrd f9, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f10
	; CHECK-P9-NEXT: mtvsrd f10, r5
	; CHECK-P9-NEXT: xxswapd v0, vs9
	; CHECK-P9-NEXT: xxswapd v1, vs10
	; CHECK-P9-NEXT: vmrglh v0, v1, v0
	; CHECK-P9-NEXT: vmrglw v2, v2, v0
	; CHECK-P9-NEXT: stxv vs2, 0(r3)
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglh v4, v4, v5			; CHECK-P9-NEXT: vmrglh v4, v4, v5
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld vs0, v3, v2			; CHECK-P9-NEXT: xxmrgld vs0, v3, v2
	; CHECK-P9-NEXT: stxv vs0, 16(r3)			; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r4)			; CHECK-BE-NEXT: lxv vs1, 16(r4)
				; CHECK-BE-NEXT: lxv vs0, 0(r4)
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xxswapd vs3, vs1			; CHECK-BE-NEXT: xxswapd vs3, vs1
	; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: mfvsrwz r5, f2
	; CHECK-BE-NEXT: xscvspdpn f4, vs1			; CHECK-BE-NEXT: xscvspdpn f4, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
				; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: xscvdpsxws f2, f2
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: mfvsrwz r5, f2
				; CHECK-BE-NEXT: xxsldwi vs2, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v2, r5			; CHECK-BE-NEXT: mtvsrd v2, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f3			; CHECK-BE-NEXT: mfvsrwz r5, f3
	; CHECK-BE-NEXT: xscvdpsxws f3, f4			; CHECK-BE-NEXT: xscvdpsxws f3, f4
	; CHECK-BE-NEXT: lxv vs0, 0(r4)
	; CHECK-BE-NEXT: xxsldwi vs2, vs0, vs0, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
				; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mtvsrd v3, r5			; CHECK-BE-NEXT: mtvsrd v3, r5
	; CHECK-BE-NEXT: vmrghh v2, v3, v2			; CHECK-BE-NEXT: vmrghh v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r5, f3			; CHECK-BE-NEXT: mfvsrwz r5, f3
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mtvsrd v3, r5			; CHECK-BE-NEXT: mtvsrd v3, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f1			; CHECK-BE-NEXT: mfvsrwz r5, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0			; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r5			; CHECK-BE-NEXT: mtvsrd v4, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f2			; CHECK-BE-NEXT: mfvsrwz r5, f2
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: vmrghh v3, v3, v4			; CHECK-BE-NEXT: vmrghh v3, v3, v4
	; CHECK-BE-NEXT: mtvsrd v4, r5			; CHECK-BE-NEXT: mtvsrd v4, r5
	Show All 10 Lines
	; CHECK-BE-NEXT: mfvsrwz r5, f1			; CHECK-BE-NEXT: mfvsrwz r5, f1
	; CHECK-BE-NEXT: lxv vs1, 48(r4)			; CHECK-BE-NEXT: lxv vs1, 48(r4)
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mtvsrd v5, r5			; CHECK-BE-NEXT: mtvsrd v5, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f0			; CHECK-BE-NEXT: mfvsrwz r5, f0
	; CHECK-BE-NEXT: lxv vs0, 32(r4)			; CHECK-BE-NEXT: lxv vs0, 32(r4)
	; CHECK-BE-NEXT: xscvspdpn f5, vs1			; CHECK-BE-NEXT: xscvspdpn f5, vs1
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xscvdpsxws f5, f5
	; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: xxswapd vs3, vs1			; CHECK-BE-NEXT: xxswapd vs3, vs1
				; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
				; CHECK-BE-NEXT: sldi r5, r5, 48
				; CHECK-BE-NEXT: xscvdpsxws f5, f5
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v0, r5			; CHECK-BE-NEXT: mtvsrd v0, r5
	; CHECK-BE-NEXT: vmrghh v5, v5, v0
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: vmrghh v5, v5, v0
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: vmrghw v3, v5, v4
	; CHECK-BE-NEXT: xscvdpsxws f3, f3			; CHECK-BE-NEXT: xscvdpsxws f3, f3
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: vmrghw v3, v5, v4
	; CHECK-BE-NEXT: mfvsrwz r4, f5			; CHECK-BE-NEXT: mfvsrwz r4, f5
	; CHECK-BE-NEXT: xxmrghd vs4, v3, v2			; CHECK-BE-NEXT: xxmrghd vs4, v3, v2
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f2			; CHECK-BE-NEXT: mfvsrwz r4, f2
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: stxv vs4, 0(r3)			; CHECK-BE-NEXT: stxv vs4, 0(r3)
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v3, r4			; CHECK-BE-NEXT: mtvsrd v3, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f3			; CHECK-BE-NEXT: mfvsrwz r4, f3
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v4, r4			; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f1			; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghh v3, v4, v3			; CHECK-BE-NEXT: vmrghh v3, v4, v3
	; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghh v2, v2, v4			; CHECK-BE-NEXT: vmrghh v2, v2, v4
	; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: vmrghw v2, v2, v3			; CHECK-BE-NEXT: vmrghw v2, v2, v3
				; CHECK-BE-NEXT: mfvsrwz r4, f1
				; CHECK-BE-NEXT: xxswapd vs1, vs0
				; CHECK-BE-NEXT: sldi r4, r4, 48
				; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r4			; CHECK-BE-NEXT: mtvsrd v3, r4
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mfvsrwz r4, f1			; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: mtvsrd v4, r4			; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	Show All 18 Lines

llvm/test/CodeGen/PowerPC/vec_conv_fp32_to_i64_elts.ll

	Show First 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt:			; CHECK-BE-LABEL: test4elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: xxsldwi vs1, v2, v2, 1			; CHECK-BE-NEXT: xxsldwi vs1, v2, v2, 1
	; CHECK-BE-NEXT: xscvspdpn f0, v2			; CHECK-BE-NEXT: xscvspdpn f0, v2
	; CHECK-BE-NEXT: xxswapd vs2, v2			; CHECK-BE-NEXT: xxswapd vs2, v2
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs1			; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, v2, v2, 3			; CHECK-BE-NEXT: xxsldwi vs1, v2, v2, 3
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0			; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0
	; CHECK-BE-NEXT: xxmrghd vs1, vs2, vs1			; CHECK-BE-NEXT: xxmrghd vs1, vs2, vs1
	; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1			; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1
	; CHECK-BE-NEXT: stxv vs0, 0(r3)			; CHECK-BE-NEXT: stxv vs0, 0(r3)
	; CHECK-BE-NEXT: stxv vs1, 16(r3)			; CHECK-BE-NEXT: stxv vs1, 16(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%0 = fptoui <4 x float> %a to <4 x i64>			%0 = fptoui <4 x float> %a to <4 x i64>
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs3, 0, r3			; CHECK-P8-NEXT: stxvd2x vs3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs0, 0(r4)			; CHECK-P9-NEXT: lxv vs0, 0(r4)
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xxswapd vs2, vs0			; CHECK-P9-NEXT: xxswapd vs2, vs0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvspdpn f3, vs0			; CHECK-P9-NEXT: xscvspdpn f3, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
				; CHECK-P9-NEXT: xscvspdpn f1, vs1
				; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xxmrghd vs1, vs2, vs1			; CHECK-P9-NEXT: xxmrghd vs1, vs2, vs1
	; CHECK-P9-NEXT: lxv vs2, 16(r4)			; CHECK-P9-NEXT: lxv vs2, 16(r4)
	; CHECK-P9-NEXT: xxmrghd vs0, vs3, vs0			; CHECK-P9-NEXT: xxmrghd vs0, vs3, vs0
	; CHECK-P9-NEXT: xvcvdpuxds vs1, vs1			; CHECK-P9-NEXT: xvcvdpuxds vs1, vs1
	; CHECK-P9-NEXT: xvcvdpuxds vs0, vs0			; CHECK-P9-NEXT: xvcvdpuxds vs0, vs0
	; CHECK-P9-NEXT: xxsldwi vs3, vs2, vs2, 3			; CHECK-P9-NEXT: xxsldwi vs3, vs2, vs2, 3
	; CHECK-P9-NEXT: xxswapd vs4, vs2			; CHECK-P9-NEXT: xxswapd vs4, vs2
	; CHECK-P9-NEXT: xscvspdpn f3, vs3			; CHECK-P9-NEXT: xscvspdpn f3, vs3
	; CHECK-P9-NEXT: xscvspdpn f4, vs4			; CHECK-P9-NEXT: xscvspdpn f4, vs4
	; CHECK-P9-NEXT: stxv vs0, 16(r3)			; CHECK-P9-NEXT: stxv vs0, 16(r3)
				; CHECK-P9-NEXT: stxv vs1, 0(r3)
	; CHECK-P9-NEXT: xxmrghd vs3, vs4, vs3			; CHECK-P9-NEXT: xxmrghd vs3, vs4, vs3
	; CHECK-P9-NEXT: xscvspdpn f4, vs2			; CHECK-P9-NEXT: xscvspdpn f4, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1			; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xvcvdpuxds vs3, vs3			; CHECK-P9-NEXT: xvcvdpuxds vs3, vs3
	; CHECK-P9-NEXT: xxmrghd vs2, vs4, vs2			; CHECK-P9-NEXT: xxmrghd vs2, vs4, vs2
	; CHECK-P9-NEXT: xvcvdpuxds vs2, vs2			; CHECK-P9-NEXT: xvcvdpuxds vs2, vs2
	; CHECK-P9-NEXT: stxv vs3, 32(r3)			; CHECK-P9-NEXT: stxv vs3, 32(r3)
	; CHECK-P9-NEXT: stxv vs2, 48(r3)			; CHECK-P9-NEXT: stxv vs2, 48(r3)
	; CHECK-P9-NEXT: stxv vs1, 0(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 0(r4)			; CHECK-BE-NEXT: lxv vs1, 0(r4)
				; CHECK-BE-NEXT: lxv vs0, 16(r4)
	; CHECK-BE-NEXT: xxsldwi vs3, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs3, vs1, vs1, 1
	; CHECK-BE-NEXT: xscvspdpn f2, vs1			; CHECK-BE-NEXT: xscvspdpn f2, vs1
	; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: lxv vs0, 16(r4)
	; CHECK-BE-NEXT: xxsldwi vs4, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs4, vs0, vs0, 1
				; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvspdpn f4, vs4			; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xxmrghd vs2, vs2, vs3			; CHECK-BE-NEXT: xxmrghd vs2, vs2, vs3
	; CHECK-BE-NEXT: xxsldwi vs3, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs3, vs1, vs1, 3
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: xvcvdpuxds vs2, vs2
	; CHECK-BE-NEXT: xxmrghd vs1, vs1, vs3			; CHECK-BE-NEXT: xxmrghd vs1, vs1, vs3
	; CHECK-BE-NEXT: xscvspdpn f3, vs0			; CHECK-BE-NEXT: xscvspdpn f3, vs0
	; CHECK-BE-NEXT: xxmrghd vs3, vs3, vs4			; CHECK-BE-NEXT: xxmrghd vs3, vs3, vs4
	; CHECK-BE-NEXT: xxsldwi vs4, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs4, vs0, vs0, 3
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs4
	; CHECK-BE-NEXT: xvcvdpuxds vs2, vs2
	; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1			; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1
				; CHECK-BE-NEXT: stxv vs2, 0(r3)
				; CHECK-BE-NEXT: xscvspdpn f4, vs4
				; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: xvcvdpuxds vs3, vs3			; CHECK-BE-NEXT: xvcvdpuxds vs3, vs3
				; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs4
	; CHECK-BE-NEXT: stxv vs1, 16(r3)			; CHECK-BE-NEXT: stxv vs1, 16(r3)
	; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0			; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0
	; CHECK-BE-NEXT: stxv vs3, 32(r3)			; CHECK-BE-NEXT: stxv vs3, 32(r3)
	; CHECK-BE-NEXT: stxv vs0, 48(r3)			; CHECK-BE-NEXT: stxv vs0, 48(r3)
	; CHECK-BE-NEXT: stxv vs2, 0(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <8 x float>, <8 x float>* %0, align 32			%a = load <8 x float>, <8 x float>* %0, align 32
	%1 = fptoui <8 x float> %a to <8 x i64>			%1 = fptoui <8 x float> %a to <8 x i64>
	store <8 x i64> %1, <8 x i64>* %agg.result, align 64			store <8 x i64> %1, <8 x i64>* %agg.result, align 64
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs4, r3, r6			; CHECK-P8-NEXT: stxvd2x vs4, r3, r6
	; CHECK-P8-NEXT: stxvd2x vs1, r3, r5			; CHECK-P8-NEXT: stxvd2x vs1, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs5, 0, r3			; CHECK-P8-NEXT: stxvd2x vs5, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs4, 16(r4)			; CHECK-P9-NEXT: lxv vs4, 16(r4)
				; CHECK-P9-NEXT: lxv vs0, 0(r4)
				; CHECK-P9-NEXT: lxv vs3, 32(r4)
	; CHECK-P9-NEXT: xxsldwi vs5, vs4, vs4, 3			; CHECK-P9-NEXT: xxsldwi vs5, vs4, vs4, 3
	; CHECK-P9-NEXT: xxswapd vs6, vs4			; CHECK-P9-NEXT: xxswapd vs6, vs4
	; CHECK-P9-NEXT: lxv vs0, 0(r4)
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xxswapd vs2, vs0			; CHECK-P9-NEXT: xxswapd vs2, vs0
				; CHECK-P9-NEXT: xxswapd vs7, vs3
	; CHECK-P9-NEXT: xscvspdpn f5, vs5			; CHECK-P9-NEXT: xscvspdpn f5, vs5
	; CHECK-P9-NEXT: xscvspdpn f6, vs6			; CHECK-P9-NEXT: xscvspdpn f6, vs6
				; CHECK-P9-NEXT: xscvspdpn f1, vs1
				; CHECK-P9-NEXT: xscvspdpn f2, vs2
				; CHECK-P9-NEXT: xscvspdpn f7, vs7
	; CHECK-P9-NEXT: xxmrghd vs5, vs6, vs5			; CHECK-P9-NEXT: xxmrghd vs5, vs6, vs5
	; CHECK-P9-NEXT: xscvspdpn f6, vs4			; CHECK-P9-NEXT: xscvspdpn f6, vs4
	; CHECK-P9-NEXT: xxsldwi vs4, vs4, vs4, 1			; CHECK-P9-NEXT: xxsldwi vs4, vs4, vs4, 1
	; CHECK-P9-NEXT: lxv vs3, 32(r4)
	; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xxswapd vs7, vs3
	; CHECK-P9-NEXT: xscvspdpn f7, vs7
	; CHECK-P9-NEXT: xscvspdpn f4, vs4
	; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xxmrghd vs1, vs2, vs1			; CHECK-P9-NEXT: xxmrghd vs1, vs2, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs0			; CHECK-P9-NEXT: xscvspdpn f2, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
				; CHECK-P9-NEXT: xscvspdpn f4, vs4
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xxmrghd vs0, vs2, vs0			; CHECK-P9-NEXT: xvcvdpuxds vs1, vs1
	; CHECK-P9-NEXT: xxmrghd vs4, vs6, vs4			; CHECK-P9-NEXT: xxmrghd vs4, vs6, vs4
	; CHECK-P9-NEXT: xxsldwi vs6, vs3, vs3, 3			; CHECK-P9-NEXT: xxsldwi vs6, vs3, vs3, 3
	; CHECK-P9-NEXT: xvcvdpuxds vs1, vs1			; CHECK-P9-NEXT: xxmrghd vs0, vs2, vs0
				; CHECK-P9-NEXT: lxv vs2, 48(r4)
	; CHECK-P9-NEXT: xvcvdpuxds vs5, vs5			; CHECK-P9-NEXT: xvcvdpuxds vs5, vs5
	; CHECK-P9-NEXT: xscvspdpn f6, vs6			; CHECK-P9-NEXT: xscvspdpn f6, vs6
				; CHECK-P9-NEXT: xvcvdpuxds vs0, vs0
				; CHECK-P9-NEXT: xvcvdpuxds vs4, vs4
				; CHECK-P9-NEXT: stxv vs5, 32(r3)
				; CHECK-P9-NEXT: stxv vs1, 0(r3)
				; CHECK-P9-NEXT: xxswapd vs8, vs2
	; CHECK-P9-NEXT: xxmrghd vs6, vs7, vs6			; CHECK-P9-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-P9-NEXT: xscvspdpn f7, vs3			; CHECK-P9-NEXT: xscvspdpn f7, vs3
	; CHECK-P9-NEXT: xxsldwi vs3, vs3, vs3, 1			; CHECK-P9-NEXT: xxsldwi vs3, vs3, vs3, 1
	; CHECK-P9-NEXT: lxv vs2, 48(r4)
	; CHECK-P9-NEXT: xxswapd vs8, vs2
	; CHECK-P9-NEXT: xscvspdpn f8, vs8			; CHECK-P9-NEXT: xscvspdpn f8, vs8
	; CHECK-P9-NEXT: xvcvdpuxds vs4, vs4
	; CHECK-P9-NEXT: xscvspdpn f3, vs3			; CHECK-P9-NEXT: xscvspdpn f3, vs3
				; CHECK-P9-NEXT: xvcvdpuxds vs6, vs6
				; CHECK-P9-NEXT: stxv vs4, 48(r3)
				; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: xxmrghd vs3, vs7, vs3			; CHECK-P9-NEXT: xxmrghd vs3, vs7, vs3
	; CHECK-P9-NEXT: xxsldwi vs7, vs2, vs2, 3			; CHECK-P9-NEXT: xxsldwi vs7, vs2, vs2, 3
	; CHECK-P9-NEXT: xvcvdpuxds vs0, vs0
	; CHECK-P9-NEXT: xvcvdpuxds vs6, vs6
	; CHECK-P9-NEXT: stxv vs6, 64(r3)
	; CHECK-P9-NEXT: xscvspdpn f7, vs7			; CHECK-P9-NEXT: xscvspdpn f7, vs7
				; CHECK-P9-NEXT: xvcvdpuxds vs3, vs3
				; CHECK-P9-NEXT: stxv vs6, 64(r3)
	; CHECK-P9-NEXT: xxmrghd vs7, vs8, vs7			; CHECK-P9-NEXT: xxmrghd vs7, vs8, vs7
	; CHECK-P9-NEXT: xscvspdpn f8, vs2			; CHECK-P9-NEXT: xscvspdpn f8, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1			; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xxmrghd vs2, vs8, vs2
	; CHECK-P9-NEXT: xvcvdpuxds vs3, vs3
	; CHECK-P9-NEXT: xvcvdpuxds vs7, vs7			; CHECK-P9-NEXT: xvcvdpuxds vs7, vs7
	; CHECK-P9-NEXT: stxv vs3, 80(r3)			; CHECK-P9-NEXT: stxv vs3, 80(r3)
				; CHECK-P9-NEXT: xxmrghd vs2, vs8, vs2
	; CHECK-P9-NEXT: xvcvdpuxds vs2, vs2			; CHECK-P9-NEXT: xvcvdpuxds vs2, vs2
	; CHECK-P9-NEXT: stxv vs7, 96(r3)			; CHECK-P9-NEXT: stxv vs7, 96(r3)
	; CHECK-P9-NEXT: stxv vs2, 112(r3)			; CHECK-P9-NEXT: stxv vs2, 112(r3)
	; CHECK-P9-NEXT: stxv vs4, 48(r3)
	; CHECK-P9-NEXT: stxv vs5, 32(r3)
	; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: stxv vs1, 0(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs0, 0(r4)			; CHECK-BE-NEXT: lxv vs0, 0(r4)
	; CHECK-BE-NEXT: lxv vs4, 16(r4)			; CHECK-BE-NEXT: lxv vs4, 16(r4)
	; CHECK-BE-NEXT: xxsldwi vs2, vs0, vs0, 1			; CHECK-BE-NEXT: lxv vs3, 32(r4)
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
				; CHECK-BE-NEXT: xxsldwi vs2, vs0, vs0, 1
	; CHECK-BE-NEXT: xxsldwi vs5, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs5, vs0, vs0, 3
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
				; CHECK-BE-NEXT: xxsldwi vs6, vs4, vs4, 1
				; CHECK-BE-NEXT: xxsldwi vs7, vs3, vs3, 1
	; CHECK-BE-NEXT: xscvspdpn f5, vs5			; CHECK-BE-NEXT: xscvspdpn f5, vs5
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: xxsldwi vs6, vs4, vs4, 1
	; CHECK-BE-NEXT: xscvspdpn f6, vs6			; CHECK-BE-NEXT: xscvspdpn f6, vs6
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
				; CHECK-BE-NEXT: xscvspdpn f7, vs7
	; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs5			; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs5
	; CHECK-BE-NEXT: xscvspdpn f5, vs4			; CHECK-BE-NEXT: xscvspdpn f5, vs4
	; CHECK-BE-NEXT: lxv vs3, 32(r4)			; CHECK-BE-NEXT: xxmrghd vs1, vs1, vs2
	; CHECK-BE-NEXT: xxsldwi vs7, vs3, vs3, 1			; CHECK-BE-NEXT: lxv vs2, 48(r4)
	; CHECK-BE-NEXT: xscvspdpn f7, vs7
	; CHECK-BE-NEXT: xxmrghd vs5, vs5, vs6			; CHECK-BE-NEXT: xxmrghd vs5, vs5, vs6
	; CHECK-BE-NEXT: xxsldwi vs6, vs4, vs4, 3			; CHECK-BE-NEXT: xxsldwi vs6, vs4, vs4, 3
	; CHECK-BE-NEXT: xxswapd vs4, vs4			; CHECK-BE-NEXT: xxswapd vs4, vs4
	; CHECK-BE-NEXT: xscvspdpn f6, vs6
	; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xxmrghd vs1, vs1, vs2
	; CHECK-BE-NEXT: lxv vs2, 48(r4)
	; CHECK-BE-NEXT: xxsldwi vs8, vs2, vs2, 1
	; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1			; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1
				; CHECK-BE-NEXT: xxsldwi vs8, vs2, vs2, 1
	; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0			; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0
				; CHECK-BE-NEXT: xscvspdpn f6, vs6
				; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xvcvdpuxds vs5, vs5			; CHECK-BE-NEXT: xvcvdpuxds vs5, vs5
	; CHECK-BE-NEXT: xscvspdpn f8, vs8			; CHECK-BE-NEXT: xscvspdpn f8, vs8
	; CHECK-BE-NEXT: xxmrghd vs4, vs4, vs6			; CHECK-BE-NEXT: xxmrghd vs4, vs4, vs6
	; CHECK-BE-NEXT: xscvspdpn f6, vs3			; CHECK-BE-NEXT: xscvspdpn f6, vs3
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
				; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: xxmrghd vs6, vs6, vs7			; CHECK-BE-NEXT: xxmrghd vs6, vs6, vs7
	; CHECK-BE-NEXT: xxsldwi vs7, vs3, vs3, 3			; CHECK-BE-NEXT: xxsldwi vs7, vs3, vs3, 3
	; CHECK-BE-NEXT: xxswapd vs3, vs3			; CHECK-BE-NEXT: xxswapd vs3, vs3
				; CHECK-BE-NEXT: xvcvdpuxds vs4, vs4
				; CHECK-BE-NEXT: stxv vs5, 32(r3)
	; CHECK-BE-NEXT: xscvspdpn f7, vs7			; CHECK-BE-NEXT: xscvspdpn f7, vs7
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
				; CHECK-BE-NEXT: xvcvdpuxds vs6, vs6
	; CHECK-BE-NEXT: xxmrghd vs3, vs3, vs7			; CHECK-BE-NEXT: xxmrghd vs3, vs3, vs7
	; CHECK-BE-NEXT: xscvspdpn f7, vs2			; CHECK-BE-NEXT: xscvspdpn f7, vs2
				; CHECK-BE-NEXT: stxv vs4, 48(r3)
	; CHECK-BE-NEXT: xxmrghd vs7, vs7, vs8			; CHECK-BE-NEXT: xxmrghd vs7, vs7, vs8
	; CHECK-BE-NEXT: xxsldwi vs8, vs2, vs2, 3			; CHECK-BE-NEXT: xxsldwi vs8, vs2, vs2, 3
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
				; CHECK-BE-NEXT: xvcvdpuxds vs3, vs3
				; CHECK-BE-NEXT: stxv vs6, 64(r3)
	; CHECK-BE-NEXT: xscvspdpn f8, vs8			; CHECK-BE-NEXT: xscvspdpn f8, vs8
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xxmrghd vs2, vs2, vs8
	; CHECK-BE-NEXT: stxv vs5, 32(r3)
	; CHECK-BE-NEXT: xvcvdpuxds vs4, vs4
	; CHECK-BE-NEXT: xvcvdpuxds vs6, vs6
	; CHECK-BE-NEXT: xvcvdpuxds vs3, vs3
	; CHECK-BE-NEXT: xvcvdpuxds vs7, vs7			; CHECK-BE-NEXT: xvcvdpuxds vs7, vs7
				; CHECK-BE-NEXT: xxmrghd vs2, vs2, vs8
	; CHECK-BE-NEXT: stxv vs3, 80(r3)			; CHECK-BE-NEXT: stxv vs3, 80(r3)
	; CHECK-BE-NEXT: stxv vs7, 96(r3)
	; CHECK-BE-NEXT: xvcvdpuxds vs2, vs2			; CHECK-BE-NEXT: xvcvdpuxds vs2, vs2
				; CHECK-BE-NEXT: stxv vs7, 96(r3)
	; CHECK-BE-NEXT: stxv vs2, 112(r3)			; CHECK-BE-NEXT: stxv vs2, 112(r3)
	; CHECK-BE-NEXT: stxv vs6, 64(r3)
	; CHECK-BE-NEXT: stxv vs4, 48(r3)
	; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <16 x float>, <16 x float>* %0, align 64			%a = load <16 x float>, <16 x float>* %0, align 64
	%1 = fptoui <16 x float> %a to <16 x i64>			%1 = fptoui <16 x float> %a to <16 x i64>
	store <16 x i64> %1, <16 x i64>* %agg.result, align 128			store <16 x i64> %1, <16 x i64>* %agg.result, align 128
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt_signed:			; CHECK-BE-LABEL: test4elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: xxsldwi vs1, v2, v2, 1			; CHECK-BE-NEXT: xxsldwi vs1, v2, v2, 1
	; CHECK-BE-NEXT: xscvspdpn f0, v2			; CHECK-BE-NEXT: xscvspdpn f0, v2
	; CHECK-BE-NEXT: xxswapd vs2, v2			; CHECK-BE-NEXT: xxswapd vs2, v2
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs1			; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, v2, v2, 3			; CHECK-BE-NEXT: xxsldwi vs1, v2, v2, 3
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0			; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0
	; CHECK-BE-NEXT: xxmrghd vs1, vs2, vs1			; CHECK-BE-NEXT: xxmrghd vs1, vs2, vs1
	; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1			; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1
	; CHECK-BE-NEXT: stxv vs0, 0(r3)			; CHECK-BE-NEXT: stxv vs0, 0(r3)
	; CHECK-BE-NEXT: stxv vs1, 16(r3)			; CHECK-BE-NEXT: stxv vs1, 16(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%0 = fptoui <4 x float> %a to <4 x i64>			%0 = fptoui <4 x float> %a to <4 x i64>
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs3, 0, r3			; CHECK-P8-NEXT: stxvd2x vs3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs0, 0(r4)			; CHECK-P9-NEXT: lxv vs0, 0(r4)
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xxswapd vs2, vs0			; CHECK-P9-NEXT: xxswapd vs2, vs0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvspdpn f3, vs0			; CHECK-P9-NEXT: xscvspdpn f3, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
				; CHECK-P9-NEXT: xscvspdpn f1, vs1
				; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xxmrghd vs1, vs2, vs1			; CHECK-P9-NEXT: xxmrghd vs1, vs2, vs1
	; CHECK-P9-NEXT: lxv vs2, 16(r4)			; CHECK-P9-NEXT: lxv vs2, 16(r4)
	; CHECK-P9-NEXT: xxmrghd vs0, vs3, vs0			; CHECK-P9-NEXT: xxmrghd vs0, vs3, vs0
	; CHECK-P9-NEXT: xvcvdpuxds vs1, vs1			; CHECK-P9-NEXT: xvcvdpuxds vs1, vs1
	; CHECK-P9-NEXT: xvcvdpuxds vs0, vs0			; CHECK-P9-NEXT: xvcvdpuxds vs0, vs0
	; CHECK-P9-NEXT: xxsldwi vs3, vs2, vs2, 3			; CHECK-P9-NEXT: xxsldwi vs3, vs2, vs2, 3
	; CHECK-P9-NEXT: xxswapd vs4, vs2			; CHECK-P9-NEXT: xxswapd vs4, vs2
	; CHECK-P9-NEXT: xscvspdpn f3, vs3			; CHECK-P9-NEXT: xscvspdpn f3, vs3
	; CHECK-P9-NEXT: xscvspdpn f4, vs4			; CHECK-P9-NEXT: xscvspdpn f4, vs4
	; CHECK-P9-NEXT: stxv vs0, 16(r3)			; CHECK-P9-NEXT: stxv vs0, 16(r3)
				; CHECK-P9-NEXT: stxv vs1, 0(r3)
	; CHECK-P9-NEXT: xxmrghd vs3, vs4, vs3			; CHECK-P9-NEXT: xxmrghd vs3, vs4, vs3
	; CHECK-P9-NEXT: xscvspdpn f4, vs2			; CHECK-P9-NEXT: xscvspdpn f4, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1			; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xvcvdpuxds vs3, vs3			; CHECK-P9-NEXT: xvcvdpuxds vs3, vs3
	; CHECK-P9-NEXT: xxmrghd vs2, vs4, vs2			; CHECK-P9-NEXT: xxmrghd vs2, vs4, vs2
	; CHECK-P9-NEXT: xvcvdpuxds vs2, vs2			; CHECK-P9-NEXT: xvcvdpuxds vs2, vs2
	; CHECK-P9-NEXT: stxv vs3, 32(r3)			; CHECK-P9-NEXT: stxv vs3, 32(r3)
	; CHECK-P9-NEXT: stxv vs2, 48(r3)			; CHECK-P9-NEXT: stxv vs2, 48(r3)
	; CHECK-P9-NEXT: stxv vs1, 0(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 0(r4)			; CHECK-BE-NEXT: lxv vs1, 0(r4)
				; CHECK-BE-NEXT: lxv vs0, 16(r4)
	; CHECK-BE-NEXT: xxsldwi vs3, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs3, vs1, vs1, 1
	; CHECK-BE-NEXT: xscvspdpn f2, vs1			; CHECK-BE-NEXT: xscvspdpn f2, vs1
	; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: lxv vs0, 16(r4)
	; CHECK-BE-NEXT: xxsldwi vs4, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs4, vs0, vs0, 1
				; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvspdpn f4, vs4			; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xxmrghd vs2, vs2, vs3			; CHECK-BE-NEXT: xxmrghd vs2, vs2, vs3
	; CHECK-BE-NEXT: xxsldwi vs3, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs3, vs1, vs1, 3
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
				; CHECK-BE-NEXT: xvcvdpuxds vs2, vs2
	; CHECK-BE-NEXT: xxmrghd vs1, vs1, vs3			; CHECK-BE-NEXT: xxmrghd vs1, vs1, vs3
	; CHECK-BE-NEXT: xscvspdpn f3, vs0			; CHECK-BE-NEXT: xscvspdpn f3, vs0
	; CHECK-BE-NEXT: xxmrghd vs3, vs3, vs4			; CHECK-BE-NEXT: xxmrghd vs3, vs3, vs4
	; CHECK-BE-NEXT: xxsldwi vs4, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs4, vs0, vs0, 3
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs4
	; CHECK-BE-NEXT: xvcvdpuxds vs2, vs2
	; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1			; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1
				; CHECK-BE-NEXT: stxv vs2, 0(r3)
				; CHECK-BE-NEXT: xscvspdpn f4, vs4
				; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: xvcvdpuxds vs3, vs3			; CHECK-BE-NEXT: xvcvdpuxds vs3, vs3
				; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs4
	; CHECK-BE-NEXT: stxv vs1, 16(r3)			; CHECK-BE-NEXT: stxv vs1, 16(r3)
	; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0			; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0
	; CHECK-BE-NEXT: stxv vs3, 32(r3)			; CHECK-BE-NEXT: stxv vs3, 32(r3)
	; CHECK-BE-NEXT: stxv vs0, 48(r3)			; CHECK-BE-NEXT: stxv vs0, 48(r3)
	; CHECK-BE-NEXT: stxv vs2, 0(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <8 x float>, <8 x float>* %0, align 32			%a = load <8 x float>, <8 x float>* %0, align 32
	%1 = fptoui <8 x float> %a to <8 x i64>			%1 = fptoui <8 x float> %a to <8 x i64>
	store <8 x i64> %1, <8 x i64>* %agg.result, align 64			store <8 x i64> %1, <8 x i64>* %agg.result, align 64
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs4, r3, r6			; CHECK-P8-NEXT: stxvd2x vs4, r3, r6
	; CHECK-P8-NEXT: stxvd2x vs1, r3, r5			; CHECK-P8-NEXT: stxvd2x vs1, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs5, 0, r3			; CHECK-P8-NEXT: stxvd2x vs5, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs4, 16(r4)			; CHECK-P9-NEXT: lxv vs4, 16(r4)
				; CHECK-P9-NEXT: lxv vs0, 0(r4)
				; CHECK-P9-NEXT: lxv vs3, 32(r4)
	; CHECK-P9-NEXT: xxsldwi vs5, vs4, vs4, 3			; CHECK-P9-NEXT: xxsldwi vs5, vs4, vs4, 3
	; CHECK-P9-NEXT: xxswapd vs6, vs4			; CHECK-P9-NEXT: xxswapd vs6, vs4
	; CHECK-P9-NEXT: lxv vs0, 0(r4)
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xxswapd vs2, vs0			; CHECK-P9-NEXT: xxswapd vs2, vs0
				; CHECK-P9-NEXT: xxswapd vs7, vs3
	; CHECK-P9-NEXT: xscvspdpn f5, vs5			; CHECK-P9-NEXT: xscvspdpn f5, vs5
	; CHECK-P9-NEXT: xscvspdpn f6, vs6			; CHECK-P9-NEXT: xscvspdpn f6, vs6
				; CHECK-P9-NEXT: xscvspdpn f1, vs1
				; CHECK-P9-NEXT: xscvspdpn f2, vs2
				; CHECK-P9-NEXT: xscvspdpn f7, vs7
	; CHECK-P9-NEXT: xxmrghd vs5, vs6, vs5			; CHECK-P9-NEXT: xxmrghd vs5, vs6, vs5
	; CHECK-P9-NEXT: xscvspdpn f6, vs4			; CHECK-P9-NEXT: xscvspdpn f6, vs4
	; CHECK-P9-NEXT: xxsldwi vs4, vs4, vs4, 1			; CHECK-P9-NEXT: xxsldwi vs4, vs4, vs4, 1
	; CHECK-P9-NEXT: lxv vs3, 32(r4)
	; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xxswapd vs7, vs3
	; CHECK-P9-NEXT: xscvspdpn f7, vs7
	; CHECK-P9-NEXT: xscvspdpn f4, vs4
	; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xxmrghd vs1, vs2, vs1			; CHECK-P9-NEXT: xxmrghd vs1, vs2, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs0			; CHECK-P9-NEXT: xscvspdpn f2, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
				; CHECK-P9-NEXT: xscvspdpn f4, vs4
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xxmrghd vs0, vs2, vs0			; CHECK-P9-NEXT: xvcvdpuxds vs1, vs1
	; CHECK-P9-NEXT: xxmrghd vs4, vs6, vs4			; CHECK-P9-NEXT: xxmrghd vs4, vs6, vs4
	; CHECK-P9-NEXT: xxsldwi vs6, vs3, vs3, 3			; CHECK-P9-NEXT: xxsldwi vs6, vs3, vs3, 3
	; CHECK-P9-NEXT: xvcvdpuxds vs1, vs1			; CHECK-P9-NEXT: xxmrghd vs0, vs2, vs0
				; CHECK-P9-NEXT: lxv vs2, 48(r4)
	; CHECK-P9-NEXT: xvcvdpuxds vs5, vs5			; CHECK-P9-NEXT: xvcvdpuxds vs5, vs5
	; CHECK-P9-NEXT: xscvspdpn f6, vs6			; CHECK-P9-NEXT: xscvspdpn f6, vs6
				; CHECK-P9-NEXT: xvcvdpuxds vs0, vs0
				; CHECK-P9-NEXT: xvcvdpuxds vs4, vs4
				; CHECK-P9-NEXT: stxv vs5, 32(r3)
				; CHECK-P9-NEXT: stxv vs1, 0(r3)
				; CHECK-P9-NEXT: xxswapd vs8, vs2
	; CHECK-P9-NEXT: xxmrghd vs6, vs7, vs6			; CHECK-P9-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-P9-NEXT: xscvspdpn f7, vs3			; CHECK-P9-NEXT: xscvspdpn f7, vs3
	; CHECK-P9-NEXT: xxsldwi vs3, vs3, vs3, 1			; CHECK-P9-NEXT: xxsldwi vs3, vs3, vs3, 1
	; CHECK-P9-NEXT: lxv vs2, 48(r4)
	; CHECK-P9-NEXT: xxswapd vs8, vs2
	; CHECK-P9-NEXT: xscvspdpn f8, vs8			; CHECK-P9-NEXT: xscvspdpn f8, vs8
	; CHECK-P9-NEXT: xvcvdpuxds vs4, vs4
	; CHECK-P9-NEXT: xscvspdpn f3, vs3			; CHECK-P9-NEXT: xscvspdpn f3, vs3
				; CHECK-P9-NEXT: xvcvdpuxds vs6, vs6
				; CHECK-P9-NEXT: stxv vs4, 48(r3)
				; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: xxmrghd vs3, vs7, vs3			; CHECK-P9-NEXT: xxmrghd vs3, vs7, vs3
	; CHECK-P9-NEXT: xxsldwi vs7, vs2, vs2, 3			; CHECK-P9-NEXT: xxsldwi vs7, vs2, vs2, 3
	; CHECK-P9-NEXT: xvcvdpuxds vs0, vs0
	; CHECK-P9-NEXT: xvcvdpuxds vs6, vs6
	; CHECK-P9-NEXT: stxv vs6, 64(r3)
	; CHECK-P9-NEXT: xscvspdpn f7, vs7			; CHECK-P9-NEXT: xscvspdpn f7, vs7
				; CHECK-P9-NEXT: xvcvdpuxds vs3, vs3
				; CHECK-P9-NEXT: stxv vs6, 64(r3)
	; CHECK-P9-NEXT: xxmrghd vs7, vs8, vs7			; CHECK-P9-NEXT: xxmrghd vs7, vs8, vs7
	; CHECK-P9-NEXT: xscvspdpn f8, vs2			; CHECK-P9-NEXT: xscvspdpn f8, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1			; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xxmrghd vs2, vs8, vs2
	; CHECK-P9-NEXT: xvcvdpuxds vs3, vs3
	; CHECK-P9-NEXT: xvcvdpuxds vs7, vs7			; CHECK-P9-NEXT: xvcvdpuxds vs7, vs7
	; CHECK-P9-NEXT: stxv vs3, 80(r3)			; CHECK-P9-NEXT: stxv vs3, 80(r3)
				; CHECK-P9-NEXT: xxmrghd vs2, vs8, vs2
	; CHECK-P9-NEXT: xvcvdpuxds vs2, vs2			; CHECK-P9-NEXT: xvcvdpuxds vs2, vs2
	; CHECK-P9-NEXT: stxv vs7, 96(r3)			; CHECK-P9-NEXT: stxv vs7, 96(r3)
	; CHECK-P9-NEXT: stxv vs2, 112(r3)			; CHECK-P9-NEXT: stxv vs2, 112(r3)
	; CHECK-P9-NEXT: stxv vs4, 48(r3)
	; CHECK-P9-NEXT: stxv vs5, 32(r3)
	; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: stxv vs1, 0(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs0, 0(r4)			; CHECK-BE-NEXT: lxv vs0, 0(r4)
	; CHECK-BE-NEXT: lxv vs4, 16(r4)			; CHECK-BE-NEXT: lxv vs4, 16(r4)
	; CHECK-BE-NEXT: xxsldwi vs2, vs0, vs0, 1			; CHECK-BE-NEXT: lxv vs3, 32(r4)
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
				; CHECK-BE-NEXT: xxsldwi vs2, vs0, vs0, 1
	; CHECK-BE-NEXT: xxsldwi vs5, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs5, vs0, vs0, 3
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
				; CHECK-BE-NEXT: xxsldwi vs6, vs4, vs4, 1
				; CHECK-BE-NEXT: xxsldwi vs7, vs3, vs3, 1
	; CHECK-BE-NEXT: xscvspdpn f5, vs5			; CHECK-BE-NEXT: xscvspdpn f5, vs5
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: xxsldwi vs6, vs4, vs4, 1
	; CHECK-BE-NEXT: xscvspdpn f6, vs6			; CHECK-BE-NEXT: xscvspdpn f6, vs6
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
				; CHECK-BE-NEXT: xscvspdpn f7, vs7
	; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs5			; CHECK-BE-NEXT: xxmrghd vs0, vs0, vs5
	; CHECK-BE-NEXT: xscvspdpn f5, vs4			; CHECK-BE-NEXT: xscvspdpn f5, vs4
	; CHECK-BE-NEXT: lxv vs3, 32(r4)			; CHECK-BE-NEXT: xxmrghd vs1, vs1, vs2
	; CHECK-BE-NEXT: xxsldwi vs7, vs3, vs3, 1			; CHECK-BE-NEXT: lxv vs2, 48(r4)
	; CHECK-BE-NEXT: xscvspdpn f7, vs7
	; CHECK-BE-NEXT: xxmrghd vs5, vs5, vs6			; CHECK-BE-NEXT: xxmrghd vs5, vs5, vs6
	; CHECK-BE-NEXT: xxsldwi vs6, vs4, vs4, 3			; CHECK-BE-NEXT: xxsldwi vs6, vs4, vs4, 3
	; CHECK-BE-NEXT: xxswapd vs4, vs4			; CHECK-BE-NEXT: xxswapd vs4, vs4
	; CHECK-BE-NEXT: xscvspdpn f6, vs6
	; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xxmrghd vs1, vs1, vs2
	; CHECK-BE-NEXT: lxv vs2, 48(r4)
	; CHECK-BE-NEXT: xxsldwi vs8, vs2, vs2, 1
	; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1			; CHECK-BE-NEXT: xvcvdpuxds vs1, vs1
				; CHECK-BE-NEXT: xxsldwi vs8, vs2, vs2, 1
	; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0			; CHECK-BE-NEXT: xvcvdpuxds vs0, vs0
				; CHECK-BE-NEXT: xscvspdpn f6, vs6
				; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xvcvdpuxds vs5, vs5			; CHECK-BE-NEXT: xvcvdpuxds vs5, vs5
	; CHECK-BE-NEXT: xscvspdpn f8, vs8			; CHECK-BE-NEXT: xscvspdpn f8, vs8
	; CHECK-BE-NEXT: xxmrghd vs4, vs4, vs6			; CHECK-BE-NEXT: xxmrghd vs4, vs4, vs6
	; CHECK-BE-NEXT: xscvspdpn f6, vs3			; CHECK-BE-NEXT: xscvspdpn f6, vs3
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
				; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: xxmrghd vs6, vs6, vs7			; CHECK-BE-NEXT: xxmrghd vs6, vs6, vs7
	; CHECK-BE-NEXT: xxsldwi vs7, vs3, vs3, 3			; CHECK-BE-NEXT: xxsldwi vs7, vs3, vs3, 3
	; CHECK-BE-NEXT: xxswapd vs3, vs3			; CHECK-BE-NEXT: xxswapd vs3, vs3
				; CHECK-BE-NEXT: xvcvdpuxds vs4, vs4
				; CHECK-BE-NEXT: stxv vs5, 32(r3)
	; CHECK-BE-NEXT: xscvspdpn f7, vs7			; CHECK-BE-NEXT: xscvspdpn f7, vs7
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
				; CHECK-BE-NEXT: xvcvdpuxds vs6, vs6
	; CHECK-BE-NEXT: xxmrghd vs3, vs3, vs7			; CHECK-BE-NEXT: xxmrghd vs3, vs3, vs7
	; CHECK-BE-NEXT: xscvspdpn f7, vs2			; CHECK-BE-NEXT: xscvspdpn f7, vs2
				; CHECK-BE-NEXT: stxv vs4, 48(r3)
	; CHECK-BE-NEXT: xxmrghd vs7, vs7, vs8			; CHECK-BE-NEXT: xxmrghd vs7, vs7, vs8
	; CHECK-BE-NEXT: xxsldwi vs8, vs2, vs2, 3			; CHECK-BE-NEXT: xxsldwi vs8, vs2, vs2, 3
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
				; CHECK-BE-NEXT: xvcvdpuxds vs3, vs3
				; CHECK-BE-NEXT: stxv vs6, 64(r3)
	; CHECK-BE-NEXT: xscvspdpn f8, vs8			; CHECK-BE-NEXT: xscvspdpn f8, vs8
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xxmrghd vs2, vs2, vs8
	; CHECK-BE-NEXT: stxv vs5, 32(r3)
	; CHECK-BE-NEXT: xvcvdpuxds vs4, vs4
	; CHECK-BE-NEXT: xvcvdpuxds vs6, vs6
	; CHECK-BE-NEXT: xvcvdpuxds vs3, vs3
	; CHECK-BE-NEXT: xvcvdpuxds vs7, vs7			; CHECK-BE-NEXT: xvcvdpuxds vs7, vs7
				; CHECK-BE-NEXT: xxmrghd vs2, vs2, vs8
	; CHECK-BE-NEXT: stxv vs3, 80(r3)			; CHECK-BE-NEXT: stxv vs3, 80(r3)
	; CHECK-BE-NEXT: stxv vs7, 96(r3)
	; CHECK-BE-NEXT: xvcvdpuxds vs2, vs2			; CHECK-BE-NEXT: xvcvdpuxds vs2, vs2
				; CHECK-BE-NEXT: stxv vs7, 96(r3)
	; CHECK-BE-NEXT: stxv vs2, 112(r3)			; CHECK-BE-NEXT: stxv vs2, 112(r3)
	; CHECK-BE-NEXT: stxv vs6, 64(r3)
	; CHECK-BE-NEXT: stxv vs4, 48(r3)
	; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <16 x float>, <16 x float>* %0, align 64			%a = load <16 x float>, <16 x float>* %0, align 64
	%1 = fptoui <16 x float> %a to <16 x i64>			%1 = fptoui <16 x float> %a to <16 x i64>
	store <16 x i64> %1, <16 x i64>* %agg.result, align 128			store <16 x i64> %1, <16 x i64>* %agg.result, align 128
	ret void			ret void
	}			}

llvm/test/CodeGen/PowerPC/vec_conv_fp32_to_i8_elts.ll

	Show All 33 Lines
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test2elt:			; CHECK-P9-LABEL: test2elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xxsldwi vs1, v2, v2, 3			; CHECK-P9-NEXT: xxsldwi vs1, v2, v2, 3
				; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs1			; CHECK-P9-NEXT: xxswapd v2, vs1
				; CHECK-P9-NEXT: addi r3, r1, -2
	; CHECK-P9-NEXT: xxswapd v3, vs0			; CHECK-P9-NEXT: xxswapd v3, vs0
	; CHECK-P9-NEXT: vmrglb v2, v3, v2			; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: vsldoi v2, v2, v2, 8			; CHECK-P9-NEXT: vsldoi v2, v2, v2, 8
	; CHECK-P9-NEXT: addi r3, r1, -2
	; CHECK-P9-NEXT: stxsihx v2, 0, r3			; CHECK-P9-NEXT: stxsihx v2, 0, r3
	; CHECK-P9-NEXT: lhz r3, -2(r1)			; CHECK-P9-NEXT: lhz r3, -2(r1)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test2elt:			; CHECK-BE-LABEL: test2elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd f0, r3			; CHECK-BE-NEXT: mtvsrd f0, r3
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: xxswapd vs0, v2			; CHECK-P9-NEXT: xxswapd vs0, v2
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, v2			; CHECK-P9-NEXT: xscvspdpn f0, v2
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, v2, v2, 1			; CHECK-P9-NEXT: xxsldwi vs0, v2, v2, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: li r3, 0			; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: xxswapd vs0, v2			; CHECK-P8-NEXT: xxswapd vs0, v2
	; CHECK-P8-NEXT: mfvsrd r3, f0			; CHECK-P8-NEXT: mfvsrd r3, f0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r3)			; CHECK-P9-NEXT: lxv vs1, 0(r3)
				; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: xxswapd vs2, vs1			; CHECK-P9-NEXT: xxswapd vs2, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xscvspdpn f2, vs1			; CHECK-P9-NEXT: xscvspdpn f2, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
				; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: vmrglb v3, v3, v4			; CHECK-P9-NEXT: vmrglb v3, v3, v4
				; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
	; CHECK-P9-NEXT: xxswapd vs1, vs0			; CHECK-P9-NEXT: xxswapd vs1, vs0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvspdpn f1, vs0			; CHECK-P9-NEXT: xscvspdpn f1, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs1			; CHECK-BE-NEXT: xxswapd vs2, vs1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xscvspdpn f2, vs1			; CHECK-BE-NEXT: xscvspdpn f2, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghb v2, v3, v2			; CHECK-BE-NEXT: vmrghb v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: vmrghb v3, v3, v4
				; CHECK-BE-NEXT: vmrghh v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0			; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghb v3, v3, v4
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: vmrghh v2, v3, v2			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	▲ Show 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v2, v3			; CHECK-P8-NEXT: vmrglw v2, v2, v3
	; CHECK-P8-NEXT: vmrglw v3, v5, v4			; CHECK-P8-NEXT: vmrglw v3, v5, v4
	; CHECK-P8-NEXT: xxmrgld v2, v3, v2			; CHECK-P8-NEXT: xxmrgld v2, v3, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs2, 0(r3)			; CHECK-P9-NEXT: lxv vs2, 0(r3)
	; CHECK-P9-NEXT: xxsldwi vs3, vs2, vs2, 3
	; CHECK-P9-NEXT: xscvspdpn f3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: lxv vs0, 48(r3)			; CHECK-P9-NEXT: lxv vs0, 48(r3)
	; CHECK-P9-NEXT: lxv vs1, 32(r3)			; CHECK-P9-NEXT: lxv vs1, 32(r3)
	; CHECK-P9-NEXT: lxv vs4, 16(r3)			; CHECK-P9-NEXT: lxv vs4, 16(r3)
				; CHECK-P9-NEXT: xxsldwi vs3, vs2, vs2, 3
				; CHECK-P9-NEXT: xscvspdpn f3, vs3
				; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v2, vs3			; CHECK-P9-NEXT: xxswapd v2, vs3
	; CHECK-P9-NEXT: xxswapd vs3, vs2			; CHECK-P9-NEXT: xxswapd vs3, vs2
	; CHECK-P9-NEXT: xscvspdpn f3, vs3			; CHECK-P9-NEXT: xscvspdpn f3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v3, vs3			; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: xscvspdpn f3, vs2			; CHECK-P9-NEXT: xscvspdpn f3, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1			; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
				; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
				; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs4, vs4, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs4, vs4, 3
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: vmrglb v3, v3, v4			; CHECK-P9-NEXT: vmrglb v3, v3, v4
				; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xxswapd vs2, vs4			; CHECK-P9-NEXT: xxswapd vs2, vs4
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xscvspdpn f2, vs4			; CHECK-P9-NEXT: xscvspdpn f2, vs4
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs4, vs4, 1			; CHECK-P9-NEXT: xxsldwi vs2, vs4, vs4, 1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v5, vs2			; CHECK-P9-NEXT: xxswapd v5, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
				; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xxswapd vs2, vs1			; CHECK-P9-NEXT: xxswapd vs2, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xscvspdpn f2, vs1			; CHECK-P9-NEXT: xscvspdpn f2, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
				; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
				; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xxswapd vs1, vs0			; CHECK-P9-NEXT: xxswapd vs1, vs0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
	; CHECK-P9-NEXT: xscvspdpn f1, vs0			; CHECK-P9-NEXT: xscvspdpn f1, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglb v4, v5, v4
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v4, v5, v4
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v0, vs0			; CHECK-P9-NEXT: xxswapd v0, vs0
	; CHECK-P9-NEXT: vmrglb v5, v5, v0			; CHECK-P9-NEXT: vmrglb v5, v5, v0
	; CHECK-P9-NEXT: vmrglh v4, v5, v4			; CHECK-P9-NEXT: vmrglh v4, v5, v4
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld v2, v3, v2			; CHECK-P9-NEXT: xxmrgld v2, v3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs3, 48(r3)			; CHECK-BE-NEXT: lxv vs3, 48(r3)
	; CHECK-BE-NEXT: xxsldwi vs4, vs3, vs3, 3
	; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: lxv vs0, 0(r3)			; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
	; CHECK-BE-NEXT: lxv vs2, 32(r3)			; CHECK-BE-NEXT: lxv vs2, 32(r3)
				; CHECK-BE-NEXT: xxsldwi vs4, vs3, vs3, 3
				; CHECK-BE-NEXT: xscvspdpn f4, vs4
				; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: xxswapd vs4, vs3			; CHECK-BE-NEXT: xxswapd vs4, vs3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f4, vs4			; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: xscvdpsxws f4, f4			; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: xscvspdpn f4, vs3			; CHECK-BE-NEXT: xscvspdpn f4, vs3
	; CHECK-BE-NEXT: xxsldwi vs3, vs3, vs3, 1			; CHECK-BE-NEXT: xxsldwi vs3, vs3, vs3, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f4, f4			; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3			; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: vmrghb v2, v3, v2			; CHECK-BE-NEXT: vmrghb v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xxsldwi vs3, vs2, vs2, 3			; CHECK-BE-NEXT: xxsldwi vs3, vs2, vs2, 3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3			; CHECK-BE-NEXT: xscvdpsxws f3, f3
				; CHECK-BE-NEXT: vmrghb v3, v3, v4
				; CHECK-BE-NEXT: vmrghh v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xxswapd vs3, vs2			; CHECK-BE-NEXT: xxswapd vs3, vs2
	; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: vmrghb v3, v3, v4
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: vmrghh v2, v3, v2			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xscvspdpn f3, vs2			; CHECK-BE-NEXT: xscvspdpn f3, vs2
	; CHECK-BE-NEXT: xxsldwi vs2, vs2, vs2, 1			; CHECK-BE-NEXT: xxsldwi vs2, vs2, vs2, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f3, f3			; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: vmrghb v3, v4, v3			; CHECK-BE-NEXT: vmrghb v3, v4, v3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v5, r3			; CHECK-BE-NEXT: mtvsrd v5, r3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs1
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: vmrghb v4, v4, v5			; CHECK-BE-NEXT: vmrghb v4, v4, v5
	; CHECK-BE-NEXT: vmrghh v3, v4, v3			; CHECK-BE-NEXT: vmrghh v3, v4, v3
	; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: vmrghw v2, v3, v2			; CHECK-BE-NEXT: vmrghw v2, v3, v2
				; CHECK-BE-NEXT: mfvsrwz r3, f2
				; CHECK-BE-NEXT: xxswapd vs2, vs1
				; CHECK-BE-NEXT: sldi r3, r3, 56
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
				; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xscvspdpn f2, vs1			; CHECK-BE-NEXT: xscvspdpn f2, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghb v3, v4, v3			; CHECK-BE-NEXT: vmrghb v3, v4, v3
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v5, r3			; CHECK-BE-NEXT: mtvsrd v5, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: vmrghb v4, v4, v5
				; CHECK-BE-NEXT: vmrghh v3, v4, v3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0			; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghb v4, v4, v5
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: vmrghh v3, v4, v3			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: mtvsrd v5, r3			; CHECK-BE-NEXT: mtvsrd v5, r3
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	Show All 40 Lines
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test2elt_signed:			; CHECK-P9-LABEL: test2elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xxsldwi vs1, v2, v2, 3			; CHECK-P9-NEXT: xxsldwi vs1, v2, v2, 3
				; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs1			; CHECK-P9-NEXT: xxswapd v2, vs1
				; CHECK-P9-NEXT: addi r3, r1, -2
	; CHECK-P9-NEXT: xxswapd v3, vs0			; CHECK-P9-NEXT: xxswapd v3, vs0
	; CHECK-P9-NEXT: vmrglb v2, v3, v2			; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: vsldoi v2, v2, v2, 8			; CHECK-P9-NEXT: vsldoi v2, v2, v2, 8
	; CHECK-P9-NEXT: addi r3, r1, -2
	; CHECK-P9-NEXT: stxsihx v2, 0, r3			; CHECK-P9-NEXT: stxsihx v2, 0, r3
	; CHECK-P9-NEXT: lhz r3, -2(r1)			; CHECK-P9-NEXT: lhz r3, -2(r1)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test2elt_signed:			; CHECK-BE-LABEL: test2elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd f0, r3			; CHECK-BE-NEXT: mtvsrd f0, r3
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: xxswapd vs0, v2			; CHECK-P9-NEXT: xxswapd vs0, v2
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xscvspdpn f0, v2			; CHECK-P9-NEXT: xscvspdpn f0, v2
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, v2, v2, 1			; CHECK-P9-NEXT: xxsldwi vs0, v2, v2, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: li r3, 0			; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: xxswapd vs0, v2			; CHECK-P8-NEXT: xxswapd vs0, v2
	; CHECK-P8-NEXT: mfvsrd r3, f0			; CHECK-P8-NEXT: mfvsrd r3, f0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r3)			; CHECK-P9-NEXT: lxv vs1, 0(r3)
				; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: xxswapd vs2, vs1			; CHECK-P9-NEXT: xxswapd vs2, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xscvspdpn f2, vs1			; CHECK-P9-NEXT: xscvspdpn f2, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
				; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: vmrglb v3, v3, v4			; CHECK-P9-NEXT: vmrglb v3, v3, v4
				; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
	; CHECK-P9-NEXT: xxswapd vs1, vs0			; CHECK-P9-NEXT: xxswapd vs1, vs0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvspdpn f1, vs0			; CHECK-P9-NEXT: xscvspdpn f1, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs1			; CHECK-BE-NEXT: xxswapd vs2, vs1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xscvspdpn f2, vs1			; CHECK-BE-NEXT: xscvspdpn f2, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghb v2, v3, v2			; CHECK-BE-NEXT: vmrghb v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: vmrghb v3, v3, v4
				; CHECK-BE-NEXT: vmrghh v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0			; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghb v3, v3, v4
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: vmrghh v2, v3, v2			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	▲ Show 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v2, v3			; CHECK-P8-NEXT: vmrglw v2, v2, v3
	; CHECK-P8-NEXT: vmrglw v3, v5, v4			; CHECK-P8-NEXT: vmrglw v3, v5, v4
	; CHECK-P8-NEXT: xxmrgld v2, v3, v2			; CHECK-P8-NEXT: xxmrgld v2, v3, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs2, 0(r3)			; CHECK-P9-NEXT: lxv vs2, 0(r3)
	; CHECK-P9-NEXT: xxsldwi vs3, vs2, vs2, 3
	; CHECK-P9-NEXT: xscvspdpn f3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: lxv vs0, 48(r3)			; CHECK-P9-NEXT: lxv vs0, 48(r3)
	; CHECK-P9-NEXT: lxv vs1, 32(r3)			; CHECK-P9-NEXT: lxv vs1, 32(r3)
	; CHECK-P9-NEXT: lxv vs4, 16(r3)			; CHECK-P9-NEXT: lxv vs4, 16(r3)
				; CHECK-P9-NEXT: xxsldwi vs3, vs2, vs2, 3
				; CHECK-P9-NEXT: xscvspdpn f3, vs3
				; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v2, vs3			; CHECK-P9-NEXT: xxswapd v2, vs3
	; CHECK-P9-NEXT: xxswapd vs3, vs2			; CHECK-P9-NEXT: xxswapd vs3, vs2
	; CHECK-P9-NEXT: xscvspdpn f3, vs3			; CHECK-P9-NEXT: xscvspdpn f3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v3, vs3			; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: xscvspdpn f3, vs2			; CHECK-P9-NEXT: xscvspdpn f3, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1			; CHECK-P9-NEXT: xxsldwi vs2, vs2, vs2, 1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
				; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
				; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs4, vs4, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs4, vs4, 3
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: vmrglb v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: vmrglb v3, v3, v4			; CHECK-P9-NEXT: vmrglb v3, v3, v4
				; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xxswapd vs2, vs4			; CHECK-P9-NEXT: xxswapd vs2, vs4
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xscvspdpn f2, vs4			; CHECK-P9-NEXT: xscvspdpn f2, vs4
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs4, vs4, 1			; CHECK-P9-NEXT: xxsldwi vs2, vs4, vs4, 1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v5, vs2			; CHECK-P9-NEXT: xxswapd v5, vs2
	; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-P9-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
				; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xxswapd vs2, vs1			; CHECK-P9-NEXT: xxswapd vs2, vs1
	; CHECK-P9-NEXT: xscvspdpn f2, vs2			; CHECK-P9-NEXT: xscvspdpn f2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xscvspdpn f2, vs1			; CHECK-P9-NEXT: xscvspdpn f2, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-P9-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
				; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
	; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglb v3, v4, v3
	; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
				; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xxswapd vs1, vs0			; CHECK-P9-NEXT: xxswapd vs1, vs0
	; CHECK-P9-NEXT: xscvspdpn f1, vs1			; CHECK-P9-NEXT: xscvspdpn f1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
	; CHECK-P9-NEXT: xscvspdpn f1, vs0			; CHECK-P9-NEXT: xscvspdpn f1, vs0
	; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-P9-NEXT: xscvspdpn f0, vs0			; CHECK-P9-NEXT: xscvspdpn f0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglb v4, v5, v4
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v4, v5, v4
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v0, vs0			; CHECK-P9-NEXT: xxswapd v0, vs0
	; CHECK-P9-NEXT: vmrglb v5, v5, v0			; CHECK-P9-NEXT: vmrglb v5, v5, v0
	; CHECK-P9-NEXT: vmrglh v4, v5, v4			; CHECK-P9-NEXT: vmrglh v4, v5, v4
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld v2, v3, v2			; CHECK-P9-NEXT: xxmrgld v2, v3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs3, 48(r3)			; CHECK-BE-NEXT: lxv vs3, 48(r3)
	; CHECK-BE-NEXT: xxsldwi vs4, vs3, vs3, 3
	; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: lxv vs0, 0(r3)			; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
	; CHECK-BE-NEXT: lxv vs2, 32(r3)			; CHECK-BE-NEXT: lxv vs2, 32(r3)
				; CHECK-BE-NEXT: xxsldwi vs4, vs3, vs3, 3
				; CHECK-BE-NEXT: xscvspdpn f4, vs4
				; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: xxswapd vs4, vs3			; CHECK-BE-NEXT: xxswapd vs4, vs3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f4, vs4			; CHECK-BE-NEXT: xscvspdpn f4, vs4
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: xscvdpsxws f4, f4			; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: xscvspdpn f4, vs3			; CHECK-BE-NEXT: xscvspdpn f4, vs3
	; CHECK-BE-NEXT: xxsldwi vs3, vs3, vs3, 1			; CHECK-BE-NEXT: xxsldwi vs3, vs3, vs3, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f4, f4			; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3			; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: vmrghb v2, v3, v2			; CHECK-BE-NEXT: vmrghb v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xxsldwi vs3, vs2, vs2, 3			; CHECK-BE-NEXT: xxsldwi vs3, vs2, vs2, 3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f3, vs3			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3			; CHECK-BE-NEXT: xscvdpsxws f3, f3
				; CHECK-BE-NEXT: vmrghb v3, v3, v4
				; CHECK-BE-NEXT: vmrghh v2, v3, v2
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xxswapd vs3, vs2			; CHECK-BE-NEXT: xxswapd vs3, vs2
	; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: vmrghb v3, v3, v4
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: vmrghh v2, v3, v2			; CHECK-BE-NEXT: xscvspdpn f3, vs3
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xscvspdpn f3, vs2			; CHECK-BE-NEXT: xscvspdpn f3, vs2
	; CHECK-BE-NEXT: xxsldwi vs2, vs2, vs2, 1			; CHECK-BE-NEXT: xxsldwi vs2, vs2, vs2, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f3, f3			; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: vmrghb v3, v4, v3			; CHECK-BE-NEXT: vmrghb v3, v4, v3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3			; CHECK-BE-NEXT: xxsldwi vs2, vs1, vs1, 3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f2, vs2			; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v5, r3			; CHECK-BE-NEXT: mtvsrd v5, r3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs1
	; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: vmrghb v4, v4, v5			; CHECK-BE-NEXT: vmrghb v4, v4, v5
	; CHECK-BE-NEXT: vmrghh v3, v4, v3			; CHECK-BE-NEXT: vmrghh v3, v4, v3
	; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: vmrghw v2, v3, v2			; CHECK-BE-NEXT: vmrghw v2, v3, v2
				; CHECK-BE-NEXT: mfvsrwz r3, f2
				; CHECK-BE-NEXT: xxswapd vs2, vs1
				; CHECK-BE-NEXT: sldi r3, r3, 56
				; CHECK-BE-NEXT: xscvspdpn f2, vs2
	; CHECK-BE-NEXT: mtvsrd v3, r3			; CHECK-BE-NEXT: mtvsrd v3, r3
				; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: xscvspdpn f2, vs1			; CHECK-BE-NEXT: xscvspdpn f2, vs1
	; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1			; CHECK-BE-NEXT: xxsldwi vs1, vs1, vs1, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghb v3, v4, v3			; CHECK-BE-NEXT: vmrghb v3, v4, v3
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi vs1, vs0, vs0, 3
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvspdpn f1, vs1			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v5, r3			; CHECK-BE-NEXT: mtvsrd v5, r3
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: vmrghb v4, v4, v5
				; CHECK-BE-NEXT: vmrghh v3, v4, v3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs0			; CHECK-BE-NEXT: xxswapd vs1, vs0
	; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: vmrghb v4, v4, v5
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: vmrghh v3, v4, v3			; CHECK-BE-NEXT: xscvspdpn f1, vs1
	; CHECK-BE-NEXT: mtvsrd v4, r3			; CHECK-BE-NEXT: mtvsrd v4, r3
				; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvspdpn f1, vs0			; CHECK-BE-NEXT: xscvspdpn f1, vs0
	; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs0, vs0, 1
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: xscvspdpn f0, vs0			; CHECK-BE-NEXT: xscvspdpn f0, vs0
	; CHECK-BE-NEXT: mtvsrd v5, r3			; CHECK-BE-NEXT: mtvsrd v5, r3
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	Show All 17 Lines

llvm/test/CodeGen/PowerPC/vec_conv_fp64_to_i16_elts.ll

	Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: xxswapd vs0, v2			; CHECK-P8-NEXT: xxswapd vs0, v2
	; CHECK-P8-NEXT: mfvsrd r3, f0			; CHECK-P8-NEXT: mfvsrd r3, f0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt:			; CHECK-P9-LABEL: test4elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r3)			; CHECK-P9-NEXT: lxv vs1, 0(r3)
				; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: vmrglh v3, v3, v4			; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt:			; CHECK-BE-LABEL: test4elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: xscvdpsxws f2, f1			; CHECK-BE-NEXT: xscvdpsxws f2, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvdpsxws f1, f0			; CHECK-BE-NEXT: xscvdpsxws f1, f0
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: vmrglw v3, v5, v4			; CHECK-P8-NEXT: vmrglw v3, v5, v4
	; CHECK-P8-NEXT: xxmrgld v2, v3, v2			; CHECK-P8-NEXT: xxmrgld v2, v3, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs3, 0(r3)			; CHECK-P9-NEXT: lxv vs3, 0(r3)
	; CHECK-P9-NEXT: xscvdpsxws f4, f3
	; CHECK-P9-NEXT: xxswapd vs3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: lxv vs0, 48(r3)			; CHECK-P9-NEXT: lxv vs0, 48(r3)
	; CHECK-P9-NEXT: lxv vs1, 32(r3)			; CHECK-P9-NEXT: lxv vs1, 32(r3)
	; CHECK-P9-NEXT: lxv vs2, 16(r3)			; CHECK-P9-NEXT: lxv vs2, 16(r3)
				; CHECK-P9-NEXT: xscvdpsxws f4, f3
				; CHECK-P9-NEXT: xxswapd vs3, vs3
				; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: mfvsrwz r3, f4			; CHECK-P9-NEXT: mfvsrwz r3, f4
	; CHECK-P9-NEXT: mtvsrd f4, r3			; CHECK-P9-NEXT: mtvsrd f4, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: xxswapd v2, vs4			; CHECK-P9-NEXT: xxswapd v2, vs4
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v3, vs3			; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f2			; CHECK-P9-NEXT: xscvdpsxws f3, f2
	; CHECK-P9-NEXT: xxswapd vs2, vs2			; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
				; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglh v3, v3, v4
				; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglh v4, v4, v5			; CHECK-P9-NEXT: vmrglh v4, v4, v5
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld v2, v3, v2			; CHECK-P9-NEXT: xxmrgld v2, v3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs3, 48(r3)			; CHECK-BE-NEXT: lxv vs3, 48(r3)
	; CHECK-BE-NEXT: xscvdpsxws f4, f3
	; CHECK-BE-NEXT: xxswapd vs3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: lxv vs2, 32(r3)			; CHECK-BE-NEXT: lxv vs2, 32(r3)
	; CHECK-BE-NEXT: lxv vs0, 0(r3)			; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: xscvdpsxws f4, f3
				; CHECK-BE-NEXT: xxswapd vs3, vs3
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xscvdpsxws f3, f2			; CHECK-BE-NEXT: xscvdpsxws f3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	▲ Show 20 Lines • Show All 144 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v2, r3, r5			; CHECK-P8-NEXT: stvx v2, r3, r5
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs4, 0(r4)			; CHECK-P9-NEXT: lxv vs4, 0(r4)
	; CHECK-P9-NEXT: lxv vs3, 16(r4)			; CHECK-P9-NEXT: lxv vs3, 16(r4)
	; CHECK-P9-NEXT: lxv vs2, 32(r4)			; CHECK-P9-NEXT: lxv vs2, 32(r4)
	; CHECK-P9-NEXT: xscvdpsxws f5, f4
	; CHECK-P9-NEXT: lxv vs1, 48(r4)			; CHECK-P9-NEXT: lxv vs1, 48(r4)
				; CHECK-P9-NEXT: xscvdpsxws f5, f4
	; CHECK-P9-NEXT: xscvdpsxws f6, f3			; CHECK-P9-NEXT: xscvdpsxws f6, f3
	; CHECK-P9-NEXT: lxv vs0, 64(r4)			; CHECK-P9-NEXT: lxv vs0, 64(r4)
	; CHECK-P9-NEXT: xscvdpsxws f7, f2			; CHECK-P9-NEXT: xscvdpsxws f7, f2
	; CHECK-P9-NEXT: xscvdpsxws f8, f1			; CHECK-P9-NEXT: xscvdpsxws f8, f1
	; CHECK-P9-NEXT: xxswapd vs4, vs4			; CHECK-P9-NEXT: xxswapd vs4, vs4
	; CHECK-P9-NEXT: xscvdpsxws f4, f4
	; CHECK-P9-NEXT: mfvsrwz r5, f5
	; CHECK-P9-NEXT: xscvdpsxws f9, f0			; CHECK-P9-NEXT: xscvdpsxws f9, f0
	; CHECK-P9-NEXT: xxswapd vs3, vs3			; CHECK-P9-NEXT: xxswapd vs3, vs3
				; CHECK-P9-NEXT: xxswapd vs2, vs2
				; CHECK-P9-NEXT: xxswapd vs1, vs1
				; CHECK-P9-NEXT: xxswapd vs0, vs0
				; CHECK-P9-NEXT: xscvdpsxws f4, f4
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
				; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: mfvsrwz r5, f5
	; CHECK-P9-NEXT: mtvsrd f5, r5			; CHECK-P9-NEXT: mtvsrd f5, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f6			; CHECK-P9-NEXT: mfvsrwz r5, f6
	; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mtvsrd f6, r5			; CHECK-P9-NEXT: mtvsrd f6, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f7			; CHECK-P9-NEXT: mfvsrwz r5, f7
				; CHECK-P9-NEXT: xxswapd v2, vs5
	; CHECK-P9-NEXT: mtvsrd f7, r5			; CHECK-P9-NEXT: mtvsrd f7, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f8			; CHECK-P9-NEXT: mfvsrwz r5, f8
	; CHECK-P9-NEXT: mtvsrd f8, r5			; CHECK-P9-NEXT: mtvsrd f8, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f9			; CHECK-P9-NEXT: mfvsrwz r5, f9
	; CHECK-P9-NEXT: mtvsrd f9, r5			; CHECK-P9-NEXT: mtvsrd f9, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f4			; CHECK-P9-NEXT: mfvsrwz r5, f4
				; CHECK-P9-NEXT: xxswapd v5, vs8
	; CHECK-P9-NEXT: mtvsrd f4, r5			; CHECK-P9-NEXT: mtvsrd f4, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f3			; CHECK-P9-NEXT: mfvsrwz r5, f3
	; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: xxswapd v2, vs5
	; CHECK-P9-NEXT: xxswapd v5, vs8
	; CHECK-P9-NEXT: xxswapd v0, vs9			; CHECK-P9-NEXT: xxswapd v0, vs9
	; CHECK-P9-NEXT: mtvsrd f3, r5			; CHECK-P9-NEXT: mtvsrd f3, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f2			; CHECK-P9-NEXT: mfvsrwz r5, f2
	; CHECK-P9-NEXT: mtvsrd f2, r5
	; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: xxswapd v1, vs2
	; CHECK-P9-NEXT: lxv vs2, 80(r4)
	; CHECK-P9-NEXT: xxswapd v3, vs4			; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: vmrglh v2, v2, v3			; CHECK-P9-NEXT: mtvsrd f2, r5
	; CHECK-P9-NEXT: xxswapd v3, vs6
	; CHECK-P9-NEXT: xxswapd v4, vs3			; CHECK-P9-NEXT: xxswapd v4, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f2
	; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: mfvsrwz r5, f1			; CHECK-P9-NEXT: mfvsrwz r5, f1
	; CHECK-P9-NEXT: vmrglh v3, v3, v4			; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v4, vs7			; CHECK-P9-NEXT: xxswapd v3, vs6
				; CHECK-P9-NEXT: xxswapd v1, vs2
				; CHECK-P9-NEXT: lxv vs2, 80(r4)
	; CHECK-P9-NEXT: mtvsrd f1, r5			; CHECK-P9-NEXT: mtvsrd f1, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f0			; CHECK-P9-NEXT: mfvsrwz r5, f0
				; CHECK-P9-NEXT: vmrglh v3, v3, v4
				; CHECK-P9-NEXT: xxswapd v4, vs7
				; CHECK-P9-NEXT: mtvsrd f0, r5
				; CHECK-P9-NEXT: xscvdpsxws f3, f2
				; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: vmrglh v4, v4, v1			; CHECK-P9-NEXT: vmrglh v4, v4, v1
	; CHECK-P9-NEXT: xxswapd v1, vs1			; CHECK-P9-NEXT: xxswapd v1, vs1
	; CHECK-P9-NEXT: mtvsrd f0, r5			; CHECK-P9-NEXT: lxv vs1, 96(r4)
	; CHECK-P9-NEXT: vmrglh v5, v5, v1			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglh v5, v5, v1
	; CHECK-P9-NEXT: xxswapd v1, vs0			; CHECK-P9-NEXT: xxswapd v1, vs0
	; CHECK-P9-NEXT: lxv vs0, 112(r4)			; CHECK-P9-NEXT: lxv vs0, 112(r4)
	; CHECK-P9-NEXT: lxv vs1, 96(r4)			; CHECK-P9-NEXT: vmrglw v3, v5, v4
				; CHECK-P9-NEXT: vmrglh v0, v0, v1
	; CHECK-P9-NEXT: mfvsrwz r4, f3			; CHECK-P9-NEXT: mfvsrwz r4, f3
	; CHECK-P9-NEXT: mtvsrd f3, r4			; CHECK-P9-NEXT: mtvsrd f3, r4
	; CHECK-P9-NEXT: mfvsrwz r4, f2
	; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: vmrglw v3, v5, v4
	; CHECK-P9-NEXT: xxmrgld vs4, v3, v2			; CHECK-P9-NEXT: xxmrgld vs4, v3, v2
				; CHECK-P9-NEXT: mfvsrwz r4, f2
	; CHECK-P9-NEXT: xxswapd v2, vs3			; CHECK-P9-NEXT: xxswapd v2, vs3
	; CHECK-P9-NEXT: vmrglh v0, v0, v1
	; CHECK-P9-NEXT: mtvsrd f2, r4			; CHECK-P9-NEXT: mtvsrd f2, r4
				; CHECK-P9-NEXT: stxv vs4, 0(r3)
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglh v2, v2, v3
				; CHECK-P9-NEXT: vmrglw v2, v2, v0
	; CHECK-P9-NEXT: mfvsrwz r4, f2			; CHECK-P9-NEXT: mfvsrwz r4, f2
	; CHECK-P9-NEXT: mtvsrd f2, r4			; CHECK-P9-NEXT: mtvsrd f2, r4
	; CHECK-P9-NEXT: mfvsrwz r4, f1			; CHECK-P9-NEXT: mfvsrwz r4, f1
				; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r4			; CHECK-P9-NEXT: mtvsrd f1, r4
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r4, f1			; CHECK-P9-NEXT: mfvsrwz r4, f1
	; CHECK-P9-NEXT: mtvsrd f1, r4			; CHECK-P9-NEXT: mtvsrd f1, r4
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: vmrglw v2, v2, v0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglh v4, v4, v5			; CHECK-P9-NEXT: vmrglh v4, v4, v5
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld vs0, v3, v2			; CHECK-P9-NEXT: xxmrgld vs0, v3, v2
	; CHECK-P9-NEXT: stxv vs0, 16(r3)			; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: stxv vs4, 0(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs4, 48(r4)			; CHECK-BE-NEXT: lxv vs4, 48(r4)
				; CHECK-BE-NEXT: lxv vs3, 32(r4)
				; CHECK-BE-NEXT: lxv vs2, 16(r4)
				; CHECK-BE-NEXT: lxv vs1, 0(r4)
	; CHECK-BE-NEXT: xscvdpsxws f5, f4			; CHECK-BE-NEXT: xscvdpsxws f5, f4
	; CHECK-BE-NEXT: xxswapd vs4, vs4			; CHECK-BE-NEXT: xxswapd vs4, vs4
	; CHECK-BE-NEXT: lxv vs3, 32(r4)
	; CHECK-BE-NEXT: xscvdpsxws f6, f3			; CHECK-BE-NEXT: xscvdpsxws f6, f3
	; CHECK-BE-NEXT: xxswapd vs3, vs3			; CHECK-BE-NEXT: xxswapd vs3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: mfvsrwz r5, f5
	; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: lxv vs2, 16(r4)
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: xscvdpsxws f7, f2			; CHECK-BE-NEXT: xscvdpsxws f7, f2
				; CHECK-BE-NEXT: lxv vs0, 112(r4)
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
				; CHECK-BE-NEXT: xscvdpsxws f4, f4
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
				; CHECK-BE-NEXT: mfvsrwz r5, f5
				; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mtvsrd v2, r5			; CHECK-BE-NEXT: mtvsrd v2, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f4			; CHECK-BE-NEXT: mfvsrwz r5, f4
	; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: lxv vs1, 0(r4)
	; CHECK-BE-NEXT: xscvdpsxws f4, f1			; CHECK-BE-NEXT: xscvdpsxws f4, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
				; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mtvsrd v3, r5			; CHECK-BE-NEXT: mtvsrd v3, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f6			; CHECK-BE-NEXT: mfvsrwz r5, f6
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: lxv vs0, 112(r4)
	; CHECK-BE-NEXT: vmrghh v2, v2, v3			; CHECK-BE-NEXT: vmrghh v2, v2, v3
	; CHECK-BE-NEXT: mtvsrd v3, r5			; CHECK-BE-NEXT: mtvsrd v3, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f3			; CHECK-BE-NEXT: mfvsrwz r5, f3
	; CHECK-BE-NEXT: xscvdpsxws f3, f0			; CHECK-BE-NEXT: xscvdpsxws f3, f0
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	; CHECK-BE-NEXT: mtvsrd v4, r5			; CHECK-BE-NEXT: mtvsrd v4, r5
	Show All 15 Lines
	; CHECK-BE-NEXT: mfvsrwz r5, f1			; CHECK-BE-NEXT: mfvsrwz r5, f1
	; CHECK-BE-NEXT: lxv vs1, 80(r4)			; CHECK-BE-NEXT: lxv vs1, 80(r4)
	; CHECK-BE-NEXT: xscvdpsxws f3, f2			; CHECK-BE-NEXT: xscvdpsxws f3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: vmrghh v4, v4, v1			; CHECK-BE-NEXT: vmrghh v4, v4, v1
	; CHECK-BE-NEXT: mtvsrd v1, r5			; CHECK-BE-NEXT: mtvsrd v1, r5
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: vmrghh v5, v5, v1
	; CHECK-BE-NEXT: mfvsrwz r5, f0			; CHECK-BE-NEXT: mfvsrwz r5, f0
	; CHECK-BE-NEXT: lxv vs0, 64(r4)			; CHECK-BE-NEXT: lxv vs0, 64(r4)
				; CHECK-BE-NEXT: vmrghh v5, v5, v1
				; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mfvsrwz r4, f3			; CHECK-BE-NEXT: mfvsrwz r4, f3
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: mtvsrd v1, r5
	; CHECK-BE-NEXT: vmrghw v3, v5, v4			; CHECK-BE-NEXT: vmrghw v3, v5, v4
				; CHECK-BE-NEXT: sldi r4, r4, 48
				; CHECK-BE-NEXT: vmrghh v0, v0, v1
	; CHECK-BE-NEXT: xxmrghd vs3, v3, v2			; CHECK-BE-NEXT: xxmrghd vs3, v3, v2
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f2			; CHECK-BE-NEXT: mfvsrwz r4, f2
	; CHECK-BE-NEXT: xscvdpsxws f2, f1			; CHECK-BE-NEXT: xscvdpsxws f2, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: stxv vs3, 0(r3)
	; CHECK-BE-NEXT: mtvsrd v3, r4			; CHECK-BE-NEXT: mtvsrd v3, r4
	; CHECK-BE-NEXT: vmrghh v2, v2, v3			; CHECK-BE-NEXT: vmrghh v2, v2, v3
	; CHECK-BE-NEXT: mfvsrwz r4, f2			; CHECK-BE-NEXT: mfvsrwz r4, f2
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
				; CHECK-BE-NEXT: vmrghw v2, v2, v0
	; CHECK-BE-NEXT: mtvsrd v3, r4			; CHECK-BE-NEXT: mtvsrd v3, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f1			; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: xscvdpsxws f1, f0			; CHECK-BE-NEXT: xscvdpsxws f1, f0
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	; CHECK-BE-NEXT: mtvsrd v4, r4			; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: vmrghh v3, v3, v4			; CHECK-BE-NEXT: vmrghh v3, v3, v4
	; CHECK-BE-NEXT: mfvsrwz r4, f1			; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v4, r4			; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f0			; CHECK-BE-NEXT: mfvsrwz r4, f0
	; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mtvsrd v1, r5
	; CHECK-BE-NEXT: vmrghh v0, v0, v1
	; CHECK-BE-NEXT: vmrghw v2, v2, v0
	; CHECK-BE-NEXT: stxv vs3, 0(r3)
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v5, r4			; CHECK-BE-NEXT: mtvsrd v5, r4
	; CHECK-BE-NEXT: vmrghh v4, v4, v5			; CHECK-BE-NEXT: vmrghh v4, v4, v5
	; CHECK-BE-NEXT: vmrghw v3, v4, v3			; CHECK-BE-NEXT: vmrghw v3, v4, v3
	; CHECK-BE-NEXT: xxmrghd vs0, v3, v2			; CHECK-BE-NEXT: xxmrghd vs0, v3, v2
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: xxswapd vs0, v2			; CHECK-P8-NEXT: xxswapd vs0, v2
	; CHECK-P8-NEXT: mfvsrd r3, f0			; CHECK-P8-NEXT: mfvsrd r3, f0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt_signed:			; CHECK-P9-LABEL: test4elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r3)			; CHECK-P9-NEXT: lxv vs1, 0(r3)
				; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: vmrglh v3, v3, v4			; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt_signed:			; CHECK-BE-LABEL: test4elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: xscvdpsxws f2, f1			; CHECK-BE-NEXT: xscvdpsxws f2, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvdpsxws f1, f0			; CHECK-BE-NEXT: xscvdpsxws f1, f0
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: vmrglw v3, v5, v4			; CHECK-P8-NEXT: vmrglw v3, v5, v4
	; CHECK-P8-NEXT: xxmrgld v2, v3, v2			; CHECK-P8-NEXT: xxmrgld v2, v3, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs3, 0(r3)			; CHECK-P9-NEXT: lxv vs3, 0(r3)
	; CHECK-P9-NEXT: xscvdpsxws f4, f3
	; CHECK-P9-NEXT: xxswapd vs3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: lxv vs0, 48(r3)			; CHECK-P9-NEXT: lxv vs0, 48(r3)
	; CHECK-P9-NEXT: lxv vs1, 32(r3)			; CHECK-P9-NEXT: lxv vs1, 32(r3)
	; CHECK-P9-NEXT: lxv vs2, 16(r3)			; CHECK-P9-NEXT: lxv vs2, 16(r3)
				; CHECK-P9-NEXT: xscvdpsxws f4, f3
				; CHECK-P9-NEXT: xxswapd vs3, vs3
				; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: mfvsrwz r3, f4			; CHECK-P9-NEXT: mfvsrwz r3, f4
	; CHECK-P9-NEXT: mtvsrd f4, r3			; CHECK-P9-NEXT: mtvsrd f4, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: xxswapd v2, vs4			; CHECK-P9-NEXT: xxswapd v2, vs4
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v3, vs3			; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f2			; CHECK-P9-NEXT: xscvdpsxws f3, f2
	; CHECK-P9-NEXT: xxswapd vs2, vs2			; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
				; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglh v3, v3, v4
				; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglh v4, v4, v5			; CHECK-P9-NEXT: vmrglh v4, v4, v5
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld v2, v3, v2			; CHECK-P9-NEXT: xxmrgld v2, v3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs3, 48(r3)			; CHECK-BE-NEXT: lxv vs3, 48(r3)
	; CHECK-BE-NEXT: xscvdpsxws f4, f3
	; CHECK-BE-NEXT: xxswapd vs3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: lxv vs2, 32(r3)			; CHECK-BE-NEXT: lxv vs2, 32(r3)
	; CHECK-BE-NEXT: lxv vs0, 0(r3)			; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: xscvdpsxws f4, f3
				; CHECK-BE-NEXT: xxswapd vs3, vs3
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xscvdpsxws f3, f2			; CHECK-BE-NEXT: xscvdpsxws f3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
	; CHECK-BE-NEXT: sldi r3, r3, 48			; CHECK-BE-NEXT: sldi r3, r3, 48
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	▲ Show 20 Lines • Show All 144 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v2, r3, r5			; CHECK-P8-NEXT: stvx v2, r3, r5
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs4, 0(r4)			; CHECK-P9-NEXT: lxv vs4, 0(r4)
	; CHECK-P9-NEXT: lxv vs3, 16(r4)			; CHECK-P9-NEXT: lxv vs3, 16(r4)
	; CHECK-P9-NEXT: lxv vs2, 32(r4)			; CHECK-P9-NEXT: lxv vs2, 32(r4)
	; CHECK-P9-NEXT: xscvdpsxws f5, f4
	; CHECK-P9-NEXT: lxv vs1, 48(r4)			; CHECK-P9-NEXT: lxv vs1, 48(r4)
				; CHECK-P9-NEXT: xscvdpsxws f5, f4
	; CHECK-P9-NEXT: xscvdpsxws f6, f3			; CHECK-P9-NEXT: xscvdpsxws f6, f3
	; CHECK-P9-NEXT: lxv vs0, 64(r4)			; CHECK-P9-NEXT: lxv vs0, 64(r4)
	; CHECK-P9-NEXT: xscvdpsxws f7, f2			; CHECK-P9-NEXT: xscvdpsxws f7, f2
	; CHECK-P9-NEXT: xscvdpsxws f8, f1			; CHECK-P9-NEXT: xscvdpsxws f8, f1
	; CHECK-P9-NEXT: xxswapd vs4, vs4			; CHECK-P9-NEXT: xxswapd vs4, vs4
	; CHECK-P9-NEXT: xscvdpsxws f4, f4
	; CHECK-P9-NEXT: mfvsrwz r5, f5
	; CHECK-P9-NEXT: xscvdpsxws f9, f0			; CHECK-P9-NEXT: xscvdpsxws f9, f0
	; CHECK-P9-NEXT: xxswapd vs3, vs3			; CHECK-P9-NEXT: xxswapd vs3, vs3
				; CHECK-P9-NEXT: xxswapd vs2, vs2
				; CHECK-P9-NEXT: xxswapd vs1, vs1
				; CHECK-P9-NEXT: xxswapd vs0, vs0
				; CHECK-P9-NEXT: xscvdpsxws f4, f4
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
				; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: mfvsrwz r5, f5
	; CHECK-P9-NEXT: mtvsrd f5, r5			; CHECK-P9-NEXT: mtvsrd f5, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f6			; CHECK-P9-NEXT: mfvsrwz r5, f6
	; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2
	; CHECK-P9-NEXT: mtvsrd f6, r5			; CHECK-P9-NEXT: mtvsrd f6, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f7			; CHECK-P9-NEXT: mfvsrwz r5, f7
				; CHECK-P9-NEXT: xxswapd v2, vs5
	; CHECK-P9-NEXT: mtvsrd f7, r5			; CHECK-P9-NEXT: mtvsrd f7, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f8			; CHECK-P9-NEXT: mfvsrwz r5, f8
	; CHECK-P9-NEXT: mtvsrd f8, r5			; CHECK-P9-NEXT: mtvsrd f8, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f9			; CHECK-P9-NEXT: mfvsrwz r5, f9
	; CHECK-P9-NEXT: mtvsrd f9, r5			; CHECK-P9-NEXT: mtvsrd f9, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f4			; CHECK-P9-NEXT: mfvsrwz r5, f4
				; CHECK-P9-NEXT: xxswapd v5, vs8
	; CHECK-P9-NEXT: mtvsrd f4, r5			; CHECK-P9-NEXT: mtvsrd f4, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f3			; CHECK-P9-NEXT: mfvsrwz r5, f3
	; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: xxswapd v2, vs5
	; CHECK-P9-NEXT: xxswapd v5, vs8
	; CHECK-P9-NEXT: xxswapd v0, vs9			; CHECK-P9-NEXT: xxswapd v0, vs9
	; CHECK-P9-NEXT: mtvsrd f3, r5			; CHECK-P9-NEXT: mtvsrd f3, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f2			; CHECK-P9-NEXT: mfvsrwz r5, f2
	; CHECK-P9-NEXT: mtvsrd f2, r5
	; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0
	; CHECK-P9-NEXT: xxswapd v1, vs2
	; CHECK-P9-NEXT: lxv vs2, 80(r4)
	; CHECK-P9-NEXT: xxswapd v3, vs4			; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: vmrglh v2, v2, v3			; CHECK-P9-NEXT: mtvsrd f2, r5
	; CHECK-P9-NEXT: xxswapd v3, vs6
	; CHECK-P9-NEXT: xxswapd v4, vs3			; CHECK-P9-NEXT: xxswapd v4, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f2
	; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: mfvsrwz r5, f1			; CHECK-P9-NEXT: mfvsrwz r5, f1
	; CHECK-P9-NEXT: vmrglh v3, v3, v4			; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v4, vs7			; CHECK-P9-NEXT: xxswapd v3, vs6
				; CHECK-P9-NEXT: xxswapd v1, vs2
				; CHECK-P9-NEXT: lxv vs2, 80(r4)
	; CHECK-P9-NEXT: mtvsrd f1, r5			; CHECK-P9-NEXT: mtvsrd f1, r5
	; CHECK-P9-NEXT: mfvsrwz r5, f0			; CHECK-P9-NEXT: mfvsrwz r5, f0
				; CHECK-P9-NEXT: vmrglh v3, v3, v4
				; CHECK-P9-NEXT: xxswapd v4, vs7
				; CHECK-P9-NEXT: mtvsrd f0, r5
				; CHECK-P9-NEXT: xscvdpsxws f3, f2
				; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: vmrglh v4, v4, v1			; CHECK-P9-NEXT: vmrglh v4, v4, v1
	; CHECK-P9-NEXT: xxswapd v1, vs1			; CHECK-P9-NEXT: xxswapd v1, vs1
	; CHECK-P9-NEXT: mtvsrd f0, r5			; CHECK-P9-NEXT: lxv vs1, 96(r4)
	; CHECK-P9-NEXT: vmrglh v5, v5, v1			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglh v5, v5, v1
	; CHECK-P9-NEXT: xxswapd v1, vs0			; CHECK-P9-NEXT: xxswapd v1, vs0
	; CHECK-P9-NEXT: lxv vs0, 112(r4)			; CHECK-P9-NEXT: lxv vs0, 112(r4)
	; CHECK-P9-NEXT: lxv vs1, 96(r4)			; CHECK-P9-NEXT: vmrglw v3, v5, v4
				; CHECK-P9-NEXT: vmrglh v0, v0, v1
	; CHECK-P9-NEXT: mfvsrwz r4, f3			; CHECK-P9-NEXT: mfvsrwz r4, f3
	; CHECK-P9-NEXT: mtvsrd f3, r4			; CHECK-P9-NEXT: mtvsrd f3, r4
	; CHECK-P9-NEXT: mfvsrwz r4, f2
	; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: vmrglw v3, v5, v4
	; CHECK-P9-NEXT: xxmrgld vs4, v3, v2			; CHECK-P9-NEXT: xxmrgld vs4, v3, v2
				; CHECK-P9-NEXT: mfvsrwz r4, f2
	; CHECK-P9-NEXT: xxswapd v2, vs3			; CHECK-P9-NEXT: xxswapd v2, vs3
	; CHECK-P9-NEXT: vmrglh v0, v0, v1
	; CHECK-P9-NEXT: mtvsrd f2, r4			; CHECK-P9-NEXT: mtvsrd f2, r4
				; CHECK-P9-NEXT: stxv vs4, 0(r3)
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglh v2, v2, v3
				; CHECK-P9-NEXT: vmrglw v2, v2, v0
	; CHECK-P9-NEXT: mfvsrwz r4, f2			; CHECK-P9-NEXT: mfvsrwz r4, f2
	; CHECK-P9-NEXT: mtvsrd f2, r4			; CHECK-P9-NEXT: mtvsrd f2, r4
	; CHECK-P9-NEXT: mfvsrwz r4, f1			; CHECK-P9-NEXT: mfvsrwz r4, f1
				; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r4			; CHECK-P9-NEXT: mtvsrd f1, r4
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r4, f1			; CHECK-P9-NEXT: mfvsrwz r4, f1
	; CHECK-P9-NEXT: mtvsrd f1, r4			; CHECK-P9-NEXT: mtvsrd f1, r4
	; CHECK-P9-NEXT: mfvsrwz r4, f0			; CHECK-P9-NEXT: mfvsrwz r4, f0
	; CHECK-P9-NEXT: vmrglh v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: vmrglh v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: vmrglw v2, v2, v0
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglh v4, v4, v5			; CHECK-P9-NEXT: vmrglh v4, v4, v5
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld vs0, v3, v2			; CHECK-P9-NEXT: xxmrgld vs0, v3, v2
	; CHECK-P9-NEXT: stxv vs0, 16(r3)			; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: stxv vs4, 0(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs4, 48(r4)			; CHECK-BE-NEXT: lxv vs4, 48(r4)
				; CHECK-BE-NEXT: lxv vs3, 32(r4)
				; CHECK-BE-NEXT: lxv vs2, 16(r4)
				; CHECK-BE-NEXT: lxv vs1, 0(r4)
	; CHECK-BE-NEXT: xscvdpsxws f5, f4			; CHECK-BE-NEXT: xscvdpsxws f5, f4
	; CHECK-BE-NEXT: xxswapd vs4, vs4			; CHECK-BE-NEXT: xxswapd vs4, vs4
	; CHECK-BE-NEXT: lxv vs3, 32(r4)
	; CHECK-BE-NEXT: xscvdpsxws f6, f3			; CHECK-BE-NEXT: xscvdpsxws f6, f3
	; CHECK-BE-NEXT: xxswapd vs3, vs3			; CHECK-BE-NEXT: xxswapd vs3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f4, f4
	; CHECK-BE-NEXT: mfvsrwz r5, f5
	; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: lxv vs2, 16(r4)
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: xscvdpsxws f7, f2			; CHECK-BE-NEXT: xscvdpsxws f7, f2
				; CHECK-BE-NEXT: lxv vs0, 112(r4)
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
				; CHECK-BE-NEXT: xscvdpsxws f4, f4
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
				; CHECK-BE-NEXT: mfvsrwz r5, f5
				; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mtvsrd v2, r5			; CHECK-BE-NEXT: mtvsrd v2, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f4			; CHECK-BE-NEXT: mfvsrwz r5, f4
	; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: lxv vs1, 0(r4)
	; CHECK-BE-NEXT: xscvdpsxws f4, f1			; CHECK-BE-NEXT: xscvdpsxws f4, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
				; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: mtvsrd v3, r5			; CHECK-BE-NEXT: mtvsrd v3, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f6			; CHECK-BE-NEXT: mfvsrwz r5, f6
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: lxv vs0, 112(r4)
	; CHECK-BE-NEXT: vmrghh v2, v2, v3			; CHECK-BE-NEXT: vmrghh v2, v2, v3
	; CHECK-BE-NEXT: mtvsrd v3, r5			; CHECK-BE-NEXT: mtvsrd v3, r5
	; CHECK-BE-NEXT: mfvsrwz r5, f3			; CHECK-BE-NEXT: mfvsrwz r5, f3
	; CHECK-BE-NEXT: xscvdpsxws f3, f0			; CHECK-BE-NEXT: xscvdpsxws f3, f0
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	; CHECK-BE-NEXT: mtvsrd v4, r5			; CHECK-BE-NEXT: mtvsrd v4, r5
	Show All 15 Lines
	; CHECK-BE-NEXT: mfvsrwz r5, f1			; CHECK-BE-NEXT: mfvsrwz r5, f1
	; CHECK-BE-NEXT: lxv vs1, 80(r4)			; CHECK-BE-NEXT: lxv vs1, 80(r4)
	; CHECK-BE-NEXT: xscvdpsxws f3, f2			; CHECK-BE-NEXT: xscvdpsxws f3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
	; CHECK-BE-NEXT: sldi r5, r5, 48			; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: vmrghh v4, v4, v1			; CHECK-BE-NEXT: vmrghh v4, v4, v1
	; CHECK-BE-NEXT: mtvsrd v1, r5			; CHECK-BE-NEXT: mtvsrd v1, r5
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	; CHECK-BE-NEXT: vmrghh v5, v5, v1
	; CHECK-BE-NEXT: mfvsrwz r5, f0			; CHECK-BE-NEXT: mfvsrwz r5, f0
	; CHECK-BE-NEXT: lxv vs0, 64(r4)			; CHECK-BE-NEXT: lxv vs0, 64(r4)
				; CHECK-BE-NEXT: vmrghh v5, v5, v1
				; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mfvsrwz r4, f3			; CHECK-BE-NEXT: mfvsrwz r4, f3
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: mtvsrd v1, r5
	; CHECK-BE-NEXT: vmrghw v3, v5, v4			; CHECK-BE-NEXT: vmrghw v3, v5, v4
				; CHECK-BE-NEXT: sldi r4, r4, 48
				; CHECK-BE-NEXT: vmrghh v0, v0, v1
	; CHECK-BE-NEXT: xxmrghd vs3, v3, v2			; CHECK-BE-NEXT: xxmrghd vs3, v3, v2
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f2			; CHECK-BE-NEXT: mfvsrwz r4, f2
	; CHECK-BE-NEXT: xscvdpsxws f2, f1			; CHECK-BE-NEXT: xscvdpsxws f2, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
				; CHECK-BE-NEXT: stxv vs3, 0(r3)
	; CHECK-BE-NEXT: mtvsrd v3, r4			; CHECK-BE-NEXT: mtvsrd v3, r4
	; CHECK-BE-NEXT: vmrghh v2, v2, v3			; CHECK-BE-NEXT: vmrghh v2, v2, v3
	; CHECK-BE-NEXT: mfvsrwz r4, f2			; CHECK-BE-NEXT: mfvsrwz r4, f2
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
				; CHECK-BE-NEXT: vmrghw v2, v2, v0
	; CHECK-BE-NEXT: mtvsrd v3, r4			; CHECK-BE-NEXT: mtvsrd v3, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f1			; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: xscvdpsxws f1, f0			; CHECK-BE-NEXT: xscvdpsxws f1, f0
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	; CHECK-BE-NEXT: mtvsrd v4, r4			; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: vmrghh v3, v3, v4			; CHECK-BE-NEXT: vmrghh v3, v3, v4
	; CHECK-BE-NEXT: mfvsrwz r4, f1			; CHECK-BE-NEXT: mfvsrwz r4, f1
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v4, r4			; CHECK-BE-NEXT: mtvsrd v4, r4
	; CHECK-BE-NEXT: mfvsrwz r4, f0			; CHECK-BE-NEXT: mfvsrwz r4, f0
	; CHECK-BE-NEXT: sldi r5, r5, 48
	; CHECK-BE-NEXT: mtvsrd v1, r5
	; CHECK-BE-NEXT: vmrghh v0, v0, v1
	; CHECK-BE-NEXT: vmrghw v2, v2, v0
	; CHECK-BE-NEXT: stxv vs3, 0(r3)
	; CHECK-BE-NEXT: sldi r4, r4, 48			; CHECK-BE-NEXT: sldi r4, r4, 48
	; CHECK-BE-NEXT: mtvsrd v5, r4			; CHECK-BE-NEXT: mtvsrd v5, r4
	; CHECK-BE-NEXT: vmrghh v4, v4, v5			; CHECK-BE-NEXT: vmrghh v4, v4, v5
	; CHECK-BE-NEXT: vmrghw v3, v4, v3			; CHECK-BE-NEXT: vmrghw v3, v4, v3
	; CHECK-BE-NEXT: xxmrghd vs0, v3, v2			; CHECK-BE-NEXT: xxmrghd vs0, v3, v2
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <16 x double>, <16 x double>* %0, align 128			%a = load <16 x double>, <16 x double>* %0, align 128
	%1 = fptosi <16 x double> %a to <16 x i16>			%1 = fptosi <16 x double> %a to <16 x i16>
	store <16 x i16> %1, <16 x i16>* %agg.result, align 32			store <16 x i16> %1, <16 x i16>* %agg.result, align 32
	ret void			ret void
	}			}

llvm/test/CodeGen/PowerPC/vec_conv_fp64_to_i32_elts.ll

	Show First 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v2, r3, r5			; CHECK-P8-NEXT: stvx v2, r3, r5
	; CHECK-P8-NEXT: stvx v3, 0, r3			; CHECK-P8-NEXT: stvx v3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs2, 0(r4)			; CHECK-P9-NEXT: lxv vs2, 0(r4)
	; CHECK-P9-NEXT: lxv vs3, 16(r4)			; CHECK-P9-NEXT: lxv vs3, 16(r4)
	; CHECK-P9-NEXT: xxmrgld vs4, vs3, vs2
	; CHECK-P9-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-P9-NEXT: lxv vs0, 32(r4)			; CHECK-P9-NEXT: lxv vs0, 32(r4)
	; CHECK-P9-NEXT: lxv vs1, 48(r4)			; CHECK-P9-NEXT: lxv vs1, 48(r4)
				; CHECK-P9-NEXT: xxmrgld vs4, vs3, vs2
				; CHECK-P9-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-P9-NEXT: xvcvdpuxws v2, vs4			; CHECK-P9-NEXT: xvcvdpuxws v2, vs4
	; CHECK-P9-NEXT: xvcvdpuxws v3, vs2			; CHECK-P9-NEXT: xvcvdpuxws v3, vs2
	; CHECK-P9-NEXT: xxmrgld vs2, vs1, vs0			; CHECK-P9-NEXT: xxmrgld vs2, vs1, vs0
	; CHECK-P9-NEXT: xxmrghd vs0, vs1, vs0			; CHECK-P9-NEXT: xxmrghd vs0, vs1, vs0
	; CHECK-P9-NEXT: xvcvdpuxws v4, vs0			; CHECK-P9-NEXT: xvcvdpuxws v4, vs0
	; CHECK-P9-NEXT: vmrgew v2, v3, v2			; CHECK-P9-NEXT: vmrgew v2, v3, v2
	; CHECK-P9-NEXT: xvcvdpuxws v3, vs2			; CHECK-P9-NEXT: xvcvdpuxws v3, vs2
	; CHECK-P9-NEXT: stxv v2, 0(r3)			; CHECK-P9-NEXT: stxv v2, 0(r3)
	; CHECK-P9-NEXT: vmrgew v3, v4, v3			; CHECK-P9-NEXT: vmrgew v3, v4, v3
	; CHECK-P9-NEXT: stxv v3, 16(r3)			; CHECK-P9-NEXT: stxv v3, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs2, 16(r4)			; CHECK-BE-NEXT: lxv vs2, 16(r4)
	; CHECK-BE-NEXT: lxv vs3, 0(r4)			; CHECK-BE-NEXT: lxv vs3, 0(r4)
	; CHECK-BE-NEXT: xxmrgld vs4, vs3, vs2
	; CHECK-BE-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-BE-NEXT: lxv vs0, 48(r4)			; CHECK-BE-NEXT: lxv vs0, 48(r4)
	; CHECK-BE-NEXT: lxv vs1, 32(r4)			; CHECK-BE-NEXT: lxv vs1, 32(r4)
				; CHECK-BE-NEXT: xxmrgld vs4, vs3, vs2
				; CHECK-BE-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-BE-NEXT: xvcvdpuxws v2, vs4			; CHECK-BE-NEXT: xvcvdpuxws v2, vs4
	; CHECK-BE-NEXT: xvcvdpuxws v3, vs2			; CHECK-BE-NEXT: xvcvdpuxws v3, vs2
	; CHECK-BE-NEXT: xxmrgld vs2, vs1, vs0			; CHECK-BE-NEXT: xxmrgld vs2, vs1, vs0
	; CHECK-BE-NEXT: xxmrghd vs0, vs1, vs0			; CHECK-BE-NEXT: xxmrghd vs0, vs1, vs0
	; CHECK-BE-NEXT: xvcvdpuxws v4, vs0			; CHECK-BE-NEXT: xvcvdpuxws v4, vs0
	; CHECK-BE-NEXT: vmrgew v2, v3, v2			; CHECK-BE-NEXT: vmrgew v2, v3, v2
	; CHECK-BE-NEXT: xvcvdpuxws v3, vs2			; CHECK-BE-NEXT: xvcvdpuxws v3, vs2
	; CHECK-BE-NEXT: stxv v2, 0(r3)			; CHECK-BE-NEXT: stxv v2, 0(r3)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v4, r3, r6			; CHECK-P8-NEXT: stvx v4, r3, r6
	; CHECK-P8-NEXT: stvx v5, 0, r3			; CHECK-P8-NEXT: stvx v5, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs6, 0(r4)			; CHECK-P9-NEXT: lxv vs6, 0(r4)
	; CHECK-P9-NEXT: lxv vs7, 16(r4)			; CHECK-P9-NEXT: lxv vs7, 16(r4)
	; CHECK-P9-NEXT: xxmrgld vs8, vs7, vs6
	; CHECK-P9-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-P9-NEXT: lxv vs4, 32(r4)			; CHECK-P9-NEXT: lxv vs4, 32(r4)
	; CHECK-P9-NEXT: lxv vs5, 48(r4)			; CHECK-P9-NEXT: lxv vs5, 48(r4)
				; CHECK-P9-NEXT: xxmrgld vs8, vs7, vs6
				; CHECK-P9-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-P9-NEXT: xxmrgld vs7, vs5, vs4			; CHECK-P9-NEXT: xxmrgld vs7, vs5, vs4
	; CHECK-P9-NEXT: xxmrghd vs4, vs5, vs4			; CHECK-P9-NEXT: xxmrghd vs4, vs5, vs4
	; CHECK-P9-NEXT: xvcvdpuxws v2, vs8
	; CHECK-P9-NEXT: xvcvdpuxws v3, vs6
	; CHECK-P9-NEXT: lxv vs2, 64(r4)			; CHECK-P9-NEXT: lxv vs2, 64(r4)
	; CHECK-P9-NEXT: lxv vs3, 80(r4)			; CHECK-P9-NEXT: lxv vs3, 80(r4)
				; CHECK-P9-NEXT: lxv vs0, 96(r4)
				; CHECK-P9-NEXT: lxv vs1, 112(r4)
				; CHECK-P9-NEXT: xvcvdpuxws v2, vs8
				; CHECK-P9-NEXT: xvcvdpuxws v3, vs6
	; CHECK-P9-NEXT: xvcvdpuxws v4, vs7			; CHECK-P9-NEXT: xvcvdpuxws v4, vs7
	; CHECK-P9-NEXT: vmrgew v2, v3, v2			; CHECK-P9-NEXT: vmrgew v2, v3, v2
	; CHECK-P9-NEXT: xvcvdpuxws v3, vs4			; CHECK-P9-NEXT: xvcvdpuxws v3, vs4
	; CHECK-P9-NEXT: xxmrgld vs4, vs3, vs2			; CHECK-P9-NEXT: xxmrgld vs4, vs3, vs2
	; CHECK-P9-NEXT: xxmrghd vs2, vs3, vs2			; CHECK-P9-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-P9-NEXT: lxv vs0, 96(r4)
	; CHECK-P9-NEXT: lxv vs1, 112(r4)
	; CHECK-P9-NEXT: stxv v2, 0(r3)			; CHECK-P9-NEXT: stxv v2, 0(r3)
	; CHECK-P9-NEXT: xvcvdpuxws v5, vs2			; CHECK-P9-NEXT: xvcvdpuxws v5, vs2
	; CHECK-P9-NEXT: xxmrgld vs2, vs1, vs0			; CHECK-P9-NEXT: xxmrgld vs2, vs1, vs0
	; CHECK-P9-NEXT: xxmrghd vs0, vs1, vs0			; CHECK-P9-NEXT: xxmrghd vs0, vs1, vs0
	; CHECK-P9-NEXT: xvcvdpuxws v0, vs0			; CHECK-P9-NEXT: xvcvdpuxws v0, vs0
	; CHECK-P9-NEXT: vmrgew v3, v3, v4			; CHECK-P9-NEXT: vmrgew v3, v3, v4
	; CHECK-P9-NEXT: xvcvdpuxws v4, vs4			; CHECK-P9-NEXT: xvcvdpuxws v4, vs4
	; CHECK-P9-NEXT: stxv v3, 16(r3)			; CHECK-P9-NEXT: stxv v3, 16(r3)
	; CHECK-P9-NEXT: vmrgew v4, v5, v4			; CHECK-P9-NEXT: vmrgew v4, v5, v4
	; CHECK-P9-NEXT: stxv v4, 32(r3)			; CHECK-P9-NEXT: stxv v4, 32(r3)
	; CHECK-P9-NEXT: xvcvdpuxws v5, vs2			; CHECK-P9-NEXT: xvcvdpuxws v5, vs2
	; CHECK-P9-NEXT: vmrgew v5, v0, v5			; CHECK-P9-NEXT: vmrgew v5, v0, v5
	; CHECK-P9-NEXT: stxv v5, 48(r3)			; CHECK-P9-NEXT: stxv v5, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs6, 16(r4)			; CHECK-BE-NEXT: lxv vs6, 16(r4)
	; CHECK-BE-NEXT: lxv vs7, 0(r4)			; CHECK-BE-NEXT: lxv vs7, 0(r4)
	; CHECK-BE-NEXT: xxmrgld vs8, vs7, vs6
	; CHECK-BE-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-BE-NEXT: lxv vs4, 48(r4)			; CHECK-BE-NEXT: lxv vs4, 48(r4)
	; CHECK-BE-NEXT: lxv vs5, 32(r4)			; CHECK-BE-NEXT: lxv vs5, 32(r4)
				; CHECK-BE-NEXT: xxmrgld vs8, vs7, vs6
				; CHECK-BE-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-BE-NEXT: xxmrgld vs7, vs5, vs4			; CHECK-BE-NEXT: xxmrgld vs7, vs5, vs4
	; CHECK-BE-NEXT: xxmrghd vs4, vs5, vs4			; CHECK-BE-NEXT: xxmrghd vs4, vs5, vs4
	; CHECK-BE-NEXT: xvcvdpuxws v2, vs8
	; CHECK-BE-NEXT: xvcvdpuxws v3, vs6
	; CHECK-BE-NEXT: lxv vs2, 80(r4)			; CHECK-BE-NEXT: lxv vs2, 80(r4)
	; CHECK-BE-NEXT: lxv vs3, 64(r4)			; CHECK-BE-NEXT: lxv vs3, 64(r4)
				; CHECK-BE-NEXT: lxv vs0, 112(r4)
				; CHECK-BE-NEXT: lxv vs1, 96(r4)
				; CHECK-BE-NEXT: xvcvdpuxws v2, vs8
				; CHECK-BE-NEXT: xvcvdpuxws v3, vs6
	; CHECK-BE-NEXT: xvcvdpuxws v4, vs7			; CHECK-BE-NEXT: xvcvdpuxws v4, vs7
	; CHECK-BE-NEXT: vmrgew v2, v3, v2			; CHECK-BE-NEXT: vmrgew v2, v3, v2
	; CHECK-BE-NEXT: xvcvdpuxws v3, vs4			; CHECK-BE-NEXT: xvcvdpuxws v3, vs4
	; CHECK-BE-NEXT: xxmrgld vs4, vs3, vs2			; CHECK-BE-NEXT: xxmrgld vs4, vs3, vs2
	; CHECK-BE-NEXT: xxmrghd vs2, vs3, vs2			; CHECK-BE-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-BE-NEXT: lxv vs0, 112(r4)
	; CHECK-BE-NEXT: lxv vs1, 96(r4)
	; CHECK-BE-NEXT: stxv v2, 0(r3)			; CHECK-BE-NEXT: stxv v2, 0(r3)
	; CHECK-BE-NEXT: xvcvdpuxws v5, vs2			; CHECK-BE-NEXT: xvcvdpuxws v5, vs2
	; CHECK-BE-NEXT: xxmrgld vs2, vs1, vs0			; CHECK-BE-NEXT: xxmrgld vs2, vs1, vs0
	; CHECK-BE-NEXT: xxmrghd vs0, vs1, vs0			; CHECK-BE-NEXT: xxmrghd vs0, vs1, vs0
	; CHECK-BE-NEXT: xvcvdpuxws v0, vs0			; CHECK-BE-NEXT: xvcvdpuxws v0, vs0
	; CHECK-BE-NEXT: vmrgew v3, v3, v4			; CHECK-BE-NEXT: vmrgew v3, v3, v4
	; CHECK-BE-NEXT: xvcvdpuxws v4, vs4			; CHECK-BE-NEXT: xvcvdpuxws v4, vs4
	; CHECK-BE-NEXT: stxv v3, 16(r3)			; CHECK-BE-NEXT: stxv v3, 16(r3)
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v2, r3, r5			; CHECK-P8-NEXT: stvx v2, r3, r5
	; CHECK-P8-NEXT: stvx v3, 0, r3			; CHECK-P8-NEXT: stvx v3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs2, 0(r4)			; CHECK-P9-NEXT: lxv vs2, 0(r4)
	; CHECK-P9-NEXT: lxv vs3, 16(r4)			; CHECK-P9-NEXT: lxv vs3, 16(r4)
	; CHECK-P9-NEXT: xxmrgld vs4, vs3, vs2
	; CHECK-P9-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-P9-NEXT: lxv vs0, 32(r4)			; CHECK-P9-NEXT: lxv vs0, 32(r4)
	; CHECK-P9-NEXT: lxv vs1, 48(r4)			; CHECK-P9-NEXT: lxv vs1, 48(r4)
				; CHECK-P9-NEXT: xxmrgld vs4, vs3, vs2
				; CHECK-P9-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-P9-NEXT: xvcvdpsxws v2, vs4			; CHECK-P9-NEXT: xvcvdpsxws v2, vs4
	; CHECK-P9-NEXT: xvcvdpsxws v3, vs2			; CHECK-P9-NEXT: xvcvdpsxws v3, vs2
	; CHECK-P9-NEXT: xxmrgld vs2, vs1, vs0			; CHECK-P9-NEXT: xxmrgld vs2, vs1, vs0
	; CHECK-P9-NEXT: xxmrghd vs0, vs1, vs0			; CHECK-P9-NEXT: xxmrghd vs0, vs1, vs0
	; CHECK-P9-NEXT: xvcvdpsxws v4, vs0			; CHECK-P9-NEXT: xvcvdpsxws v4, vs0
	; CHECK-P9-NEXT: vmrgew v2, v3, v2			; CHECK-P9-NEXT: vmrgew v2, v3, v2
	; CHECK-P9-NEXT: xvcvdpsxws v3, vs2			; CHECK-P9-NEXT: xvcvdpsxws v3, vs2
	; CHECK-P9-NEXT: stxv v2, 0(r3)			; CHECK-P9-NEXT: stxv v2, 0(r3)
	; CHECK-P9-NEXT: vmrgew v3, v4, v3			; CHECK-P9-NEXT: vmrgew v3, v4, v3
	; CHECK-P9-NEXT: stxv v3, 16(r3)			; CHECK-P9-NEXT: stxv v3, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs2, 16(r4)			; CHECK-BE-NEXT: lxv vs2, 16(r4)
	; CHECK-BE-NEXT: lxv vs3, 0(r4)			; CHECK-BE-NEXT: lxv vs3, 0(r4)
	; CHECK-BE-NEXT: xxmrgld vs4, vs3, vs2
	; CHECK-BE-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-BE-NEXT: lxv vs0, 48(r4)			; CHECK-BE-NEXT: lxv vs0, 48(r4)
	; CHECK-BE-NEXT: lxv vs1, 32(r4)			; CHECK-BE-NEXT: lxv vs1, 32(r4)
				; CHECK-BE-NEXT: xxmrgld vs4, vs3, vs2
				; CHECK-BE-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-BE-NEXT: xvcvdpsxws v2, vs4			; CHECK-BE-NEXT: xvcvdpsxws v2, vs4
	; CHECK-BE-NEXT: xvcvdpsxws v3, vs2			; CHECK-BE-NEXT: xvcvdpsxws v3, vs2
	; CHECK-BE-NEXT: xxmrgld vs2, vs1, vs0			; CHECK-BE-NEXT: xxmrgld vs2, vs1, vs0
	; CHECK-BE-NEXT: xxmrghd vs0, vs1, vs0			; CHECK-BE-NEXT: xxmrghd vs0, vs1, vs0
	; CHECK-BE-NEXT: xvcvdpsxws v4, vs0			; CHECK-BE-NEXT: xvcvdpsxws v4, vs0
	; CHECK-BE-NEXT: vmrgew v2, v3, v2			; CHECK-BE-NEXT: vmrgew v2, v3, v2
	; CHECK-BE-NEXT: xvcvdpsxws v3, vs2			; CHECK-BE-NEXT: xvcvdpsxws v3, vs2
	; CHECK-BE-NEXT: stxv v2, 0(r3)			; CHECK-BE-NEXT: stxv v2, 0(r3)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v4, r3, r6			; CHECK-P8-NEXT: stvx v4, r3, r6
	; CHECK-P8-NEXT: stvx v5, 0, r3			; CHECK-P8-NEXT: stvx v5, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs6, 0(r4)			; CHECK-P9-NEXT: lxv vs6, 0(r4)
	; CHECK-P9-NEXT: lxv vs7, 16(r4)			; CHECK-P9-NEXT: lxv vs7, 16(r4)
	; CHECK-P9-NEXT: xxmrgld vs8, vs7, vs6
	; CHECK-P9-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-P9-NEXT: lxv vs4, 32(r4)			; CHECK-P9-NEXT: lxv vs4, 32(r4)
	; CHECK-P9-NEXT: lxv vs5, 48(r4)			; CHECK-P9-NEXT: lxv vs5, 48(r4)
				; CHECK-P9-NEXT: xxmrgld vs8, vs7, vs6
				; CHECK-P9-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-P9-NEXT: xxmrgld vs7, vs5, vs4			; CHECK-P9-NEXT: xxmrgld vs7, vs5, vs4
	; CHECK-P9-NEXT: xxmrghd vs4, vs5, vs4			; CHECK-P9-NEXT: xxmrghd vs4, vs5, vs4
	; CHECK-P9-NEXT: xvcvdpsxws v2, vs8
	; CHECK-P9-NEXT: xvcvdpsxws v3, vs6
	; CHECK-P9-NEXT: lxv vs2, 64(r4)			; CHECK-P9-NEXT: lxv vs2, 64(r4)
	; CHECK-P9-NEXT: lxv vs3, 80(r4)			; CHECK-P9-NEXT: lxv vs3, 80(r4)
				; CHECK-P9-NEXT: lxv vs0, 96(r4)
				; CHECK-P9-NEXT: lxv vs1, 112(r4)
				; CHECK-P9-NEXT: xvcvdpsxws v2, vs8
				; CHECK-P9-NEXT: xvcvdpsxws v3, vs6
	; CHECK-P9-NEXT: xvcvdpsxws v4, vs7			; CHECK-P9-NEXT: xvcvdpsxws v4, vs7
	; CHECK-P9-NEXT: vmrgew v2, v3, v2			; CHECK-P9-NEXT: vmrgew v2, v3, v2
	; CHECK-P9-NEXT: xvcvdpsxws v3, vs4			; CHECK-P9-NEXT: xvcvdpsxws v3, vs4
	; CHECK-P9-NEXT: xxmrgld vs4, vs3, vs2			; CHECK-P9-NEXT: xxmrgld vs4, vs3, vs2
	; CHECK-P9-NEXT: xxmrghd vs2, vs3, vs2			; CHECK-P9-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-P9-NEXT: lxv vs0, 96(r4)
	; CHECK-P9-NEXT: lxv vs1, 112(r4)
	; CHECK-P9-NEXT: stxv v2, 0(r3)			; CHECK-P9-NEXT: stxv v2, 0(r3)
	; CHECK-P9-NEXT: xvcvdpsxws v5, vs2			; CHECK-P9-NEXT: xvcvdpsxws v5, vs2
	; CHECK-P9-NEXT: xxmrgld vs2, vs1, vs0			; CHECK-P9-NEXT: xxmrgld vs2, vs1, vs0
	; CHECK-P9-NEXT: xxmrghd vs0, vs1, vs0			; CHECK-P9-NEXT: xxmrghd vs0, vs1, vs0
	; CHECK-P9-NEXT: xvcvdpsxws v0, vs0			; CHECK-P9-NEXT: xvcvdpsxws v0, vs0
	; CHECK-P9-NEXT: vmrgew v3, v3, v4			; CHECK-P9-NEXT: vmrgew v3, v3, v4
	; CHECK-P9-NEXT: xvcvdpsxws v4, vs4			; CHECK-P9-NEXT: xvcvdpsxws v4, vs4
	; CHECK-P9-NEXT: stxv v3, 16(r3)			; CHECK-P9-NEXT: stxv v3, 16(r3)
	; CHECK-P9-NEXT: vmrgew v4, v5, v4			; CHECK-P9-NEXT: vmrgew v4, v5, v4
	; CHECK-P9-NEXT: stxv v4, 32(r3)			; CHECK-P9-NEXT: stxv v4, 32(r3)
	; CHECK-P9-NEXT: xvcvdpsxws v5, vs2			; CHECK-P9-NEXT: xvcvdpsxws v5, vs2
	; CHECK-P9-NEXT: vmrgew v5, v0, v5			; CHECK-P9-NEXT: vmrgew v5, v0, v5
	; CHECK-P9-NEXT: stxv v5, 48(r3)			; CHECK-P9-NEXT: stxv v5, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs6, 16(r4)			; CHECK-BE-NEXT: lxv vs6, 16(r4)
	; CHECK-BE-NEXT: lxv vs7, 0(r4)			; CHECK-BE-NEXT: lxv vs7, 0(r4)
	; CHECK-BE-NEXT: xxmrgld vs8, vs7, vs6
	; CHECK-BE-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-BE-NEXT: lxv vs4, 48(r4)			; CHECK-BE-NEXT: lxv vs4, 48(r4)
	; CHECK-BE-NEXT: lxv vs5, 32(r4)			; CHECK-BE-NEXT: lxv vs5, 32(r4)
				; CHECK-BE-NEXT: xxmrgld vs8, vs7, vs6
				; CHECK-BE-NEXT: xxmrghd vs6, vs7, vs6
	; CHECK-BE-NEXT: xxmrgld vs7, vs5, vs4			; CHECK-BE-NEXT: xxmrgld vs7, vs5, vs4
	; CHECK-BE-NEXT: xxmrghd vs4, vs5, vs4			; CHECK-BE-NEXT: xxmrghd vs4, vs5, vs4
	; CHECK-BE-NEXT: xvcvdpsxws v2, vs8
	; CHECK-BE-NEXT: xvcvdpsxws v3, vs6
	; CHECK-BE-NEXT: lxv vs2, 80(r4)			; CHECK-BE-NEXT: lxv vs2, 80(r4)
	; CHECK-BE-NEXT: lxv vs3, 64(r4)			; CHECK-BE-NEXT: lxv vs3, 64(r4)
				; CHECK-BE-NEXT: lxv vs0, 112(r4)
				; CHECK-BE-NEXT: lxv vs1, 96(r4)
				; CHECK-BE-NEXT: xvcvdpsxws v2, vs8
				; CHECK-BE-NEXT: xvcvdpsxws v3, vs6
	; CHECK-BE-NEXT: xvcvdpsxws v4, vs7			; CHECK-BE-NEXT: xvcvdpsxws v4, vs7
	; CHECK-BE-NEXT: vmrgew v2, v3, v2			; CHECK-BE-NEXT: vmrgew v2, v3, v2
	; CHECK-BE-NEXT: xvcvdpsxws v3, vs4			; CHECK-BE-NEXT: xvcvdpsxws v3, vs4
	; CHECK-BE-NEXT: xxmrgld vs4, vs3, vs2			; CHECK-BE-NEXT: xxmrgld vs4, vs3, vs2
	; CHECK-BE-NEXT: xxmrghd vs2, vs3, vs2			; CHECK-BE-NEXT: xxmrghd vs2, vs3, vs2
	; CHECK-BE-NEXT: lxv vs0, 112(r4)
	; CHECK-BE-NEXT: lxv vs1, 96(r4)
	; CHECK-BE-NEXT: stxv v2, 0(r3)			; CHECK-BE-NEXT: stxv v2, 0(r3)
	; CHECK-BE-NEXT: xvcvdpsxws v5, vs2			; CHECK-BE-NEXT: xvcvdpsxws v5, vs2
	; CHECK-BE-NEXT: xxmrgld vs2, vs1, vs0			; CHECK-BE-NEXT: xxmrgld vs2, vs1, vs0
	; CHECK-BE-NEXT: xxmrghd vs0, vs1, vs0			; CHECK-BE-NEXT: xxmrghd vs0, vs1, vs0
	; CHECK-BE-NEXT: xvcvdpsxws v0, vs0			; CHECK-BE-NEXT: xvcvdpsxws v0, vs0
	; CHECK-BE-NEXT: vmrgew v3, v3, v4			; CHECK-BE-NEXT: vmrgew v3, v3, v4
	; CHECK-BE-NEXT: xvcvdpsxws v4, vs4			; CHECK-BE-NEXT: xvcvdpsxws v4, vs4
	; CHECK-BE-NEXT: stxv v3, 16(r3)			; CHECK-BE-NEXT: stxv v3, 16(r3)
	Show All 12 Lines

llvm/test/CodeGen/PowerPC/vec_conv_fp64_to_i8_elts.ll

	Show First 20 Lines • Show All 98 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglh v2, v3, v2			; CHECK-P8-NEXT: vmrglh v2, v3, v2
	; CHECK-P8-NEXT: xxswapd vs0, v2			; CHECK-P8-NEXT: xxswapd vs0, v2
	; CHECK-P8-NEXT: mfvsrwz r3, f0			; CHECK-P8-NEXT: mfvsrwz r3, f0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt:			; CHECK-P9-LABEL: test4elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r3)			; CHECK-P9-NEXT: lxv vs1, 0(r3)
				; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
				; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: vmrglb v3, v3, v4			; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: vextuwrx r3, r3, v2			; CHECK-P9-NEXT: vextuwrx r3, r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt:			; CHECK-BE-LABEL: test4elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: xscvdpsxws f2, f1			; CHECK-BE-NEXT: xscvdpsxws f2, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvdpsxws f1, f0			; CHECK-BE-NEXT: xscvdpsxws f1, f0
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: xxswapd vs0, v2			; CHECK-P8-NEXT: xxswapd vs0, v2
	; CHECK-P8-NEXT: mfvsrd r3, f0			; CHECK-P8-NEXT: mfvsrd r3, f0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs3, 0(r3)			; CHECK-P9-NEXT: lxv vs3, 0(r3)
	; CHECK-P9-NEXT: xscvdpsxws f4, f3
	; CHECK-P9-NEXT: xxswapd vs3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: lxv vs0, 48(r3)			; CHECK-P9-NEXT: lxv vs0, 48(r3)
	; CHECK-P9-NEXT: lxv vs1, 32(r3)			; CHECK-P9-NEXT: lxv vs1, 32(r3)
	; CHECK-P9-NEXT: lxv vs2, 16(r3)			; CHECK-P9-NEXT: lxv vs2, 16(r3)
				; CHECK-P9-NEXT: xscvdpsxws f4, f3
				; CHECK-P9-NEXT: xxswapd vs3, vs3
				; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: mfvsrwz r3, f4			; CHECK-P9-NEXT: mfvsrwz r3, f4
	; CHECK-P9-NEXT: mtvsrd f4, r3			; CHECK-P9-NEXT: mtvsrd f4, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: xxswapd v2, vs4			; CHECK-P9-NEXT: xxswapd v2, vs4
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v3, vs3			; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f2			; CHECK-P9-NEXT: xscvdpsxws f3, f2
	; CHECK-P9-NEXT: xxswapd vs2, vs2			; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
				; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
				; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs3, 48(r3)			; CHECK-BE-NEXT: lxv vs3, 48(r3)
	; CHECK-BE-NEXT: xscvdpsxws f4, f3
	; CHECK-BE-NEXT: xxswapd vs3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: lxv vs2, 32(r3)			; CHECK-BE-NEXT: lxv vs2, 32(r3)
	; CHECK-BE-NEXT: lxv vs0, 0(r3)			; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: xscvdpsxws f4, f3
				; CHECK-BE-NEXT: xxswapd vs3, vs3
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xscvdpsxws f3, f2			; CHECK-BE-NEXT: xscvdpsxws f3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v3, v5, v4			; CHECK-P8-NEXT: vmrglw v3, v5, v4
	; CHECK-P8-NEXT: vmrglw v2, v2, v0			; CHECK-P8-NEXT: vmrglw v2, v2, v0
	; CHECK-P8-NEXT: xxmrgld v2, v2, v3			; CHECK-P8-NEXT: xxmrgld v2, v2, v3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs7, 0(r3)			; CHECK-P9-NEXT: lxv vs7, 0(r3)
	; CHECK-P9-NEXT: xscvdpsxws f8, f7
	; CHECK-P9-NEXT: xxswapd vs7, vs7
	; CHECK-P9-NEXT: xscvdpsxws f7, f7
	; CHECK-P9-NEXT: lxv vs0, 112(r3)			; CHECK-P9-NEXT: lxv vs0, 112(r3)
	; CHECK-P9-NEXT: lxv vs1, 96(r3)			; CHECK-P9-NEXT: lxv vs1, 96(r3)
	; CHECK-P9-NEXT: lxv vs2, 80(r3)			; CHECK-P9-NEXT: lxv vs2, 80(r3)
				; CHECK-P9-NEXT: xscvdpsxws f8, f7
				; CHECK-P9-NEXT: xxswapd vs7, vs7
	; CHECK-P9-NEXT: lxv vs3, 64(r3)			; CHECK-P9-NEXT: lxv vs3, 64(r3)
	; CHECK-P9-NEXT: lxv vs4, 48(r3)			; CHECK-P9-NEXT: lxv vs4, 48(r3)
	; CHECK-P9-NEXT: lxv vs5, 32(r3)			; CHECK-P9-NEXT: lxv vs5, 32(r3)
	; CHECK-P9-NEXT: lxv vs6, 16(r3)			; CHECK-P9-NEXT: lxv vs6, 16(r3)
				; CHECK-P9-NEXT: xscvdpsxws f7, f7
	; CHECK-P9-NEXT: mfvsrwz r3, f8			; CHECK-P9-NEXT: mfvsrwz r3, f8
	; CHECK-P9-NEXT: mtvsrd f8, r3			; CHECK-P9-NEXT: mtvsrd f8, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f7			; CHECK-P9-NEXT: mfvsrwz r3, f7
	; CHECK-P9-NEXT: xxswapd v2, vs8			; CHECK-P9-NEXT: xxswapd v2, vs8
	; CHECK-P9-NEXT: mtvsrd f7, r3			; CHECK-P9-NEXT: mtvsrd f7, r3
	; CHECK-P9-NEXT: xxswapd v3, vs7			; CHECK-P9-NEXT: xxswapd v3, vs7
	; CHECK-P9-NEXT: xscvdpsxws f7, f6			; CHECK-P9-NEXT: xscvdpsxws f7, f6
	; CHECK-P9-NEXT: xxswapd vs6, vs6			; CHECK-P9-NEXT: xxswapd vs6, vs6
	; CHECK-P9-NEXT: xscvdpsxws f6, f6			; CHECK-P9-NEXT: xscvdpsxws f6, f6
				; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f7			; CHECK-P9-NEXT: mfvsrwz r3, f7
	; CHECK-P9-NEXT: mtvsrd f7, r3			; CHECK-P9-NEXT: mtvsrd f7, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f6			; CHECK-P9-NEXT: mfvsrwz r3, f6
				; CHECK-P9-NEXT: xxswapd v3, vs7
	; CHECK-P9-NEXT: mtvsrd f6, r3			; CHECK-P9-NEXT: mtvsrd f6, r3
	; CHECK-P9-NEXT: xxswapd v4, vs6			; CHECK-P9-NEXT: xxswapd v4, vs6
	; CHECK-P9-NEXT: xscvdpsxws f6, f5			; CHECK-P9-NEXT: xscvdpsxws f6, f5
	; CHECK-P9-NEXT: xxswapd vs5, vs5			; CHECK-P9-NEXT: xxswapd vs5, vs5
	; CHECK-P9-NEXT: xscvdpsxws f5, f5			; CHECK-P9-NEXT: xscvdpsxws f5, f5
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
				; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f6			; CHECK-P9-NEXT: mfvsrwz r3, f6
	; CHECK-P9-NEXT: mtvsrd f6, r3			; CHECK-P9-NEXT: mtvsrd f6, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f5			; CHECK-P9-NEXT: mfvsrwz r3, f5
	; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs7
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs6			; CHECK-P9-NEXT: xxswapd v3, vs6
	; CHECK-P9-NEXT: mtvsrd f5, r3			; CHECK-P9-NEXT: mtvsrd f5, r3
	; CHECK-P9-NEXT: xxswapd v4, vs5			; CHECK-P9-NEXT: xxswapd v4, vs5
	; CHECK-P9-NEXT: xscvdpsxws f5, f4			; CHECK-P9-NEXT: xscvdpsxws f5, f4
	; CHECK-P9-NEXT: xxswapd vs4, vs4			; CHECK-P9-NEXT: xxswapd vs4, vs4
	; CHECK-P9-NEXT: xscvdpsxws f4, f4			; CHECK-P9-NEXT: xscvdpsxws f4, f4
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r3, f5			; CHECK-P9-NEXT: mfvsrwz r3, f5
	; CHECK-P9-NEXT: mtvsrd f5, r3			; CHECK-P9-NEXT: mtvsrd f5, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f4			; CHECK-P9-NEXT: mfvsrwz r3, f4
				; CHECK-P9-NEXT: xxswapd v4, vs5
	; CHECK-P9-NEXT: mtvsrd f4, r3			; CHECK-P9-NEXT: mtvsrd f4, r3
	; CHECK-P9-NEXT: xxswapd v5, vs4			; CHECK-P9-NEXT: xxswapd v5, vs4
	; CHECK-P9-NEXT: xscvdpsxws f4, f3			; CHECK-P9-NEXT: xscvdpsxws f4, f3
	; CHECK-P9-NEXT: xxswapd vs3, vs3			; CHECK-P9-NEXT: xxswapd vs3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs5
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f4			; CHECK-P9-NEXT: mfvsrwz r3, f4
	; CHECK-P9-NEXT: mtvsrd f4, r3			; CHECK-P9-NEXT: mtvsrd f4, r3
				; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
				; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v4, vs3			; CHECK-P9-NEXT: xxswapd v4, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f2			; CHECK-P9-NEXT: xscvdpsxws f3, f2
	; CHECK-P9-NEXT: xxswapd vs2, vs2			; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
				; CHECK-P9-NEXT: xxswapd v4, vs3
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v5, vs2			; CHECK-P9-NEXT: xxswapd v5, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs3
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v0, vs0			; CHECK-P9-NEXT: xxswapd v0, vs0
	; CHECK-P9-NEXT: vmrglb v5, v5, v0			; CHECK-P9-NEXT: vmrglb v5, v5, v0
	; CHECK-P9-NEXT: vmrglh v4, v5, v4			; CHECK-P9-NEXT: vmrglh v4, v5, v4
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld v2, v3, v2			; CHECK-P9-NEXT: xxmrgld v2, v3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs7, 112(r3)			; CHECK-BE-NEXT: lxv vs7, 112(r3)
	; CHECK-BE-NEXT: xscvdpsxws f8, f7
	; CHECK-BE-NEXT: xxswapd vs7, vs7
	; CHECK-BE-NEXT: xscvdpsxws f7, f7
	; CHECK-BE-NEXT: lxv vs6, 96(r3)			; CHECK-BE-NEXT: lxv vs6, 96(r3)
	; CHECK-BE-NEXT: lxv vs0, 0(r3)			; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: xscvdpsxws f8, f7
				; CHECK-BE-NEXT: xxswapd vs7, vs7
	; CHECK-BE-NEXT: lxv vs2, 32(r3)			; CHECK-BE-NEXT: lxv vs2, 32(r3)
	; CHECK-BE-NEXT: lxv vs3, 48(r3)			; CHECK-BE-NEXT: lxv vs3, 48(r3)
	; CHECK-BE-NEXT: lxv vs4, 64(r3)			; CHECK-BE-NEXT: lxv vs4, 64(r3)
	; CHECK-BE-NEXT: lxv vs5, 80(r3)			; CHECK-BE-NEXT: lxv vs5, 80(r3)
				; CHECK-BE-NEXT: xscvdpsxws f7, f7
	; CHECK-BE-NEXT: mfvsrwz r3, f8			; CHECK-BE-NEXT: mfvsrwz r3, f8
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f7			; CHECK-BE-NEXT: mfvsrwz r3, f7
	; CHECK-BE-NEXT: xscvdpsxws f7, f6			; CHECK-BE-NEXT: xscvdpsxws f7, f6
	; CHECK-BE-NEXT: xxswapd vs6, vs6			; CHECK-BE-NEXT: xxswapd vs6, vs6
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f6, f6			; CHECK-BE-NEXT: xscvdpsxws f6, f6
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglh v2, v3, v2			; CHECK-P8-NEXT: vmrglh v2, v3, v2
	; CHECK-P8-NEXT: xxswapd vs0, v2			; CHECK-P8-NEXT: xxswapd vs0, v2
	; CHECK-P8-NEXT: mfvsrwz r3, f0			; CHECK-P8-NEXT: mfvsrwz r3, f0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt_signed:			; CHECK-P9-LABEL: test4elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r3)			; CHECK-P9-NEXT: lxv vs1, 0(r3)
				; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: lxv vs0, 16(r3)
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: xxswapd v2, vs2			; CHECK-P9-NEXT: xxswapd v2, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs1			; CHECK-P9-NEXT: xxswapd v3, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
				; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: xxswapd v4, vs0			; CHECK-P9-NEXT: xxswapd v4, vs0
	; CHECK-P9-NEXT: vmrglb v3, v3, v4			; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: vmrglh v2, v3, v2			; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: vextuwrx r3, r3, v2			; CHECK-P9-NEXT: vextuwrx r3, r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt_signed:			; CHECK-BE-LABEL: test4elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: xscvdpsxws f2, f1			; CHECK-BE-NEXT: xscvdpsxws f2, f1
	; CHECK-BE-NEXT: xxswapd vs1, vs1			; CHECK-BE-NEXT: xxswapd vs1, vs1
	; CHECK-BE-NEXT: xscvdpsxws f1, f1			; CHECK-BE-NEXT: xscvdpsxws f1, f1
	; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: mfvsrwz r3, f2			; CHECK-BE-NEXT: mfvsrwz r3, f2
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f1			; CHECK-BE-NEXT: mfvsrwz r3, f1
	; CHECK-BE-NEXT: xscvdpsxws f1, f0			; CHECK-BE-NEXT: xscvdpsxws f1, f0
	; CHECK-BE-NEXT: xxswapd vs0, vs0			; CHECK-BE-NEXT: xxswapd vs0, vs0
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f0, f0			; CHECK-BE-NEXT: xscvdpsxws f0, f0
	▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v2, v3, v2			; CHECK-P8-NEXT: vmrglw v2, v3, v2
	; CHECK-P8-NEXT: xxswapd vs0, v2			; CHECK-P8-NEXT: xxswapd vs0, v2
	; CHECK-P8-NEXT: mfvsrd r3, f0			; CHECK-P8-NEXT: mfvsrd r3, f0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs3, 0(r3)			; CHECK-P9-NEXT: lxv vs3, 0(r3)
	; CHECK-P9-NEXT: xscvdpsxws f4, f3
	; CHECK-P9-NEXT: xxswapd vs3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: lxv vs0, 48(r3)			; CHECK-P9-NEXT: lxv vs0, 48(r3)
	; CHECK-P9-NEXT: lxv vs1, 32(r3)			; CHECK-P9-NEXT: lxv vs1, 32(r3)
	; CHECK-P9-NEXT: lxv vs2, 16(r3)			; CHECK-P9-NEXT: lxv vs2, 16(r3)
				; CHECK-P9-NEXT: xscvdpsxws f4, f3
				; CHECK-P9-NEXT: xxswapd vs3, vs3
				; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: mfvsrwz r3, f4			; CHECK-P9-NEXT: mfvsrwz r3, f4
	; CHECK-P9-NEXT: mtvsrd f4, r3			; CHECK-P9-NEXT: mtvsrd f4, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: xxswapd v2, vs4			; CHECK-P9-NEXT: xxswapd v2, vs4
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v3, vs3			; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f2			; CHECK-P9-NEXT: xscvdpsxws f3, f2
	; CHECK-P9-NEXT: xxswapd vs2, vs2			; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
				; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
				; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs3
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs2			; CHECK-P9-NEXT: xxswapd v3, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs1			; CHECK-P9-NEXT: xxswapd v4, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v5, vs0			; CHECK-P9-NEXT: xxswapd v5, vs0
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: vmrglw v2, v3, v2			; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs3, 48(r3)			; CHECK-BE-NEXT: lxv vs3, 48(r3)
	; CHECK-BE-NEXT: xscvdpsxws f4, f3
	; CHECK-BE-NEXT: xxswapd vs3, vs3
	; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: lxv vs2, 32(r3)			; CHECK-BE-NEXT: lxv vs2, 32(r3)
	; CHECK-BE-NEXT: lxv vs0, 0(r3)			; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: xscvdpsxws f4, f3
				; CHECK-BE-NEXT: xxswapd vs3, vs3
				; CHECK-BE-NEXT: xscvdpsxws f3, f3
	; CHECK-BE-NEXT: mfvsrwz r3, f4			; CHECK-BE-NEXT: mfvsrwz r3, f4
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f3			; CHECK-BE-NEXT: mfvsrwz r3, f3
	; CHECK-BE-NEXT: xscvdpsxws f3, f2			; CHECK-BE-NEXT: xscvdpsxws f3, f2
	; CHECK-BE-NEXT: xxswapd vs2, vs2			; CHECK-BE-NEXT: xxswapd vs2, vs2
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f2, f2			; CHECK-BE-NEXT: xscvdpsxws f2, f2
	▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: vmrglw v3, v5, v4			; CHECK-P8-NEXT: vmrglw v3, v5, v4
	; CHECK-P8-NEXT: vmrglw v2, v2, v0			; CHECK-P8-NEXT: vmrglw v2, v2, v0
	; CHECK-P8-NEXT: xxmrgld v2, v2, v3			; CHECK-P8-NEXT: xxmrgld v2, v2, v3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs7, 0(r3)			; CHECK-P9-NEXT: lxv vs7, 0(r3)
	; CHECK-P9-NEXT: xscvdpsxws f8, f7
	; CHECK-P9-NEXT: xxswapd vs7, vs7
	; CHECK-P9-NEXT: xscvdpsxws f7, f7
	; CHECK-P9-NEXT: lxv vs0, 112(r3)			; CHECK-P9-NEXT: lxv vs0, 112(r3)
	; CHECK-P9-NEXT: lxv vs1, 96(r3)			; CHECK-P9-NEXT: lxv vs1, 96(r3)
	; CHECK-P9-NEXT: lxv vs2, 80(r3)			; CHECK-P9-NEXT: lxv vs2, 80(r3)
				; CHECK-P9-NEXT: xscvdpsxws f8, f7
				; CHECK-P9-NEXT: xxswapd vs7, vs7
	; CHECK-P9-NEXT: lxv vs3, 64(r3)			; CHECK-P9-NEXT: lxv vs3, 64(r3)
	; CHECK-P9-NEXT: lxv vs4, 48(r3)			; CHECK-P9-NEXT: lxv vs4, 48(r3)
	; CHECK-P9-NEXT: lxv vs5, 32(r3)			; CHECK-P9-NEXT: lxv vs5, 32(r3)
	; CHECK-P9-NEXT: lxv vs6, 16(r3)			; CHECK-P9-NEXT: lxv vs6, 16(r3)
				; CHECK-P9-NEXT: xscvdpsxws f7, f7
	; CHECK-P9-NEXT: mfvsrwz r3, f8			; CHECK-P9-NEXT: mfvsrwz r3, f8
	; CHECK-P9-NEXT: mtvsrd f8, r3			; CHECK-P9-NEXT: mtvsrd f8, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f7			; CHECK-P9-NEXT: mfvsrwz r3, f7
	; CHECK-P9-NEXT: xxswapd v2, vs8			; CHECK-P9-NEXT: xxswapd v2, vs8
	; CHECK-P9-NEXT: mtvsrd f7, r3			; CHECK-P9-NEXT: mtvsrd f7, r3
	; CHECK-P9-NEXT: xxswapd v3, vs7			; CHECK-P9-NEXT: xxswapd v3, vs7
	; CHECK-P9-NEXT: xscvdpsxws f7, f6			; CHECK-P9-NEXT: xscvdpsxws f7, f6
	; CHECK-P9-NEXT: xxswapd vs6, vs6			; CHECK-P9-NEXT: xxswapd vs6, vs6
	; CHECK-P9-NEXT: xscvdpsxws f6, f6			; CHECK-P9-NEXT: xscvdpsxws f6, f6
				; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f7			; CHECK-P9-NEXT: mfvsrwz r3, f7
	; CHECK-P9-NEXT: mtvsrd f7, r3			; CHECK-P9-NEXT: mtvsrd f7, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f6			; CHECK-P9-NEXT: mfvsrwz r3, f6
				; CHECK-P9-NEXT: xxswapd v3, vs7
	; CHECK-P9-NEXT: mtvsrd f6, r3			; CHECK-P9-NEXT: mtvsrd f6, r3
	; CHECK-P9-NEXT: xxswapd v4, vs6			; CHECK-P9-NEXT: xxswapd v4, vs6
	; CHECK-P9-NEXT: xscvdpsxws f6, f5			; CHECK-P9-NEXT: xscvdpsxws f6, f5
	; CHECK-P9-NEXT: xxswapd vs5, vs5			; CHECK-P9-NEXT: xxswapd vs5, vs5
	; CHECK-P9-NEXT: xscvdpsxws f5, f5			; CHECK-P9-NEXT: xscvdpsxws f5, f5
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
				; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f6			; CHECK-P9-NEXT: mfvsrwz r3, f6
	; CHECK-P9-NEXT: mtvsrd f6, r3			; CHECK-P9-NEXT: mtvsrd f6, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f5			; CHECK-P9-NEXT: mfvsrwz r3, f5
	; CHECK-P9-NEXT: vmrglb v2, v2, v3
	; CHECK-P9-NEXT: xxswapd v3, vs7
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: vmrglh v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs6			; CHECK-P9-NEXT: xxswapd v3, vs6
	; CHECK-P9-NEXT: mtvsrd f5, r3			; CHECK-P9-NEXT: mtvsrd f5, r3
	; CHECK-P9-NEXT: xxswapd v4, vs5			; CHECK-P9-NEXT: xxswapd v4, vs5
	; CHECK-P9-NEXT: xscvdpsxws f5, f4			; CHECK-P9-NEXT: xscvdpsxws f5, f4
	; CHECK-P9-NEXT: xxswapd vs4, vs4			; CHECK-P9-NEXT: xxswapd vs4, vs4
	; CHECK-P9-NEXT: xscvdpsxws f4, f4			; CHECK-P9-NEXT: xscvdpsxws f4, f4
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r3, f5			; CHECK-P9-NEXT: mfvsrwz r3, f5
	; CHECK-P9-NEXT: mtvsrd f5, r3			; CHECK-P9-NEXT: mtvsrd f5, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f4			; CHECK-P9-NEXT: mfvsrwz r3, f4
				; CHECK-P9-NEXT: xxswapd v4, vs5
	; CHECK-P9-NEXT: mtvsrd f4, r3			; CHECK-P9-NEXT: mtvsrd f4, r3
	; CHECK-P9-NEXT: xxswapd v5, vs4			; CHECK-P9-NEXT: xxswapd v5, vs4
	; CHECK-P9-NEXT: xscvdpsxws f4, f3			; CHECK-P9-NEXT: xscvdpsxws f4, f3
	; CHECK-P9-NEXT: xxswapd vs3, vs3			; CHECK-P9-NEXT: xxswapd vs3, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f3			; CHECK-P9-NEXT: xscvdpsxws f3, f3
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs5
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f4			; CHECK-P9-NEXT: mfvsrwz r3, f4
	; CHECK-P9-NEXT: mtvsrd f4, r3			; CHECK-P9-NEXT: mtvsrd f4, r3
				; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
				; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: xxswapd v4, vs3			; CHECK-P9-NEXT: xxswapd v4, vs3
	; CHECK-P9-NEXT: xscvdpsxws f3, f2			; CHECK-P9-NEXT: xscvdpsxws f3, f2
	; CHECK-P9-NEXT: xxswapd vs2, vs2			; CHECK-P9-NEXT: xxswapd vs2, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f2			; CHECK-P9-NEXT: xscvdpsxws f2, f2
				; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: mfvsrwz r3, f3			; CHECK-P9-NEXT: mfvsrwz r3, f3
	; CHECK-P9-NEXT: mtvsrd f3, r3			; CHECK-P9-NEXT: mtvsrd f3, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
				; CHECK-P9-NEXT: xxswapd v4, vs3
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: xxswapd v5, vs2			; CHECK-P9-NEXT: xxswapd v5, vs2
	; CHECK-P9-NEXT: xscvdpsxws f2, f1			; CHECK-P9-NEXT: xscvdpsxws f2, f1
	; CHECK-P9-NEXT: xxswapd vs1, vs1			; CHECK-P9-NEXT: xxswapd vs1, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f1			; CHECK-P9-NEXT: xscvdpsxws f1, f1
	; CHECK-P9-NEXT: vmrglw v2, v3, v2
	; CHECK-P9-NEXT: xxswapd v3, vs4
	; CHECK-P9-NEXT: vmrglb v3, v3, v4
	; CHECK-P9-NEXT: xxswapd v4, vs3
	; CHECK-P9-NEXT: vmrglb v4, v4, v5			; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: vmrglh v3, v4, v3			; CHECK-P9-NEXT: vmrglh v3, v4, v3
	; CHECK-P9-NEXT: mfvsrwz r3, f2			; CHECK-P9-NEXT: mfvsrwz r3, f2
	; CHECK-P9-NEXT: mtvsrd f2, r3			; CHECK-P9-NEXT: mtvsrd f2, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: xxswapd v4, vs2			; CHECK-P9-NEXT: xxswapd v4, vs2
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
	; CHECK-P9-NEXT: xscvdpsxws f1, f0			; CHECK-P9-NEXT: xscvdpsxws f1, f0
	; CHECK-P9-NEXT: xxswapd vs0, vs0			; CHECK-P9-NEXT: xxswapd vs0, vs0
	; CHECK-P9-NEXT: xscvdpsxws f0, f0			; CHECK-P9-NEXT: xscvdpsxws f0, f0
				; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: mfvsrwz r3, f1			; CHECK-P9-NEXT: mfvsrwz r3, f1
	; CHECK-P9-NEXT: mtvsrd f1, r3			; CHECK-P9-NEXT: mtvsrd f1, r3
	; CHECK-P9-NEXT: mfvsrwz r3, f0			; CHECK-P9-NEXT: mfvsrwz r3, f0
	; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: vmrglb v4, v4, v5
	; CHECK-P9-NEXT: xxswapd v5, vs1			; CHECK-P9-NEXT: xxswapd v5, vs1
				; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: xxswapd v0, vs0			; CHECK-P9-NEXT: xxswapd v0, vs0
	; CHECK-P9-NEXT: vmrglb v5, v5, v0			; CHECK-P9-NEXT: vmrglb v5, v5, v0
	; CHECK-P9-NEXT: vmrglh v4, v5, v4			; CHECK-P9-NEXT: vmrglh v4, v5, v4
	; CHECK-P9-NEXT: vmrglw v3, v4, v3			; CHECK-P9-NEXT: vmrglw v3, v4, v3
	; CHECK-P9-NEXT: xxmrgld v2, v3, v2			; CHECK-P9-NEXT: xxmrgld v2, v3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs7, 112(r3)			; CHECK-BE-NEXT: lxv vs7, 112(r3)
	; CHECK-BE-NEXT: xscvdpsxws f8, f7
	; CHECK-BE-NEXT: xxswapd vs7, vs7
	; CHECK-BE-NEXT: xscvdpsxws f7, f7
	; CHECK-BE-NEXT: lxv vs6, 96(r3)			; CHECK-BE-NEXT: lxv vs6, 96(r3)
	; CHECK-BE-NEXT: lxv vs0, 0(r3)			; CHECK-BE-NEXT: lxv vs0, 0(r3)
	; CHECK-BE-NEXT: lxv vs1, 16(r3)			; CHECK-BE-NEXT: lxv vs1, 16(r3)
				; CHECK-BE-NEXT: xscvdpsxws f8, f7
				; CHECK-BE-NEXT: xxswapd vs7, vs7
	; CHECK-BE-NEXT: lxv vs2, 32(r3)			; CHECK-BE-NEXT: lxv vs2, 32(r3)
	; CHECK-BE-NEXT: lxv vs3, 48(r3)			; CHECK-BE-NEXT: lxv vs3, 48(r3)
	; CHECK-BE-NEXT: lxv vs4, 64(r3)			; CHECK-BE-NEXT: lxv vs4, 64(r3)
	; CHECK-BE-NEXT: lxv vs5, 80(r3)			; CHECK-BE-NEXT: lxv vs5, 80(r3)
				; CHECK-BE-NEXT: xscvdpsxws f7, f7
	; CHECK-BE-NEXT: mfvsrwz r3, f8			; CHECK-BE-NEXT: mfvsrwz r3, f8
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: mfvsrwz r3, f7			; CHECK-BE-NEXT: mfvsrwz r3, f7
	; CHECK-BE-NEXT: xscvdpsxws f7, f6			; CHECK-BE-NEXT: xscvdpsxws f7, f6
	; CHECK-BE-NEXT: xxswapd vs6, vs6			; CHECK-BE-NEXT: xxswapd vs6, vs6
	; CHECK-BE-NEXT: sldi r3, r3, 56			; CHECK-BE-NEXT: sldi r3, r3, 56
	; CHECK-BE-NEXT: xscvdpsxws f6, f6			; CHECK-BE-NEXT: xscvdpsxws f6, f6
	▲ Show 20 Lines • Show All 82 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/vec_conv_i16_to_fp32_elts.ll

	Show All 34 Lines
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrws v2, r3			; CHECK-P9-NEXT: mtvsrws v2, r3
	; CHECK-P9-NEXT: li r3, 0			; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: vextuhrx r3, r3, v2			; CHECK-P9-NEXT: vextuhrx r3, r3, v2
	; CHECK-P9-NEXT: rlwinm r3, r3, 0, 16, 31			; CHECK-P9-NEXT: rlwinm r3, r3, 0, 16, 31
	; CHECK-P9-NEXT: mtfprwz f0, r3			; CHECK-P9-NEXT: mtfprwz f0, r3
	; CHECK-P9-NEXT: li r3, 2			; CHECK-P9-NEXT: li r3, 2
	; CHECK-P9-NEXT: xscvuxdsp f0, f0			; CHECK-P9-NEXT: xscvuxdsp f0, f0
	; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: vextuhrx r3, r3, v2			; CHECK-P9-NEXT: vextuhrx r3, r3, v2
	; CHECK-P9-NEXT: rlwinm r3, r3, 0, 16, 31			; CHECK-P9-NEXT: rlwinm r3, r3, 0, 16, 31
				; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 1
	; CHECK-P9-NEXT: mtfprwz f0, r3			; CHECK-P9-NEXT: mtfprwz f0, r3
	; CHECK-P9-NEXT: xscvuxdsp f0, f0			; CHECK-P9-NEXT: xscvuxdsp f0, f0
	; CHECK-P9-NEXT: xscvdpspn vs0, f0			; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 1
	; CHECK-P9-NEXT: vmrglw v2, v2, v3			; CHECK-P9-NEXT: vmrglw v2, v2, v3
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	Show All 35 Lines
	; CHECK-P8-NEXT: vperm v2, v4, v2, v3			; CHECK-P8-NEXT: vperm v2, v4, v2, v3
	; CHECK-P8-NEXT: xvcvuxwsp v2, v2			; CHECK-P8-NEXT: xvcvuxwsp v2, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt:			; CHECK-P9-LABEL: test4elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r3			; CHECK-P9-NEXT: mtvsrd f0, r3
	; CHECK-P9-NEXT: addis r3, r2, .LCPI1_0@toc@ha			; CHECK-P9-NEXT: addis r3, r2, .LCPI1_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
				; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: addi r3, r3, .LCPI1_0@toc@l			; CHECK-P9-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r3			; CHECK-P9-NEXT: lxvx v3, 0, r3
	; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: vperm v2, v4, v2, v3			; CHECK-P9-NEXT: vperm v2, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxwsp v2, v2			; CHECK-P9-NEXT: xvcvuxwsp v2, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt:			; CHECK-BE-LABEL: test4elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd v2, r3			; CHECK-BE-NEXT: mtvsrd v2, r3
	; CHECK-BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha			; CHECK-BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r3, r3, .LCPI1_0@toc@l			; CHECK-BE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r3			; CHECK-BE-NEXT: lxvx v3, 0, r3
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: vperm v2, v2, v4, v3			; CHECK-BE-NEXT: vperm v2, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxwsp v2, v2			; CHECK-BE-NEXT: xvcvuxwsp v2, v2
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%0 = bitcast i64 %a.coerce to <4 x i16>			%0 = bitcast i64 %a.coerce to <4 x i16>
	%1 = uitofp <4 x i16> %0 to <4 x float>			%1 = uitofp <4 x i16> %0 to <4 x float>
	ret <4 x float> %1			ret <4 x float> %1
	}			}
	Show All 15 Lines
	; CHECK-P8-NEXT: xvcvuxwsp v2, v2			; CHECK-P8-NEXT: xvcvuxwsp v2, v2
	; CHECK-P8-NEXT: stvx v3, 0, r3			; CHECK-P8-NEXT: stvx v3, 0, r3
	; CHECK-P8-NEXT: stvx v2, r3, r4			; CHECK-P8-NEXT: stvx v2, r3, r4
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_1@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxwsp vs0, v3			; CHECK-P9-NEXT: xvcvuxwsp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: vperm v2, v4, v2, v3			; CHECK-P9-NEXT: vperm v2, v4, v2, v3
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: xvcvuxwsp vs1, v2			; CHECK-P9-NEXT: xvcvuxwsp vs1, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_1@toc@l
	; CHECK-BE-NEXT: vperm v3, v2, v4, v3			; CHECK-BE-NEXT: vperm v3, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxwsp vs0, v3			; CHECK-BE-NEXT: xvcvuxwsp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: vperm v2, v4, v2, v3			; CHECK-BE-NEXT: vperm v2, v4, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 0(r3)			; CHECK-BE-NEXT: stxv vs0, 0(r3)
	; CHECK-BE-NEXT: xvcvuxwsp vs1, v2			; CHECK-BE-NEXT: xvcvuxwsp vs1, v2
	Show All 34 Lines
	; CHECK-P8-NEXT: stvx v3, r3, r5			; CHECK-P8-NEXT: stvx v3, r3, r5
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v2, 16(r4)			; CHECK-P9-NEXT: lxv v2, 16(r4)
	; CHECK-P9-NEXT: lxv v3, 0(r4)			; CHECK-P9-NEXT: lxv v3, 0(r4)
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v5, v5, v5
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; CHECK-P9-NEXT: lxvx v4, 0, r4			; CHECK-P9-NEXT: lxvx v4, 0, r4
	; CHECK-P9-NEXT: xxlxor v5, v5, v5
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_1@toc@l
	; CHECK-P9-NEXT: vperm v0, v5, v3, v4			; CHECK-P9-NEXT: vperm v0, v5, v3, v4
	; CHECK-P9-NEXT: xvcvuxwsp vs0, v0			; CHECK-P9-NEXT: xvcvuxwsp vs0, v0
	; CHECK-P9-NEXT: lxvx v0, 0, r4			; CHECK-P9-NEXT: lxvx v0, 0, r4
	; CHECK-P9-NEXT: vperm v3, v5, v3, v0			; CHECK-P9-NEXT: vperm v3, v5, v3, v0
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: xvcvuxwsp vs1, v3			; CHECK-P9-NEXT: xvcvuxwsp vs1, v3
	; CHECK-P9-NEXT: vperm v3, v5, v2, v4			; CHECK-P9-NEXT: vperm v3, v5, v2, v4
	; CHECK-P9-NEXT: vperm v2, v5, v2, v0			; CHECK-P9-NEXT: vperm v2, v5, v2, v0
	; CHECK-P9-NEXT: xvcvuxwsp vs2, v3			; CHECK-P9-NEXT: xvcvuxwsp vs2, v3
	; CHECK-P9-NEXT: xvcvuxwsp vs3, v2			; CHECK-P9-NEXT: xvcvuxwsp vs3, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: stxv vs2, 32(r3)			; CHECK-P9-NEXT: stxv vs2, 32(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v2, 16(r4)			; CHECK-BE-NEXT: lxv v2, 16(r4)
	; CHECK-BE-NEXT: lxv v3, 0(r4)			; CHECK-BE-NEXT: lxv v3, 0(r4)
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v5, v5, v5
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; CHECK-BE-NEXT: lxvx v4, 0, r4			; CHECK-BE-NEXT: lxvx v4, 0, r4
	; CHECK-BE-NEXT: xxlxor v5, v5, v5
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_1@toc@l
	; CHECK-BE-NEXT: vperm v0, v3, v5, v4			; CHECK-BE-NEXT: vperm v0, v3, v5, v4
	; CHECK-BE-NEXT: xvcvuxwsp vs0, v0			; CHECK-BE-NEXT: xvcvuxwsp vs0, v0
	; CHECK-BE-NEXT: lxvx v0, 0, r4			; CHECK-BE-NEXT: lxvx v0, 0, r4
	; CHECK-BE-NEXT: vperm v3, v5, v3, v0			; CHECK-BE-NEXT: vperm v3, v5, v3, v0
	; CHECK-BE-NEXT: stxv vs0, 0(r3)			; CHECK-BE-NEXT: stxv vs0, 0(r3)
	; CHECK-BE-NEXT: xvcvuxwsp vs1, v3			; CHECK-BE-NEXT: xvcvuxwsp vs1, v3
	Show All 38 Lines
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrws v2, r3			; CHECK-P9-NEXT: mtvsrws v2, r3
	; CHECK-P9-NEXT: li r3, 0			; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: vextuhrx r3, r3, v2			; CHECK-P9-NEXT: vextuhrx r3, r3, v2
	; CHECK-P9-NEXT: extsh r3, r3			; CHECK-P9-NEXT: extsh r3, r3
	; CHECK-P9-NEXT: mtfprwa f0, r3			; CHECK-P9-NEXT: mtfprwa f0, r3
	; CHECK-P9-NEXT: li r3, 2			; CHECK-P9-NEXT: li r3, 2
	; CHECK-P9-NEXT: xscvsxdsp f0, f0			; CHECK-P9-NEXT: xscvsxdsp f0, f0
	; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: vextuhrx r3, r3, v2			; CHECK-P9-NEXT: vextuhrx r3, r3, v2
	; CHECK-P9-NEXT: extsh r3, r3			; CHECK-P9-NEXT: extsh r3, r3
				; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 1
	; CHECK-P9-NEXT: mtfprwa f0, r3			; CHECK-P9-NEXT: mtfprwa f0, r3
	; CHECK-P9-NEXT: xscvsxdsp f0, f0			; CHECK-P9-NEXT: xscvsxdsp f0, f0
	; CHECK-P9-NEXT: xscvdpspn vs0, f0			; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 1
	; CHECK-P9-NEXT: vmrglw v2, v2, v3			; CHECK-P9-NEXT: vmrglw v2, v2, v3
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: xvcvsxwsp vs1, v2			; CHECK-P9-NEXT: xvcvsxwsp vs1, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3			; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: vmrghh v2, v2, v2			; CHECK-BE-NEXT: vmrghh v2, v2, v2
	; CHECK-BE-NEXT: vextsh2w v3, v3			; CHECK-BE-NEXT: vextsh2w v3, v3
	; CHECK-BE-NEXT: vextsh2w v2, v2			; CHECK-BE-NEXT: vextsh2w v2, v2
	; CHECK-BE-NEXT: xvcvsxwsp vs0, v3			; CHECK-BE-NEXT: xvcvsxwsp vs0, v3
	; CHECK-BE-NEXT: xvcvsxwsp vs1, v2			; CHECK-BE-NEXT: xvcvsxwsp vs1, v2
	; CHECK-BE-NEXT: stxv vs1, 0(r3)			; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	Show All 38 Lines
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v3, 0(r4)			; CHECK-P9-NEXT: lxv v3, 0(r4)
	; CHECK-P9-NEXT: lxv v2, 16(r4)			; CHECK-P9-NEXT: lxv v2, 16(r4)
	; CHECK-P9-NEXT: vmrglh v4, v3, v3			; CHECK-P9-NEXT: vmrglh v4, v3, v3
	; CHECK-P9-NEXT: vmrghh v3, v3, v3			; CHECK-P9-NEXT: vmrghh v3, v3, v3
	; CHECK-P9-NEXT: vextsh2w v3, v3			; CHECK-P9-NEXT: vextsh2w v3, v3
				; CHECK-P9-NEXT: vextsh2w v4, v4
	; CHECK-P9-NEXT: xvcvsxwsp vs1, v3			; CHECK-P9-NEXT: xvcvsxwsp vs1, v3
	; CHECK-P9-NEXT: vmrglh v3, v2, v2			; CHECK-P9-NEXT: vmrglh v3, v2, v2
	; CHECK-P9-NEXT: vmrghh v2, v2, v2			; CHECK-P9-NEXT: vmrghh v2, v2, v2
	; CHECK-P9-NEXT: vextsh2w v4, v4
	; CHECK-P9-NEXT: xvcvsxwsp vs0, v4			; CHECK-P9-NEXT: xvcvsxwsp vs0, v4
	; CHECK-P9-NEXT: vextsh2w v3, v3			; CHECK-P9-NEXT: vextsh2w v3, v3
	; CHECK-P9-NEXT: vextsh2w v2, v2			; CHECK-P9-NEXT: vextsh2w v2, v2
	; CHECK-P9-NEXT: xvcvsxwsp vs2, v3			; CHECK-P9-NEXT: xvcvsxwsp vs2, v3
	; CHECK-P9-NEXT: xvcvsxwsp vs3, v2			; CHECK-P9-NEXT: xvcvsxwsp vs3, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: stxv vs2, 32(r3)			; CHECK-P9-NEXT: stxv vs2, 32(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v2, 16(r4)			; CHECK-BE-NEXT: lxv v2, 16(r4)
	; CHECK-BE-NEXT: lxv v3, 0(r4)			; CHECK-BE-NEXT: lxv v3, 0(r4)
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI7_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v5, v5, v5
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI7_0@toc@l
	; CHECK-BE-NEXT: lxvx v4, 0, r4			; CHECK-BE-NEXT: lxvx v4, 0, r4
	; CHECK-BE-NEXT: xxlxor v5, v5, v5
	; CHECK-BE-NEXT: vperm v0, v5, v3, v4			; CHECK-BE-NEXT: vperm v0, v5, v3, v4
	; CHECK-BE-NEXT: vperm v4, v5, v2, v4			; CHECK-BE-NEXT: vperm v4, v5, v2, v4
	; CHECK-BE-NEXT: vmrghh v3, v3, v3			; CHECK-BE-NEXT: vmrghh v3, v3, v3
	; CHECK-BE-NEXT: vmrghh v2, v2, v2			; CHECK-BE-NEXT: vmrghh v2, v2, v2
	; CHECK-BE-NEXT: vextsh2w v0, v0			; CHECK-BE-NEXT: vextsh2w v0, v0
	; CHECK-BE-NEXT: vextsh2w v4, v4			; CHECK-BE-NEXT: vextsh2w v4, v4
	; CHECK-BE-NEXT: vextsh2w v3, v3			; CHECK-BE-NEXT: vextsh2w v3, v3
	; CHECK-BE-NEXT: vextsh2w v2, v2			; CHECK-BE-NEXT: vextsh2w v2, v2
	Show All 15 Lines

llvm/test/CodeGen/PowerPC/vec_conv_i16_to_fp64_elts.ll

	Show All 20 Lines
	; CHECK-P8-NEXT: vperm v2, v4, v2, v3			; CHECK-P8-NEXT: vperm v2, v4, v2, v3
	; CHECK-P8-NEXT: xvcvuxddp v2, v2			; CHECK-P8-NEXT: xvcvuxddp v2, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test2elt:			; CHECK-P9-LABEL: test2elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrws v2, r3			; CHECK-P9-NEXT: mtvsrws v2, r3
	; CHECK-P9-NEXT: addis r3, r2, .LCPI0_0@toc@ha			; CHECK-P9-NEXT: addis r3, r2, .LCPI0_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addi r3, r3, .LCPI0_0@toc@l			; CHECK-P9-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r3			; CHECK-P9-NEXT: lxvx v3, 0, r3
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: vperm v2, v4, v2, v3			; CHECK-P9-NEXT: vperm v2, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxddp v2, v2			; CHECK-P9-NEXT: xvcvuxddp v2, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test2elt:			; CHECK-BE-LABEL: test2elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrws v2, r3			; CHECK-BE-NEXT: mtvsrws v2, r3
	; CHECK-BE-NEXT: addis r3, r2, .LCPI0_0@toc@ha			; CHECK-BE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r3, r3, .LCPI0_0@toc@l			; CHECK-BE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r3			; CHECK-BE-NEXT: lxvx v3, 0, r3
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: vperm v2, v2, v4, v3			; CHECK-BE-NEXT: vperm v2, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxddp v2, v2			; CHECK-BE-NEXT: xvcvuxddp v2, v2
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%0 = bitcast i32 %a.coerce to <2 x i16>			%0 = bitcast i32 %a.coerce to <2 x i16>
	%1 = uitofp <2 x i16> %0 to <2 x double>			%1 = uitofp <2 x i16> %0 to <2 x double>
	ret <2 x double> %1			ret <2 x double> %1
	}			}
	Show All 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs1, r3, r4			; CHECK-P8-NEXT: stxvd2x vs1, r3, r4
	; CHECK-P8-NEXT: stxvd2x vs0, 0, r3			; CHECK-P8-NEXT: stxvd2x vs0, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt:			; CHECK-P9-LABEL: test4elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI1_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI1_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
				; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: addi r4, r4, .LCPI1_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI1_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI1_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI1_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI1_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI1_1@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxddp vs0, v3			; CHECK-P9-NEXT: xvcvuxddp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: vperm v2, v4, v2, v3			; CHECK-P9-NEXT: vperm v2, v4, v2, v3
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: xvcvuxddp vs1, v2			; CHECK-P9-NEXT: xvcvuxddp vs1, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt:			; CHECK-BE-LABEL: test4elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI1_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI1_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI1_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI1_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI1_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI1_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI1_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI1_1@toc@l
	; CHECK-BE-NEXT: vperm v3, v2, v4, v3			; CHECK-BE-NEXT: vperm v3, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxddp vs0, v3			; CHECK-BE-NEXT: xvcvuxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: vperm v2, v4, v2, v3			; CHECK-BE-NEXT: vperm v2, v4, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 0(r3)			; CHECK-BE-NEXT: stxv vs0, 0(r3)
	; CHECK-BE-NEXT: xvcvuxddp vs1, v2			; CHECK-BE-NEXT: xvcvuxddp vs1, v2
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs1, r3, r5			; CHECK-P8-NEXT: stxvd2x vs1, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs3, r3, r4			; CHECK-P8-NEXT: stxvd2x vs3, r3, r4
	; CHECK-P8-NEXT: stxvd2x vs0, 0, r3			; CHECK-P8-NEXT: stxvd2x vs0, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_1@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxddp vs0, v3			; CHECK-P9-NEXT: xvcvuxddp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_2@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_2@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_2@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_2@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	Show All 10 Lines
	; CHECK-P9-NEXT: stxv vs2, 32(r3)			; CHECK-P9-NEXT: stxv vs2, 32(r3)
	; CHECK-P9-NEXT: xvcvuxddp vs3, v2			; CHECK-P9-NEXT: xvcvuxddp vs3, v2
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_1@toc@l
	; CHECK-BE-NEXT: vperm v3, v2, v4, v3			; CHECK-BE-NEXT: vperm v3, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxddp vs0, v3			; CHECK-BE-NEXT: xvcvuxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_2@toc@l
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3			; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs3, 0, r3			; CHECK-P8-NEXT: stxvd2x vs3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v2, 16(r4)			; CHECK-P9-NEXT: lxv v2, 16(r4)
	; CHECK-P9-NEXT: lxv v3, 0(r4)			; CHECK-P9-NEXT: lxv v3, 0(r4)
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v5, v5, v5
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; CHECK-P9-NEXT: lxvx v4, 0, r4			; CHECK-P9-NEXT: lxvx v4, 0, r4
	; CHECK-P9-NEXT: xxlxor v5, v5, v5
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_1@toc@l
	; CHECK-P9-NEXT: vperm v0, v5, v3, v4			; CHECK-P9-NEXT: vperm v0, v5, v3, v4
	; CHECK-P9-NEXT: xvcvuxddp vs0, v0			; CHECK-P9-NEXT: xvcvuxddp vs0, v0
	; CHECK-P9-NEXT: lxvx v0, 0, r4			; CHECK-P9-NEXT: lxvx v0, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_2@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_2@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_2@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_2@toc@l
	; CHECK-P9-NEXT: vperm v1, v5, v3, v0			; CHECK-P9-NEXT: vperm v1, v5, v3, v0
	Show All 24 Lines
	; CHECK-P9-NEXT: stxv vs6, 96(r3)			; CHECK-P9-NEXT: stxv vs6, 96(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v2, 16(r4)			; CHECK-BE-NEXT: lxv v2, 16(r4)
	; CHECK-BE-NEXT: lxv v3, 0(r4)			; CHECK-BE-NEXT: lxv v3, 0(r4)
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v5, v5, v5
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; CHECK-BE-NEXT: lxvx v4, 0, r4			; CHECK-BE-NEXT: lxvx v4, 0, r4
	; CHECK-BE-NEXT: xxlxor v5, v5, v5
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_1@toc@l
	; CHECK-BE-NEXT: vperm v0, v3, v5, v4			; CHECK-BE-NEXT: vperm v0, v3, v5, v4
	; CHECK-BE-NEXT: xvcvuxddp vs0, v0			; CHECK-BE-NEXT: xvcvuxddp vs0, v0
	; CHECK-BE-NEXT: lxvx v0, 0, r4			; CHECK-BE-NEXT: lxvx v0, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_2@toc@l
	; CHECK-BE-NEXT: vperm v1, v5, v3, v0			; CHECK-BE-NEXT: vperm v1, v5, v3, v0
	▲ Show 20 Lines • Show All 105 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs0, 0, r3			; CHECK-P8-NEXT: stxvd2x vs0, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt_signed:			; CHECK-P9-LABEL: test4elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI5_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI5_0@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI5_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI5_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: vperm v3, v2, v2, v3			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI5_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI5_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI5_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI5_1@toc@l
				; CHECK-P9-NEXT: vperm v3, v2, v2, v3
	; CHECK-P9-NEXT: vextsh2d v3, v3			; CHECK-P9-NEXT: vextsh2d v3, v3
	; CHECK-P9-NEXT: xvcvsxddp vs0, v3			; CHECK-P9-NEXT: xvcvsxddp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: vperm v2, v2, v2, v3			; CHECK-P9-NEXT: vperm v2, v2, v2, v3
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: vextsh2d v2, v2			; CHECK-P9-NEXT: vextsh2d v2, v2
	; CHECK-P9-NEXT: xvcvsxddp vs1, v2			; CHECK-P9-NEXT: xvcvsxddp vs1, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt_signed:			; CHECK-BE-LABEL: test4elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI5_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI5_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v3, v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI5_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI5_0@toc@l
	; CHECK-BE-NEXT: lxvx v4, 0, r4			; CHECK-BE-NEXT: lxvx v4, 0, r4
	; CHECK-BE-NEXT: xxlxor v3, v3, v3
	; CHECK-BE-NEXT: vperm v3, v3, v2, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI5_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI5_1@toc@ha
	; CHECK-BE-NEXT: vextsh2d v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI5_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI5_1@toc@l
				; CHECK-BE-NEXT: vperm v3, v3, v2, v4
				; CHECK-BE-NEXT: vextsh2d v3, v3
	; CHECK-BE-NEXT: xvcvsxddp vs0, v3			; CHECK-BE-NEXT: xvcvsxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: vextsh2d v2, v2			; CHECK-BE-NEXT: vextsh2d v2, v2
	; CHECK-BE-NEXT: xvcvsxddp vs1, v2			; CHECK-BE-NEXT: xvcvsxddp vs1, v2
	; CHECK-BE-NEXT: stxv vs1, 0(r3)			; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	▲ Show 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: vextsh2d v2, v2			; CHECK-P9-NEXT: vextsh2d v2, v2
	; CHECK-P9-NEXT: xvcvsxddp vs3, v2			; CHECK-P9-NEXT: xvcvsxddp vs3, v2
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_1@toc@l
				; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: vextsh2d v3, v3			; CHECK-BE-NEXT: vextsh2d v3, v3
	; CHECK-BE-NEXT: xvcvsxddp vs0, v3			; CHECK-BE-NEXT: xvcvsxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_2@toc@l
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3			; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: vextsh2d v3, v3			; CHECK-BE-NEXT: vextsh2d v3, v3
	▲ Show 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs0, r3, r5			; CHECK-P8-NEXT: stxvd2x vs0, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs2, r3, r6			; CHECK-P8-NEXT: stxvd2x vs2, r3, r6
	; CHECK-P8-NEXT: stxvd2x vs3, 0, r3			; CHECK-P8-NEXT: stxvd2x vs3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: addis r5, r2, .LCPI7_0@toc@ha			; CHECK-P9-NEXT: addis r5, r2, .LCPI7_0@toc@ha
	; CHECK-P9-NEXT: addi r5, r5, .LCPI7_0@toc@l
	; CHECK-P9-NEXT: lxv v2, 0(r4)			; CHECK-P9-NEXT: lxv v2, 0(r4)
				; CHECK-P9-NEXT: addi r5, r5, .LCPI7_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r5			; CHECK-P9-NEXT: lxvx v3, 0, r5
	; CHECK-P9-NEXT: addis r5, r2, .LCPI7_1@toc@ha			; CHECK-P9-NEXT: addis r5, r2, .LCPI7_1@toc@ha
	; CHECK-P9-NEXT: addi r5, r5, .LCPI7_1@toc@l			; CHECK-P9-NEXT: addi r5, r5, .LCPI7_1@toc@l
	; CHECK-P9-NEXT: lxvx v5, 0, r5			; CHECK-P9-NEXT: lxvx v5, 0, r5
	; CHECK-P9-NEXT: addis r5, r2, .LCPI7_2@toc@ha			; CHECK-P9-NEXT: addis r5, r2, .LCPI7_2@toc@ha
	; CHECK-P9-NEXT: vperm v4, v2, v2, v3			; CHECK-P9-NEXT: vperm v4, v2, v2, v3
	; CHECK-P9-NEXT: addi r5, r5, .LCPI7_2@toc@l			; CHECK-P9-NEXT: addi r5, r5, .LCPI7_2@toc@l
	; CHECK-P9-NEXT: vextsh2d v4, v4			; CHECK-P9-NEXT: vextsh2d v4, v4
	; CHECK-P9-NEXT: lxvx v0, 0, r5			; CHECK-P9-NEXT: lxvx v0, 0, r5
	; CHECK-P9-NEXT: addis r5, r2, .LCPI7_3@toc@ha			; CHECK-P9-NEXT: addis r5, r2, .LCPI7_3@toc@ha
	; CHECK-P9-NEXT: xvcvsxddp vs0, v4			; CHECK-P9-NEXT: xvcvsxddp vs0, v4
	; CHECK-P9-NEXT: vperm v4, v2, v2, v5			; CHECK-P9-NEXT: vperm v4, v2, v2, v5
	; CHECK-P9-NEXT: addi r5, r5, .LCPI7_3@toc@l			; CHECK-P9-NEXT: addi r5, r5, .LCPI7_3@toc@l
	; CHECK-P9-NEXT: lxvx v1, 0, r5			; CHECK-P9-NEXT: lxvx v1, 0, r5
	; CHECK-P9-NEXT: vextsh2d v4, v4			; CHECK-P9-NEXT: vextsh2d v4, v4
	; CHECK-P9-NEXT: xvcvsxddp vs1, v4			; CHECK-P9-NEXT: xvcvsxddp vs1, v4
	; CHECK-P9-NEXT: vperm v4, v2, v2, v0			; CHECK-P9-NEXT: vperm v4, v2, v2, v0
	; CHECK-P9-NEXT: vperm v2, v2, v2, v1			; CHECK-P9-NEXT: vperm v2, v2, v2, v1
				; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: vextsh2d v4, v4			; CHECK-P9-NEXT: vextsh2d v4, v4
	; CHECK-P9-NEXT: xvcvsxddp vs2, v4			; CHECK-P9-NEXT: xvcvsxddp vs2, v4
	; CHECK-P9-NEXT: lxv v4, 16(r4)			; CHECK-P9-NEXT: lxv v4, 16(r4)
				; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: vextsh2d v2, v2			; CHECK-P9-NEXT: vextsh2d v2, v2
	; CHECK-P9-NEXT: xvcvsxddp vs3, v2			; CHECK-P9-NEXT: xvcvsxddp vs3, v2
	; CHECK-P9-NEXT: vperm v2, v4, v4, v3			; CHECK-P9-NEXT: vperm v2, v4, v4, v3
	; CHECK-P9-NEXT: stxv vs2, 32(r3)			; CHECK-P9-NEXT: stxv vs2, 32(r3)
	; CHECK-P9-NEXT: vextsh2d v2, v2			; CHECK-P9-NEXT: vextsh2d v2, v2
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: xvcvsxddp vs4, v2			; CHECK-P9-NEXT: xvcvsxddp vs4, v2
	; CHECK-P9-NEXT: vperm v2, v4, v4, v5			; CHECK-P9-NEXT: vperm v2, v4, v4, v5
	; CHECK-P9-NEXT: vextsh2d v2, v2			; CHECK-P9-NEXT: vextsh2d v2, v2
	; CHECK-P9-NEXT: xvcvsxddp vs5, v2			; CHECK-P9-NEXT: xvcvsxddp vs5, v2
	; CHECK-P9-NEXT: vperm v2, v4, v4, v0			; CHECK-P9-NEXT: vperm v2, v4, v4, v0
	; CHECK-P9-NEXT: stxv vs4, 64(r3)			; CHECK-P9-NEXT: stxv vs4, 64(r3)
	; CHECK-P9-NEXT: vextsh2d v2, v2			; CHECK-P9-NEXT: vextsh2d v2, v2
	; CHECK-P9-NEXT: xvcvsxddp vs6, v2			; CHECK-P9-NEXT: xvcvsxddp vs6, v2
	; CHECK-P9-NEXT: vperm v2, v4, v4, v1			; CHECK-P9-NEXT: vperm v2, v4, v4, v1
	; CHECK-P9-NEXT: stxv vs5, 80(r3)			; CHECK-P9-NEXT: stxv vs5, 80(r3)
	; CHECK-P9-NEXT: stxv vs6, 96(r3)
	; CHECK-P9-NEXT: vextsh2d v2, v2			; CHECK-P9-NEXT: vextsh2d v2, v2
	; CHECK-P9-NEXT: xvcvsxddp vs7, v2			; CHECK-P9-NEXT: xvcvsxddp vs7, v2
				; CHECK-P9-NEXT: stxv vs6, 96(r3)
	; CHECK-P9-NEXT: stxv vs7, 112(r3)			; CHECK-P9-NEXT: stxv vs7, 112(r3)
	; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r5, r2, .LCPI7_0@toc@ha			; CHECK-BE-NEXT: addis r5, r2, .LCPI7_0@toc@ha
	; CHECK-BE-NEXT: addi r5, r5, .LCPI7_0@toc@l
	; CHECK-BE-NEXT: lxvx v2, 0, r5
	; CHECK-BE-NEXT: lxv v4, 0(r4)			; CHECK-BE-NEXT: lxv v4, 0(r4)
	; CHECK-BE-NEXT: lxv v1, 16(r4)			; CHECK-BE-NEXT: lxv v1, 16(r4)
				; CHECK-BE-NEXT: xxlxor v5, v5, v5
				; CHECK-BE-NEXT: addis r4, r2, .LCPI7_2@toc@ha
				; CHECK-BE-NEXT: addi r5, r5, .LCPI7_0@toc@l
				; CHECK-BE-NEXT: addi r4, r4, .LCPI7_2@toc@l
				; CHECK-BE-NEXT: lxvx v2, 0, r5
	; CHECK-BE-NEXT: addis r5, r2, .LCPI7_1@toc@ha			; CHECK-BE-NEXT: addis r5, r2, .LCPI7_1@toc@ha
	; CHECK-BE-NEXT: addi r5, r5, .LCPI7_1@toc@l			; CHECK-BE-NEXT: addi r5, r5, .LCPI7_1@toc@l
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_2@toc@ha
	; CHECK-BE-NEXT: xxlxor v5, v5, v5
	; CHECK-BE-NEXT: vperm v0, v5, v4, v2
	; CHECK-BE-NEXT: lxvx v3, 0, r5			; CHECK-BE-NEXT: lxvx v3, 0, r5
				; CHECK-BE-NEXT: vperm v0, v5, v4, v2
	; CHECK-BE-NEXT: vperm v2, v5, v1, v2			; CHECK-BE-NEXT: vperm v2, v5, v1, v2
	; CHECK-BE-NEXT: vextsh2d v2, v2			; CHECK-BE-NEXT: vextsh2d v2, v2
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_2@toc@l
	; CHECK-BE-NEXT: vextsh2d v0, v0			; CHECK-BE-NEXT: vextsh2d v0, v0
	; CHECK-BE-NEXT: xvcvsxddp vs2, v2			; CHECK-BE-NEXT: xvcvsxddp vs2, v2
	; CHECK-BE-NEXT: vperm v2, v5, v1, v3			; CHECK-BE-NEXT: vperm v2, v5, v1, v3
				; CHECK-BE-NEXT: xvcvsxddp vs0, v0
				; CHECK-BE-NEXT: vperm v0, v5, v4, v3
	; CHECK-BE-NEXT: vextsh2d v2, v2			; CHECK-BE-NEXT: vextsh2d v2, v2
	; CHECK-BE-NEXT: stxv vs2, 80(r3)			; CHECK-BE-NEXT: vextsh2d v0, v0
	; CHECK-BE-NEXT: xvcvsxddp vs3, v2			; CHECK-BE-NEXT: xvcvsxddp vs3, v2
	; CHECK-BE-NEXT: lxvx v2, 0, r4			; CHECK-BE-NEXT: lxvx v2, 0, r4
	; CHECK-BE-NEXT: xvcvsxddp vs0, v0
	; CHECK-BE-NEXT: vperm v0, v5, v4, v3
	; CHECK-BE-NEXT: vperm v3, v4, v4, v2
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_3@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI7_3@toc@ha
	; CHECK-BE-NEXT: vextsh2d v0, v0
	; CHECK-BE-NEXT: xvcvsxddp vs1, v0			; CHECK-BE-NEXT: xvcvsxddp vs1, v0
				; CHECK-BE-NEXT: addi r4, r4, .LCPI7_3@toc@l
				; CHECK-BE-NEXT: stxv vs2, 80(r3)
				; CHECK-BE-NEXT: stxv vs0, 16(r3)
				; CHECK-BE-NEXT: vperm v3, v4, v4, v2
				; CHECK-BE-NEXT: vperm v2, v1, v1, v2
				; CHECK-BE-NEXT: stxv vs3, 112(r3)
	; CHECK-BE-NEXT: stxv vs1, 48(r3)			; CHECK-BE-NEXT: stxv vs1, 48(r3)
	; CHECK-BE-NEXT: vextsh2d v3, v3			; CHECK-BE-NEXT: vextsh2d v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_3@toc@l			; CHECK-BE-NEXT: vextsh2d v2, v2
	; CHECK-BE-NEXT: xvcvsxddp vs4, v3			; CHECK-BE-NEXT: xvcvsxddp vs4, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: vperm v2, v1, v1, v2
	; CHECK-BE-NEXT: vextsh2d v2, v2
	; CHECK-BE-NEXT: xvcvsxddp vs6, v2			; CHECK-BE-NEXT: xvcvsxddp vs6, v2
	; CHECK-BE-NEXT: vperm v2, v1, v1, v3
	; CHECK-BE-NEXT: vperm v4, v4, v4, v3			; CHECK-BE-NEXT: vperm v4, v4, v4, v3
				; CHECK-BE-NEXT: vperm v2, v1, v1, v3
				; CHECK-BE-NEXT: stxv vs6, 64(r3)
				; CHECK-BE-NEXT: stxv vs4, 0(r3)
	; CHECK-BE-NEXT: vextsh2d v4, v4			; CHECK-BE-NEXT: vextsh2d v4, v4
	; CHECK-BE-NEXT: vextsh2d v2, v2			; CHECK-BE-NEXT: vextsh2d v2, v2
	; CHECK-BE-NEXT: xvcvsxddp vs7, v2
	; CHECK-BE-NEXT: xvcvsxddp vs5, v4			; CHECK-BE-NEXT: xvcvsxddp vs5, v4
	; CHECK-BE-NEXT: stxv vs3, 112(r3)			; CHECK-BE-NEXT: xvcvsxddp vs7, v2
	; CHECK-BE-NEXT: stxv vs6, 64(r3)
	; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: stxv vs4, 0(r3)
	; CHECK-BE-NEXT: stxv vs7, 96(r3)			; CHECK-BE-NEXT: stxv vs7, 96(r3)
	; CHECK-BE-NEXT: stxv vs5, 32(r3)			; CHECK-BE-NEXT: stxv vs5, 32(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <16 x i16>, <16 x i16>* %0, align 32			%a = load <16 x i16>, <16 x i16>* %0, align 32
	%1 = sitofp <16 x i16> %a to <16 x double>			%1 = sitofp <16 x i16> %a to <16 x double>
	store <16 x double> %1, <16 x double>* %agg.result, align 128			store <16 x double> %1, <16 x double>* %agg.result, align 128
	ret void			ret void
	}			}

llvm/test/CodeGen/PowerPC/vec_conv_i32_to_fp64_elts.ll

	Show First 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs0, r3, r6			; CHECK-P8-NEXT: stxvd2x vs0, r3, r6
	; CHECK-P8-NEXT: stxvd2x vs3, r3, r5			; CHECK-P8-NEXT: stxvd2x vs3, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs2, 0, r3			; CHECK-P8-NEXT: stxvd2x vs2, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r4)			; CHECK-P9-NEXT: lxv vs1, 0(r4)
	; CHECK-P9-NEXT: xxmrglw v2, vs1, vs1
	; CHECK-P9-NEXT: lxv vs0, 16(r4)			; CHECK-P9-NEXT: lxv vs0, 16(r4)
				; CHECK-P9-NEXT: xxmrglw v2, vs1, vs1
	; CHECK-P9-NEXT: xvcvuxwdp vs2, v2			; CHECK-P9-NEXT: xvcvuxwdp vs2, v2
	; CHECK-P9-NEXT: xxmrghw v2, vs1, vs1			; CHECK-P9-NEXT: xxmrghw v2, vs1, vs1
	; CHECK-P9-NEXT: xvcvuxwdp vs1, v2			; CHECK-P9-NEXT: xvcvuxwdp vs1, v2
	; CHECK-P9-NEXT: xxmrglw v2, vs0, vs0			; CHECK-P9-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-P9-NEXT: xvcvuxwdp vs3, v2			; CHECK-P9-NEXT: xvcvuxwdp vs3, v2
	; CHECK-P9-NEXT: xxmrghw v2, vs0, vs0			; CHECK-P9-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-P9-NEXT: stxv vs2, 0(r3)			; CHECK-P9-NEXT: stxv vs2, 0(r3)
	; CHECK-P9-NEXT: xvcvuxwdp vs0, v2			; CHECK-P9-NEXT: xvcvuxwdp vs0, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: stxv vs3, 32(r3)			; CHECK-P9-NEXT: stxv vs3, 32(r3)
	; CHECK-P9-NEXT: stxv vs0, 48(r3)			; CHECK-P9-NEXT: stxv vs0, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 0(r4)			; CHECK-BE-NEXT: lxv vs1, 0(r4)
	; CHECK-BE-NEXT: xxmrghw v2, vs1, vs1
	; CHECK-BE-NEXT: lxv vs0, 16(r4)			; CHECK-BE-NEXT: lxv vs0, 16(r4)
				; CHECK-BE-NEXT: xxmrghw v2, vs1, vs1
	; CHECK-BE-NEXT: xvcvuxwdp vs2, v2			; CHECK-BE-NEXT: xvcvuxwdp vs2, v2
	; CHECK-BE-NEXT: xxmrglw v2, vs1, vs1			; CHECK-BE-NEXT: xxmrglw v2, vs1, vs1
	; CHECK-BE-NEXT: xvcvuxwdp vs1, v2			; CHECK-BE-NEXT: xvcvuxwdp vs1, v2
	; CHECK-BE-NEXT: xxmrghw v2, vs0, vs0			; CHECK-BE-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-BE-NEXT: xvcvuxwdp vs3, v2			; CHECK-BE-NEXT: xvcvuxwdp vs3, v2
	; CHECK-BE-NEXT: xxmrglw v2, vs0, vs0			; CHECK-BE-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-BE-NEXT: stxv vs2, 0(r3)			; CHECK-BE-NEXT: stxv vs2, 0(r3)
	; CHECK-BE-NEXT: xvcvuxwdp vs0, v2			; CHECK-BE-NEXT: xvcvuxwdp vs0, v2
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs0, r3, r7			; CHECK-P8-NEXT: stxvd2x vs0, r3, r7
	; CHECK-P8-NEXT: stxvd2x vs3, r3, r5			; CHECK-P8-NEXT: stxvd2x vs3, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs5, 0, r3			; CHECK-P8-NEXT: stxvd2x vs5, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs0, 0(r4)			; CHECK-P9-NEXT: lxv vs0, 0(r4)
	; CHECK-P9-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-P9-NEXT: lxv vs2, 16(r4)			; CHECK-P9-NEXT: lxv vs2, 16(r4)
				; CHECK-P9-NEXT: lxv vs5, 32(r4)
	; CHECK-P9-NEXT: lxv vs4, 48(r4)			; CHECK-P9-NEXT: lxv vs4, 48(r4)
				; CHECK-P9-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-P9-NEXT: xvcvuxwdp vs1, v2			; CHECK-P9-NEXT: xvcvuxwdp vs1, v2
	; CHECK-P9-NEXT: xxmrghw v2, vs0, vs0			; CHECK-P9-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-P9-NEXT: lxv vs5, 32(r4)
	; CHECK-P9-NEXT: xvcvuxwdp vs0, v2			; CHECK-P9-NEXT: xvcvuxwdp vs0, v2
	; CHECK-P9-NEXT: xxmrglw v2, vs2, vs2			; CHECK-P9-NEXT: xxmrglw v2, vs2, vs2
	; CHECK-P9-NEXT: xvcvuxwdp vs3, v2			; CHECK-P9-NEXT: xvcvuxwdp vs3, v2
	; CHECK-P9-NEXT: xxmrghw v2, vs2, vs2			; CHECK-P9-NEXT: xxmrghw v2, vs2, vs2
	; CHECK-P9-NEXT: stxv vs1, 0(r3)			; CHECK-P9-NEXT: stxv vs1, 0(r3)
	; CHECK-P9-NEXT: stxv vs0, 16(r3)			; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: xvcvuxwdp vs2, v2			; CHECK-P9-NEXT: xvcvuxwdp vs2, v2
	; CHECK-P9-NEXT: xxmrglw v2, vs5, vs5			; CHECK-P9-NEXT: xxmrglw v2, vs5, vs5
	Show All 10 Lines
	; CHECK-P9-NEXT: xvcvuxwdp vs4, v2			; CHECK-P9-NEXT: xvcvuxwdp vs4, v2
	; CHECK-P9-NEXT: stxv vs7, 96(r3)			; CHECK-P9-NEXT: stxv vs7, 96(r3)
	; CHECK-P9-NEXT: stxv vs4, 112(r3)			; CHECK-P9-NEXT: stxv vs4, 112(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs0, 0(r4)			; CHECK-BE-NEXT: lxv vs0, 0(r4)
	; CHECK-BE-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-BE-NEXT: lxv vs2, 16(r4)			; CHECK-BE-NEXT: lxv vs2, 16(r4)
				; CHECK-BE-NEXT: lxv vs5, 32(r4)
	; CHECK-BE-NEXT: lxv vs4, 48(r4)			; CHECK-BE-NEXT: lxv vs4, 48(r4)
				; CHECK-BE-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-BE-NEXT: xvcvuxwdp vs1, v2			; CHECK-BE-NEXT: xvcvuxwdp vs1, v2
	; CHECK-BE-NEXT: xxmrglw v2, vs0, vs0			; CHECK-BE-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-BE-NEXT: lxv vs5, 32(r4)
	; CHECK-BE-NEXT: xvcvuxwdp vs0, v2			; CHECK-BE-NEXT: xvcvuxwdp vs0, v2
	; CHECK-BE-NEXT: xxmrghw v2, vs2, vs2			; CHECK-BE-NEXT: xxmrghw v2, vs2, vs2
	; CHECK-BE-NEXT: xvcvuxwdp vs3, v2			; CHECK-BE-NEXT: xvcvuxwdp vs3, v2
	; CHECK-BE-NEXT: xxmrglw v2, vs2, vs2			; CHECK-BE-NEXT: xxmrglw v2, vs2, vs2
	; CHECK-BE-NEXT: stxv vs1, 0(r3)			; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: xvcvuxwdp vs2, v2			; CHECK-BE-NEXT: xvcvuxwdp vs2, v2
	; CHECK-BE-NEXT: xxmrghw v2, vs5, vs5			; CHECK-BE-NEXT: xxmrghw v2, vs5, vs5
	▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs0, r3, r6			; CHECK-P8-NEXT: stxvd2x vs0, r3, r6
	; CHECK-P8-NEXT: stxvd2x vs3, r3, r5			; CHECK-P8-NEXT: stxvd2x vs3, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs2, 0, r3			; CHECK-P8-NEXT: stxvd2x vs2, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs1, 0(r4)			; CHECK-P9-NEXT: lxv vs1, 0(r4)
	; CHECK-P9-NEXT: xxmrglw v2, vs1, vs1
	; CHECK-P9-NEXT: lxv vs0, 16(r4)			; CHECK-P9-NEXT: lxv vs0, 16(r4)
				; CHECK-P9-NEXT: xxmrglw v2, vs1, vs1
	; CHECK-P9-NEXT: xvcvsxwdp vs2, v2			; CHECK-P9-NEXT: xvcvsxwdp vs2, v2
	; CHECK-P9-NEXT: xxmrghw v2, vs1, vs1			; CHECK-P9-NEXT: xxmrghw v2, vs1, vs1
	; CHECK-P9-NEXT: xvcvsxwdp vs1, v2			; CHECK-P9-NEXT: xvcvsxwdp vs1, v2
	; CHECK-P9-NEXT: xxmrglw v2, vs0, vs0			; CHECK-P9-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-P9-NEXT: xvcvsxwdp vs3, v2			; CHECK-P9-NEXT: xvcvsxwdp vs3, v2
	; CHECK-P9-NEXT: xxmrghw v2, vs0, vs0			; CHECK-P9-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-P9-NEXT: stxv vs2, 0(r3)			; CHECK-P9-NEXT: stxv vs2, 0(r3)
	; CHECK-P9-NEXT: xvcvsxwdp vs0, v2			; CHECK-P9-NEXT: xvcvsxwdp vs0, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: stxv vs3, 32(r3)			; CHECK-P9-NEXT: stxv vs3, 32(r3)
	; CHECK-P9-NEXT: stxv vs0, 48(r3)			; CHECK-P9-NEXT: stxv vs0, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs1, 0(r4)			; CHECK-BE-NEXT: lxv vs1, 0(r4)
	; CHECK-BE-NEXT: xxmrghw v2, vs1, vs1
	; CHECK-BE-NEXT: lxv vs0, 16(r4)			; CHECK-BE-NEXT: lxv vs0, 16(r4)
				; CHECK-BE-NEXT: xxmrghw v2, vs1, vs1
	; CHECK-BE-NEXT: xvcvsxwdp vs2, v2			; CHECK-BE-NEXT: xvcvsxwdp vs2, v2
	; CHECK-BE-NEXT: xxmrglw v2, vs1, vs1			; CHECK-BE-NEXT: xxmrglw v2, vs1, vs1
	; CHECK-BE-NEXT: xvcvsxwdp vs1, v2			; CHECK-BE-NEXT: xvcvsxwdp vs1, v2
	; CHECK-BE-NEXT: xxmrghw v2, vs0, vs0			; CHECK-BE-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-BE-NEXT: xvcvsxwdp vs3, v2			; CHECK-BE-NEXT: xvcvsxwdp vs3, v2
	; CHECK-BE-NEXT: xxmrglw v2, vs0, vs0			; CHECK-BE-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-BE-NEXT: stxv vs2, 0(r3)			; CHECK-BE-NEXT: stxv vs2, 0(r3)
	; CHECK-BE-NEXT: xvcvsxwdp vs0, v2			; CHECK-BE-NEXT: xvcvsxwdp vs0, v2
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs0, r3, r7			; CHECK-P8-NEXT: stxvd2x vs0, r3, r7
	; CHECK-P8-NEXT: stxvd2x vs3, r3, r5			; CHECK-P8-NEXT: stxvd2x vs3, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs5, 0, r3			; CHECK-P8-NEXT: stxvd2x vs5, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv vs0, 0(r4)			; CHECK-P9-NEXT: lxv vs0, 0(r4)
	; CHECK-P9-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-P9-NEXT: lxv vs2, 16(r4)			; CHECK-P9-NEXT: lxv vs2, 16(r4)
				; CHECK-P9-NEXT: lxv vs5, 32(r4)
	; CHECK-P9-NEXT: lxv vs4, 48(r4)			; CHECK-P9-NEXT: lxv vs4, 48(r4)
				; CHECK-P9-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-P9-NEXT: xvcvsxwdp vs1, v2			; CHECK-P9-NEXT: xvcvsxwdp vs1, v2
	; CHECK-P9-NEXT: xxmrghw v2, vs0, vs0			; CHECK-P9-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-P9-NEXT: lxv vs5, 32(r4)
	; CHECK-P9-NEXT: xvcvsxwdp vs0, v2			; CHECK-P9-NEXT: xvcvsxwdp vs0, v2
	; CHECK-P9-NEXT: xxmrglw v2, vs2, vs2			; CHECK-P9-NEXT: xxmrglw v2, vs2, vs2
	; CHECK-P9-NEXT: xvcvsxwdp vs3, v2			; CHECK-P9-NEXT: xvcvsxwdp vs3, v2
	; CHECK-P9-NEXT: xxmrghw v2, vs2, vs2			; CHECK-P9-NEXT: xxmrghw v2, vs2, vs2
	; CHECK-P9-NEXT: stxv vs1, 0(r3)			; CHECK-P9-NEXT: stxv vs1, 0(r3)
	; CHECK-P9-NEXT: stxv vs0, 16(r3)			; CHECK-P9-NEXT: stxv vs0, 16(r3)
	; CHECK-P9-NEXT: xvcvsxwdp vs2, v2			; CHECK-P9-NEXT: xvcvsxwdp vs2, v2
	; CHECK-P9-NEXT: xxmrglw v2, vs5, vs5			; CHECK-P9-NEXT: xxmrglw v2, vs5, vs5
	Show All 10 Lines
	; CHECK-P9-NEXT: xvcvsxwdp vs4, v2			; CHECK-P9-NEXT: xvcvsxwdp vs4, v2
	; CHECK-P9-NEXT: stxv vs7, 96(r3)			; CHECK-P9-NEXT: stxv vs7, 96(r3)
	; CHECK-P9-NEXT: stxv vs4, 112(r3)			; CHECK-P9-NEXT: stxv vs4, 112(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv vs0, 0(r4)			; CHECK-BE-NEXT: lxv vs0, 0(r4)
	; CHECK-BE-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-BE-NEXT: lxv vs2, 16(r4)			; CHECK-BE-NEXT: lxv vs2, 16(r4)
				; CHECK-BE-NEXT: lxv vs5, 32(r4)
	; CHECK-BE-NEXT: lxv vs4, 48(r4)			; CHECK-BE-NEXT: lxv vs4, 48(r4)
				; CHECK-BE-NEXT: xxmrghw v2, vs0, vs0
	; CHECK-BE-NEXT: xvcvsxwdp vs1, v2			; CHECK-BE-NEXT: xvcvsxwdp vs1, v2
	; CHECK-BE-NEXT: xxmrglw v2, vs0, vs0			; CHECK-BE-NEXT: xxmrglw v2, vs0, vs0
	; CHECK-BE-NEXT: lxv vs5, 32(r4)
	; CHECK-BE-NEXT: xvcvsxwdp vs0, v2			; CHECK-BE-NEXT: xvcvsxwdp vs0, v2
	; CHECK-BE-NEXT: xxmrghw v2, vs2, vs2			; CHECK-BE-NEXT: xxmrghw v2, vs2, vs2
	; CHECK-BE-NEXT: xvcvsxwdp vs3, v2			; CHECK-BE-NEXT: xvcvsxwdp vs3, v2
	; CHECK-BE-NEXT: xxmrglw v2, vs2, vs2			; CHECK-BE-NEXT: xxmrglw v2, vs2, vs2
	; CHECK-BE-NEXT: stxv vs1, 0(r3)			; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: xvcvsxwdp vs2, v2			; CHECK-BE-NEXT: xvcvsxwdp vs2, v2
	; CHECK-BE-NEXT: xxmrghw v2, vs5, vs5			; CHECK-BE-NEXT: xxmrghw v2, vs5, vs5
	Show All 20 Lines

llvm/test/CodeGen/PowerPC/vec_conv_i64_to_fp32_elts.ll

	Show First 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: xxsldwi v3, vs1, vs1, 3			; CHECK-P8-NEXT: xxsldwi v3, vs1, vs1, 3
	; CHECK-P8-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-P8-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-P8-NEXT: vpkudum v2, v2, v3			; CHECK-P8-NEXT: vpkudum v2, v2, v3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt:			; CHECK-P9-LABEL: test4elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v3, 0(r3)			; CHECK-P9-NEXT: lxv v3, 0(r3)
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v3
	; CHECK-P9-NEXT: lxv v2, 16(r3)			; CHECK-P9-NEXT: lxv v2, 16(r3)
				; CHECK-P9-NEXT: xvcvuxdsp vs0, v3
	; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v2			; CHECK-P9-NEXT: xvcvuxdsp vs0, v2
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-P9-NEXT: vpkudum v2, v2, v3			; CHECK-P9-NEXT: vpkudum v2, v2, v3
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt:			; CHECK-BE-LABEL: test4elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v3, 16(r3)			; CHECK-BE-NEXT: lxv v3, 16(r3)
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v3
	; CHECK-BE-NEXT: lxv v2, 0(r3)			; CHECK-BE-NEXT: lxv v2, 0(r3)
				; CHECK-BE-NEXT: xvcvuxdsp vs0, v3
	; CHECK-BE-NEXT: xxsldwi v3, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v3, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v2			; CHECK-BE-NEXT: xvcvuxdsp vs0, v2
	; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-BE-NEXT: vpkudum v2, v2, v3			; CHECK-BE-NEXT: vpkudum v2, v2, v3
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <4 x i64>, <4 x i64>* %0, align 32			%a = load <4 x i64>, <4 x i64>* %0, align 32
	%1 = uitofp <4 x i64> %a to <4 x float>			%1 = uitofp <4 x i64> %a to <4 x float>
	Show All 26 Lines
	; CHECK-P8-NEXT: vpkudum v3, v4, v5			; CHECK-P8-NEXT: vpkudum v3, v4, v5
	; CHECK-P8-NEXT: stvx v2, r3, r5			; CHECK-P8-NEXT: stvx v2, r3, r5
	; CHECK-P8-NEXT: stvx v3, 0, r3			; CHECK-P8-NEXT: stvx v3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v5, 0(r4)			; CHECK-P9-NEXT: lxv v5, 0(r4)
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v5
	; CHECK-P9-NEXT: lxv v4, 16(r4)			; CHECK-P9-NEXT: lxv v4, 16(r4)
				; CHECK-P9-NEXT: lxv v3, 32(r4)
				; CHECK-P9-NEXT: lxv v2, 48(r4)
				; CHECK-P9-NEXT: xvcvuxdsp vs0, v5
	; CHECK-P9-NEXT: xxsldwi v5, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v5, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v4			; CHECK-P9-NEXT: xvcvuxdsp vs0, v4
	; CHECK-P9-NEXT: lxv v3, 32(r4)
	; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v3			; CHECK-P9-NEXT: xvcvuxdsp vs0, v3
	; CHECK-P9-NEXT: lxv v2, 48(r4)
	; CHECK-P9-NEXT: vpkudum v3, v4, v5			; CHECK-P9-NEXT: vpkudum v3, v4, v5
	; CHECK-P9-NEXT: stxv v3, 0(r3)			; CHECK-P9-NEXT: stxv v3, 0(r3)
	; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v2			; CHECK-P9-NEXT: xvcvuxdsp vs0, v2
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-P9-NEXT: vpkudum v2, v2, v4			; CHECK-P9-NEXT: vpkudum v2, v2, v4
	; CHECK-P9-NEXT: stxv v2, 16(r3)			; CHECK-P9-NEXT: stxv v2, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v5, 16(r4)			; CHECK-BE-NEXT: lxv v5, 16(r4)
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v5
	; CHECK-BE-NEXT: lxv v4, 0(r4)			; CHECK-BE-NEXT: lxv v4, 0(r4)
				; CHECK-BE-NEXT: lxv v3, 48(r4)
				; CHECK-BE-NEXT: lxv v2, 32(r4)
				; CHECK-BE-NEXT: xvcvuxdsp vs0, v5
	; CHECK-BE-NEXT: xxsldwi v5, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v5, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v4			; CHECK-BE-NEXT: xvcvuxdsp vs0, v4
	; CHECK-BE-NEXT: lxv v3, 48(r4)
	; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v3			; CHECK-BE-NEXT: xvcvuxdsp vs0, v3
	; CHECK-BE-NEXT: lxv v2, 32(r4)
	; CHECK-BE-NEXT: vpkudum v3, v4, v5			; CHECK-BE-NEXT: vpkudum v3, v4, v5
	; CHECK-BE-NEXT: stxv v3, 0(r3)			; CHECK-BE-NEXT: stxv v3, 0(r3)
	; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v2			; CHECK-BE-NEXT: xvcvuxdsp vs0, v2
	; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-BE-NEXT: vpkudum v2, v2, v4			; CHECK-BE-NEXT: vpkudum v2, v2, v4
	; CHECK-BE-NEXT: stxv v2, 16(r3)			; CHECK-BE-NEXT: stxv v2, 16(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v3, r3, r5			; CHECK-P8-NEXT: stvx v3, r3, r5
	; CHECK-P8-NEXT: stvx v4, r3, r6			; CHECK-P8-NEXT: stvx v4, r3, r6
	; CHECK-P8-NEXT: stvx v5, 0, r3			; CHECK-P8-NEXT: stvx v5, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v7, 0(r4)			; CHECK-P9-NEXT: lxv v7, 0(r4)
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v7
	; CHECK-P9-NEXT: lxv v6, 16(r4)			; CHECK-P9-NEXT: lxv v6, 16(r4)
				; CHECK-P9-NEXT: lxv v1, 32(r4)
				; CHECK-P9-NEXT: lxv v0, 48(r4)
				; CHECK-P9-NEXT: xvcvuxdsp vs0, v7
				; CHECK-P9-NEXT: lxv v5, 64(r4)
				; CHECK-P9-NEXT: lxv v4, 80(r4)
				; CHECK-P9-NEXT: lxv v3, 96(r4)
				; CHECK-P9-NEXT: lxv v2, 112(r4)
	; CHECK-P9-NEXT: xxsldwi v7, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v7, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v6			; CHECK-P9-NEXT: xvcvuxdsp vs0, v6
	; CHECK-P9-NEXT: lxv v1, 32(r4)
	; CHECK-P9-NEXT: xxsldwi v6, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v6, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v1			; CHECK-P9-NEXT: xvcvuxdsp vs0, v1
	; CHECK-P9-NEXT: lxv v0, 48(r4)
	; CHECK-P9-NEXT: vpkudum v1, v6, v7			; CHECK-P9-NEXT: vpkudum v1, v6, v7
				; CHECK-P9-NEXT: stxv v1, 0(r3)
	; CHECK-P9-NEXT: xxsldwi v6, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v6, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v0			; CHECK-P9-NEXT: xvcvuxdsp vs0, v0
	; CHECK-P9-NEXT: lxv v5, 64(r4)
	; CHECK-P9-NEXT: stxv v1, 0(r3)
	; CHECK-P9-NEXT: xxsldwi v0, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v0, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v5			; CHECK-P9-NEXT: xvcvuxdsp vs0, v5
	; CHECK-P9-NEXT: lxv v4, 80(r4)
	; CHECK-P9-NEXT: vpkudum v0, v0, v6			; CHECK-P9-NEXT: vpkudum v0, v0, v6
	; CHECK-P9-NEXT: stxv v0, 16(r3)			; CHECK-P9-NEXT: stxv v0, 16(r3)
	; CHECK-P9-NEXT: xxsldwi v5, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v5, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v4			; CHECK-P9-NEXT: xvcvuxdsp vs0, v4
	; CHECK-P9-NEXT: lxv v3, 96(r4)
	; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v3			; CHECK-P9-NEXT: xvcvuxdsp vs0, v3
	; CHECK-P9-NEXT: lxv v2, 112(r4)
	; CHECK-P9-NEXT: vpkudum v4, v4, v5			; CHECK-P9-NEXT: vpkudum v4, v4, v5
	; CHECK-P9-NEXT: stxv v4, 32(r3)			; CHECK-P9-NEXT: stxv v4, 32(r3)
	; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvuxdsp vs0, v2			; CHECK-P9-NEXT: xvcvuxdsp vs0, v2
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-P9-NEXT: vpkudum v2, v2, v3			; CHECK-P9-NEXT: vpkudum v2, v2, v3
	; CHECK-P9-NEXT: stxv v2, 48(r3)			; CHECK-P9-NEXT: stxv v2, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v7, 16(r4)			; CHECK-BE-NEXT: lxv v7, 16(r4)
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v7
	; CHECK-BE-NEXT: lxv v6, 0(r4)			; CHECK-BE-NEXT: lxv v6, 0(r4)
				; CHECK-BE-NEXT: lxv v1, 48(r4)
				; CHECK-BE-NEXT: lxv v0, 32(r4)
				; CHECK-BE-NEXT: xvcvuxdsp vs0, v7
				; CHECK-BE-NEXT: lxv v5, 80(r4)
				; CHECK-BE-NEXT: lxv v4, 64(r4)
				; CHECK-BE-NEXT: lxv v3, 112(r4)
				; CHECK-BE-NEXT: lxv v2, 96(r4)
	; CHECK-BE-NEXT: xxsldwi v7, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v7, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v6			; CHECK-BE-NEXT: xvcvuxdsp vs0, v6
	; CHECK-BE-NEXT: lxv v1, 48(r4)
	; CHECK-BE-NEXT: xxsldwi v6, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v6, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v1			; CHECK-BE-NEXT: xvcvuxdsp vs0, v1
	; CHECK-BE-NEXT: lxv v0, 32(r4)
	; CHECK-BE-NEXT: vpkudum v1, v6, v7			; CHECK-BE-NEXT: vpkudum v1, v6, v7
				; CHECK-BE-NEXT: stxv v1, 0(r3)
	; CHECK-BE-NEXT: xxsldwi v6, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v6, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v0			; CHECK-BE-NEXT: xvcvuxdsp vs0, v0
	; CHECK-BE-NEXT: lxv v5, 80(r4)
	; CHECK-BE-NEXT: stxv v1, 0(r3)
	; CHECK-BE-NEXT: xxsldwi v0, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v0, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v5			; CHECK-BE-NEXT: xvcvuxdsp vs0, v5
	; CHECK-BE-NEXT: lxv v4, 64(r4)
	; CHECK-BE-NEXT: vpkudum v0, v0, v6			; CHECK-BE-NEXT: vpkudum v0, v0, v6
	; CHECK-BE-NEXT: stxv v0, 16(r3)			; CHECK-BE-NEXT: stxv v0, 16(r3)
	; CHECK-BE-NEXT: xxsldwi v5, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v5, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v4			; CHECK-BE-NEXT: xvcvuxdsp vs0, v4
	; CHECK-BE-NEXT: lxv v3, 112(r4)
	; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v3			; CHECK-BE-NEXT: xvcvuxdsp vs0, v3
	; CHECK-BE-NEXT: lxv v2, 96(r4)
	; CHECK-BE-NEXT: vpkudum v4, v4, v5			; CHECK-BE-NEXT: vpkudum v4, v4, v5
	; CHECK-BE-NEXT: stxv v4, 32(r3)			; CHECK-BE-NEXT: stxv v4, 32(r3)
	; CHECK-BE-NEXT: xxsldwi v3, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v3, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvuxdsp vs0, v2			; CHECK-BE-NEXT: xvcvuxdsp vs0, v2
	; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-BE-NEXT: vpkudum v2, v2, v3			; CHECK-BE-NEXT: vpkudum v2, v2, v3
	; CHECK-BE-NEXT: stxv v2, 48(r3)			; CHECK-BE-NEXT: stxv v2, 48(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: xxsldwi v3, vs1, vs1, 3			; CHECK-P8-NEXT: xxsldwi v3, vs1, vs1, 3
	; CHECK-P8-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-P8-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-P8-NEXT: vpkudum v2, v2, v3			; CHECK-P8-NEXT: vpkudum v2, v2, v3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt_signed:			; CHECK-P9-LABEL: test4elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v3, 0(r3)			; CHECK-P9-NEXT: lxv v3, 0(r3)
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v3
	; CHECK-P9-NEXT: lxv v2, 16(r3)			; CHECK-P9-NEXT: lxv v2, 16(r3)
				; CHECK-P9-NEXT: xvcvsxdsp vs0, v3
	; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v2			; CHECK-P9-NEXT: xvcvsxdsp vs0, v2
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-P9-NEXT: vpkudum v2, v2, v3			; CHECK-P9-NEXT: vpkudum v2, v2, v3
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt_signed:			; CHECK-BE-LABEL: test4elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v3, 16(r3)			; CHECK-BE-NEXT: lxv v3, 16(r3)
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v3
	; CHECK-BE-NEXT: lxv v2, 0(r3)			; CHECK-BE-NEXT: lxv v2, 0(r3)
				; CHECK-BE-NEXT: xvcvsxdsp vs0, v3
	; CHECK-BE-NEXT: xxsldwi v3, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v3, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v2			; CHECK-BE-NEXT: xvcvsxdsp vs0, v2
	; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-BE-NEXT: vpkudum v2, v2, v3			; CHECK-BE-NEXT: vpkudum v2, v2, v3
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <4 x i64>, <4 x i64>* %0, align 32			%a = load <4 x i64>, <4 x i64>* %0, align 32
	%1 = sitofp <4 x i64> %a to <4 x float>			%1 = sitofp <4 x i64> %a to <4 x float>
	Show All 26 Lines
	; CHECK-P8-NEXT: vpkudum v3, v4, v5			; CHECK-P8-NEXT: vpkudum v3, v4, v5
	; CHECK-P8-NEXT: stvx v2, r3, r5			; CHECK-P8-NEXT: stvx v2, r3, r5
	; CHECK-P8-NEXT: stvx v3, 0, r3			; CHECK-P8-NEXT: stvx v3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v5, 0(r4)			; CHECK-P9-NEXT: lxv v5, 0(r4)
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v5
	; CHECK-P9-NEXT: lxv v4, 16(r4)			; CHECK-P9-NEXT: lxv v4, 16(r4)
				; CHECK-P9-NEXT: lxv v3, 32(r4)
				; CHECK-P9-NEXT: lxv v2, 48(r4)
				; CHECK-P9-NEXT: xvcvsxdsp vs0, v5
	; CHECK-P9-NEXT: xxsldwi v5, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v5, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v4			; CHECK-P9-NEXT: xvcvsxdsp vs0, v4
	; CHECK-P9-NEXT: lxv v3, 32(r4)
	; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v3			; CHECK-P9-NEXT: xvcvsxdsp vs0, v3
	; CHECK-P9-NEXT: lxv v2, 48(r4)
	; CHECK-P9-NEXT: vpkudum v3, v4, v5			; CHECK-P9-NEXT: vpkudum v3, v4, v5
	; CHECK-P9-NEXT: stxv v3, 0(r3)			; CHECK-P9-NEXT: stxv v3, 0(r3)
	; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v2			; CHECK-P9-NEXT: xvcvsxdsp vs0, v2
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-P9-NEXT: vpkudum v2, v2, v4			; CHECK-P9-NEXT: vpkudum v2, v2, v4
	; CHECK-P9-NEXT: stxv v2, 16(r3)			; CHECK-P9-NEXT: stxv v2, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v5, 16(r4)			; CHECK-BE-NEXT: lxv v5, 16(r4)
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v5
	; CHECK-BE-NEXT: lxv v4, 0(r4)			; CHECK-BE-NEXT: lxv v4, 0(r4)
				; CHECK-BE-NEXT: lxv v3, 48(r4)
				; CHECK-BE-NEXT: lxv v2, 32(r4)
				; CHECK-BE-NEXT: xvcvsxdsp vs0, v5
	; CHECK-BE-NEXT: xxsldwi v5, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v5, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v4			; CHECK-BE-NEXT: xvcvsxdsp vs0, v4
	; CHECK-BE-NEXT: lxv v3, 48(r4)
	; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v3			; CHECK-BE-NEXT: xvcvsxdsp vs0, v3
	; CHECK-BE-NEXT: lxv v2, 32(r4)
	; CHECK-BE-NEXT: vpkudum v3, v4, v5			; CHECK-BE-NEXT: vpkudum v3, v4, v5
	; CHECK-BE-NEXT: stxv v3, 0(r3)			; CHECK-BE-NEXT: stxv v3, 0(r3)
	; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v2			; CHECK-BE-NEXT: xvcvsxdsp vs0, v2
	; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-BE-NEXT: vpkudum v2, v2, v4			; CHECK-BE-NEXT: vpkudum v2, v2, v4
	; CHECK-BE-NEXT: stxv v2, 16(r3)			; CHECK-BE-NEXT: stxv v2, 16(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v3, r3, r5			; CHECK-P8-NEXT: stvx v3, r3, r5
	; CHECK-P8-NEXT: stvx v4, r3, r6			; CHECK-P8-NEXT: stvx v4, r3, r6
	; CHECK-P8-NEXT: stvx v5, 0, r3			; CHECK-P8-NEXT: stvx v5, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt_signed:			; CHECK-P9-LABEL: test16elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: lxv v7, 0(r4)			; CHECK-P9-NEXT: lxv v7, 0(r4)
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v7
	; CHECK-P9-NEXT: lxv v6, 16(r4)			; CHECK-P9-NEXT: lxv v6, 16(r4)
				; CHECK-P9-NEXT: lxv v1, 32(r4)
				; CHECK-P9-NEXT: lxv v0, 48(r4)
				; CHECK-P9-NEXT: xvcvsxdsp vs0, v7
				; CHECK-P9-NEXT: lxv v5, 64(r4)
				; CHECK-P9-NEXT: lxv v4, 80(r4)
				; CHECK-P9-NEXT: lxv v3, 96(r4)
				; CHECK-P9-NEXT: lxv v2, 112(r4)
	; CHECK-P9-NEXT: xxsldwi v7, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v7, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v6			; CHECK-P9-NEXT: xvcvsxdsp vs0, v6
	; CHECK-P9-NEXT: lxv v1, 32(r4)
	; CHECK-P9-NEXT: xxsldwi v6, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v6, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v1			; CHECK-P9-NEXT: xvcvsxdsp vs0, v1
	; CHECK-P9-NEXT: lxv v0, 48(r4)
	; CHECK-P9-NEXT: vpkudum v1, v6, v7			; CHECK-P9-NEXT: vpkudum v1, v6, v7
				; CHECK-P9-NEXT: stxv v1, 0(r3)
	; CHECK-P9-NEXT: xxsldwi v6, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v6, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v0			; CHECK-P9-NEXT: xvcvsxdsp vs0, v0
	; CHECK-P9-NEXT: lxv v5, 64(r4)
	; CHECK-P9-NEXT: stxv v1, 0(r3)
	; CHECK-P9-NEXT: xxsldwi v0, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v0, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v5			; CHECK-P9-NEXT: xvcvsxdsp vs0, v5
	; CHECK-P9-NEXT: lxv v4, 80(r4)
	; CHECK-P9-NEXT: vpkudum v0, v0, v6			; CHECK-P9-NEXT: vpkudum v0, v0, v6
	; CHECK-P9-NEXT: stxv v0, 16(r3)			; CHECK-P9-NEXT: stxv v0, 16(r3)
	; CHECK-P9-NEXT: xxsldwi v5, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v5, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v4			; CHECK-P9-NEXT: xvcvsxdsp vs0, v4
	; CHECK-P9-NEXT: lxv v3, 96(r4)
	; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v3			; CHECK-P9-NEXT: xvcvsxdsp vs0, v3
	; CHECK-P9-NEXT: lxv v2, 112(r4)
	; CHECK-P9-NEXT: vpkudum v4, v4, v5			; CHECK-P9-NEXT: vpkudum v4, v4, v5
	; CHECK-P9-NEXT: stxv v4, 32(r3)			; CHECK-P9-NEXT: stxv v4, 32(r3)
	; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 3
	; CHECK-P9-NEXT: xvcvsxdsp vs0, v2			; CHECK-P9-NEXT: xvcvsxdsp vs0, v2
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-P9-NEXT: vpkudum v2, v2, v3			; CHECK-P9-NEXT: vpkudum v2, v2, v3
	; CHECK-P9-NEXT: stxv v2, 48(r3)			; CHECK-P9-NEXT: stxv v2, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: lxv v7, 16(r4)			; CHECK-BE-NEXT: lxv v7, 16(r4)
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v7
	; CHECK-BE-NEXT: lxv v6, 0(r4)			; CHECK-BE-NEXT: lxv v6, 0(r4)
				; CHECK-BE-NEXT: lxv v1, 48(r4)
				; CHECK-BE-NEXT: lxv v0, 32(r4)
				; CHECK-BE-NEXT: xvcvsxdsp vs0, v7
				; CHECK-BE-NEXT: lxv v5, 80(r4)
				; CHECK-BE-NEXT: lxv v4, 64(r4)
				; CHECK-BE-NEXT: lxv v3, 112(r4)
				; CHECK-BE-NEXT: lxv v2, 96(r4)
	; CHECK-BE-NEXT: xxsldwi v7, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v7, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v6			; CHECK-BE-NEXT: xvcvsxdsp vs0, v6
	; CHECK-BE-NEXT: lxv v1, 48(r4)
	; CHECK-BE-NEXT: xxsldwi v6, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v6, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v1			; CHECK-BE-NEXT: xvcvsxdsp vs0, v1
	; CHECK-BE-NEXT: lxv v0, 32(r4)
	; CHECK-BE-NEXT: vpkudum v1, v6, v7			; CHECK-BE-NEXT: vpkudum v1, v6, v7
				; CHECK-BE-NEXT: stxv v1, 0(r3)
	; CHECK-BE-NEXT: xxsldwi v6, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v6, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v0			; CHECK-BE-NEXT: xvcvsxdsp vs0, v0
	; CHECK-BE-NEXT: lxv v5, 80(r4)
	; CHECK-BE-NEXT: stxv v1, 0(r3)
	; CHECK-BE-NEXT: xxsldwi v0, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v0, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v5			; CHECK-BE-NEXT: xvcvsxdsp vs0, v5
	; CHECK-BE-NEXT: lxv v4, 64(r4)
	; CHECK-BE-NEXT: vpkudum v0, v0, v6			; CHECK-BE-NEXT: vpkudum v0, v0, v6
	; CHECK-BE-NEXT: stxv v0, 16(r3)			; CHECK-BE-NEXT: stxv v0, 16(r3)
	; CHECK-BE-NEXT: xxsldwi v5, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v5, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v4			; CHECK-BE-NEXT: xvcvsxdsp vs0, v4
	; CHECK-BE-NEXT: lxv v3, 112(r4)
	; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v4, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v3			; CHECK-BE-NEXT: xvcvsxdsp vs0, v3
	; CHECK-BE-NEXT: lxv v2, 96(r4)
	; CHECK-BE-NEXT: vpkudum v4, v4, v5			; CHECK-BE-NEXT: vpkudum v4, v4, v5
	; CHECK-BE-NEXT: stxv v4, 32(r3)			; CHECK-BE-NEXT: stxv v4, 32(r3)
	; CHECK-BE-NEXT: xxsldwi v3, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v3, vs0, vs0, 3
	; CHECK-BE-NEXT: xvcvsxdsp vs0, v2			; CHECK-BE-NEXT: xvcvsxdsp vs0, v2
	; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3			; CHECK-BE-NEXT: xxsldwi v2, vs0, vs0, 3
	; CHECK-BE-NEXT: vpkudum v2, v2, v3			; CHECK-BE-NEXT: vpkudum v2, v2, v3
	; CHECK-BE-NEXT: stxv v2, 48(r3)			; CHECK-BE-NEXT: stxv v2, 48(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%a = load <16 x i64>, <16 x i64>* %0, align 128			%a = load <16 x i64>, <16 x i64>* %0, align 128
	%1 = sitofp <16 x i64> %a to <16 x float>			%1 = sitofp <16 x i64> %a to <16 x float>
	store <16 x float> %1, <16 x float>* %agg.result, align 64			store <16 x float> %1, <16 x float>* %agg.result, align 64
	ret void			ret void
	}			}

llvm/test/CodeGen/PowerPC/vec_conv_i8_to_fp32_elts.ll

	Show All 34 Lines
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrws v2, r3			; CHECK-P9-NEXT: mtvsrws v2, r3
	; CHECK-P9-NEXT: li r3, 0			; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: vextubrx r3, r3, v2			; CHECK-P9-NEXT: vextubrx r3, r3, v2
	; CHECK-P9-NEXT: rlwinm r3, r3, 0, 24, 31			; CHECK-P9-NEXT: rlwinm r3, r3, 0, 24, 31
	; CHECK-P9-NEXT: mtfprwz f0, r3			; CHECK-P9-NEXT: mtfprwz f0, r3
	; CHECK-P9-NEXT: li r3, 1			; CHECK-P9-NEXT: li r3, 1
	; CHECK-P9-NEXT: xscvuxdsp f0, f0			; CHECK-P9-NEXT: xscvuxdsp f0, f0
	; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: vextubrx r3, r3, v2			; CHECK-P9-NEXT: vextubrx r3, r3, v2
	; CHECK-P9-NEXT: rlwinm r3, r3, 0, 24, 31			; CHECK-P9-NEXT: rlwinm r3, r3, 0, 24, 31
				; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 1
	; CHECK-P9-NEXT: mtfprwz f0, r3			; CHECK-P9-NEXT: mtfprwz f0, r3
	; CHECK-P9-NEXT: xscvuxdsp f0, f0			; CHECK-P9-NEXT: xscvuxdsp f0, f0
	; CHECK-P9-NEXT: xscvdpspn vs0, f0			; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 1
	; CHECK-P9-NEXT: vmrglw v2, v2, v3			; CHECK-P9-NEXT: vmrglw v2, v2, v3
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	Show All 35 Lines
	; CHECK-P8-NEXT: vperm v2, v4, v2, v3			; CHECK-P8-NEXT: vperm v2, v4, v2, v3
	; CHECK-P8-NEXT: xvcvuxwsp v2, v2			; CHECK-P8-NEXT: xvcvuxwsp v2, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt:			; CHECK-P9-LABEL: test4elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrws v2, r3			; CHECK-P9-NEXT: mtvsrws v2, r3
	; CHECK-P9-NEXT: addis r3, r2, .LCPI1_0@toc@ha			; CHECK-P9-NEXT: addis r3, r2, .LCPI1_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addi r3, r3, .LCPI1_0@toc@l			; CHECK-P9-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r3			; CHECK-P9-NEXT: lxvx v3, 0, r3
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: vperm v2, v4, v2, v3			; CHECK-P9-NEXT: vperm v2, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxwsp v2, v2			; CHECK-P9-NEXT: xvcvuxwsp v2, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt:			; CHECK-BE-LABEL: test4elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrws v2, r3			; CHECK-BE-NEXT: mtvsrws v2, r3
	; CHECK-BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha			; CHECK-BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r3, r3, .LCPI1_0@toc@l			; CHECK-BE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r3			; CHECK-BE-NEXT: lxvx v3, 0, r3
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: vperm v2, v2, v4, v3			; CHECK-BE-NEXT: vperm v2, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxwsp v2, v2			; CHECK-BE-NEXT: xvcvuxwsp v2, v2
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%0 = bitcast i32 %a.coerce to <4 x i8>			%0 = bitcast i32 %a.coerce to <4 x i8>
	%1 = uitofp <4 x i8> %0 to <4 x float>			%1 = uitofp <4 x i8> %0 to <4 x float>
	ret <4 x float> %1			ret <4 x float> %1
	}			}
	Show All 18 Lines
	; CHECK-P8-NEXT: stvx v2, 0, r3			; CHECK-P8-NEXT: stvx v2, 0, r3
	; CHECK-P8-NEXT: stvx v3, r3, r4			; CHECK-P8-NEXT: stvx v3, r3, r4
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
				; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_1@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxwsp vs0, v3			; CHECK-P9-NEXT: xvcvuxwsp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: vperm v2, v4, v2, v3			; CHECK-P9-NEXT: vperm v2, v4, v2, v3
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: xvcvuxwsp vs1, v2			; CHECK-P9-NEXT: xvcvuxwsp vs1, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_1@toc@l
	; CHECK-BE-NEXT: vperm v3, v2, v4, v3			; CHECK-BE-NEXT: vperm v3, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxwsp vs0, v3			; CHECK-BE-NEXT: xvcvuxwsp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: vperm v2, v4, v2, v3			; CHECK-BE-NEXT: vperm v2, v4, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 0(r3)			; CHECK-BE-NEXT: stxv vs0, 0(r3)
	; CHECK-BE-NEXT: xvcvuxwsp vs1, v2			; CHECK-BE-NEXT: xvcvuxwsp vs1, v2
	Show All 37 Lines
	; CHECK-P8-NEXT: stvx v5, r3, r4			; CHECK-P8-NEXT: stvx v5, r3, r4
	; CHECK-P8-NEXT: li r4, 16			; CHECK-P8-NEXT: li r4, 16
	; CHECK-P8-NEXT: stvx v2, r3, r4			; CHECK-P8-NEXT: stvx v2, r3, r4
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_1@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxwsp vs0, v3			; CHECK-P9-NEXT: xvcvuxwsp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_2@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_2@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_2@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_2@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	Show All 10 Lines
	; CHECK-P9-NEXT: stxv vs2, 32(r3)			; CHECK-P9-NEXT: stxv vs2, 32(r3)
	; CHECK-P9-NEXT: xvcvuxwsp vs3, v2			; CHECK-P9-NEXT: xvcvuxwsp vs3, v2
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_1@toc@l
	; CHECK-BE-NEXT: vperm v3, v2, v4, v3			; CHECK-BE-NEXT: vperm v3, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxwsp vs0, v3			; CHECK-BE-NEXT: xvcvuxwsp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_2@toc@l
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3			; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrws v2, r3			; CHECK-P9-NEXT: mtvsrws v2, r3
	; CHECK-P9-NEXT: li r3, 0			; CHECK-P9-NEXT: li r3, 0
	; CHECK-P9-NEXT: vextubrx r3, r3, v2			; CHECK-P9-NEXT: vextubrx r3, r3, v2
	; CHECK-P9-NEXT: extsb r3, r3			; CHECK-P9-NEXT: extsb r3, r3
	; CHECK-P9-NEXT: mtfprwa f0, r3			; CHECK-P9-NEXT: mtfprwa f0, r3
	; CHECK-P9-NEXT: li r3, 1			; CHECK-P9-NEXT: li r3, 1
	; CHECK-P9-NEXT: xscvsxdsp f0, f0			; CHECK-P9-NEXT: xscvsxdsp f0, f0
	; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: vextubrx r3, r3, v2			; CHECK-P9-NEXT: vextubrx r3, r3, v2
	; CHECK-P9-NEXT: extsb r3, r3			; CHECK-P9-NEXT: extsb r3, r3
				; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi v3, vs0, vs0, 1
	; CHECK-P9-NEXT: mtfprwa f0, r3			; CHECK-P9-NEXT: mtfprwa f0, r3
	; CHECK-P9-NEXT: xscvsxdsp f0, f0			; CHECK-P9-NEXT: xscvsxdsp f0, f0
	; CHECK-P9-NEXT: xscvdpspn vs0, f0			; CHECK-P9-NEXT: xscvdpspn vs0, f0
	; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 1			; CHECK-P9-NEXT: xxsldwi v2, vs0, vs0, 1
	; CHECK-P9-NEXT: vmrglw v2, v2, v3			; CHECK-P9-NEXT: vmrglw v2, v2, v3
	; CHECK-P9-NEXT: mfvsrld r3, v2			; CHECK-P9-NEXT: mfvsrld r3, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stvx v3, r3, r4			; CHECK-P8-NEXT: stvx v3, r3, r4
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI6_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI6_0@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI6_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI6_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: vperm v3, v2, v2, v3			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI6_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI6_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI6_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI6_1@toc@l
				; CHECK-P9-NEXT: vperm v3, v2, v2, v3
	; CHECK-P9-NEXT: vextsb2w v3, v3			; CHECK-P9-NEXT: vextsb2w v3, v3
	; CHECK-P9-NEXT: xvcvsxwsp vs0, v3			; CHECK-P9-NEXT: xvcvsxwsp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: vperm v2, v2, v2, v3			; CHECK-P9-NEXT: vperm v2, v2, v2, v3
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: vextsb2w v2, v2			; CHECK-P9-NEXT: vextsb2w v2, v2
	; CHECK-P9-NEXT: xvcvsxwsp vs1, v2			; CHECK-P9-NEXT: xvcvsxwsp vs1, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v3, v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_0@toc@l
	; CHECK-BE-NEXT: lxvx v4, 0, r4			; CHECK-BE-NEXT: lxvx v4, 0, r4
	; CHECK-BE-NEXT: xxlxor v3, v3, v3
	; CHECK-BE-NEXT: vperm v3, v3, v2, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_1@toc@ha
	; CHECK-BE-NEXT: vextsb2w v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_1@toc@l
				; CHECK-BE-NEXT: vperm v3, v3, v2, v4
				; CHECK-BE-NEXT: vextsb2w v3, v3
	; CHECK-BE-NEXT: xvcvsxwsp vs0, v3			; CHECK-BE-NEXT: xvcvsxwsp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: vextsb2w v2, v2			; CHECK-BE-NEXT: vextsb2w v2, v2
	; CHECK-BE-NEXT: xvcvsxwsp vs1, v2			; CHECK-BE-NEXT: xvcvsxwsp vs1, v2
	; CHECK-BE-NEXT: stxv vs1, 0(r3)			; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: vextsb2w v2, v2			; CHECK-P9-NEXT: vextsb2w v2, v2
	; CHECK-P9-NEXT: xvcvsxwsp vs3, v2			; CHECK-P9-NEXT: xvcvsxwsp vs3, v2
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI7_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI7_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI7_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI7_1@toc@l
				; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: vextsb2w v3, v3			; CHECK-BE-NEXT: vextsb2w v3, v3
	; CHECK-BE-NEXT: xvcvsxwsp vs0, v3			; CHECK-BE-NEXT: xvcvsxwsp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI7_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI7_2@toc@l
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3			; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: vextsb2w v3, v3			; CHECK-BE-NEXT: vextsb2w v3, v3
	Show All 20 Lines

llvm/test/CodeGen/PowerPC/vec_conv_i8_to_fp64_elts.ll

	Show All 20 Lines
	; CHECK-P8-NEXT: vperm v2, v4, v2, v3			; CHECK-P8-NEXT: vperm v2, v4, v2, v3
	; CHECK-P8-NEXT: xvcvuxddp v2, v2			; CHECK-P8-NEXT: xvcvuxddp v2, v2
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test2elt:			; CHECK-P9-LABEL: test2elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrws v2, r3			; CHECK-P9-NEXT: mtvsrws v2, r3
	; CHECK-P9-NEXT: addis r3, r2, .LCPI0_0@toc@ha			; CHECK-P9-NEXT: addis r3, r2, .LCPI0_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addi r3, r3, .LCPI0_0@toc@l			; CHECK-P9-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r3			; CHECK-P9-NEXT: lxvx v3, 0, r3
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: vperm v2, v4, v2, v3			; CHECK-P9-NEXT: vperm v2, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxddp v2, v2			; CHECK-P9-NEXT: xvcvuxddp v2, v2
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test2elt:			; CHECK-BE-LABEL: test2elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrws v2, r3			; CHECK-BE-NEXT: mtvsrws v2, r3
	; CHECK-BE-NEXT: addis r3, r2, .LCPI0_0@toc@ha			; CHECK-BE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r3, r3, .LCPI0_0@toc@l			; CHECK-BE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r3			; CHECK-BE-NEXT: lxvx v3, 0, r3
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: vperm v2, v2, v4, v3			; CHECK-BE-NEXT: vperm v2, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxddp v2, v2			; CHECK-BE-NEXT: xvcvuxddp v2, v2
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	entry:			entry:
	%0 = bitcast i16 %a.coerce to <2 x i8>			%0 = bitcast i16 %a.coerce to <2 x i8>
	%1 = uitofp <2 x i8> %0 to <2 x double>			%1 = uitofp <2 x i8> %0 to <2 x double>
	ret <2 x double> %1			ret <2 x double> %1
	}			}
	Show All 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs1, r3, r4			; CHECK-P8-NEXT: stxvd2x vs1, r3, r4
	; CHECK-P8-NEXT: stxvd2x vs0, 0, r3			; CHECK-P8-NEXT: stxvd2x vs0, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test4elt:			; CHECK-P9-LABEL: test4elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrws v2, r4			; CHECK-P9-NEXT: mtvsrws v2, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI1_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI1_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addi r4, r4, .LCPI1_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI1_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI1_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI1_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI1_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI1_1@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxddp vs0, v3			; CHECK-P9-NEXT: xvcvuxddp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: vperm v2, v4, v2, v3			; CHECK-P9-NEXT: vperm v2, v4, v2, v3
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: xvcvuxddp vs1, v2			; CHECK-P9-NEXT: xvcvuxddp vs1, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt:			; CHECK-BE-LABEL: test4elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrws v2, r4			; CHECK-BE-NEXT: mtvsrws v2, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI1_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI1_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI1_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI1_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI1_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI1_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI1_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI1_1@toc@l
	; CHECK-BE-NEXT: vperm v3, v2, v4, v3			; CHECK-BE-NEXT: vperm v3, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxddp vs0, v3			; CHECK-BE-NEXT: xvcvuxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: vperm v2, v4, v2, v3			; CHECK-BE-NEXT: vperm v2, v4, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 0(r3)			; CHECK-BE-NEXT: stxv vs0, 0(r3)
	; CHECK-BE-NEXT: xvcvuxddp vs1, v2			; CHECK-BE-NEXT: xvcvuxddp vs1, v2
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs3, r3, r4			; CHECK-P8-NEXT: stxvd2x vs3, r3, r4
	; CHECK-P8-NEXT: stxvd2x vs0, 0, r3			; CHECK-P8-NEXT: stxvd2x vs0, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt:			; CHECK-P9-LABEL: test8elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
				; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_1@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxddp vs0, v3			; CHECK-P9-NEXT: xvcvuxddp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI2_2@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI2_2@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI2_2@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI2_2@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	Show All 11 Lines
	; CHECK-P9-NEXT: xvcvuxddp vs3, v2			; CHECK-P9-NEXT: xvcvuxddp vs3, v2
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt:			; CHECK-BE-LABEL: test8elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_1@toc@l
	; CHECK-BE-NEXT: vperm v3, v2, v4, v3			; CHECK-BE-NEXT: vperm v3, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxddp vs0, v3			; CHECK-BE-NEXT: xvcvuxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI2_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI2_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI2_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI2_2@toc@l
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3			; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs0, r3, r5			; CHECK-P8-NEXT: stxvd2x vs0, r3, r5
	; CHECK-P8-NEXT: stxvd2x vs2, r3, r4			; CHECK-P8-NEXT: stxvd2x vs2, r3, r4
	; CHECK-P8-NEXT: stxvd2x vs3, 0, r3			; CHECK-P8-NEXT: stxvd2x vs3, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test16elt:			; CHECK-P9-LABEL: test16elt:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_0@toc@ha
				; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxlxor v4, v4, v4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_1@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	; CHECK-P9-NEXT: xvcvuxddp vs0, v3			; CHECK-P9-NEXT: xvcvuxddp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI3_2@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI3_2@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI3_2@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI3_2@toc@l
	; CHECK-P9-NEXT: vperm v3, v4, v2, v3			; CHECK-P9-NEXT: vperm v3, v4, v2, v3
	Show All 34 Lines
	; CHECK-P9-NEXT: stxv vs6, 96(r3)			; CHECK-P9-NEXT: stxv vs6, 96(r3)
	; CHECK-P9-NEXT: xvcvuxddp vs7, v2			; CHECK-P9-NEXT: xvcvuxddp vs7, v2
	; CHECK-P9-NEXT: stxv vs7, 112(r3)			; CHECK-P9-NEXT: stxv vs7, 112(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt:			; CHECK-BE-LABEL: test16elt:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_1@toc@l
	; CHECK-BE-NEXT: vperm v3, v2, v4, v3			; CHECK-BE-NEXT: vperm v3, v2, v4, v3
	; CHECK-BE-NEXT: xvcvuxddp vs0, v3			; CHECK-BE-NEXT: xvcvuxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI3_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI3_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI3_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI3_2@toc@l
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3			; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	▲ Show 20 Lines • Show All 134 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: xvcvsxddp vs1, v2			; CHECK-P9-NEXT: xvcvsxddp vs1, v2
	; CHECK-P9-NEXT: stxv vs1, 16(r3)			; CHECK-P9-NEXT: stxv vs1, 16(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test4elt_signed:			; CHECK-BE-LABEL: test4elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrws v2, r4			; CHECK-BE-NEXT: mtvsrws v2, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI5_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI5_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v3, v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI5_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI5_0@toc@l
	; CHECK-BE-NEXT: lxvx v4, 0, r4			; CHECK-BE-NEXT: lxvx v4, 0, r4
	; CHECK-BE-NEXT: xxlxor v3, v3, v3
	; CHECK-BE-NEXT: vperm v3, v3, v2, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI5_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI5_1@toc@ha
	; CHECK-BE-NEXT: vextsb2d v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI5_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI5_1@toc@l
				; CHECK-BE-NEXT: vperm v3, v3, v2, v4
				; CHECK-BE-NEXT: vextsb2d v3, v3
	; CHECK-BE-NEXT: xvcvsxddp vs0, v3			; CHECK-BE-NEXT: xvcvsxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: vperm v2, v2, v2, v3			; CHECK-BE-NEXT: vperm v2, v2, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: vextsb2d v2, v2			; CHECK-BE-NEXT: vextsb2d v2, v2
	; CHECK-BE-NEXT: xvcvsxddp vs1, v2			; CHECK-BE-NEXT: xvcvsxddp vs1, v2
	; CHECK-BE-NEXT: stxv vs1, 0(r3)			; CHECK-BE-NEXT: stxv vs1, 0(r3)
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: stxvd2x vs0, 0, r3			; CHECK-P8-NEXT: stxvd2x vs0, 0, r3
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test8elt_signed:			; CHECK-P9-LABEL: test8elt_signed:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: mtvsrd f0, r4			; CHECK-P9-NEXT: mtvsrd f0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI6_0@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI6_0@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI6_0@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI6_0@toc@l
	; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: xxswapd v2, vs0			; CHECK-P9-NEXT: xxswapd v2, vs0
	; CHECK-P9-NEXT: vperm v3, v2, v2, v3			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI6_1@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI6_1@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI6_1@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI6_1@toc@l
				; CHECK-P9-NEXT: vperm v3, v2, v2, v3
	; CHECK-P9-NEXT: vextsb2d v3, v3			; CHECK-P9-NEXT: vextsb2d v3, v3
	; CHECK-P9-NEXT: xvcvsxddp vs0, v3			; CHECK-P9-NEXT: xvcvsxddp vs0, v3
	; CHECK-P9-NEXT: lxvx v3, 0, r4			; CHECK-P9-NEXT: lxvx v3, 0, r4
	; CHECK-P9-NEXT: addis r4, r2, .LCPI6_2@toc@ha			; CHECK-P9-NEXT: addis r4, r2, .LCPI6_2@toc@ha
	; CHECK-P9-NEXT: addi r4, r4, .LCPI6_2@toc@l			; CHECK-P9-NEXT: addi r4, r4, .LCPI6_2@toc@l
	; CHECK-P9-NEXT: vperm v3, v2, v2, v3			; CHECK-P9-NEXT: vperm v3, v2, v2, v3
	; CHECK-P9-NEXT: stxv vs0, 0(r3)			; CHECK-P9-NEXT: stxv vs0, 0(r3)
	; CHECK-P9-NEXT: vextsb2d v3, v3			; CHECK-P9-NEXT: vextsb2d v3, v3
	Show All 12 Lines
	; CHECK-P9-NEXT: xvcvsxddp vs3, v2			; CHECK-P9-NEXT: xvcvsxddp vs3, v2
	; CHECK-P9-NEXT: stxv vs3, 48(r3)			; CHECK-P9-NEXT: stxv vs3, 48(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test8elt_signed:			; CHECK-BE-LABEL: test8elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: mtvsrd v2, r4			; CHECK-BE-NEXT: mtvsrd v2, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_0@toc@l
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: xxlxor v4, v4, v4
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_1@toc@ha
	; CHECK-BE-NEXT: vextsb2d v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_1@toc@l
				; CHECK-BE-NEXT: vperm v3, v4, v2, v3
				; CHECK-BE-NEXT: vextsb2d v3, v3
	; CHECK-BE-NEXT: xvcvsxddp vs0, v3			; CHECK-BE-NEXT: xvcvsxddp vs0, v3
	; CHECK-BE-NEXT: lxvx v3, 0, r4			; CHECK-BE-NEXT: lxvx v3, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI6_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI6_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI6_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI6_2@toc@l
	; CHECK-BE-NEXT: vperm v3, v4, v2, v3			; CHECK-BE-NEXT: vperm v3, v4, v2, v3
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: vextsb2d v3, v3			; CHECK-BE-NEXT: vextsb2d v3, v3
	; CHECK-BE-NEXT: xvcvsxddp vs1, v3			; CHECK-BE-NEXT: xvcvsxddp vs1, v3
	▲ Show 20 Lines • Show All 164 Lines • ▼ Show 20 Lines
	; CHECK-P9-NEXT: vextsb2d v2, v2			; CHECK-P9-NEXT: vextsb2d v2, v2
	; CHECK-P9-NEXT: xvcvsxddp vs7, v2			; CHECK-P9-NEXT: xvcvsxddp vs7, v2
	; CHECK-P9-NEXT: stxv vs7, 112(r3)			; CHECK-P9-NEXT: stxv vs7, 112(r3)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test16elt_signed:			; CHECK-BE-LABEL: test16elt_signed:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_0@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI7_0@toc@ha
				; CHECK-BE-NEXT: xxlxor v3, v3, v3
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_0@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI7_0@toc@l
	; CHECK-BE-NEXT: lxvx v4, 0, r4			; CHECK-BE-NEXT: lxvx v4, 0, r4
	; CHECK-BE-NEXT: xxlxor v3, v3, v3
	; CHECK-BE-NEXT: vperm v4, v3, v2, v4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_1@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI7_1@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_1@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI7_1@toc@l
				; CHECK-BE-NEXT: vperm v4, v3, v2, v4
	; CHECK-BE-NEXT: vextsb2d v4, v4			; CHECK-BE-NEXT: vextsb2d v4, v4
	; CHECK-BE-NEXT: xvcvsxddp vs0, v4			; CHECK-BE-NEXT: xvcvsxddp vs0, v4
	; CHECK-BE-NEXT: lxvx v4, 0, r4			; CHECK-BE-NEXT: lxvx v4, 0, r4
	; CHECK-BE-NEXT: addis r4, r2, .LCPI7_2@toc@ha			; CHECK-BE-NEXT: addis r4, r2, .LCPI7_2@toc@ha
	; CHECK-BE-NEXT: addi r4, r4, .LCPI7_2@toc@l			; CHECK-BE-NEXT: addi r4, r4, .LCPI7_2@toc@l
	; CHECK-BE-NEXT: vperm v4, v3, v2, v4			; CHECK-BE-NEXT: vperm v4, v3, v2, v4
	; CHECK-BE-NEXT: stxv vs0, 16(r3)			; CHECK-BE-NEXT: stxv vs0, 16(r3)
	; CHECK-BE-NEXT: vextsb2d v4, v4			; CHECK-BE-NEXT: vextsb2d v4, v4
	▲ Show 20 Lines • Show All 48 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/vector-constrained-fp-intrinsics.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 307 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: addis 3, 2, .LCPI6_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI6_1@toc@ha
	; PC64LE9-NEXT: lfs 31, .LCPI6_1@toc@l(3)			; PC64LE9-NEXT: lfs 31, .LCPI6_1@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI6_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI6_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI6_2@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfs 1, .LCPI6_2@toc@l(3)
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: xxmrghd 34, 1, 0			; PC64LE9-NEXT: xxmrghd 34, 1, 0
	; PC64LE9-NEXT: addi 1, 1, 64			; PC64LE9-NEXT: addi 1, 1, 64
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: lfs 1, .LCPI7_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI7_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI7_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI7_1@toc@ha
	; PC64LE9-NEXT: lfs 31, .LCPI7_1@toc@l(3)			; PC64LE9-NEXT: lfs 31, .LCPI7_1@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: bl fmodf			; PC64LE9-NEXT: bl fmodf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI7_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI7_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI7_2@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfs 1, .LCPI7_2@toc@l(3)
	; PC64LE9-NEXT: bl fmodf			; PC64LE9-NEXT: bl fmodf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI7_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI7_3@toc@ha
	; PC64LE9-NEXT: fmr 29, 1			; PC64LE9-NEXT: fmr 29, 1
	; PC64LE9-NEXT: lfs 1, .LCPI7_3@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfs 1, .LCPI7_3@toc@l(3)
	; PC64LE9-NEXT: bl fmodf			; PC64LE9-NEXT: bl fmodf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI7_4@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI7_4@toc@l
				; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 29			; PC64LE9-NEXT: xscvdpspn 0, 29
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: addis 3, 2, .LCPI7_4@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI7_4@toc@l
	; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 3, 2, 4			; PC64LE9-NEXT: vperm 2, 3, 2, 4
	; PC64LE9-NEXT: addi 1, 1, 64			; PC64LE9-NEXT: addi 1, 1, 64
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: mtlr 0			; PC64LE9-NEXT: mtlr 0
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_frem_v3f64:			; PC64LE9-LABEL: constrained_vector_frem_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -80(1)			; PC64LE9-NEXT: stdu 1, -80(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI8_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI8_0@toc@ha
				; PC64LE9-NEXT: stfd 31, 72(1) # 8-byte Folded Spill
				; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI8_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI8_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI8_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI8_1@toc@ha
	; PC64LE9-NEXT: stfd 31, 72(1) # 8-byte Folded Spill
	; PC64LE9-NEXT: lfs 31, .LCPI8_1@toc@l(3)			; PC64LE9-NEXT: lfs 31, .LCPI8_1@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI8_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI8_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI8_2@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfs 1, .LCPI8_2@toc@l(3)
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: addis 3, 2, .LCPI8_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI8_3@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: xxmrghd 63, 1, 0			; PC64LE9-NEXT: xxmrghd 63, 1, 0
	; PC64LE9-NEXT: lfs 1, .LCPI8_3@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI8_3@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: fmr 3, 1			; PC64LE9-NEXT: fmr 3, 1
	; PC64LE9-NEXT: xxswapd 1, 63			; PC64LE9-NEXT: xxswapd 1, 63
	; PC64LE9-NEXT: xscpsgndp 2, 63, 63			; PC64LE9-NEXT: xscpsgndp 2, 63, 63
	; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: lfd 31, 72(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, 72(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 killed $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 killed $vsl1
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_frem_v4f64:			; PC64LE9-LABEL: constrained_vector_frem_v4f64:
	; PC64LE9: # %bb.0:			; PC64LE9: # %bb.0:
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -80(1)			; PC64LE9-NEXT: stdu 1, -80(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI9_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI9_0@toc@ha
				; PC64LE9-NEXT: stfd 31, 72(1) # 8-byte Folded Spill
				; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI9_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI9_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI9_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI9_1@toc@ha
	; PC64LE9-NEXT: stfd 31, 72(1) # 8-byte Folded Spill
	; PC64LE9-NEXT: lfs 31, .LCPI9_1@toc@l(3)			; PC64LE9-NEXT: lfs 31, .LCPI9_1@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI9_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI9_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI9_2@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfs 1, .LCPI9_2@toc@l(3)
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: addis 3, 2, .LCPI9_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI9_3@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: xxmrghd 63, 1, 0			; PC64LE9-NEXT: xxmrghd 63, 1, 0
	; PC64LE9-NEXT: lfs 1, .LCPI9_3@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI9_3@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI9_4@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI9_4@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI9_4@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfs 1, .LCPI9_4@toc@l(3)
	; PC64LE9-NEXT: bl fmod			; PC64LE9-NEXT: bl fmod
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: vmr 2, 31			; PC64LE9-NEXT: vmr 2, 31
	; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: lfd 31, 72(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, 72(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: xxmrghd 35, 1, 0			; PC64LE9-NEXT: xxmrghd 35, 1, 0
	▲ Show 20 Lines • Show All 319 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: vmrglw 2, 3, 2			; PC64LE-NEXT: vmrglw 2, 3, 2
	; PC64LE-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE-NEXT: vperm 2, 3, 2, 4			; PC64LE-NEXT: vperm 2, 3, 2, 4
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_fadd_v3f32:			; PC64LE9-LABEL: constrained_vector_fadd_v3f32:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: addis 3, 2, .LCPI17_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI17_0@toc@ha
				; PC64LE9-NEXT: xxlxor 1, 1, 1
	; PC64LE9-NEXT: lfs 0, .LCPI17_0@toc@l(3)			; PC64LE9-NEXT: lfs 0, .LCPI17_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI17_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI17_1@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI17_1@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI17_1@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI17_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI17_2@toc@ha
	; PC64LE9-NEXT: xsaddsp 2, 0, 2
	; PC64LE9-NEXT: lfs 3, .LCPI17_2@toc@l(3)			; PC64LE9-NEXT: lfs 3, .LCPI17_2@toc@l(3)
	; PC64LE9-NEXT: xxlxor 1, 1, 1			; PC64LE9-NEXT: addis 3, 2, .LCPI17_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI17_3@toc@l
	; PC64LE9-NEXT: xsaddsp 1, 0, 1			; PC64LE9-NEXT: xsaddsp 1, 0, 1
				; PC64LE9-NEXT: lxvx 36, 0, 3
				; PC64LE9-NEXT: xsaddsp 2, 0, 2
	; PC64LE9-NEXT: xsaddsp 0, 0, 3			; PC64LE9-NEXT: xsaddsp 0, 0, 3
	; PC64LE9-NEXT: xscvdpspn 0, 0			; PC64LE9-NEXT: xscvdpspn 0, 0
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 2			; PC64LE9-NEXT: xscvdpspn 0, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
	; PC64LE9-NEXT: addis 3, 2, .LCPI17_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI17_3@toc@l
	; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 3, 2, 4			; PC64LE9-NEXT: vperm 2, 3, 2, 4
	; PC64LE9-NEXT: blr			; PC64LE9-NEXT: blr
	entry:			entry:
	%add = call <3 x float> @llvm.experimental.constrained.fadd.v3f32(			%add = call <3 x float> @llvm.experimental.constrained.fadd.v3f32(
	<3 x float> <float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000,			<3 x float> <float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000,
	float 0xFFFFFFFFE0000000>,			float 0xFFFFFFFFE0000000>,
	Show All 22 Lines
	; PC64LE-NEXT: xxswapd 1, 2			; PC64LE-NEXT: xxswapd 1, 2
	; PC64LE-NEXT: # kill: def $f2 killed $f2 killed $vsl2			; PC64LE-NEXT: # kill: def $f2 killed $f2 killed $vsl2
	; PC64LE-NEXT: # kill: def $f1 killed $f1 killed $vsl1			; PC64LE-NEXT: # kill: def $f1 killed $f1 killed $vsl1
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_fadd_v3f64:			; PC64LE9-LABEL: constrained_vector_fadd_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: addis 3, 2, .LCPI18_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI18_0@toc@ha
				; PC64LE9-NEXT: xxlxor 1, 1, 1
	; PC64LE9-NEXT: lfd 0, .LCPI18_0@toc@l(3)			; PC64LE9-NEXT: lfd 0, .LCPI18_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI18_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI18_1@toc@ha
	; PC64LE9-NEXT: xxlxor 1, 1, 1
	; PC64LE9-NEXT: addi 3, 3, .LCPI18_1@toc@l			; PC64LE9-NEXT: addi 3, 3, .LCPI18_1@toc@l
	; PC64LE9-NEXT: xsadddp 3, 0, 1			; PC64LE9-NEXT: xsadddp 3, 0, 1
	; PC64LE9-NEXT: lxvx 0, 0, 3			; PC64LE9-NEXT: lxvx 0, 0, 3
	; PC64LE9-NEXT: addis 3, 2, .LCPI18_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI18_2@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI18_2@toc@l			; PC64LE9-NEXT: addi 3, 3, .LCPI18_2@toc@l
	; PC64LE9-NEXT: lxvx 1, 0, 3			; PC64LE9-NEXT: lxvx 1, 0, 3
	; PC64LE9-NEXT: xvadddp 2, 1, 0			; PC64LE9-NEXT: xvadddp 2, 1, 0
	; PC64LE9-NEXT: xxswapd 1, 2			; PC64LE9-NEXT: xxswapd 1, 2
	▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: vmrglw 2, 3, 2			; PC64LE-NEXT: vmrglw 2, 3, 2
	; PC64LE-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE-NEXT: vperm 2, 3, 2, 4			; PC64LE-NEXT: vperm 2, 3, 2, 4
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_fsub_v3f32:			; PC64LE9-LABEL: constrained_vector_fsub_v3f32:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: addis 3, 2, .LCPI22_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI22_0@toc@ha
				; PC64LE9-NEXT: xxlxor 1, 1, 1
	; PC64LE9-NEXT: lfs 0, .LCPI22_0@toc@l(3)			; PC64LE9-NEXT: lfs 0, .LCPI22_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI22_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI22_1@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI22_1@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI22_1@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI22_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI22_2@toc@ha
	; PC64LE9-NEXT: xssubsp 2, 0, 2
	; PC64LE9-NEXT: lfs 3, .LCPI22_2@toc@l(3)			; PC64LE9-NEXT: lfs 3, .LCPI22_2@toc@l(3)
	; PC64LE9-NEXT: xxlxor 1, 1, 1			; PC64LE9-NEXT: addis 3, 2, .LCPI22_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI22_3@toc@l
	; PC64LE9-NEXT: xssubsp 1, 0, 1			; PC64LE9-NEXT: xssubsp 1, 0, 1
				; PC64LE9-NEXT: lxvx 36, 0, 3
				; PC64LE9-NEXT: xssubsp 2, 0, 2
	; PC64LE9-NEXT: xssubsp 0, 0, 3			; PC64LE9-NEXT: xssubsp 0, 0, 3
	; PC64LE9-NEXT: xscvdpspn 0, 0			; PC64LE9-NEXT: xscvdpspn 0, 0
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 2			; PC64LE9-NEXT: xscvdpspn 0, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
	; PC64LE9-NEXT: addis 3, 2, .LCPI22_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI22_3@toc@l
	; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 3, 2, 4			; PC64LE9-NEXT: vperm 2, 3, 2, 4
	; PC64LE9-NEXT: blr			; PC64LE9-NEXT: blr
	entry:			entry:
	%sub = call <3 x float> @llvm.experimental.constrained.fsub.v3f32(			%sub = call <3 x float> @llvm.experimental.constrained.fsub.v3f32(
	<3 x float> <float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000,			<3 x float> <float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000,
	float 0xFFFFFFFFE0000000>,			float 0xFFFFFFFFE0000000>,
	Show All 22 Lines
	; PC64LE-NEXT: xxswapd 1, 2			; PC64LE-NEXT: xxswapd 1, 2
	; PC64LE-NEXT: # kill: def $f2 killed $f2 killed $vsl2			; PC64LE-NEXT: # kill: def $f2 killed $f2 killed $vsl2
	; PC64LE-NEXT: # kill: def $f1 killed $f1 killed $vsl1			; PC64LE-NEXT: # kill: def $f1 killed $f1 killed $vsl1
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_fsub_v3f64:			; PC64LE9-LABEL: constrained_vector_fsub_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: addis 3, 2, .LCPI23_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI23_0@toc@ha
				; PC64LE9-NEXT: xxlxor 1, 1, 1
	; PC64LE9-NEXT: lfd 0, .LCPI23_0@toc@l(3)			; PC64LE9-NEXT: lfd 0, .LCPI23_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI23_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI23_1@toc@ha
	; PC64LE9-NEXT: xxlxor 1, 1, 1
	; PC64LE9-NEXT: addi 3, 3, .LCPI23_1@toc@l			; PC64LE9-NEXT: addi 3, 3, .LCPI23_1@toc@l
	; PC64LE9-NEXT: xssubdp 3, 0, 1			; PC64LE9-NEXT: xssubdp 3, 0, 1
	; PC64LE9-NEXT: lxvx 0, 0, 3			; PC64LE9-NEXT: lxvx 0, 0, 3
	; PC64LE9-NEXT: addis 3, 2, .LCPI23_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI23_2@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI23_2@toc@l			; PC64LE9-NEXT: addi 3, 3, .LCPI23_2@toc@l
	; PC64LE9-NEXT: lxvx 1, 0, 3			; PC64LE9-NEXT: lxvx 1, 0, 3
	; PC64LE9-NEXT: xvsubdp 2, 1, 0			; PC64LE9-NEXT: xvsubdp 2, 1, 0
	; PC64LE9-NEXT: xxswapd 1, 2			; PC64LE9-NEXT: xxswapd 1, 2
	▲ Show 20 Lines • Show All 321 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: addis 3, 2, .LCPI31_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI31_1@toc@ha
	; PC64LE9-NEXT: lfs 31, .LCPI31_1@toc@l(3)			; PC64LE9-NEXT: lfs 31, .LCPI31_1@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI31_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI31_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI31_2@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfd 1, .LCPI31_2@toc@l(3)
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: xxmrghd 34, 1, 0			; PC64LE9-NEXT: xxmrghd 34, 1, 0
	; PC64LE9-NEXT: addi 1, 1, 64			; PC64LE9-NEXT: addi 1, 1, 64
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: lfs 1, .LCPI32_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI32_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI32_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI32_1@toc@ha
	; PC64LE9-NEXT: lfs 31, .LCPI32_1@toc@l(3)			; PC64LE9-NEXT: lfs 31, .LCPI32_1@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: bl powf			; PC64LE9-NEXT: bl powf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI32_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI32_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI32_2@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfs 1, .LCPI32_2@toc@l(3)
	; PC64LE9-NEXT: bl powf			; PC64LE9-NEXT: bl powf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI32_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI32_3@toc@ha
	; PC64LE9-NEXT: fmr 29, 1			; PC64LE9-NEXT: fmr 29, 1
	; PC64LE9-NEXT: lfs 1, .LCPI32_3@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfs 1, .LCPI32_3@toc@l(3)
	; PC64LE9-NEXT: bl powf			; PC64LE9-NEXT: bl powf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI32_4@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI32_4@toc@l
				; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 29			; PC64LE9-NEXT: xscvdpspn 0, 29
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: addis 3, 2, .LCPI32_4@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI32_4@toc@l
	; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 3, 2, 4			; PC64LE9-NEXT: vperm 2, 3, 2, 4
	; PC64LE9-NEXT: addi 1, 1, 64			; PC64LE9-NEXT: addi 1, 1, 64
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: mtlr 0			; PC64LE9-NEXT: mtlr 0
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_pow_v3f64:			; PC64LE9-LABEL: constrained_vector_pow_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -80(1)			; PC64LE9-NEXT: stdu 1, -80(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI33_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI33_0@toc@ha
				; PC64LE9-NEXT: stfd 31, 72(1) # 8-byte Folded Spill
				; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI33_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI33_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI33_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI33_1@toc@ha
	; PC64LE9-NEXT: stfd 31, 72(1) # 8-byte Folded Spill
	; PC64LE9-NEXT: lfs 31, .LCPI33_1@toc@l(3)			; PC64LE9-NEXT: lfs 31, .LCPI33_1@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI33_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI33_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI33_2@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfd 1, .LCPI33_2@toc@l(3)
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: addis 3, 2, .LCPI33_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI33_3@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: xxmrghd 63, 1, 0			; PC64LE9-NEXT: xxmrghd 63, 1, 0
	; PC64LE9-NEXT: lfd 1, .LCPI33_3@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI33_3@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: fmr 3, 1			; PC64LE9-NEXT: fmr 3, 1
	; PC64LE9-NEXT: xxswapd 1, 63			; PC64LE9-NEXT: xxswapd 1, 63
	; PC64LE9-NEXT: xscpsgndp 2, 63, 63			; PC64LE9-NEXT: xscpsgndp 2, 63, 63
	; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: lfd 31, 72(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, 72(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 killed $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 killed $vsl1
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_pow_v4f64:			; PC64LE9-LABEL: constrained_vector_pow_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -80(1)			; PC64LE9-NEXT: stdu 1, -80(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI34_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI34_0@toc@ha
				; PC64LE9-NEXT: stfd 31, 72(1) # 8-byte Folded Spill
				; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI34_0@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI34_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI34_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI34_1@toc@ha
	; PC64LE9-NEXT: stfd 31, 72(1) # 8-byte Folded Spill
	; PC64LE9-NEXT: lfs 31, .LCPI34_1@toc@l(3)			; PC64LE9-NEXT: lfs 31, .LCPI34_1@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI34_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI34_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI34_2@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfd 1, .LCPI34_2@toc@l(3)
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: addis 3, 2, .LCPI34_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI34_3@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: xxmrghd 63, 1, 0			; PC64LE9-NEXT: xxmrghd 63, 1, 0
	; PC64LE9-NEXT: lfd 1, .LCPI34_3@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI34_3@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI34_4@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI34_4@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI34_4@toc@l(3)
	; PC64LE9-NEXT: fmr 2, 31			; PC64LE9-NEXT: fmr 2, 31
				; PC64LE9-NEXT: lfd 1, .LCPI34_4@toc@l(3)
	; PC64LE9-NEXT: bl pow			; PC64LE9-NEXT: bl pow
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: vmr 2, 31			; PC64LE9-NEXT: vmr 2, 31
	; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: lfd 31, 72(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, 72(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: xxmrghd 35, 1, 0			; PC64LE9-NEXT: xxmrghd 35, 1, 0
	Show All 31 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_powi_v1f32:			; PC64LE9-LABEL: constrained_vector_powi_v1f32:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -32(1)			; PC64LE9-NEXT: stdu 1, -32(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI35_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI35_0@toc@ha
	; PC64LE9-NEXT: lfs 1, .LCPI35_0@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfs 1, .LCPI35_0@toc@l(3)
	; PC64LE9-NEXT: bl __powisf2			; PC64LE9-NEXT: bl __powisf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: addi 1, 1, 32			; PC64LE9-NEXT: addi 1, 1, 32
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: mtlr 0			; PC64LE9-NEXT: mtlr 0
	; PC64LE9-NEXT: blr			; PC64LE9-NEXT: blr
	Show All 35 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_powi_v2f64:			; PC64LE9-LABEL: constrained_vector_powi_v2f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -48(1)			; PC64LE9-NEXT: stdu 1, -48(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI36_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI36_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI36_0@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfd 1, .LCPI36_0@toc@l(3)
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI36_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI36_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI36_1@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfd 1, .LCPI36_1@toc@l(3)
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: xxmrghd 34, 1, 0			; PC64LE9-NEXT: xxmrghd 34, 1, 0
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: mtlr 0			; PC64LE9-NEXT: mtlr 0
	▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	; PC64LE9-LABEL: constrained_vector_powi_v3f32:			; PC64LE9-LABEL: constrained_vector_powi_v3f32:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: stfd 30, -16(1) # 8-byte Folded Spill			; PC64LE9-NEXT: stfd 30, -16(1) # 8-byte Folded Spill
	; PC64LE9-NEXT: stfd 31, -8(1) # 8-byte Folded Spill			; PC64LE9-NEXT: stfd 31, -8(1) # 8-byte Folded Spill
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -48(1)			; PC64LE9-NEXT: stdu 1, -48(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI37_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI37_0@toc@ha
	; PC64LE9-NEXT: lfs 1, .LCPI37_0@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfs 1, .LCPI37_0@toc@l(3)
	; PC64LE9-NEXT: bl __powisf2			; PC64LE9-NEXT: bl __powisf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI37_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI37_1@toc@ha
	; PC64LE9-NEXT: fmr 31, 1			; PC64LE9-NEXT: fmr 31, 1
	; PC64LE9-NEXT: lfs 1, .LCPI37_1@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfs 1, .LCPI37_1@toc@l(3)
	; PC64LE9-NEXT: bl __powisf2			; PC64LE9-NEXT: bl __powisf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI37_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI37_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI37_2@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfs 1, .LCPI37_2@toc@l(3)
	; PC64LE9-NEXT: bl __powisf2			; PC64LE9-NEXT: bl __powisf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI37_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI37_3@toc@l
				; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI37_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI37_3@toc@l
	; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 3, 2, 4			; PC64LE9-NEXT: vperm 2, 3, 2, 4
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: mtlr 0			; PC64LE9-NEXT: mtlr 0
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_powi_v3f64:			; PC64LE9-LABEL: constrained_vector_powi_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI38_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI38_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI38_0@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI38_0@toc@l(3)
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI38_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI38_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI38_1@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfs 1, .LCPI38_1@toc@l(3)
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: addis 3, 2, .LCPI38_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI38_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; PC64LE9-NEXT: li 4, 3
	; PC64LE9-NEXT: xxmrghd 63, 0, 1			; PC64LE9-NEXT: xxmrghd 63, 0, 1
	; PC64LE9-NEXT: lfd 1, .LCPI38_2@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI38_2@toc@l(3)
	; PC64LE9-NEXT: li 4, 3
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: fmr 3, 1			; PC64LE9-NEXT: fmr 3, 1
	; PC64LE9-NEXT: xxswapd 1, 63			; PC64LE9-NEXT: xxswapd 1, 63
	; PC64LE9-NEXT: xscpsgndp 2, 63, 63			; PC64LE9-NEXT: xscpsgndp 2, 63, 63
	; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 killed $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 killed $vsl1
	; PC64LE9-NEXT: addi 1, 1, 64			; PC64LE9-NEXT: addi 1, 1, 64
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_powi_v4f64:			; PC64LE9-LABEL: constrained_vector_powi_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI39_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI39_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI39_0@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI39_0@toc@l(3)
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI39_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI39_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI39_1@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfd 1, .LCPI39_1@toc@l(3)
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: addis 3, 2, .LCPI39_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI39_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
				; PC64LE9-NEXT: li 4, 3
	; PC64LE9-NEXT: xxmrghd 63, 1, 0			; PC64LE9-NEXT: xxmrghd 63, 1, 0
	; PC64LE9-NEXT: lfd 1, .LCPI39_2@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI39_2@toc@l(3)
	; PC64LE9-NEXT: li 4, 3
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI39_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI39_3@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI39_3@toc@l(3)
	; PC64LE9-NEXT: li 4, 3			; PC64LE9-NEXT: li 4, 3
				; PC64LE9-NEXT: lfd 1, .LCPI39_3@toc@l(3)
	; PC64LE9-NEXT: bl __powidf2			; PC64LE9-NEXT: bl __powidf2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 0, 32(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: vmr 2, 31			; PC64LE9-NEXT: vmr 2, 31
	; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload			; PC64LE9-NEXT: lxv 63, 48(1) # 16-byte Folded Reload
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: xxmrghd 35, 1, 0			; PC64LE9-NEXT: xxmrghd 35, 1, 0
	; PC64LE9-NEXT: addi 1, 1, 64			; PC64LE9-NEXT: addi 1, 1, 64
	▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl sinf			; PC64LE9-NEXT: bl sinf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI42_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI42_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI42_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI42_2@toc@l(3)
	; PC64LE9-NEXT: bl sinf			; PC64LE9-NEXT: bl sinf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI42_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI42_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI42_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI42_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_sin_v3f64:			; PC64LE9-LABEL: constrained_vector_sin_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI43_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI43_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI43_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI43_0@toc@l(3)
	; PC64LE9-NEXT: bl sin			; PC64LE9-NEXT: bl sin
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI43_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI43_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI43_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI43_1@toc@l(3)
	; PC64LE9-NEXT: bl sin			; PC64LE9-NEXT: bl sin
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_sin_v4f64:			; PC64LE9-LABEL: constrained_vector_sin_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI44_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI44_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI44_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI44_0@toc@l(3)
	; PC64LE9-NEXT: bl sin			; PC64LE9-NEXT: bl sin
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI44_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI44_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI44_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI44_1@toc@l(3)
	; PC64LE9-NEXT: bl sin			; PC64LE9-NEXT: bl sin
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl cosf			; PC64LE9-NEXT: bl cosf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI47_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI47_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI47_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI47_2@toc@l(3)
	; PC64LE9-NEXT: bl cosf			; PC64LE9-NEXT: bl cosf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI47_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI47_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI47_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI47_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_cos_v3f64:			; PC64LE9-LABEL: constrained_vector_cos_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI48_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI48_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI48_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI48_0@toc@l(3)
	; PC64LE9-NEXT: bl cos			; PC64LE9-NEXT: bl cos
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI48_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI48_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI48_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI48_1@toc@l(3)
	; PC64LE9-NEXT: bl cos			; PC64LE9-NEXT: bl cos
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_cos_v4f64:			; PC64LE9-LABEL: constrained_vector_cos_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI49_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI49_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI49_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI49_0@toc@l(3)
	; PC64LE9-NEXT: bl cos			; PC64LE9-NEXT: bl cos
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI49_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI49_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI49_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI49_1@toc@l(3)
	; PC64LE9-NEXT: bl cos			; PC64LE9-NEXT: bl cos
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl expf			; PC64LE9-NEXT: bl expf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI52_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI52_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI52_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI52_2@toc@l(3)
	; PC64LE9-NEXT: bl expf			; PC64LE9-NEXT: bl expf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI52_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI52_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI52_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI52_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_exp_v3f64:			; PC64LE9-LABEL: constrained_vector_exp_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI53_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI53_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI53_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI53_0@toc@l(3)
	; PC64LE9-NEXT: bl exp			; PC64LE9-NEXT: bl exp
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI53_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI53_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI53_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI53_1@toc@l(3)
	; PC64LE9-NEXT: bl exp			; PC64LE9-NEXT: bl exp
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_exp_v4f64:			; PC64LE9-LABEL: constrained_vector_exp_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI54_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI54_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI54_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI54_0@toc@l(3)
	; PC64LE9-NEXT: bl exp			; PC64LE9-NEXT: bl exp
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI54_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI54_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI54_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI54_1@toc@l(3)
	; PC64LE9-NEXT: bl exp			; PC64LE9-NEXT: bl exp
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl exp2f			; PC64LE9-NEXT: bl exp2f
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI57_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI57_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI57_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI57_2@toc@l(3)
	; PC64LE9-NEXT: bl exp2f			; PC64LE9-NEXT: bl exp2f
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI57_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI57_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI57_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI57_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_exp2_v3f64:			; PC64LE9-LABEL: constrained_vector_exp2_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI58_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI58_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI58_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI58_0@toc@l(3)
	; PC64LE9-NEXT: bl exp2			; PC64LE9-NEXT: bl exp2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI58_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI58_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI58_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI58_1@toc@l(3)
	; PC64LE9-NEXT: bl exp2			; PC64LE9-NEXT: bl exp2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_exp2_v4f64:			; PC64LE9-LABEL: constrained_vector_exp2_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI59_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI59_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI59_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI59_0@toc@l(3)
	; PC64LE9-NEXT: bl exp2			; PC64LE9-NEXT: bl exp2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI59_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI59_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI59_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI59_1@toc@l(3)
	; PC64LE9-NEXT: bl exp2			; PC64LE9-NEXT: bl exp2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl logf			; PC64LE9-NEXT: bl logf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI62_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI62_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI62_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI62_2@toc@l(3)
	; PC64LE9-NEXT: bl logf			; PC64LE9-NEXT: bl logf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI62_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI62_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI62_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI62_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_log_v3f64:			; PC64LE9-LABEL: constrained_vector_log_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI63_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI63_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI63_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI63_0@toc@l(3)
	; PC64LE9-NEXT: bl log			; PC64LE9-NEXT: bl log
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI63_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI63_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI63_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI63_1@toc@l(3)
	; PC64LE9-NEXT: bl log			; PC64LE9-NEXT: bl log
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_log_v4f64:			; PC64LE9-LABEL: constrained_vector_log_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI64_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI64_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI64_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI64_0@toc@l(3)
	; PC64LE9-NEXT: bl log			; PC64LE9-NEXT: bl log
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI64_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI64_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI64_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI64_1@toc@l(3)
	; PC64LE9-NEXT: bl log			; PC64LE9-NEXT: bl log
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl log10f			; PC64LE9-NEXT: bl log10f
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI67_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI67_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI67_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI67_2@toc@l(3)
	; PC64LE9-NEXT: bl log10f			; PC64LE9-NEXT: bl log10f
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI67_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI67_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI67_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI67_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_log10_v3f64:			; PC64LE9-LABEL: constrained_vector_log10_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI68_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI68_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI68_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI68_0@toc@l(3)
	; PC64LE9-NEXT: bl log10			; PC64LE9-NEXT: bl log10
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI68_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI68_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI68_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI68_1@toc@l(3)
	; PC64LE9-NEXT: bl log10			; PC64LE9-NEXT: bl log10
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_log10_v4f64:			; PC64LE9-LABEL: constrained_vector_log10_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI69_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI69_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI69_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI69_0@toc@l(3)
	; PC64LE9-NEXT: bl log10			; PC64LE9-NEXT: bl log10
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI69_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI69_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI69_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI69_1@toc@l(3)
	; PC64LE9-NEXT: bl log10			; PC64LE9-NEXT: bl log10
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl log2f			; PC64LE9-NEXT: bl log2f
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI72_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI72_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI72_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI72_2@toc@l(3)
	; PC64LE9-NEXT: bl log2f			; PC64LE9-NEXT: bl log2f
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI72_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI72_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI72_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI72_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_log2_v3f64:			; PC64LE9-LABEL: constrained_vector_log2_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI73_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI73_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI73_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI73_0@toc@l(3)
	; PC64LE9-NEXT: bl log2			; PC64LE9-NEXT: bl log2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI73_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI73_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI73_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI73_1@toc@l(3)
	; PC64LE9-NEXT: bl log2			; PC64LE9-NEXT: bl log2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_log2_v4f64:			; PC64LE9-LABEL: constrained_vector_log2_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI74_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI74_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI74_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI74_0@toc@l(3)
	; PC64LE9-NEXT: bl log2			; PC64LE9-NEXT: bl log2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI74_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI74_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI74_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI74_1@toc@l(3)
	; PC64LE9-NEXT: bl log2			; PC64LE9-NEXT: bl log2
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl rintf			; PC64LE9-NEXT: bl rintf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI77_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI77_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI77_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI77_2@toc@l(3)
	; PC64LE9-NEXT: bl rintf			; PC64LE9-NEXT: bl rintf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI77_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI77_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI77_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI77_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_rint_v3f64:			; PC64LE9-LABEL: constrained_vector_rint_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI78_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI78_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI78_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI78_0@toc@l(3)
	; PC64LE9-NEXT: bl rint			; PC64LE9-NEXT: bl rint
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI78_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI78_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI78_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI78_1@toc@l(3)
	; PC64LE9-NEXT: bl rint			; PC64LE9-NEXT: bl rint
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_rint_v4f64:			; PC64LE9-LABEL: constrained_vector_rint_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI79_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI79_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI79_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI79_0@toc@l(3)
	; PC64LE9-NEXT: bl rint			; PC64LE9-NEXT: bl rint
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI79_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI79_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI79_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI79_1@toc@l(3)
	; PC64LE9-NEXT: bl rint			; PC64LE9-NEXT: bl rint
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: bl nearbyintf			; PC64LE9-NEXT: bl nearbyintf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI82_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI82_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI82_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI82_2@toc@l(3)
	; PC64LE9-NEXT: bl nearbyintf			; PC64LE9-NEXT: bl nearbyintf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI82_3@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI82_3@toc@l
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 31			; PC64LE9-NEXT: xscvdpspn 0, 31
	; PC64LE9-NEXT: addis 3, 2, .LCPI82_3@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI82_3@toc@l
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: lxvx 35, 0, 3			; PC64LE9-NEXT: lxvx 35, 0, 3
	; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 36, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 4, 2, 3			; PC64LE9-NEXT: vperm 2, 4, 2, 3
	; PC64LE9-NEXT: addi 1, 1, 48			; PC64LE9-NEXT: addi 1, 1, 48
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_nearby_v3f64:			; PC64LE9-LABEL: constrained_vector_nearby_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI83_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI83_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI83_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI83_0@toc@l(3)
	; PC64LE9-NEXT: bl nearbyint			; PC64LE9-NEXT: bl nearbyint
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI83_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI83_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI83_1@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI83_1@toc@l(3)
	; PC64LE9-NEXT: bl nearbyint			; PC64LE9-NEXT: bl nearbyint
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_nearbyint_v4f64:			; PC64LE9-LABEL: constrained_vector_nearbyint_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI84_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI84_0@toc@ha
	; PC64LE9-NEXT: lfd 1, .LCPI84_0@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
				; PC64LE9-NEXT: lfd 1, .LCPI84_0@toc@l(3)
	; PC64LE9-NEXT: bl nearbyint			; PC64LE9-NEXT: bl nearbyint
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI84_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI84_1@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfd 1, .LCPI84_1@toc@l(3)			; PC64LE9-NEXT: lfd 1, .LCPI84_1@toc@l(3)
	; PC64LE9-NEXT: bl nearbyint			; PC64LE9-NEXT: bl nearbyint
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	▲ Show 20 Lines • Show All 201 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: addis 3, 2, .LCPI87_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI87_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI87_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI87_2@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI87_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI87_3@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI87_3@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI87_3@toc@l(3)
	; PC64LE9-NEXT: bl fmaxf			; PC64LE9-NEXT: bl fmaxf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI87_4@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI87_4@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI87_4@toc@l(3)
	; PC64LE9-NEXT: fmr 29, 1			; PC64LE9-NEXT: fmr 29, 1
	; PC64LE9-NEXT: fmr 1, 31			; PC64LE9-NEXT: fmr 1, 31
				; PC64LE9-NEXT: lfs 2, .LCPI87_4@toc@l(3)
	; PC64LE9-NEXT: bl fmaxf			; PC64LE9-NEXT: bl fmaxf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI87_5@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI87_5@toc@l
				; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 29			; PC64LE9-NEXT: xscvdpspn 0, 29
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: addis 3, 2, .LCPI87_5@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI87_5@toc@l
	; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 3, 2, 4			; PC64LE9-NEXT: vperm 2, 3, 2, 4
	; PC64LE9-NEXT: addi 1, 1, 64			; PC64LE9-NEXT: addi 1, 1, 64
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: mtlr 0			; PC64LE9-NEXT: mtlr 0
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_max_v3f64:			; PC64LE9-LABEL: constrained_vector_max_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI88_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI88_0@toc@ha
				; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI88_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI88_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI88_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI88_1@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI88_1@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI88_1@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: bl fmax			; PC64LE9-NEXT: bl fmax
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI88_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI88_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI88_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI88_2@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI88_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI88_3@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI88_3@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI88_3@toc@l(3)
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_maxnum_v4f64:			; PC64LE9-LABEL: constrained_vector_maxnum_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI89_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI89_0@toc@ha
				; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI89_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI89_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI89_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI89_1@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI89_1@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI89_1@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: bl fmax			; PC64LE9-NEXT: bl fmax
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI89_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI89_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI89_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI89_2@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI89_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI89_3@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI89_3@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI89_3@toc@l(3)
	▲ Show 20 Lines • Show All 208 Lines • ▼ Show 20 Lines
	; PC64LE9-NEXT: addis 3, 2, .LCPI92_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI92_2@toc@ha
	; PC64LE9-NEXT: fmr 30, 1			; PC64LE9-NEXT: fmr 30, 1
	; PC64LE9-NEXT: lfs 1, .LCPI92_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI92_2@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI92_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI92_3@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI92_3@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI92_3@toc@l(3)
	; PC64LE9-NEXT: bl fminf			; PC64LE9-NEXT: bl fminf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI92_4@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI92_4@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI92_4@toc@l(3)
	; PC64LE9-NEXT: fmr 29, 1			; PC64LE9-NEXT: fmr 29, 1
	; PC64LE9-NEXT: fmr 1, 31			; PC64LE9-NEXT: fmr 1, 31
				; PC64LE9-NEXT: lfs 2, .LCPI92_4@toc@l(3)
	; PC64LE9-NEXT: bl fminf			; PC64LE9-NEXT: bl fminf
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: xscvdpspn 0, 1			; PC64LE9-NEXT: xscvdpspn 0, 1
				; PC64LE9-NEXT: addis 3, 2, .LCPI92_5@toc@ha
				; PC64LE9-NEXT: addi 3, 3, .LCPI92_5@toc@l
				; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 34, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 29			; PC64LE9-NEXT: xscvdpspn 0, 29
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: xscvdpspn 0, 30			; PC64LE9-NEXT: xscvdpspn 0, 30
	; PC64LE9-NEXT: addis 3, 2, .LCPI92_5@toc@ha
	; PC64LE9-NEXT: addi 3, 3, .LCPI92_5@toc@l
	; PC64LE9-NEXT: lxvx 36, 0, 3
	; PC64LE9-NEXT: vmrglw 2, 3, 2			; PC64LE9-NEXT: vmrglw 2, 3, 2
	; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1			; PC64LE9-NEXT: xxsldwi 35, 0, 0, 1
	; PC64LE9-NEXT: vperm 2, 3, 2, 4			; PC64LE9-NEXT: vperm 2, 3, 2, 4
	; PC64LE9-NEXT: addi 1, 1, 64			; PC64LE9-NEXT: addi 1, 1, 64
	; PC64LE9-NEXT: ld 0, 16(1)			; PC64LE9-NEXT: ld 0, 16(1)
	; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 31, -8(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload			; PC64LE9-NEXT: lfd 30, -16(1) # 8-byte Folded Reload
	; PC64LE9-NEXT: mtlr 0			; PC64LE9-NEXT: mtlr 0
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_min_v3f64:			; PC64LE9-LABEL: constrained_vector_min_v3f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI93_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI93_0@toc@ha
				; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI93_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI93_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI93_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI93_1@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI93_1@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI93_1@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: bl fmin			; PC64LE9-NEXT: bl fmin
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI93_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI93_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI93_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI93_2@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI93_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI93_3@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI93_3@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI93_3@toc@l(3)
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; PC64LE-NEXT: blr			; PC64LE-NEXT: blr
	;			;
	; PC64LE9-LABEL: constrained_vector_minnum_v4f64:			; PC64LE9-LABEL: constrained_vector_minnum_v4f64:
	; PC64LE9: # %bb.0: # %entry			; PC64LE9: # %bb.0: # %entry
	; PC64LE9-NEXT: mflr 0			; PC64LE9-NEXT: mflr 0
	; PC64LE9-NEXT: std 0, 16(1)			; PC64LE9-NEXT: std 0, 16(1)
	; PC64LE9-NEXT: stdu 1, -64(1)			; PC64LE9-NEXT: stdu 1, -64(1)
	; PC64LE9-NEXT: addis 3, 2, .LCPI94_0@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI94_0@toc@ha
				; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI94_0@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI94_0@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI94_1@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI94_1@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI94_1@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI94_1@toc@l(3)
	; PC64LE9-NEXT: stxv 63, 48(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: bl fmin			; PC64LE9-NEXT: bl fmin
	; PC64LE9-NEXT: nop			; PC64LE9-NEXT: nop
	; PC64LE9-NEXT: addis 3, 2, .LCPI94_2@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI94_2@toc@ha
	; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1			; PC64LE9-NEXT: # kill: def $f1 killed $f1 def $vsl1
	; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill			; PC64LE9-NEXT: stxv 1, 32(1) # 16-byte Folded Spill
	; PC64LE9-NEXT: lfs 1, .LCPI94_2@toc@l(3)			; PC64LE9-NEXT: lfs 1, .LCPI94_2@toc@l(3)
	; PC64LE9-NEXT: addis 3, 2, .LCPI94_3@toc@ha			; PC64LE9-NEXT: addis 3, 2, .LCPI94_3@toc@ha
	; PC64LE9-NEXT: lfs 2, .LCPI94_3@toc@l(3)			; PC64LE9-NEXT: lfs 2, .LCPI94_3@toc@l(3)
	▲ Show 20 Lines • Show All 1,007 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/testb-je-fusion.ll

	Show First 20 Lines • Show All 232 Lines • ▼ Show 20 Lines
	; BRANCHFUSION_POSTRA-NEXT: # %bb.1: # %if.then			; BRANCHFUSION_POSTRA-NEXT: # %bb.1: # %if.then
	; BRANCHFUSION_POSTRA-NEXT: movl $1, %eax			; BRANCHFUSION_POSTRA-NEXT: movl $1, %eax
	; BRANCHFUSION_POSTRA-NEXT: .LBB2_2: # %if.end			; BRANCHFUSION_POSTRA-NEXT: .LBB2_2: # %if.end
	; BRANCHFUSION_POSTRA-NEXT: retq			; BRANCHFUSION_POSTRA-NEXT: retq
	;			;
	; NOFUSION_MISCHEDPOSTRA-LABEL: macrofuse_alu_je:			; NOFUSION_MISCHEDPOSTRA-LABEL: macrofuse_alu_je:
	; NOFUSION_MISCHEDPOSTRA: # %bb.0: # %entry			; NOFUSION_MISCHEDPOSTRA: # %bb.0: # %entry
	; NOFUSION_MISCHEDPOSTRA-NEXT: movl %edi, %eax			; NOFUSION_MISCHEDPOSTRA-NEXT: movl %edi, %eax
	; NOFUSION_MISCHEDPOSTRA-NEXT: addl $-512, %eax # imm = 0xFE00
	; NOFUSION_MISCHEDPOSTRA-NEXT: movb $1, (%rsi)			; NOFUSION_MISCHEDPOSTRA-NEXT: movb $1, (%rsi)
				; NOFUSION_MISCHEDPOSTRA-NEXT: addl $-512, %eax # imm = 0xFE00
	; NOFUSION_MISCHEDPOSTRA-NEXT: je .LBB2_2			; NOFUSION_MISCHEDPOSTRA-NEXT: je .LBB2_2
	; NOFUSION_MISCHEDPOSTRA-NEXT: # %bb.1: # %if.then			; NOFUSION_MISCHEDPOSTRA-NEXT: # %bb.1: # %if.then
	; NOFUSION_MISCHEDPOSTRA-NEXT: movl $1, %eax			; NOFUSION_MISCHEDPOSTRA-NEXT: movl $1, %eax
	; NOFUSION_MISCHEDPOSTRA-NEXT: .LBB2_2: # %if.end			; NOFUSION_MISCHEDPOSTRA-NEXT: .LBB2_2: # %if.end
	; NOFUSION_MISCHEDPOSTRA-NEXT: retq			; NOFUSION_MISCHEDPOSTRA-NEXT: retq
	;			;
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-LABEL: macrofuse_alu_je:			; BRANCHFUSIONONLY_MISCHEDPOSTRA-LABEL: macrofuse_alu_je:
	; BRANCHFUSIONONLY_MISCHEDPOSTRA: # %bb.0: # %entry			; BRANCHFUSIONONLY_MISCHEDPOSTRA: # %bb.0: # %entry
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movl %edi, %eax			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movl %edi, %eax
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: addl $-512, %eax # imm = 0xFE00
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movb $1, (%rsi)			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movb $1, (%rsi)
				; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: addl $-512, %eax # imm = 0xFE00
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: je .LBB2_2			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: je .LBB2_2
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: # %bb.1: # %if.then			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: # %bb.1: # %if.then
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movl $1, %eax			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movl $1, %eax
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: .LBB2_2: # %if.end			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: .LBB2_2: # %if.end
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: retq			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: retq
	;			;
	; MACROFUSION_MISCHEDPOSTRA-LABEL: macrofuse_alu_je:			; MACROFUSION_MISCHEDPOSTRA-LABEL: macrofuse_alu_je:
	; MACROFUSION_MISCHEDPOSTRA: # %bb.0: # %entry			; MACROFUSION_MISCHEDPOSTRA: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	; BRANCHFUSION_POSTRA-NEXT: # %bb.1: # %if.then			; BRANCHFUSION_POSTRA-NEXT: # %bb.1: # %if.then
	; BRANCHFUSION_POSTRA-NEXT: movl $1, %eax			; BRANCHFUSION_POSTRA-NEXT: movl $1, %eax
	; BRANCHFUSION_POSTRA-NEXT: .LBB3_2: # %if.end			; BRANCHFUSION_POSTRA-NEXT: .LBB3_2: # %if.end
	; BRANCHFUSION_POSTRA-NEXT: retq			; BRANCHFUSION_POSTRA-NEXT: retq
	;			;
	; NOFUSION_MISCHEDPOSTRA-LABEL: macrofuse_dec_je:			; NOFUSION_MISCHEDPOSTRA-LABEL: macrofuse_dec_je:
	; NOFUSION_MISCHEDPOSTRA: # %bb.0: # %entry			; NOFUSION_MISCHEDPOSTRA: # %bb.0: # %entry
	; NOFUSION_MISCHEDPOSTRA-NEXT: movl %edi, %eax			; NOFUSION_MISCHEDPOSTRA-NEXT: movl %edi, %eax
	; NOFUSION_MISCHEDPOSTRA-NEXT: decl %eax
	; NOFUSION_MISCHEDPOSTRA-NEXT: movb $1, (%rsi)			; NOFUSION_MISCHEDPOSTRA-NEXT: movb $1, (%rsi)
				; NOFUSION_MISCHEDPOSTRA-NEXT: decl %eax
	; NOFUSION_MISCHEDPOSTRA-NEXT: je .LBB3_2			; NOFUSION_MISCHEDPOSTRA-NEXT: je .LBB3_2
	; NOFUSION_MISCHEDPOSTRA-NEXT: # %bb.1: # %if.then			; NOFUSION_MISCHEDPOSTRA-NEXT: # %bb.1: # %if.then
	; NOFUSION_MISCHEDPOSTRA-NEXT: movl $1, %eax			; NOFUSION_MISCHEDPOSTRA-NEXT: movl $1, %eax
	; NOFUSION_MISCHEDPOSTRA-NEXT: .LBB3_2: # %if.end			; NOFUSION_MISCHEDPOSTRA-NEXT: .LBB3_2: # %if.end
	; NOFUSION_MISCHEDPOSTRA-NEXT: retq			; NOFUSION_MISCHEDPOSTRA-NEXT: retq
	;			;
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-LABEL: macrofuse_dec_je:			; BRANCHFUSIONONLY_MISCHEDPOSTRA-LABEL: macrofuse_dec_je:
	; BRANCHFUSIONONLY_MISCHEDPOSTRA: # %bb.0: # %entry			; BRANCHFUSIONONLY_MISCHEDPOSTRA: # %bb.0: # %entry
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movl %edi, %eax			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movl %edi, %eax
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: decl %eax
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movb $1, (%rsi)			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movb $1, (%rsi)
				; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: decl %eax
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: je .LBB3_2			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: je .LBB3_2
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: # %bb.1: # %if.then			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: # %bb.1: # %if.then
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movl $1, %eax			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: movl $1, %eax
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: .LBB3_2: # %if.end			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: .LBB3_2: # %if.end
	; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: retq			; BRANCHFUSIONONLY_MISCHEDPOSTRA-NEXT: retq
	;			;
	; MACROFUSION_MISCHEDPOSTRA-LABEL: macrofuse_dec_je:			; MACROFUSION_MISCHEDPOSTRA-LABEL: macrofuse_dec_je:
	; MACROFUSION_MISCHEDPOSTRA: # %bb.0: # %entry			; MACROFUSION_MISCHEDPOSTRA: # %bb.0: # %entry
	Show All 21 Lines

llvm/test/CodeGen/X86/topdepthreduce-postra.mir

This file was added.

				# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
				# RUN: llc -mtriple=x86_64 -enable-post-misched -run-pass=postmisched -o - %s \| FileCheck %s
				---
				# Check that postmisched's TopDepthReduce heuristic moves the DEC32r later
				# because of the dependency on eax
				name: test
				body: \|
				bb.0:
				; CHECK-LABEL: name: test
				; CHECK: $eax = MOV32rr killed $edi
				; CHECK: MOV8mi killed renamable $rsi, 1, $noreg, 0, $noreg, 1 :: (store 1)
				; CHECK: renamable $eax = DEC32r killed renamable $eax, implicit-def $eflags
				$eax = MOV32rr $edi
				renamable $eax = DEC32r killed renamable $eax, implicit-def $eflags
				MOV8mi killed renamable $rsi, 1, $noreg, 0, $noreg, 1 :: (store 1)
				...

This is an archive of the discontinued LLVM Phabricator instance.

[MachineScheduler] Fix the TopDepth/BotHeightReduce latency heuristicsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 238215

llvm/lib/CodeGen/MachineScheduler.cpp

llvm/test/CodeGen/AArch64/arm64-zero-cycle-zeroing.ll

llvm/test/CodeGen/AMDGPU/bswap.ll

llvm/test/CodeGen/AMDGPU/byval-frame-setup.ll

llvm/test/CodeGen/AMDGPU/call-argument-types.ll

llvm/test/CodeGen/AMDGPU/chain-hi-to-lo.ll

llvm/test/CodeGen/AMDGPU/copy-illegal-type.ll

llvm/test/CodeGen/AMDGPU/cvt_f32_ubyte.ll

llvm/test/CodeGen/AMDGPU/fcmp.f16.ll

llvm/test/CodeGen/AMDGPU/fneg-combines.ll

llvm/test/CodeGen/AMDGPU/global-saddr.ll

llvm/test/CodeGen/AMDGPU/global_smrd.ll

llvm/test/CodeGen/AMDGPU/idiv-licm.ll

llvm/test/CodeGen/AMDGPU/idot2.ll

llvm/test/CodeGen/AMDGPU/idot4s.ll

llvm/test/CodeGen/AMDGPU/idot4u.ll

llvm/test/CodeGen/AMDGPU/idot8s.ll

llvm/test/CodeGen/AMDGPU/idot8u.ll

llvm/test/CodeGen/AMDGPU/insert_vector_elt.v2i16.ll

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.buffer.atomic.ll

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.struct.buffer.atomic.ll

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.ubfe.ll

llvm/test/CodeGen/AMDGPU/llvm.fma.f16.ll

llvm/test/CodeGen/AMDGPU/llvm.maxnum.f16.ll

llvm/test/CodeGen/AMDGPU/llvm.minnum.f16.ll

llvm/test/CodeGen/AMDGPU/lshr.v2i16.ll

llvm/test/CodeGen/AMDGPU/max.i16.ll

llvm/test/CodeGen/AMDGPU/mul24-pass-ordering.ll

llvm/test/CodeGen/AMDGPU/promote-constOffset-to-imm.ll

llvm/test/CodeGen/AMDGPU/saddo.ll

llvm/test/CodeGen/AMDGPU/salu-to-valu.ll

llvm/test/CodeGen/AMDGPU/sched-assert-dead-def-subreg-use-other-subreg.mir

llvm/test/CodeGen/AMDGPU/sdiv.ll

llvm/test/CodeGen/AMDGPU/sdwa-peephole.ll

llvm/test/CodeGen/AMDGPU/select.f16.ll

llvm/test/CodeGen/AMDGPU/shift-i64-opts.ll

llvm/test/CodeGen/AMDGPU/shl.ll

llvm/test/CodeGen/AMDGPU/shl.v2i16.ll

llvm/test/CodeGen/AMDGPU/shrink-add-sub-constant.ll

llvm/test/CodeGen/AMDGPU/si-triv-disjoint-mem-access.ll

llvm/test/CodeGen/AMDGPU/sign_extend.ll

llvm/test/CodeGen/AMDGPU/sub.v2i16.ll

llvm/test/CodeGen/AMDGPU/trunc-combine.ll

llvm/test/CodeGen/AMDGPU/v_madak_f16.ll

llvm/test/CodeGen/AMDGPU/widen-smrd-loads.ll

llvm/test/CodeGen/PowerPC/PR33671.ll

llvm/test/CodeGen/PowerPC/botheightreduce.mir

llvm/test/CodeGen/PowerPC/dform-adjust.ll

llvm/test/CodeGen/PowerPC/extract-and-store.ll

llvm/test/CodeGen/PowerPC/f128-aggregates.ll

llvm/test/CodeGen/PowerPC/f128-conv.ll

llvm/test/CodeGen/PowerPC/f128-passByValue.ll

llvm/test/CodeGen/PowerPC/float-load-store-pair.ll

llvm/test/CodeGen/PowerPC/load-shuffle-and-shuffle-store.ll

llvm/test/CodeGen/PowerPC/loop-instr-form-prepare.ll

llvm/test/CodeGen/PowerPC/machine-pre.ll

llvm/test/CodeGen/PowerPC/mi-peephole-splat.ll

llvm/test/CodeGen/PowerPC/ppcf128-constrained-fp-intrinsics.ll

llvm/test/CodeGen/PowerPC/pre-inc-disable.ll

llvm/test/CodeGen/PowerPC/remove-redundant-load-imm.ll

llvm/test/CodeGen/PowerPC/scalar_vector_test_2.ll

llvm/test/CodeGen/PowerPC/scalar_vector_test_4.ll

llvm/test/CodeGen/PowerPC/sms-cpy-1.ll

llvm/test/CodeGen/PowerPC/sms-grp-order.ll

llvm/test/CodeGen/PowerPC/sms-phi-3.ll

llvm/test/CodeGen/PowerPC/sms-simple.ll

llvm/test/CodeGen/PowerPC/srem-vector-lkk.ll

llvm/test/CodeGen/PowerPC/topdepthreduce-postra.mir

llvm/test/CodeGen/PowerPC/uint-to-fp-v4i32.ll

llvm/test/CodeGen/PowerPC/unaligned-addressing-mode.ll

llvm/test/CodeGen/PowerPC/urem-vector-lkk.ll

llvm/test/CodeGen/PowerPC/vavg.ll

llvm/test/CodeGen/PowerPC/vec-bswap.ll

[MachineScheduler] Fix the TopDepth/BotHeightReduce latency heuristics
ClosedPublic