This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/PowerPC/
-
Target/
-
PowerPC/
-
PPCISelLowering.cpp
-
test/CodeGen/PowerPC/
-
CodeGen/
-
PowerPC/
-
2006-08-11-RetVector.ll
-
aix-p9-xxinsertw-xxextractuw.ll
-
aix-vsx-splatimm.ll
-
aix32-p8-scalar_vector_conversions.ll
-
extract-and-store.ll
-
load-and-splat.ll
-
p8altivec-shuffles-pred.ll
-
perfect-shuffle.ll
-
ppc-32bit-build-vector.ll
-
pr27078.ll
-
scalar_vector_test_4.ll
-
test-vector-insert.ll
-
vec_extract_p9.ll
-
vec_perf_shuffle.ll
-
vec_shuffle_p8vector.ll

Differential D121082

[PowerPC] Disable perfect shuffle by default
ClosedPublic

Authored by qiucf on Mar 6 2022, 7:14 PM.

Download Raw Diff

Details

Reviewers

nemanjai
jsji
shchenz

Group Reviewers

Restricted Project

Commits

rG300e1293de63: [PowerPC] Disable perfect shuffle by default

Summary

We are going to remove the old 'perfect shuffle' optimization since it brings performance penalty in hot loop around vectors.

For example, in following loop sharing the same mask:

%v.1 = shufflevector %x.1, %y.1, <0, 1, 2, 3, 8, 9, 10, 11, 16, 17, 18, 19, 24, 25, 26, 27>
%v.2= shufflevector %x.2, %y.2, <0, 1, 2, 3, 8, 9, 10, 11, 16, 17, 18, 19, 24, 25, 26, 27>
...

The instruction result would be:

vmrglw ...
vmrghw ...
vmrglw ...
vmrghw ...

instead of

vperm
vperm
...

In some large loop cases, this causes 20%+ performance downgradation. In perfect-shuffle.ll, we also met such situation.

We indeed see some codegen cases are worse when disabling perfect shuffle, so they'll be fixed in a more careful way in future patches.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

qiucf created this revision.Mar 6 2022, 7:14 PM

Herald added a project: Restricted Project. · View Herald TranscriptMar 6 2022, 7:14 PM

Herald added subscribers: kbarton, hiraditya. · View Herald Transcript

qiucf requested review of this revision.Mar 6 2022, 7:14 PM

Herald added a project: Restricted Project. · View Herald TranscriptMar 6 2022, 7:14 PM

Herald added a subscriber: llvm-commits. · View Herald Transcript

qiucf mentioned this in D116801: [PowerPC] Avoid perfect shuffle when mask has multiple uses.Mar 6 2022, 7:15 PM

Harbormaster completed remote builds in B152827: Diff 413329.Mar 7 2022, 1:19 AM

Update test case

Harbormaster completed remote builds in B153743: Diff 414618.Mar 11 2022, 2:41 AM

Can you please add some comments about why it is bad for vector loops? And some general description about the performance test results with this turned off?

qiucf edited the summary of this revision. (Show Details)Mar 13 2022, 7:32 PM

Please also mention the attempt to avoid perfect shuffle when mask has multiple uses in https://reviews.llvm.org/D116801.

And also add TODO to testcases that will be handled in future patches.

This revision is now accepted and ready to land.Mar 13 2022, 8:00 PM

This revision was landed with ongoing or failed builds.Mar 15 2022, 1:02 AM

Closed by commit rG300e1293de63: [PowerPC] Disable perfect shuffle by default (authored by qiucf). · Explain Why

This revision was automatically updated to reflect the committed changes.

qiucf added a commit: rG300e1293de63: [PowerPC] Disable perfect shuffle by default.

Revision Contents

Path

Size

llvm/

lib/

Target/

PowerPC/

PPCISelLowering.cpp

2 lines

test/

CodeGen/

PowerPC/

2006-08-11-RetVector.ll

4 lines

aix-p9-xxinsertw-xxextractuw.ll

36 lines

aix-vsx-splatimm.ll

17 lines

aix32-p8-scalar_vector_conversions.ll

12 lines

extract-and-store.ll

24 lines

load-and-splat.ll

168 lines

p8altivec-shuffles-pred.ll

2 lines

perfect-shuffle.ll

4 lines

ppc-32bit-build-vector.ll

29 lines

pr27078.ll

33 lines

scalar_vector_test_4.ll

56 lines

test-vector-insert.ll

68 lines

vec_extract_p9.ll

8 lines

vec_perf_shuffle.ll

2 lines

vec_shuffle_p8vector.ll

39 lines

Diff 413329

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

	Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	static cl::opt<bool> EnableQuadwordAtomics(			static cl::opt<bool> EnableQuadwordAtomics(
	"ppc-quadword-atomics",			"ppc-quadword-atomics",
	cl::desc("enable quadword lock-free atomic operations"), cl::init(false),			cl::desc("enable quadword lock-free atomic operations"), cl::init(false),
	cl::Hidden);			cl::Hidden);

	static cl::opt<bool>			static cl::opt<bool>
	DisablePerfectShuffle("ppc-disable-perfect-shuffle",			DisablePerfectShuffle("ppc-disable-perfect-shuffle",
	cl::desc("disable vector permute decomposition"),			cl::desc("disable vector permute decomposition"),
	cl::init(false), cl::Hidden);			cl::init(true), cl::Hidden);

	STATISTIC(NumTailCalls, "Number of tail calls");			STATISTIC(NumTailCalls, "Number of tail calls");
	STATISTIC(NumSiblingCalls, "Number of sibling calls");			STATISTIC(NumSiblingCalls, "Number of sibling calls");
	STATISTIC(ShufflesHandledWithVPERM, "Number of shuffles lowered to a VPERM");			STATISTIC(ShufflesHandledWithVPERM, "Number of shuffles lowered to a VPERM");
	STATISTIC(NumDynamicAllocaProbed, "Number of dynamic stack allocation probed");			STATISTIC(NumDynamicAllocaProbed, "Number of dynamic stack allocation probed");

	static bool isNByteElemShuffleMask(ShuffleVectorSDNode *, unsigned, int);			static bool isNByteElemShuffleMask(ShuffleVectorSDNode *, unsigned, int);

	▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/2006-08-11-RetVector.ll

	; RUN: llc -verify-machineinstrs < %s -mtriple=ppc32-- -mcpu=g5 \| grep vsldoi			; RUN: llc -verify-machineinstrs < %s -mtriple=ppc32-- -mcpu=g5 -ppc-disable-perfect-shuffle=false \| grep vsldoi
	; RUN: llc -verify-machineinstrs < %s -mtriple=ppc32-- -mcpu=g5 \| not grep vor			; RUN: llc -verify-machineinstrs < %s -mtriple=ppc32-- -mcpu=g5 -ppc-disable-perfect-shuffle=false \| not grep vor

	define <4 x float> @func(<4 x float> %fp0, <4 x float> %fp1) {			define <4 x float> @func(<4 x float> %fp0, <4 x float> %fp1) {
	%tmp76 = shufflevector <4 x float> %fp0, <4 x float> %fp1, <4 x i32> < i32 0, i32 1, i32 2, i32 7 > ; <<4 x float>> [#uses=1]			%tmp76 = shufflevector <4 x float> %fp0, <4 x float> %fp1, <4 x i32> < i32 0, i32 1, i32 2, i32 7 > ; <<4 x float>> [#uses=1]
	ret <4 x float> %tmp76			ret <4 x float> %tmp76
	}			}

llvm/test/CodeGen/PowerPC/aix-p9-xxinsertw-xxextractuw.ll

	Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; CHECK-32-NEXT: blr			; CHECK-32-NEXT: blr
	entry:			entry:
	%vecins = shufflevector <4 x float> %a, <4 x float> %a, <4 x i32> <i32 0, i32 1, i32 2, i32 5>			%vecins = shufflevector <4 x float> %a, <4 x float> %a, <4 x i32> <i32 0, i32 1, i32 2, i32 5>
	ret <4 x float> %vecins			ret <4 x float> %vecins
	}			}
	define <4 x float> @testSameVecEl0LE(<4 x float> %a) {			define <4 x float> @testSameVecEl0LE(<4 x float> %a) {
	; CHECK-64-LABEL: testSameVecEl0LE:			; CHECK-64-LABEL: testSameVecEl0LE:
	; CHECK-64: # %bb.0: # %entry			; CHECK-64: # %bb.0: # %entry
	; CHECK-64-NEXT: xxspltw 0, 34, 2			; CHECK-64-NEXT: ld 3, L..C0(2) # %const.0
	; CHECK-64-NEXT: xxsldwi 0, 34, 0, 1			; CHECK-64-NEXT: lxv 35, 0(3)
	; CHECK-64-NEXT: xxsldwi 34, 0, 0, 3			; CHECK-64-NEXT: vperm 2, 2, 2, 3
	; CHECK-64-NEXT: blr			; CHECK-64-NEXT: blr
	;			;
	; CHECK-32-LABEL: testSameVecEl0LE:			; CHECK-32-LABEL: testSameVecEl0LE:
	; CHECK-32: # %bb.0: # %entry			; CHECK-32: # %bb.0: # %entry
	; CHECK-32-NEXT: xxspltw 0, 34, 2			; CHECK-32-NEXT: lwz 3, L..C0(2) # %const.0
	; CHECK-32-NEXT: xxsldwi 0, 34, 0, 1			; CHECK-32-NEXT: lxv 35, 0(3)
	; CHECK-32-NEXT: xxsldwi 34, 0, 0, 3			; CHECK-32-NEXT: vperm 2, 2, 2, 3
	; CHECK-32-NEXT: blr			; CHECK-32-NEXT: blr
	entry:			entry:
	%vecins = shufflevector <4 x float> %a, <4 x float> %a, <4 x i32> <i32 6, i32 1, i32 2, i32 3>			%vecins = shufflevector <4 x float> %a, <4 x float> %a, <4 x i32> <i32 6, i32 1, i32 2, i32 3>
	ret <4 x float> %vecins			ret <4 x float> %vecins
	}			}
	define <4 x float> @testSameVecEl1LE(<4 x float> %a) {			define <4 x float> @testSameVecEl1LE(<4 x float> %a) {
	; CHECK-64-LABEL: testSameVecEl1LE:			; CHECK-64-LABEL: testSameVecEl1LE:
	; CHECK-64: # %bb.0: # %entry			; CHECK-64: # %bb.0: # %entry
	; CHECK-64-NEXT: xxswapd 35, 34			; CHECK-64-NEXT: ld 3, L..C1(2) # %const.0
	; CHECK-64-NEXT: vmrghw 2, 2, 3			; CHECK-64-NEXT: lxv 35, 0(3)
	; CHECK-64-NEXT: vmrghw 2, 2, 3			; CHECK-64-NEXT: vperm 2, 2, 2, 3
	; CHECK-64-NEXT: blr			; CHECK-64-NEXT: blr
	;			;
	; CHECK-32-LABEL: testSameVecEl1LE:			; CHECK-32-LABEL: testSameVecEl1LE:
	; CHECK-32: # %bb.0: # %entry			; CHECK-32: # %bb.0: # %entry
	; CHECK-32-NEXT: xxswapd 35, 34			; CHECK-32-NEXT: lwz 3, L..C1(2) # %const.0
	; CHECK-32-NEXT: vmrghw 2, 2, 3			; CHECK-32-NEXT: lxv 35, 0(3)
	; CHECK-32-NEXT: vmrghw 2, 2, 3			; CHECK-32-NEXT: vperm 2, 2, 2, 3
	; CHECK-32-NEXT: blr			; CHECK-32-NEXT: blr
	entry:			entry:
	%vecins = shufflevector <4 x float> %a, <4 x float> %a, <4 x i32> <i32 0, i32 6, i32 2, i32 3>			%vecins = shufflevector <4 x float> %a, <4 x float> %a, <4 x i32> <i32 0, i32 6, i32 2, i32 3>
	ret <4 x float> %vecins			ret <4 x float> %vecins
	}			}
	define <4 x float> @testSameVecEl3LE(<4 x float> %a) {			define <4 x float> @testSameVecEl3LE(<4 x float> %a) {
	; CHECK-64-LABEL: testSameVecEl3LE:			; CHECK-64-LABEL: testSameVecEl3LE:
	; CHECK-64: # %bb.0: # %entry			; CHECK-64: # %bb.0: # %entry
	; CHECK-64-NEXT: xxspltw 0, 34, 2			; CHECK-64-NEXT: ld 3, L..C2(2) # %const.0
	; CHECK-64-NEXT: xxswapd 1, 34			; CHECK-64-NEXT: lxv 35, 0(3)
	; CHECK-64-NEXT: xxsldwi 34, 1, 0, 2			; CHECK-64-NEXT: vperm 2, 2, 2, 3
	; CHECK-64-NEXT: blr			; CHECK-64-NEXT: blr
	;			;
	; CHECK-32-LABEL: testSameVecEl3LE:			; CHECK-32-LABEL: testSameVecEl3LE:
	; CHECK-32: # %bb.0: # %entry			; CHECK-32: # %bb.0: # %entry
	; CHECK-32-NEXT: xxspltw 0, 34, 2			; CHECK-32-NEXT: lwz 3, L..C2(2) # %const.0
	; CHECK-32-NEXT: xxswapd 1, 34			; CHECK-32-NEXT: lxv 35, 0(3)
	; CHECK-32-NEXT: xxsldwi 34, 1, 0, 2			; CHECK-32-NEXT: vperm 2, 2, 2, 3
	; CHECK-32-NEXT: blr			; CHECK-32-NEXT: blr
	entry:			entry:
	%vecins = shufflevector <4 x float> %a, <4 x float> %a, <4 x i32> <i32 0, i32 1, i32 2, i32 6>			%vecins = shufflevector <4 x float> %a, <4 x float> %a, <4 x i32> <i32 0, i32 1, i32 2, i32 6>
	ret <4 x float> %vecins			ret <4 x float> %vecins
	}			}
	define <4 x float> @insertVarF(<4 x float> %a, float %f, i32 %el) {			define <4 x float> @insertVarF(<4 x float> %a, float %f, i32 %el) {
	; CHECK-64-LABEL: insertVarF:			; CHECK-64-LABEL: insertVarF:
	; CHECK-64: # %bb.0: # %entry			; CHECK-64: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 71 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/aix-vsx-splatimm.ll

	Show All 13 Lines
	; CHECK-AIX-NEXT: srwi 4, 4, 16			; CHECK-AIX-NEXT: srwi 4, 4, 16
	; CHECK-AIX-NEXT: srwi 5, 5, 16			; CHECK-AIX-NEXT: srwi 5, 5, 16
	; CHECK-AIX-NEXT: mullw 4, 5, 4			; CHECK-AIX-NEXT: mullw 4, 5, 4
	; CHECK-AIX-NEXT: lwz 5, 0(3)			; CHECK-AIX-NEXT: lwz 5, 0(3)
	; CHECK-AIX-NEXT: slwi 3, 3, 8			; CHECK-AIX-NEXT: slwi 3, 3, 8
	; CHECK-AIX-NEXT: neg 3, 3			; CHECK-AIX-NEXT: neg 3, 3
	; CHECK-AIX-NEXT: srwi 5, 5, 1			; CHECK-AIX-NEXT: srwi 5, 5, 1
	; CHECK-AIX-NEXT: sth 3, -32(1)			; CHECK-AIX-NEXT: sth 3, -32(1)
	; CHECK-AIX-NEXT: addi 3, 1, -32
	; CHECK-AIX-NEXT: mullw 4, 4, 5			; CHECK-AIX-NEXT: mullw 4, 4, 5
	; CHECK-AIX-NEXT: li 5, 0			; CHECK-AIX-NEXT: li 5, 0
	; CHECK-AIX-NEXT: sth 5, -48(1)			; CHECK-AIX-NEXT: sth 5, -48(1)
	; CHECK-AIX-NEXT: neg 4, 4			; CHECK-AIX-NEXT: neg 3, 4
	; CHECK-AIX-NEXT: sth 4, -16(1)
	; CHECK-AIX-NEXT: addi 4, 1, -48			; CHECK-AIX-NEXT: addi 4, 1, -48
				; CHECK-AIX-NEXT: sth 3, -16(1)
				; CHECK-AIX-NEXT: addi 3, 1, -32
	; CHECK-AIX-NEXT: lxvw4x 34, 0, 4			; CHECK-AIX-NEXT: lxvw4x 34, 0, 4
	; CHECK-AIX-NEXT: lxvw4x 35, 0, 3			; CHECK-AIX-NEXT: lxvw4x 35, 0, 3
	; CHECK-AIX-NEXT: addi 3, 1, -16			; CHECK-AIX-NEXT: addi 3, 1, -16
	; CHECK-AIX-NEXT: vmrghh 3, 2, 3
	; CHECK-AIX-NEXT: vsplth 4, 2, 0
	; CHECK-AIX-NEXT: vmrghw 3, 3, 4
	; CHECK-AIX-NEXT: lxvw4x 36, 0, 3			; CHECK-AIX-NEXT: lxvw4x 36, 0, 3
				; CHECK-AIX-NEXT: ld 3, L..C0(2) # %const.0
				; CHECK-AIX-NEXT: vmrghh 3, 2, 3
				; CHECK-AIX-NEXT: vsplth 5, 2, 0
	; CHECK-AIX-NEXT: vmrghh 2, 4, 2			; CHECK-AIX-NEXT: vmrghh 2, 4, 2
	; CHECK-AIX-NEXT: xxswapd 0, 35			; CHECK-AIX-NEXT: lxvw4x 36, 0, 3
	; CHECK-AIX-NEXT: xxsldwi 34, 0, 34, 2			; CHECK-AIX-NEXT: vmrghw 3, 3, 5
				; CHECK-AIX-NEXT: vperm 2, 3, 2, 4
	; CHECK-AIX-NEXT: vsplth 3, 2, 1			; CHECK-AIX-NEXT: vsplth 3, 2, 1
	; CHECK-AIX-NEXT: vsplth 2, 2, 4			; CHECK-AIX-NEXT: vsplth 2, 2, 4
	; CHECK-AIX-NEXT: stxvw4x 35, 0, 5			; CHECK-AIX-NEXT: stxvw4x 35, 0, 5
	; CHECK-AIX-NEXT: stxvw4x 34, 0, 3			; CHECK-AIX-NEXT: stxvw4x 34, 0, 3
	;			;
	; CHECK-LABEL: test_aix_splatimm:			; CHECK-LABEL: test_aix_splatimm:
	; CHECK: # %bb.0: # %bb			; CHECK: # %bb.0: # %bb
	; CHECK-NEXT: bclr 12, 20, 0			; CHECK-NEXT: bclr 12, 20, 0
	▲ Show 20 Lines • Show All 57 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/aix32-p8-scalar_vector_conversions.ll

Show First 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	entry:
%splat.splat = shufflevector <4 x i32> %splat.splatinsert, <4 x i32> undef, <4 x i32> zeroinitializer		%splat.splat = shufflevector <4 x i32> %splat.splatinsert, <4 x i32> undef, <4 x i32> zeroinitializer
ret <4 x i32> %splat.splat		ret <4 x i32> %splat.splat
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define <2 x i64> @buildl(i64 %a) {		define <2 x i64> @buildl(i64 %a) {
; CHECK-LABEL: buildl:		; CHECK-LABEL: buildl:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: lwz 5, L..C0(2) # %const.0
; CHECK-NEXT: stw 4, -16(1)		; CHECK-NEXT: stw 4, -16(1)
; CHECK-NEXT: stw 3, -32(1)		; CHECK-NEXT: stw 3, -32(1)
; CHECK-NEXT: addi 3, 1, -16		; CHECK-NEXT: addi 3, 1, -16
; CHECK-NEXT: addi 4, 1, -32		; CHECK-NEXT: addi 4, 1, -32
; CHECK-NEXT: lxvw4x 34, 0, 3		; CHECK-NEXT: lxvw4x 35, 0, 3
; CHECK-NEXT: lxvw4x 35, 0, 4		; CHECK-NEXT: lxvw4x 36, 0, 4
; CHECK-NEXT: vmrghw 2, 3, 2		; CHECK-NEXT: lxvw4x 34, 0, 5
; CHECK-NEXT: xxswapd 0, 34		; CHECK-NEXT: vperm 2, 4, 3, 2
; CHECK-NEXT: xxsldwi 34, 0, 34, 2
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%splat.splatinsert = insertelement <2 x i64> undef, i64 %a, i32 0		%splat.splatinsert = insertelement <2 x i64> undef, i64 %a, i32 0
%splat.splat = shufflevector <2 x i64> %splat.splatinsert, <2 x i64> undef, <2 x i32> zeroinitializer		%splat.splat = shufflevector <2 x i64> %splat.splatinsert, <2 x i64> undef, <2 x i32> zeroinitializer
ret <2 x i64> %splat.splat		ret <2 x i64> %splat.splat
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
Show All 10 Lines
}		}

; The optimization to remove stack operations from PPCDAGToDAGISel::Select		; The optimization to remove stack operations from PPCDAGToDAGISel::Select
; should still trigger for v2f64, producing an lxvdsx.		; should still trigger for v2f64, producing an lxvdsx.
; Function Attrs: norecurse nounwind readonly		; Function Attrs: norecurse nounwind readonly
define <2 x double> @buildd() {		define <2 x double> @buildd() {
; CHECK-LABEL: buildd:		; CHECK-LABEL: buildd:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: lwz 3, L..C0(2)		; CHECK-NEXT: lwz 3, L..C1(2) # @d
; CHECK-NEXT: lxvdsx 34, 0, 3		; CHECK-NEXT: lxvdsx 34, 0, 3
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%0 = load double, double* @d, align 8		%0 = load double, double* @d, align 8
%splat.splatinsert = insertelement <2 x double> undef, double %0, i32 0		%splat.splatinsert = insertelement <2 x double> undef, double %0, i32 0
%splat.splat = shufflevector <2 x double> %splat.splatinsert, <2 x double> undef, <2 x i32> zeroinitializer		%splat.splat = shufflevector <2 x double> %splat.splatinsert, <2 x double> undef, <2 x i32> zeroinitializer
ret <2 x double> %splat.splat		ret <2 x double> %splat.splat
}		}
▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/extract-and-store.ll

	Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: xxswapd vs0, vs35			; CHECK-NEXT: xxswapd vs0, vs35
	; CHECK-NEXT: stxvd2x vs0, 0, r5			; CHECK-NEXT: stxvd2x vs0, 0, r5
	; CHECK-NEXT: stfiwx f1, r5, r3			; CHECK-NEXT: stfiwx f1, r5, r3
	; CHECK-NEXT: stxsiwx vs34, r5, r4			; CHECK-NEXT: stxsiwx vs34, r5, r4
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	;			;
	; CHECK-BE-LABEL: test_stores_exceed_vec_size:			; CHECK-BE-LABEL: test_stores_exceed_vec_size:
	; CHECK-BE: # %bb.0: # %entry			; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: xxspltw vs0, vs34, 0			; CHECK-BE-NEXT: addis r3, r2, .LCPI16_0@toc@ha
	; CHECK-BE-NEXT: xxsldwi vs1, vs34, vs34, 1			; CHECK-BE-NEXT: xxsldwi vs0, vs34, vs34, 1
	; CHECK-BE-NEXT: li r3, 16
	; CHECK-BE-NEXT: li r4, 20			; CHECK-BE-NEXT: li r4, 20
				; CHECK-BE-NEXT: addi r3, r3, .LCPI16_0@toc@l
				; CHECK-BE-NEXT: lxvw4x vs35, 0, r3
				; CHECK-BE-NEXT: li r3, 16
	; CHECK-BE-NEXT: stxsiwx vs34, r5, r3			; CHECK-BE-NEXT: stxsiwx vs34, r5, r3
	; CHECK-BE-NEXT: xxsldwi vs0, vs34, vs0, 2			; CHECK-BE-NEXT: stfiwx f0, r5, r4
	; CHECK-BE-NEXT: stfiwx f1, r5, r4			; CHECK-BE-NEXT: vperm v3, v2, v2, v3
	; CHECK-BE-NEXT: stxvw4x vs0, 0, r5			; CHECK-BE-NEXT: stxvw4x vs35, 0, r5
	; CHECK-BE-NEXT: blr			; CHECK-BE-NEXT: blr
	;			;
	; CHECK-P9-LABEL: test_stores_exceed_vec_size:			; CHECK-P9-LABEL: test_stores_exceed_vec_size:
	; CHECK-P9: # %bb.0: # %entry			; CHECK-P9: # %bb.0: # %entry
	; CHECK-P9-NEXT: addis r3, r2, .LCPI16_0@toc@ha			; CHECK-P9-NEXT: addis r3, r2, .LCPI16_0@toc@ha
	; CHECK-P9-NEXT: xxsldwi vs0, vs34, vs34, 1			; CHECK-P9-NEXT: xxsldwi vs0, vs34, vs34, 1
	; CHECK-P9-NEXT: addi r3, r3, .LCPI16_0@toc@l			; CHECK-P9-NEXT: addi r3, r3, .LCPI16_0@toc@l
	; CHECK-P9-NEXT: lxv vs35, 0(r3)			; CHECK-P9-NEXT: lxv vs35, 0(r3)
	; CHECK-P9-NEXT: li r3, 16			; CHECK-P9-NEXT: li r3, 16
	; CHECK-P9-NEXT: stfiwx f0, r5, r3			; CHECK-P9-NEXT: stfiwx f0, r5, r3
	; CHECK-P9-NEXT: li r3, 20			; CHECK-P9-NEXT: li r3, 20
	; CHECK-P9-NEXT: stxsiwx vs34, r5, r3			; CHECK-P9-NEXT: stxsiwx vs34, r5, r3
	; CHECK-P9-NEXT: vperm v3, v2, v2, v3			; CHECK-P9-NEXT: vperm v3, v2, v2, v3
	; CHECK-P9-NEXT: stxv vs35, 0(r5)			; CHECK-P9-NEXT: stxv vs35, 0(r5)
	; CHECK-P9-NEXT: blr			; CHECK-P9-NEXT: blr
	;			;
	; CHECK-P9-BE-LABEL: test_stores_exceed_vec_size:			; CHECK-P9-BE-LABEL: test_stores_exceed_vec_size:
	; CHECK-P9-BE: # %bb.0: # %entry			; CHECK-P9-BE: # %bb.0: # %entry
	; CHECK-P9-BE-NEXT: xxspltw vs0, vs34, 0			; CHECK-P9-BE-NEXT: addis r3, r2, .LCPI16_0@toc@ha
				; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 1
				; CHECK-P9-BE-NEXT: addi r3, r3, .LCPI16_0@toc@l
				; CHECK-P9-BE-NEXT: lxv vs35, 0(r3)
	; CHECK-P9-BE-NEXT: li r3, 16			; CHECK-P9-BE-NEXT: li r3, 16
	; CHECK-P9-BE-NEXT: stxsiwx vs34, r5, r3			; CHECK-P9-BE-NEXT: stxsiwx vs34, r5, r3
	; CHECK-P9-BE-NEXT: li r3, 20			; CHECK-P9-BE-NEXT: li r3, 20
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs0, 2
	; CHECK-P9-BE-NEXT: stxv vs0, 0(r5)
	; CHECK-P9-BE-NEXT: xxsldwi vs0, vs34, vs34, 1
	; CHECK-P9-BE-NEXT: stfiwx f0, r5, r3			; CHECK-P9-BE-NEXT: stfiwx f0, r5, r3
				; CHECK-P9-BE-NEXT: vperm v3, v2, v2, v3
				; CHECK-P9-BE-NEXT: stxv vs35, 0(r5)
	; CHECK-P9-BE-NEXT: blr			; CHECK-P9-BE-NEXT: blr
	entry:			entry:
	%vecext = extractelement <4 x i32> %a, i32 2			%vecext = extractelement <4 x i32> %a, i32 2
	store i32 %vecext, i32* %b, align 4			store i32 %vecext, i32* %b, align 4
	%vecext1 = extractelement <4 x i32> %a, i32 3			%vecext1 = extractelement <4 x i32> %a, i32 3
	%arrayidx2 = getelementptr inbounds i32, i32* %b, i64 1			%arrayidx2 = getelementptr inbounds i32, i32* %b, i64 1
	store i32 %vecext1, i32* %arrayidx2, align 4			store i32 %vecext1, i32* %arrayidx2, align 4
	%vecext3 = extractelement <4 x i32> %a, i32 0			%vecext3 = extractelement <4 x i32> %a, i32 0
	▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/load-and-splat.ll

	Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; P7-NEXT: stxvd2x vs0, 0, r3			; P7-NEXT: stxvd2x vs0, 0, r3
	; P7-NEXT: blr			; P7-NEXT: blr
	;			;
	; P9-AIX32-LABEL: test4:			; P9-AIX32-LABEL: test4:
	; P9-AIX32: # %bb.0: # %entry			; P9-AIX32: # %bb.0: # %entry
	; P9-AIX32-NEXT: lwz r5, 24(r4)			; P9-AIX32-NEXT: lwz r5, 24(r4)
	; P9-AIX32-NEXT: lwz r4, 28(r4)			; P9-AIX32-NEXT: lwz r4, 28(r4)
	; P9-AIX32-NEXT: stw r4, -16(r1)			; P9-AIX32-NEXT: stw r4, -16(r1)
				; P9-AIX32-NEXT: lwz r4, L..C0(r2) # %const.0
	; P9-AIX32-NEXT: stw r5, -32(r1)			; P9-AIX32-NEXT: stw r5, -32(r1)
	; P9-AIX32-NEXT: lxv v2, -16(r1)			; P9-AIX32-NEXT: lxv v3, -16(r1)
	; P9-AIX32-NEXT: lxv v3, -32(r1)			; P9-AIX32-NEXT: lxv v4, -32(r1)
	; P9-AIX32-NEXT: vmrghw v2, v3, v2			; P9-AIX32-NEXT: lxv v2, 0(r4)
	; P9-AIX32-NEXT: xxswapd vs0, v2			; P9-AIX32-NEXT: vperm v2, v4, v3, v2
	; P9-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2			; P9-AIX32-NEXT: stxv v2, 0(r3)
	; P9-AIX32-NEXT: stxv vs0, 0(r3)
	; P9-AIX32-NEXT: blr			; P9-AIX32-NEXT: blr
	;			;
	; P8-AIX32-LABEL: test4:			; P8-AIX32-LABEL: test4:
	; P8-AIX32: # %bb.0: # %entry			; P8-AIX32: # %bb.0: # %entry
	; P8-AIX32-NEXT: lwz r5, 24(r4)			; P8-AIX32-NEXT: lwz r5, L..C0(r2) # %const.0
	; P8-AIX32-NEXT: lwz r4, 28(r4)			; P8-AIX32-NEXT: lwz r6, 28(r4)
	; P8-AIX32-NEXT: stw r4, -16(r1)			; P8-AIX32-NEXT: lwz r4, 24(r4)
	; P8-AIX32-NEXT: stw r5, -32(r1)			; P8-AIX32-NEXT: stw r6, -16(r1)
				; P8-AIX32-NEXT: stw r4, -32(r1)
	; P8-AIX32-NEXT: addi r4, r1, -16			; P8-AIX32-NEXT: addi r4, r1, -16
				; P8-AIX32-NEXT: lxvw4x v2, 0, r5
	; P8-AIX32-NEXT: addi r5, r1, -32			; P8-AIX32-NEXT: addi r5, r1, -32
	; P8-AIX32-NEXT: lxvw4x v2, 0, r4			; P8-AIX32-NEXT: lxvw4x v3, 0, r4
	; P8-AIX32-NEXT: lxvw4x v3, 0, r5			; P8-AIX32-NEXT: lxvw4x v4, 0, r5
	; P8-AIX32-NEXT: vmrghw v2, v3, v2			; P8-AIX32-NEXT: vperm v2, v4, v3, v2
	; P8-AIX32-NEXT: xxswapd vs0, v2			; P8-AIX32-NEXT: stxvw4x v2, 0, r3
	; P8-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2
	; P8-AIX32-NEXT: stxvw4x vs0, 0, r3
	; P8-AIX32-NEXT: blr			; P8-AIX32-NEXT: blr
	;			;
	; P7-AIX32-LABEL: test4:			; P7-AIX32-LABEL: test4:
	; P7-AIX32: # %bb.0: # %entry			; P7-AIX32: # %bb.0: # %entry
	; P7-AIX32-NEXT: lwz r6, 28(r4)			; P7-AIX32-NEXT: lwz r5, L..C0(r2) # %const.0
	; P7-AIX32-NEXT: lwz r4, 24(r4)			; P7-AIX32-NEXT: lwz r6, 24(r4)
	; P7-AIX32-NEXT: addi r5, r1, -16			; P7-AIX32-NEXT: lwz r4, 28(r4)
	; P7-AIX32-NEXT: stw r6, -16(r1)			; P7-AIX32-NEXT: stw r4, -16(r1)
	; P7-AIX32-NEXT: stw r4, -32(r1)			; P7-AIX32-NEXT: stw r6, -32(r1)
	; P7-AIX32-NEXT: addi r4, r1, -32
	; P7-AIX32-NEXT: lxvw4x v2, 0, r5			; P7-AIX32-NEXT: lxvw4x v2, 0, r5
				; P7-AIX32-NEXT: addi r4, r1, -16
				; P7-AIX32-NEXT: addi r5, r1, -32
	; P7-AIX32-NEXT: lxvw4x v3, 0, r4			; P7-AIX32-NEXT: lxvw4x v3, 0, r4
	; P7-AIX32-NEXT: vmrghw v2, v3, v2			; P7-AIX32-NEXT: lxvw4x v4, 0, r5
	; P7-AIX32-NEXT: xxswapd vs0, v2			; P7-AIX32-NEXT: vperm v2, v4, v3, v2
	; P7-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2			; P7-AIX32-NEXT: stxvw4x v2, 0, r3
	; P7-AIX32-NEXT: stxvw4x vs0, 0, r3
	; P7-AIX32-NEXT: blr			; P7-AIX32-NEXT: blr
	entry:			entry:
	%arrayidx = getelementptr inbounds i64, i64* %a, i64 3			%arrayidx = getelementptr inbounds i64, i64* %a, i64 3
	%0 = load i64, i64* %arrayidx, align 8			%0 = load i64, i64* %arrayidx, align 8
	%splat.splatinsert.i = insertelement <2 x i64> undef, i64 %0, i32 0			%splat.splatinsert.i = insertelement <2 x i64> undef, i64 %0, i32 0
	%splat.splat.i = shufflevector <2 x i64> %splat.splatinsert.i, <2 x i64> undef, <2 x i32> zeroinitializer			%splat.splat.i = shufflevector <2 x i64> %splat.splatinsert.i, <2 x i64> undef, <2 x i32> zeroinitializer
	store <2 x i64> %splat.splat.i, <2 x i64>* %c, align 16			store <2 x i64> %splat.splat.i, <2 x i64>* %c, align 16
	ret void			ret void
	Show All 22 Lines
	; P7-NEXT: stxvd2x vs0, 0, r3			; P7-NEXT: stxvd2x vs0, 0, r3
	; P7-NEXT: blr			; P7-NEXT: blr
	;			;
	; P9-AIX32-LABEL: test5:			; P9-AIX32-LABEL: test5:
	; P9-AIX32: # %bb.0: # %entry			; P9-AIX32: # %bb.0: # %entry
	; P9-AIX32-NEXT: lwz r4, 0(r4)			; P9-AIX32-NEXT: lwz r4, 0(r4)
	; P9-AIX32-NEXT: srawi r5, r4, 31			; P9-AIX32-NEXT: srawi r5, r4, 31
	; P9-AIX32-NEXT: stw r4, -16(r1)			; P9-AIX32-NEXT: stw r4, -16(r1)
	; P9-AIX32-NEXT: lxv v2, -16(r1)			; P9-AIX32-NEXT: lwz r4, L..C1(r2) # %const.0
				; P9-AIX32-NEXT: lxv v3, -16(r1)
	; P9-AIX32-NEXT: stw r5, -32(r1)			; P9-AIX32-NEXT: stw r5, -32(r1)
	; P9-AIX32-NEXT: lxv v3, -32(r1)			; P9-AIX32-NEXT: lxv v4, -32(r1)
	; P9-AIX32-NEXT: vmrghw v2, v3, v2			; P9-AIX32-NEXT: lxv v2, 0(r4)
	; P9-AIX32-NEXT: xxswapd vs0, v2			; P9-AIX32-NEXT: vperm v2, v4, v3, v2
	; P9-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2			; P9-AIX32-NEXT: stxv v2, 0(r3)
	; P9-AIX32-NEXT: stxv vs0, 0(r3)
	; P9-AIX32-NEXT: blr			; P9-AIX32-NEXT: blr
	;			;
	; P8-AIX32-LABEL: test5:			; P8-AIX32-LABEL: test5:
	; P8-AIX32: # %bb.0: # %entry			; P8-AIX32: # %bb.0: # %entry
				; P8-AIX32-NEXT: lwz r5, L..C1(r2) # %const.0
	; P8-AIX32-NEXT: lwz r4, 0(r4)			; P8-AIX32-NEXT: lwz r4, 0(r4)
	; P8-AIX32-NEXT: srawi r5, r4, 31
	; P8-AIX32-NEXT: stw r4, -16(r1)			; P8-AIX32-NEXT: stw r4, -16(r1)
				; P8-AIX32-NEXT: srawi r4, r4, 31
				; P8-AIX32-NEXT: stw r4, -32(r1)
				; P8-AIX32-NEXT: lxvw4x v2, 0, r5
	; P8-AIX32-NEXT: addi r4, r1, -16			; P8-AIX32-NEXT: addi r4, r1, -16
	; P8-AIX32-NEXT: stw r5, -32(r1)
	; P8-AIX32-NEXT: addi r5, r1, -32			; P8-AIX32-NEXT: addi r5, r1, -32
	; P8-AIX32-NEXT: lxvw4x v2, 0, r4			; P8-AIX32-NEXT: lxvw4x v3, 0, r4
	; P8-AIX32-NEXT: lxvw4x v3, 0, r5			; P8-AIX32-NEXT: lxvw4x v4, 0, r5
	; P8-AIX32-NEXT: vmrghw v2, v3, v2			; P8-AIX32-NEXT: vperm v2, v4, v3, v2
	; P8-AIX32-NEXT: xxswapd vs0, v2			; P8-AIX32-NEXT: stxvw4x v2, 0, r3
	; P8-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2
	; P8-AIX32-NEXT: stxvw4x vs0, 0, r3
	; P8-AIX32-NEXT: blr			; P8-AIX32-NEXT: blr
	;			;
	; P7-AIX32-LABEL: test5:			; P7-AIX32-LABEL: test5:
	; P7-AIX32: # %bb.0: # %entry			; P7-AIX32: # %bb.0: # %entry
	; P7-AIX32-NEXT: lwz r4, 0(r4)			; P7-AIX32-NEXT: lwz r4, 0(r4)
	; P7-AIX32-NEXT: addi r5, r1, -16			; P7-AIX32-NEXT: lwz r5, L..C1(r2) # %const.0
				; P7-AIX32-NEXT: srawi r6, r4, 31
	; P7-AIX32-NEXT: stw r4, -16(r1)			; P7-AIX32-NEXT: stw r4, -16(r1)
	; P7-AIX32-NEXT: srawi r4, r4, 31			; P7-AIX32-NEXT: addi r4, r1, -16
	; P7-AIX32-NEXT: stw r4, -32(r1)			; P7-AIX32-NEXT: stw r6, -32(r1)
	; P7-AIX32-NEXT: addi r4, r1, -32
	; P7-AIX32-NEXT: lxvw4x v2, 0, r5			; P7-AIX32-NEXT: lxvw4x v2, 0, r5
				; P7-AIX32-NEXT: addi r5, r1, -32
	; P7-AIX32-NEXT: lxvw4x v3, 0, r4			; P7-AIX32-NEXT: lxvw4x v3, 0, r4
	; P7-AIX32-NEXT: vmrghw v2, v3, v2			; P7-AIX32-NEXT: lxvw4x v4, 0, r5
	; P7-AIX32-NEXT: xxswapd vs0, v2			; P7-AIX32-NEXT: vperm v2, v4, v3, v2
	; P7-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2			; P7-AIX32-NEXT: stxvw4x v2, 0, r3
	; P7-AIX32-NEXT: stxvw4x vs0, 0, r3
	; P7-AIX32-NEXT: blr			; P7-AIX32-NEXT: blr
	entry:			entry:
	%0 = load i32, i32* %in, align 4			%0 = load i32, i32* %in, align 4
	%conv = sext i32 %0 to i64			%conv = sext i32 %0 to i64
	%splat.splatinsert.i = insertelement <2 x i64> poison, i64 %conv, i32 0			%splat.splatinsert.i = insertelement <2 x i64> poison, i64 %conv, i32 0
	%splat.splat.i = shufflevector <2 x i64> %splat.splatinsert.i, <2 x i64> poison, <2 x i32> zeroinitializer			%splat.splat.i = shufflevector <2 x i64> %splat.splatinsert.i, <2 x i64> poison, <2 x i32> zeroinitializer
	store <2 x i64> %splat.splat.i, <2 x i64>* %a, align 16			store <2 x i64> %splat.splat.i, <2 x i64>* %a, align 16
	ret void			ret void
	Show All 22 Lines
	; P7-NEXT: stxvd2x vs0, 0, r3			; P7-NEXT: stxvd2x vs0, 0, r3
	; P7-NEXT: blr			; P7-NEXT: blr
	;			;
	; P9-AIX32-LABEL: test6:			; P9-AIX32-LABEL: test6:
	; P9-AIX32: # %bb.0: # %entry			; P9-AIX32: # %bb.0: # %entry
	; P9-AIX32-NEXT: lwz r4, 0(r4)			; P9-AIX32-NEXT: lwz r4, 0(r4)
	; P9-AIX32-NEXT: li r5, 0			; P9-AIX32-NEXT: li r5, 0
	; P9-AIX32-NEXT: stw r5, -32(r1)			; P9-AIX32-NEXT: stw r5, -32(r1)
	; P9-AIX32-NEXT: lxv v2, -32(r1)			; P9-AIX32-NEXT: lxv v3, -32(r1)
	; P9-AIX32-NEXT: stw r4, -16(r1)			; P9-AIX32-NEXT: stw r4, -16(r1)
	; P9-AIX32-NEXT: lxv v3, -16(r1)			; P9-AIX32-NEXT: lwz r4, L..C2(r2) # %const.0
	; P9-AIX32-NEXT: vmrghw v2, v2, v3			; P9-AIX32-NEXT: lxv v4, -16(r1)
	; P9-AIX32-NEXT: xxswapd vs0, v2			; P9-AIX32-NEXT: lxv v2, 0(r4)
	; P9-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2			; P9-AIX32-NEXT: vperm v2, v3, v4, v2
	; P9-AIX32-NEXT: stxv vs0, 0(r3)			; P9-AIX32-NEXT: stxv v2, 0(r3)
	; P9-AIX32-NEXT: blr			; P9-AIX32-NEXT: blr
	;			;
	; P8-AIX32-LABEL: test6:			; P8-AIX32-LABEL: test6:
	; P8-AIX32: # %bb.0: # %entry			; P8-AIX32: # %bb.0: # %entry
				; P8-AIX32-NEXT: lwz r6, L..C2(r2) # %const.0
	; P8-AIX32-NEXT: lwz r4, 0(r4)			; P8-AIX32-NEXT: lwz r4, 0(r4)
	; P8-AIX32-NEXT: li r5, 0			; P8-AIX32-NEXT: li r5, 0
	; P8-AIX32-NEXT: stw r5, -32(r1)			; P8-AIX32-NEXT: stw r5, -32(r1)
	; P8-AIX32-NEXT: addi r5, r1, -16			; P8-AIX32-NEXT: addi r5, r1, -16
	; P8-AIX32-NEXT: stw r4, -16(r1)			; P8-AIX32-NEXT: stw r4, -16(r1)
	; P8-AIX32-NEXT: addi r4, r1, -32			; P8-AIX32-NEXT: addi r4, r1, -32
	; P8-AIX32-NEXT: lxvw4x v2, 0, r4			; P8-AIX32-NEXT: lxvw4x v2, 0, r6
	; P8-AIX32-NEXT: lxvw4x v3, 0, r5			; P8-AIX32-NEXT: lxvw4x v3, 0, r4
	; P8-AIX32-NEXT: vmrghw v2, v2, v3			; P8-AIX32-NEXT: lxvw4x v4, 0, r5
	; P8-AIX32-NEXT: xxswapd vs0, v2			; P8-AIX32-NEXT: vperm v2, v3, v4, v2
	; P8-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2			; P8-AIX32-NEXT: stxvw4x v2, 0, r3
	; P8-AIX32-NEXT: stxvw4x vs0, 0, r3
	; P8-AIX32-NEXT: blr			; P8-AIX32-NEXT: blr
	;			;
	; P7-AIX32-LABEL: test6:			; P7-AIX32-LABEL: test6:
	; P7-AIX32: # %bb.0: # %entry			; P7-AIX32: # %bb.0: # %entry
				; P7-AIX32-NEXT: lwz r5, L..C2(r2) # %const.0
	; P7-AIX32-NEXT: lwz r4, 0(r4)			; P7-AIX32-NEXT: lwz r4, 0(r4)
	; P7-AIX32-NEXT: li r5, 0			; P7-AIX32-NEXT: li r6, 0
	; P7-AIX32-NEXT: stw r5, -32(r1)			; P7-AIX32-NEXT: stw r6, -32(r1)
	; P7-AIX32-NEXT: addi r5, r1, -16
	; P7-AIX32-NEXT: stw r4, -16(r1)			; P7-AIX32-NEXT: stw r4, -16(r1)
	; P7-AIX32-NEXT: addi r4, r1, -32			; P7-AIX32-NEXT: addi r4, r1, -32
	; P7-AIX32-NEXT: lxvw4x v2, 0, r4			; P7-AIX32-NEXT: lxvw4x v2, 0, r5
	; P7-AIX32-NEXT: lxvw4x v3, 0, r5			; P7-AIX32-NEXT: addi r5, r1, -16
	; P7-AIX32-NEXT: vmrghw v2, v2, v3			; P7-AIX32-NEXT: lxvw4x v3, 0, r4
	; P7-AIX32-NEXT: xxswapd vs0, v2			; P7-AIX32-NEXT: lxvw4x v4, 0, r5
	; P7-AIX32-NEXT: xxsldwi vs0, vs0, v2, 2			; P7-AIX32-NEXT: vperm v2, v3, v4, v2
	; P7-AIX32-NEXT: stxvw4x vs0, 0, r3			; P7-AIX32-NEXT: stxvw4x v2, 0, r3
	; P7-AIX32-NEXT: blr			; P7-AIX32-NEXT: blr
	entry:			entry:
	%0 = load i32, i32* %in, align 4			%0 = load i32, i32* %in, align 4
	%conv = zext i32 %0 to i64			%conv = zext i32 %0 to i64
	%splat.splatinsert.i = insertelement <2 x i64> poison, i64 %conv, i32 0			%splat.splatinsert.i = insertelement <2 x i64> poison, i64 %conv, i32 0
	%splat.splat.i = shufflevector <2 x i64> %splat.splatinsert.i, <2 x i64> poison, <2 x i32> zeroinitializer			%splat.splat.i = shufflevector <2 x i64> %splat.splatinsert.i, <2 x i64> poison, <2 x i32> zeroinitializer
	store <2 x i64> %splat.splat.i, <2 x i64>* %a, align 16			store <2 x i64> %splat.splat.i, <2 x i64>* %a, align 16
	ret void			ret void
	▲ Show 20 Lines • Show All 182 Lines • ▼ Show 20 Lines
	; P9-AIX32-NEXT: lxv vs1, -16(r1)			; P9-AIX32-NEXT: lxv vs1, -16(r1)
	; P9-AIX32-NEXT: mtfprwz f0, r3			; P9-AIX32-NEXT: mtfprwz f0, r3
	; P9-AIX32-NEXT: xxinsertw vs1, vs0, 4			; P9-AIX32-NEXT: xxinsertw vs1, vs0, 4
	; P9-AIX32-NEXT: xxmrghd v2, vs1, vs1			; P9-AIX32-NEXT: xxmrghd v2, vs1, vs1
	; P9-AIX32-NEXT: blr			; P9-AIX32-NEXT: blr
	;			;
	; P8-AIX32-LABEL: unadjusted_lxvdsx:			; P8-AIX32-LABEL: unadjusted_lxvdsx:
	; P8-AIX32: # %bb.0: # %entry			; P8-AIX32: # %bb.0: # %entry
	; P8-AIX32-NEXT: lwz r4, 4(r3)			; P8-AIX32-NEXT: lwz r5, 4(r3)
	; P8-AIX32-NEXT: stw r4, -32(r1)			; P8-AIX32-NEXT: lwz r4, L..C3(r2) # %const.0
	; P8-AIX32-NEXT: addi r4, r1, -16			; P8-AIX32-NEXT: stw r5, -32(r1)
	; P8-AIX32-NEXT: lwz r3, 0(r3)			; P8-AIX32-NEXT: lwz r3, 0(r3)
				; P8-AIX32-NEXT: lxvw4x v2, 0, r4
				; P8-AIX32-NEXT: addi r4, r1, -16
	; P8-AIX32-NEXT: stw r3, -16(r1)			; P8-AIX32-NEXT: stw r3, -16(r1)
	; P8-AIX32-NEXT: addi r3, r1, -32			; P8-AIX32-NEXT: addi r3, r1, -32
	; P8-AIX32-NEXT: lxvw4x v2, 0, r3			; P8-AIX32-NEXT: lxvw4x v3, 0, r3
	; P8-AIX32-NEXT: lxvw4x v3, 0, r4			; P8-AIX32-NEXT: lxvw4x v4, 0, r4
	; P8-AIX32-NEXT: vmrghw v2, v3, v2			; P8-AIX32-NEXT: vperm v2, v4, v3, v2
	; P8-AIX32-NEXT: xxsldwi vs0, v3, v2, 2			; P8-AIX32-NEXT: xxmrghd v2, v2, v2
	; P8-AIX32-NEXT: xxmrgld v2, vs0, vs0
	; P8-AIX32-NEXT: blr			; P8-AIX32-NEXT: blr
	;			;
	; P7-AIX32-LABEL: unadjusted_lxvdsx:			; P7-AIX32-LABEL: unadjusted_lxvdsx:
	; P7-AIX32: # %bb.0: # %entry			; P7-AIX32: # %bb.0: # %entry
	; P7-AIX32-NEXT: lwz r5, 4(r3)			; P7-AIX32-NEXT: lwz r5, 4(r3)
	; P7-AIX32-NEXT: addi r4, r1, -32			; P7-AIX32-NEXT: lwz r4, L..C3(r2) # %const.0
	; P7-AIX32-NEXT: stw r5, -32(r1)			; P7-AIX32-NEXT: stw r5, -32(r1)
	; P7-AIX32-NEXT: lwz r3, 0(r3)			; P7-AIX32-NEXT: lwz r3, 0(r3)
	; P7-AIX32-NEXT: stw r3, -16(r1)
	; P7-AIX32-NEXT: addi r3, r1, -16
	; P7-AIX32-NEXT: lxvw4x v2, 0, r4			; P7-AIX32-NEXT: lxvw4x v2, 0, r4
				; P7-AIX32-NEXT: addi r4, r1, -16
				; P7-AIX32-NEXT: stw r3, -16(r1)
				; P7-AIX32-NEXT: addi r3, r1, -32
	; P7-AIX32-NEXT: lxvw4x v3, 0, r3			; P7-AIX32-NEXT: lxvw4x v3, 0, r3
	; P7-AIX32-NEXT: vmrghw v2, v3, v2			; P7-AIX32-NEXT: lxvw4x v4, 0, r4
	; P7-AIX32-NEXT: xxsldwi vs0, v3, v2, 2			; P7-AIX32-NEXT: vperm v2, v4, v3, v2
	; P7-AIX32-NEXT: xxmrgld v2, vs0, vs0			; P7-AIX32-NEXT: xxmrghd v2, v2, v2
	; P7-AIX32-NEXT: blr			; P7-AIX32-NEXT: blr
	entry:			entry:
	%0 = bitcast i64* %s to <8 x i8>*			%0 = bitcast i64* %s to <8 x i8>*
	%1 = load <8 x i8>, <8 x i8>* %0, align 8			%1 = load <8 x i8>, <8 x i8>* %0, align 8
	%2 = shufflevector <8 x i8> %1, <8 x i8> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>			%2 = shufflevector <8 x i8> %1, <8 x i8> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <16 x i8> %2			ret <16 x i8> %2
	}			}

	▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/p8altivec-shuffles-pred.ll

	; RUN: llc -verify-machineinstrs < %s \| FileCheck %s			; RUN: llc -verify-machineinstrs -ppc-disable-perfect-shuffle=false < %s \| FileCheck %s
	target datalayout = "E-m:e-i64:64-n32:64"			target datalayout = "E-m:e-i64:64-n32:64"
	target triple = "powerpc64-unknown-linux-gnu"			target triple = "powerpc64-unknown-linux-gnu"

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define <2 x i32> @test1(<4 x i32> %wide.vec) #0 {			define <2 x i32> @test1(<4 x i32> %wide.vec) #0 {
	entry:			entry:
	%strided.vec = shufflevector <4 x i32> %wide.vec, <4 x i32> undef, <2 x i32> <i32 0, i32 2>			%strided.vec = shufflevector <4 x i32> %wide.vec, <4 x i32> undef, <2 x i32> <i32 0, i32 2>
	ret <2 x i32> %strided.vec			ret <2 x i32> %strided.vec
	Show All 20 Lines

llvm/test/CodeGen/PowerPC/perfect-shuffle.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple powerpc64 -mcpu=pwr10 < %s \| FileCheck %s --check-prefix=BE			; RUN: llc -mtriple powerpc64 -mcpu=pwr10 -ppc-disable-perfect-shuffle=false < %s \| FileCheck %s --check-prefix=BE
	; RUN: llc -mtriple powerpc64le -mcpu=pwr10 < %s \| FileCheck %s --check-prefix=LE			; RUN: llc -mtriple powerpc64le -mcpu=pwr10 -ppc-disable-perfect-shuffle=false < %s \| FileCheck %s --check-prefix=LE

	define <4 x float> @shuffle1(<16 x i8> %v1, <16 x i8> %v2) {			define <4 x float> @shuffle1(<16 x i8> %v1, <16 x i8> %v2) {
	; BE-LABEL: shuffle1:			; BE-LABEL: shuffle1:
	; BE: # %bb.0:			; BE: # %bb.0:
	; BE-NEXT: vmrglw 4, 2, 3			; BE-NEXT: vmrglw 4, 2, 3
	; BE-NEXT: vmrghw 2, 2, 3			; BE-NEXT: vmrghw 2, 2, 3
	; BE-NEXT: vmrghw 2, 2, 4			; BE-NEXT: vmrghw 2, 2, 4
	; BE-NEXT: blr			; BE-NEXT: blr
	▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/ppc-32bit-build-vector.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -verify-machineinstrs -mtriple=powerpc -mcpu=pwr8 < %s \|\			; RUN: llc -verify-machineinstrs -mtriple=powerpc -mcpu=pwr8 < %s \|\
	; RUN: FileCheck %s --check-prefix=32BIT			; RUN: FileCheck %s --check-prefix=32BIT

	; RUN: llc -verify-machineinstrs -mtriple=powerpc64 -mcpu=pwr8 < %s \|\			; RUN: llc -verify-machineinstrs -mtriple=powerpc64 -mcpu=pwr8 < %s \|\
	; RUN: FileCheck %s --check-prefix=64BIT			; RUN: FileCheck %s --check-prefix=64BIT

	define dso_local fastcc void @BuildVectorICE() unnamed_addr {			define dso_local fastcc void @BuildVectorICE() unnamed_addr {
	; 32BIT-LABEL: BuildVectorICE:			; 32BIT-LABEL: BuildVectorICE:
	; 32BIT: # %bb.0: # %entry			; 32BIT: # %bb.0: # %entry
	; 32BIT-NEXT: stwu 1, -64(1)			; 32BIT-NEXT: stwu 1, -64(1)
	; 32BIT-NEXT: .cfi_def_cfa_offset 64			; 32BIT-NEXT: .cfi_def_cfa_offset 64
	; 32BIT-NEXT: lxvw4x 34, 0, 3			; 32BIT-NEXT: li 3, .LCPI0_0@l
	; 32BIT-NEXT: li 3, 0			; 32BIT-NEXT: lis 4, .LCPI0_0@ha
	; 32BIT-NEXT: addi 4, 1, 16			; 32BIT-NEXT: addi 5, 1, 16
	; 32BIT-NEXT: addi 5, 1, 32
	; 32BIT-NEXT: addi 6, 1, 48			; 32BIT-NEXT: addi 6, 1, 48
	; 32BIT-NEXT: li 7, 0			; 32BIT-NEXT: li 7, 0
				; 32BIT-NEXT: lxvw4x 34, 0, 3
				; 32BIT-NEXT: lxvw4x 35, 4, 3
				; 32BIT-NEXT: li 3, 0
				; 32BIT-NEXT: addi 4, 1, 32
	; 32BIT-NEXT: .p2align 4			; 32BIT-NEXT: .p2align 4
	; 32BIT-NEXT: .LBB0_1: # %while.body			; 32BIT-NEXT: .LBB0_1: # %while.body
	; 32BIT-NEXT: #			; 32BIT-NEXT: #
	; 32BIT-NEXT: stw 7, 16(1)
	; 32BIT-NEXT: stw 3, 32(1)			; 32BIT-NEXT: stw 3, 32(1)
	; 32BIT-NEXT: lxvw4x 0, 0, 4			; 32BIT-NEXT: stw 7, 16(1)
	; 32BIT-NEXT: lxvw4x 1, 0, 5			; 32BIT-NEXT: lxvw4x 36, 0, 4
	; 32BIT-NEXT: xxsldwi 0, 1, 0, 1			; 32BIT-NEXT: lxvw4x 37, 0, 5
	; 32BIT-NEXT: xxspltw 1, 1, 0			; 32BIT-NEXT: vperm 4, 5, 4, 3
	; 32BIT-NEXT: xxsldwi 35, 0, 1, 3			; 32BIT-NEXT: vadduwm 4, 2, 4
	; 32BIT-NEXT: vadduwm 3, 2, 3			; 32BIT-NEXT: xxspltw 37, 36, 1
	; 32BIT-NEXT: xxspltw 36, 35, 1			; 32BIT-NEXT: vadduwm 4, 4, 5
	; 32BIT-NEXT: vadduwm 3, 3, 4			; 32BIT-NEXT: stxvw4x 36, 0, 6
	; 32BIT-NEXT: stxvw4x 35, 0, 6
	; 32BIT-NEXT: lwz 7, 48(1)			; 32BIT-NEXT: lwz 7, 48(1)
	; 32BIT-NEXT: b .LBB0_1			; 32BIT-NEXT: b .LBB0_1
	;			;
	; 64BIT-LABEL: BuildVectorICE:			; 64BIT-LABEL: BuildVectorICE:
	; 64BIT: # %bb.0: # %entry			; 64BIT: # %bb.0: # %entry
	; 64BIT-NEXT: li 3, 0			; 64BIT-NEXT: li 3, 0
	; 64BIT-NEXT: lxvw4x 34, 0, 3			; 64BIT-NEXT: lxvw4x 34, 0, 3
	; 64BIT-NEXT: rldimi 3, 3, 32, 0			; 64BIT-NEXT: rldimi 3, 3, 32, 0
	Show All 27 Lines

llvm/test/CodeGen/PowerPC/pr27078.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -verify-machineinstrs -mtriple=powerpc64-linux-gnu -mcpu=pwr8 -mattr=+vsx < %s \| FileCheck %s			; RUN: llc -verify-machineinstrs -mtriple=powerpc64-linux-gnu -mcpu=pwr8 -mattr=+vsx < %s \| FileCheck %s

	define <4 x float> @bar(float* %p, float* %q) {			define <4 x float> @bar(float* %p, float* %q) {
	; CHECK-LABEL: bar:			; CHECK-LABEL: bar:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lxvw4x 0, 0, 3
	; CHECK-NEXT: lxvw4x 1, 0, 4
	; CHECK-NEXT: li 5, 16			; CHECK-NEXT: li 5, 16
	; CHECK-NEXT: lxvw4x 2, 3, 5			; CHECK-NEXT: lxvw4x 2, 0, 3
	; CHECK-NEXT: lxvw4x 3, 4, 5			; CHECK-NEXT: lxvw4x 3, 0, 4
				; CHECK-NEXT: lxvw4x 0, 3, 5
				; CHECK-NEXT: lxvw4x 1, 4, 5
	; CHECK-NEXT: li 5, 32			; CHECK-NEXT: li 5, 32
	; CHECK-NEXT: lxvw4x 4, 4, 5			; CHECK-NEXT: lxvw4x 4, 3, 5
	; CHECK-NEXT: xvsubsp 0, 1, 0			; CHECK-NEXT: lxvw4x 5, 4, 5
	; CHECK-NEXT: lxvw4x 1, 3, 5			; CHECK-NEXT: addis 3, 2, .LCPI0_0@toc@ha
	; CHECK-NEXT: xvsubsp 34, 3, 2			; CHECK-NEXT: xvsubsp 35, 3, 2
	; CHECK-NEXT: xvsubsp 35, 4, 1			; CHECK-NEXT: addi 3, 3, .LCPI0_0@toc@l
	; CHECK-NEXT: xxsldwi 36, 0, 0, 1			; CHECK-NEXT: xvsubsp 34, 1, 0
	; CHECK-NEXT: vmrglw 2, 4, 2			; CHECK-NEXT: lxvw4x 37, 0, 3
	; CHECK-NEXT: vmrghw 3, 3, 3			; CHECK-NEXT: addis 3, 2, .LCPI0_1@toc@ha
	; CHECK-NEXT: xxsldwi 0, 36, 34, 3			; CHECK-NEXT: xvsubsp 36, 5, 4
	; CHECK-NEXT: xxsldwi 0, 35, 0, 3			; CHECK-NEXT: addi 3, 3, .LCPI0_1@toc@l
	; CHECK-NEXT: xxsldwi 34, 0, 0, 1			; CHECK-NEXT: vperm 2, 3, 2, 5
				; CHECK-NEXT: vmrghw 3, 4, 4
				; CHECK-NEXT: lxvw4x 36, 0, 3
				; CHECK-NEXT: vperm 2, 2, 3, 4
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	%1 = bitcast float* %p to <12 x float>*			%1 = bitcast float* %p to <12 x float>*
	%2 = bitcast float* %q to <12 x float>*			%2 = bitcast float* %q to <12 x float>*
	%3 = load <12 x float>, <12 x float>* %1, align 16			%3 = load <12 x float>, <12 x float>* %1, align 16
	%4 = load <12 x float>, <12 x float>* %2, align 16			%4 = load <12 x float>, <12 x float>* %2, align 16
	%5 = fsub <12 x float> %4, %3			%5 = fsub <12 x float> %4, %3
	%6 = shufflevector <12 x float> %5, <12 x float> undef, <4 x i32> <i32 0, i32 3, i32 6, i32 9>			%6 = shufflevector <12 x float> %5, <12 x float> undef, <4 x i32> <i32 0, i32 3, i32 6, i32 9>
	ret <4 x float> %6			ret <4 x float> %6
	}			}

llvm/test/CodeGen/PowerPC/scalar_vector_test_4.ll

	Show All 29 Lines
	; P8LE-NEXT: lxsiwzx v4, 0, r3			; P8LE-NEXT: lxsiwzx v4, 0, r3
	; P8LE-NEXT: addi r4, r4, .LCPI0_0@toc@l			; P8LE-NEXT: addi r4, r4, .LCPI0_0@toc@l
	; P8LE-NEXT: lvx v3, 0, r4			; P8LE-NEXT: lvx v3, 0, r4
	; P8LE-NEXT: vperm v2, v2, v4, v3			; P8LE-NEXT: vperm v2, v2, v4, v3
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: s2v_test1:			; P8BE-LABEL: s2v_test1:
	; P8BE: # %bb.0: # %entry			; P8BE: # %bb.0: # %entry
	; P8BE-NEXT: lxsiwzx v3, 0, r3			; P8BE-NEXT: addis r4, r2, .LCPI0_0@toc@ha
	; P8BE-NEXT: vmrghw v4, v2, v3			; P8BE-NEXT: lxsiwzx v4, 0, r3
	; P8BE-NEXT: xxsldwi vs0, v2, v3, 1			; P8BE-NEXT: addi r4, r4, .LCPI0_0@toc@l
	; P8BE-NEXT: xxsldwi v2, v4, vs0, 3			; P8BE-NEXT: lxvw4x v3, 0, r4
				; P8BE-NEXT: vperm v2, v4, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	entry:			entry:
	%0 = load i32, i32* %int32, align 4			%0 = load i32, i32* %int32, align 4
	%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0			%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0
	ret <4 x i32> %vecins			ret <4 x i32> %vecins
	}			}

	; Function Attrs: norecurse nounwind readonly			; Function Attrs: norecurse nounwind readonly
	Show All 19 Lines
	; P8LE-NEXT: addi r4, r4, .LCPI1_0@toc@l			; P8LE-NEXT: addi r4, r4, .LCPI1_0@toc@l
	; P8LE-NEXT: lxsiwzx v4, 0, r3			; P8LE-NEXT: lxsiwzx v4, 0, r3
	; P8LE-NEXT: lvx v3, 0, r4			; P8LE-NEXT: lvx v3, 0, r4
	; P8LE-NEXT: vperm v2, v2, v4, v3			; P8LE-NEXT: vperm v2, v2, v4, v3
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: s2v_test2:			; P8BE-LABEL: s2v_test2:
	; P8BE: # %bb.0: # %entry			; P8BE: # %bb.0: # %entry
				; P8BE-NEXT: addis r4, r2, .LCPI1_0@toc@ha
	; P8BE-NEXT: addi r3, r3, 4			; P8BE-NEXT: addi r3, r3, 4
	; P8BE-NEXT: lxsiwzx v3, 0, r3			; P8BE-NEXT: addi r4, r4, .LCPI1_0@toc@l
	; P8BE-NEXT: vmrghw v4, v2, v3			; P8BE-NEXT: lxsiwzx v4, 0, r3
	; P8BE-NEXT: xxsldwi vs0, v2, v3, 1			; P8BE-NEXT: lxvw4x v3, 0, r4
	; P8BE-NEXT: xxsldwi v2, v4, vs0, 3			; P8BE-NEXT: vperm v2, v4, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	entry:			entry:
	%arrayidx = getelementptr inbounds i32, i32* %int32, i64 1			%arrayidx = getelementptr inbounds i32, i32* %int32, i64 1
	%0 = load i32, i32* %arrayidx, align 4			%0 = load i32, i32* %arrayidx, align 4
	%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0			%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0
	ret <4 x i32> %vecins			ret <4 x i32> %vecins
	}			}

	Show All 22 Lines
	; P8LE-NEXT: addi r4, r4, .LCPI2_0@toc@l			; P8LE-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; P8LE-NEXT: lxsiwzx v3, r3, r5			; P8LE-NEXT: lxsiwzx v3, r3, r5
	; P8LE-NEXT: lvx v4, 0, r4			; P8LE-NEXT: lvx v4, 0, r4
	; P8LE-NEXT: vperm v2, v2, v3, v4			; P8LE-NEXT: vperm v2, v2, v3, v4
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: s2v_test3:			; P8BE-LABEL: s2v_test3:
	; P8BE: # %bb.0: # %entry			; P8BE: # %bb.0: # %entry
	; P8BE-NEXT: sldi r4, r7, 2			; P8BE-NEXT: addis r4, r2, .LCPI2_0@toc@ha
	; P8BE-NEXT: lxsiwzx v3, r3, r4			; P8BE-NEXT: sldi r5, r7, 2
	; P8BE-NEXT: vmrghw v4, v2, v3			; P8BE-NEXT: addi r4, r4, .LCPI2_0@toc@l
	; P8BE-NEXT: xxsldwi vs0, v2, v3, 1			; P8BE-NEXT: lxsiwzx v3, r3, r5
	; P8BE-NEXT: xxsldwi v2, v4, vs0, 3			; P8BE-NEXT: lxvw4x v4, 0, r4
				; P8BE-NEXT: vperm v2, v3, v2, v4
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	entry:			entry:
	%idxprom = sext i32 %Idx to i64			%idxprom = sext i32 %Idx to i64
	%arrayidx = getelementptr inbounds i32, i32* %int32, i64 %idxprom			%arrayidx = getelementptr inbounds i32, i32* %int32, i64 %idxprom
	%0 = load i32, i32* %arrayidx, align 4			%0 = load i32, i32* %arrayidx, align 4
	%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0			%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0
	ret <4 x i32> %vecins			ret <4 x i32> %vecins
	}			}
	Show All 21 Lines
	; P8LE-NEXT: addi r4, r4, .LCPI3_0@toc@l			; P8LE-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; P8LE-NEXT: lxsiwzx v4, 0, r3			; P8LE-NEXT: lxsiwzx v4, 0, r3
	; P8LE-NEXT: lvx v3, 0, r4			; P8LE-NEXT: lvx v3, 0, r4
	; P8LE-NEXT: vperm v2, v2, v4, v3			; P8LE-NEXT: vperm v2, v2, v4, v3
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: s2v_test4:			; P8BE-LABEL: s2v_test4:
	; P8BE: # %bb.0: # %entry			; P8BE: # %bb.0: # %entry
				; P8BE-NEXT: addis r4, r2, .LCPI3_0@toc@ha
	; P8BE-NEXT: addi r3, r3, 4			; P8BE-NEXT: addi r3, r3, 4
	; P8BE-NEXT: lxsiwzx v3, 0, r3			; P8BE-NEXT: addi r4, r4, .LCPI3_0@toc@l
	; P8BE-NEXT: vmrghw v4, v2, v3			; P8BE-NEXT: lxsiwzx v4, 0, r3
	; P8BE-NEXT: xxsldwi vs0, v2, v3, 1			; P8BE-NEXT: lxvw4x v3, 0, r4
	; P8BE-NEXT: xxsldwi v2, v4, vs0, 3			; P8BE-NEXT: vperm v2, v4, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	entry:			entry:
	%arrayidx = getelementptr inbounds i32, i32* %int32, i64 1			%arrayidx = getelementptr inbounds i32, i32* %int32, i64 1
	%0 = load i32, i32* %arrayidx, align 4			%0 = load i32, i32* %arrayidx, align 4
	%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0			%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0
	ret <4 x i32> %vecins			ret <4 x i32> %vecins
	}			}

	Show All 19 Lines
	; P8LE-NEXT: lxsiwzx v4, 0, r5			; P8LE-NEXT: lxsiwzx v4, 0, r5
	; P8LE-NEXT: addi r3, r3, .LCPI4_0@toc@l			; P8LE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P8LE-NEXT: lvx v3, 0, r3			; P8LE-NEXT: lvx v3, 0, r3
	; P8LE-NEXT: vperm v2, v2, v4, v3			; P8LE-NEXT: vperm v2, v2, v4, v3
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: s2v_test5:			; P8BE-LABEL: s2v_test5:
	; P8BE: # %bb.0: # %entry			; P8BE: # %bb.0: # %entry
	; P8BE-NEXT: lxsiwzx v3, 0, r5			; P8BE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P8BE-NEXT: vmrghw v4, v2, v3			; P8BE-NEXT: lxsiwzx v4, 0, r5
	; P8BE-NEXT: xxsldwi vs0, v2, v3, 1			; P8BE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P8BE-NEXT: xxsldwi v2, v4, vs0, 3			; P8BE-NEXT: lxvw4x v3, 0, r3
				; P8BE-NEXT: vperm v2, v4, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	entry:			entry:
	%0 = load i32, i32* %ptr1, align 4			%0 = load i32, i32* %ptr1, align 4
	%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0			%vecins = insertelement <4 x i32> %vec, i32 %0, i32 0
	ret <4 x i32> %vecins			ret <4 x i32> %vecins
	}			}

	; Function Attrs: norecurse nounwind readonly			; Function Attrs: norecurse nounwind readonly
	Show All 18 Lines
	; P8LE-NEXT: lxsiwzx v4, 0, r3			; P8LE-NEXT: lxsiwzx v4, 0, r3
	; P8LE-NEXT: addi r4, r4, .LCPI5_0@toc@l			; P8LE-NEXT: addi r4, r4, .LCPI5_0@toc@l
	; P8LE-NEXT: lvx v3, 0, r4			; P8LE-NEXT: lvx v3, 0, r4
	; P8LE-NEXT: vperm v2, v2, v4, v3			; P8LE-NEXT: vperm v2, v2, v4, v3
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: s2v_test_f1:			; P8BE-LABEL: s2v_test_f1:
	; P8BE: # %bb.0: # %entry			; P8BE: # %bb.0: # %entry
	; P8BE-NEXT: lxsiwzx v3, 0, r3			; P8BE-NEXT: addis r4, r2, .LCPI5_0@toc@ha
	; P8BE-NEXT: vmrghw v4, v2, v3			; P8BE-NEXT: lxsiwzx v4, 0, r3
	; P8BE-NEXT: xxsldwi vs0, v2, v3, 1			; P8BE-NEXT: addi r4, r4, .LCPI5_0@toc@l
	; P8BE-NEXT: xxsldwi v2, v4, vs0, 3			; P8BE-NEXT: lxvw4x v3, 0, r4
				; P8BE-NEXT: vperm v2, v4, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	entry:			entry:
	%0 = load float, float* %f64, align 4			%0 = load float, float* %f64, align 4
	%vecins = insertelement <4 x float> %vec, float %0, i32 0			%vecins = insertelement <4 x float> %vec, float %0, i32 0
	ret <4 x float> %vecins			ret <4 x float> %vecins
	}			}

	; Function Attrs: norecurse nounwind readonly			; Function Attrs: norecurse nounwind readonly
	▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/test-vector-insert.ll

	Show First 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; CHECK-LE-P9-NEXT: xscvdpsxws f0, f1			; CHECK-LE-P9-NEXT: xscvdpsxws f0, f1
	; CHECK-LE-P9-NEXT: xxinsertw v2, vs0, 0			; CHECK-LE-P9-NEXT: xxinsertw v2, vs0, 0
	; CHECK-LE-P9-NEXT: blr			; CHECK-LE-P9-NEXT: blr
	;			;
	; CHECK-BE-P7-LABEL: test:			; CHECK-BE-P7-LABEL: test:
	; CHECK-BE-P7: # %bb.0: # %entry			; CHECK-BE-P7: # %bb.0: # %entry
	; CHECK-BE-P7-NEXT: xscvdpsxws f0, f1			; CHECK-BE-P7-NEXT: xscvdpsxws f0, f1
	; CHECK-BE-P7-NEXT: addi r3, r1, -4			; CHECK-BE-P7-NEXT: addi r3, r1, -4
				; CHECK-BE-P7-NEXT: addis r4, r2, .LCPI0_0@toc@ha
	; CHECK-BE-P7-NEXT: stfiwx f0, 0, r3			; CHECK-BE-P7-NEXT: stfiwx f0, 0, r3
	; CHECK-BE-P7-NEXT: lwz r3, -4(r1)			; CHECK-BE-P7-NEXT: lwz r3, -4(r1)
	; CHECK-BE-P7-NEXT: xxsldwi vs0, v2, v2, 3
	; CHECK-BE-P7-NEXT: stw r3, -32(r1)			; CHECK-BE-P7-NEXT: stw r3, -32(r1)
	; CHECK-BE-P7-NEXT: addi r3, r1, -32			; CHECK-BE-P7-NEXT: addi r3, r4, .LCPI0_0@toc@l
	; CHECK-BE-P7-NEXT: lxvw4x vs1, 0, r3			; CHECK-BE-P7-NEXT: addi r4, r1, -32
	; CHECK-BE-P7-NEXT: xxsldwi v2, vs0, vs1, 1			; CHECK-BE-P7-NEXT: lxvw4x v3, 0, r3
				; CHECK-BE-P7-NEXT: lxvw4x v4, 0, r4
				; CHECK-BE-P7-NEXT: vperm v2, v2, v4, v3
	; CHECK-BE-P7-NEXT: blr			; CHECK-BE-P7-NEXT: blr
	;			;
	; CHECK-BE-P8-LABEL: test:			; CHECK-BE-P8-LABEL: test:
	; CHECK-BE-P8: # %bb.0: # %entry			; CHECK-BE-P8: # %bb.0: # %entry
	; CHECK-BE-P8-NEXT: xscvdpsxws v3, f1			; CHECK-BE-P8-NEXT: xscvdpsxws v3, f1
	; CHECK-BE-P8-NEXT: vmrghw v3, v2, v3			; CHECK-BE-P8-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; CHECK-BE-P8-NEXT: xxsldwi vs0, v3, v2, 3			; CHECK-BE-P8-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; CHECK-BE-P8-NEXT: xxsldwi v2, vs0, vs0, 1			; CHECK-BE-P8-NEXT: lxvw4x v4, 0, r3
				; CHECK-BE-P8-NEXT: vperm v2, v2, v3, v4
	; CHECK-BE-P8-NEXT: blr			; CHECK-BE-P8-NEXT: blr
	;			;
	; CHECK-BE-P9-LABEL: test:			; CHECK-BE-P9-LABEL: test:
	; CHECK-BE-P9: # %bb.0: # %entry			; CHECK-BE-P9: # %bb.0: # %entry
	; CHECK-BE-P9-NEXT: xscvdpsxws f0, f1			; CHECK-BE-P9-NEXT: xscvdpsxws f0, f1
	; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12			; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12
	; CHECK-BE-P9-NEXT: blr			; CHECK-BE-P9-NEXT: blr
	entry:			entry:
	Show All 32 Lines
	; CHECK-LE-P9-NEXT: xscvdpsxws f0, f1			; CHECK-LE-P9-NEXT: xscvdpsxws f0, f1
	; CHECK-LE-P9-NEXT: xxinsertw v2, vs0, 0			; CHECK-LE-P9-NEXT: xxinsertw v2, vs0, 0
	; CHECK-LE-P9-NEXT: blr			; CHECK-LE-P9-NEXT: blr
	;			;
	; CHECK-BE-P7-LABEL: test2:			; CHECK-BE-P7-LABEL: test2:
	; CHECK-BE-P7: # %bb.0: # %entry			; CHECK-BE-P7: # %bb.0: # %entry
	; CHECK-BE-P7-NEXT: xscvdpsxws f0, f1			; CHECK-BE-P7-NEXT: xscvdpsxws f0, f1
	; CHECK-BE-P7-NEXT: addi r3, r1, -4			; CHECK-BE-P7-NEXT: addi r3, r1, -4
				; CHECK-BE-P7-NEXT: addis r4, r2, .LCPI1_0@toc@ha
	; CHECK-BE-P7-NEXT: stfiwx f0, 0, r3			; CHECK-BE-P7-NEXT: stfiwx f0, 0, r3
	; CHECK-BE-P7-NEXT: lwz r3, -4(r1)			; CHECK-BE-P7-NEXT: lwz r3, -4(r1)
	; CHECK-BE-P7-NEXT: xxsldwi vs0, v2, v2, 3
	; CHECK-BE-P7-NEXT: stw r3, -32(r1)			; CHECK-BE-P7-NEXT: stw r3, -32(r1)
	; CHECK-BE-P7-NEXT: addi r3, r1, -32			; CHECK-BE-P7-NEXT: addi r3, r4, .LCPI1_0@toc@l
	; CHECK-BE-P7-NEXT: lxvw4x vs1, 0, r3			; CHECK-BE-P7-NEXT: addi r4, r1, -32
	; CHECK-BE-P7-NEXT: xxsldwi v2, vs0, vs1, 1			; CHECK-BE-P7-NEXT: lxvw4x v3, 0, r3
				; CHECK-BE-P7-NEXT: lxvw4x v4, 0, r4
				; CHECK-BE-P7-NEXT: vperm v2, v2, v4, v3
	; CHECK-BE-P7-NEXT: blr			; CHECK-BE-P7-NEXT: blr
	;			;
	; CHECK-BE-P8-LABEL: test2:			; CHECK-BE-P8-LABEL: test2:
	; CHECK-BE-P8: # %bb.0: # %entry			; CHECK-BE-P8: # %bb.0: # %entry
	; CHECK-BE-P8-NEXT: xscvdpsxws v3, f1			; CHECK-BE-P8-NEXT: xscvdpsxws v3, f1
	; CHECK-BE-P8-NEXT: vmrghw v3, v2, v3			; CHECK-BE-P8-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; CHECK-BE-P8-NEXT: xxsldwi vs0, v3, v2, 3			; CHECK-BE-P8-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; CHECK-BE-P8-NEXT: xxsldwi v2, vs0, vs0, 1			; CHECK-BE-P8-NEXT: lxvw4x v4, 0, r3
				; CHECK-BE-P8-NEXT: vperm v2, v2, v3, v4
	; CHECK-BE-P8-NEXT: blr			; CHECK-BE-P8-NEXT: blr
	;			;
	; CHECK-BE-P9-LABEL: test2:			; CHECK-BE-P9-LABEL: test2:
	; CHECK-BE-P9: # %bb.0: # %entry			; CHECK-BE-P9: # %bb.0: # %entry
	; CHECK-BE-P9-NEXT: xscvdpsxws f0, f1			; CHECK-BE-P9-NEXT: xscvdpsxws f0, f1
	; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12			; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12
	; CHECK-BE-P9-NEXT: blr			; CHECK-BE-P9-NEXT: blr
	entry:			entry:
	Show All 32 Lines
	; CHECK-LE-P9-NEXT: xscvdpuxws f0, f1			; CHECK-LE-P9-NEXT: xscvdpuxws f0, f1
	; CHECK-LE-P9-NEXT: xxinsertw v2, vs0, 0			; CHECK-LE-P9-NEXT: xxinsertw v2, vs0, 0
	; CHECK-LE-P9-NEXT: blr			; CHECK-LE-P9-NEXT: blr
	;			;
	; CHECK-BE-P7-LABEL: test3:			; CHECK-BE-P7-LABEL: test3:
	; CHECK-BE-P7: # %bb.0: # %entry			; CHECK-BE-P7: # %bb.0: # %entry
	; CHECK-BE-P7-NEXT: xscvdpuxws f0, f1			; CHECK-BE-P7-NEXT: xscvdpuxws f0, f1
	; CHECK-BE-P7-NEXT: addi r3, r1, -4			; CHECK-BE-P7-NEXT: addi r3, r1, -4
				; CHECK-BE-P7-NEXT: addis r4, r2, .LCPI2_0@toc@ha
	; CHECK-BE-P7-NEXT: stfiwx f0, 0, r3			; CHECK-BE-P7-NEXT: stfiwx f0, 0, r3
	; CHECK-BE-P7-NEXT: lwz r3, -4(r1)			; CHECK-BE-P7-NEXT: lwz r3, -4(r1)
	; CHECK-BE-P7-NEXT: xxsldwi vs0, v2, v2, 3
	; CHECK-BE-P7-NEXT: stw r3, -32(r1)			; CHECK-BE-P7-NEXT: stw r3, -32(r1)
	; CHECK-BE-P7-NEXT: addi r3, r1, -32			; CHECK-BE-P7-NEXT: addi r3, r4, .LCPI2_0@toc@l
	; CHECK-BE-P7-NEXT: lxvw4x vs1, 0, r3			; CHECK-BE-P7-NEXT: addi r4, r1, -32
	; CHECK-BE-P7-NEXT: xxsldwi v2, vs0, vs1, 1			; CHECK-BE-P7-NEXT: lxvw4x v3, 0, r3
				; CHECK-BE-P7-NEXT: lxvw4x v4, 0, r4
				; CHECK-BE-P7-NEXT: vperm v2, v2, v4, v3
	; CHECK-BE-P7-NEXT: blr			; CHECK-BE-P7-NEXT: blr
	;			;
	; CHECK-BE-P8-LABEL: test3:			; CHECK-BE-P8-LABEL: test3:
	; CHECK-BE-P8: # %bb.0: # %entry			; CHECK-BE-P8: # %bb.0: # %entry
	; CHECK-BE-P8-NEXT: xscvdpuxws v3, f1			; CHECK-BE-P8-NEXT: xscvdpuxws v3, f1
	; CHECK-BE-P8-NEXT: vmrghw v3, v2, v3			; CHECK-BE-P8-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; CHECK-BE-P8-NEXT: xxsldwi vs0, v3, v2, 3			; CHECK-BE-P8-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; CHECK-BE-P8-NEXT: xxsldwi v2, vs0, vs0, 1			; CHECK-BE-P8-NEXT: lxvw4x v4, 0, r3
				; CHECK-BE-P8-NEXT: vperm v2, v2, v3, v4
	; CHECK-BE-P8-NEXT: blr			; CHECK-BE-P8-NEXT: blr
	;			;
	; CHECK-BE-P9-LABEL: test3:			; CHECK-BE-P9-LABEL: test3:
	; CHECK-BE-P9: # %bb.0: # %entry			; CHECK-BE-P9: # %bb.0: # %entry
	; CHECK-BE-P9-NEXT: xscvdpuxws f0, f1			; CHECK-BE-P9-NEXT: xscvdpuxws f0, f1
	; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12			; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12
	; CHECK-BE-P9-NEXT: blr			; CHECK-BE-P9-NEXT: blr
	entry:			entry:
	Show All 32 Lines
	; CHECK-LE-P9-NEXT: xscvdpuxws f0, f1			; CHECK-LE-P9-NEXT: xscvdpuxws f0, f1
	; CHECK-LE-P9-NEXT: xxinsertw v2, vs0, 0			; CHECK-LE-P9-NEXT: xxinsertw v2, vs0, 0
	; CHECK-LE-P9-NEXT: blr			; CHECK-LE-P9-NEXT: blr
	;			;
	; CHECK-BE-P7-LABEL: test4:			; CHECK-BE-P7-LABEL: test4:
	; CHECK-BE-P7: # %bb.0: # %entry			; CHECK-BE-P7: # %bb.0: # %entry
	; CHECK-BE-P7-NEXT: xscvdpuxws f0, f1			; CHECK-BE-P7-NEXT: xscvdpuxws f0, f1
	; CHECK-BE-P7-NEXT: addi r3, r1, -4			; CHECK-BE-P7-NEXT: addi r3, r1, -4
				; CHECK-BE-P7-NEXT: addis r4, r2, .LCPI3_0@toc@ha
	; CHECK-BE-P7-NEXT: stfiwx f0, 0, r3			; CHECK-BE-P7-NEXT: stfiwx f0, 0, r3
	; CHECK-BE-P7-NEXT: lwz r3, -4(r1)			; CHECK-BE-P7-NEXT: lwz r3, -4(r1)
	; CHECK-BE-P7-NEXT: xxsldwi vs0, v2, v2, 3
	; CHECK-BE-P7-NEXT: stw r3, -32(r1)			; CHECK-BE-P7-NEXT: stw r3, -32(r1)
	; CHECK-BE-P7-NEXT: addi r3, r1, -32			; CHECK-BE-P7-NEXT: addi r3, r4, .LCPI3_0@toc@l
	; CHECK-BE-P7-NEXT: lxvw4x vs1, 0, r3			; CHECK-BE-P7-NEXT: addi r4, r1, -32
	; CHECK-BE-P7-NEXT: xxsldwi v2, vs0, vs1, 1			; CHECK-BE-P7-NEXT: lxvw4x v3, 0, r3
				; CHECK-BE-P7-NEXT: lxvw4x v4, 0, r4
				; CHECK-BE-P7-NEXT: vperm v2, v2, v4, v3
	; CHECK-BE-P7-NEXT: blr			; CHECK-BE-P7-NEXT: blr
	;			;
	; CHECK-BE-P8-LABEL: test4:			; CHECK-BE-P8-LABEL: test4:
	; CHECK-BE-P8: # %bb.0: # %entry			; CHECK-BE-P8: # %bb.0: # %entry
	; CHECK-BE-P8-NEXT: xscvdpuxws v3, f1			; CHECK-BE-P8-NEXT: xscvdpuxws v3, f1
	; CHECK-BE-P8-NEXT: vmrghw v3, v2, v3			; CHECK-BE-P8-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; CHECK-BE-P8-NEXT: xxsldwi vs0, v3, v2, 3			; CHECK-BE-P8-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; CHECK-BE-P8-NEXT: xxsldwi v2, vs0, vs0, 1			; CHECK-BE-P8-NEXT: lxvw4x v4, 0, r3
				; CHECK-BE-P8-NEXT: vperm v2, v2, v3, v4
	; CHECK-BE-P8-NEXT: blr			; CHECK-BE-P8-NEXT: blr
	;			;
	; CHECK-BE-P9-LABEL: test4:			; CHECK-BE-P9-LABEL: test4:
	; CHECK-BE-P9: # %bb.0: # %entry			; CHECK-BE-P9: # %bb.0: # %entry
	; CHECK-BE-P9-NEXT: xscvdpuxws f0, f1			; CHECK-BE-P9-NEXT: xscvdpuxws f0, f1
	; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12			; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12
	; CHECK-BE-P9-NEXT: blr			; CHECK-BE-P9-NEXT: blr
	entry:			entry:
	%conv = fptoui float %b to i32			%conv = fptoui float %b to i32
	%vecins = insertelement <4 x i32> %a, i32 %conv, i32 3			%vecins = insertelement <4 x i32> %a, i32 %conv, i32 3
	ret <4 x i32> %vecins			ret <4 x i32> %vecins
	}			}

llvm/test/CodeGen/PowerPC/vec_extract_p9.ll

	Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; CHECK-LE-NEXT: lfs 0, .LCPI9_1@toc@l(3)	; CHECK-LE-NEXT: lfs 0, .LCPI9_1@toc@l(3)
	; CHECK-LE-NEXT: vperm 2, 3, 2, 4	; CHECK-LE-NEXT: vperm 2, 3, 2, 4
	; CHECK-LE-NEXT: xsadddp 1, 34, 0	; CHECK-LE-NEXT: xsadddp 1, 34, 0
	; CHECK-LE-NEXT: blr	; CHECK-LE-NEXT: blr
	;	;
	; CHECK-BE-LABEL: test10:	; CHECK-BE-LABEL: test10:
	; CHECK-BE: # %bb.0: # %entry	; CHECK-BE: # %bb.0: # %entry
	; CHECK-BE-NEXT: addis 3, 2, .LCPI9_0@toc@ha	; CHECK-BE-NEXT: addis 3, 2, .LCPI9_0@toc@ha
	; CHECK-BE-NEXT: vmrghw 3, 3, 3	; CHECK-BE-NEXT: addi 3, 3, .LCPI9_0@toc@l
	; CHECK-BE-NEXT: lfs 0, .LCPI9_0@toc@l(3)	; CHECK-BE-NEXT: lxv 36, 0(3)
	; CHECK-BE-NEXT: vmrglw 2, 3, 2	; CHECK-BE-NEXT: addis 3, 2, .LCPI9_1@toc@ha
		; CHECK-BE-NEXT: lfs 0, .LCPI9_1@toc@l(3)
		; CHECK-BE-NEXT: vperm 2, 3, 2, 4
	; CHECK-BE-NEXT: xsadddp 1, 34, 0	; CHECK-BE-NEXT: xsadddp 1, 34, 0
	; CHECK-BE-NEXT: blr	; CHECK-BE-NEXT: blr
	entry:	entry:
	%shuffle = shufflevector <4 x i32> %a, <4 x i32> %b, <4 x i32> <i32 5, i32 2, i32 3, i32 7>	%shuffle = shufflevector <4 x i32> %a, <4 x i32> %b, <4 x i32> <i32 5, i32 2, i32 3, i32 7>
	%cast = bitcast <4 x i32> %shuffle to <2 x double>	%cast = bitcast <4 x i32> %shuffle to <2 x double>
	%extract = extractelement <2 x double> %cast, i32 0	%extract = extractelement <2 x double> %cast, i32 0
	%add = fadd double %extract, 1.0000	%add = fadd double %extract, 1.0000
	ret double %add	ret double %add
	}	}
Context not available.

llvm/test/CodeGen/PowerPC/vec_perf_shuffle.ll

	; RUN: llc -verify-machineinstrs < %s -mtriple=ppc32-- -mcpu=g5 \| not grep vperm			; RUN: llc -verify-machineinstrs < %s -mtriple=ppc32-- -ppc-disable-perfect-shuffle=false -mcpu=g5 \| not grep vperm

	define <4 x float> @test_uu72(<4 x float>* %P1, <4 x float>* %P2) {			define <4 x float> @test_uu72(<4 x float>* %P1, <4 x float>* %P2) {
	%V1 = load <4 x float>, <4 x float>* %P1 ; <<4 x float>> [#uses=1]			%V1 = load <4 x float>, <4 x float>* %P1 ; <<4 x float>> [#uses=1]
	%V2 = load <4 x float>, <4 x float>* %P2 ; <<4 x float>> [#uses=1]			%V2 = load <4 x float>, <4 x float>* %P2 ; <<4 x float>> [#uses=1]
	%V3 = shufflevector <4 x float> %V1, <4 x float> %V2, <4 x i32> < i32 undef, i32 undef, i32 7, i32 2 > ; <<4 x float>> [#uses=1]			%V3 = shufflevector <4 x float> %V1, <4 x float> %V2, <4 x i32> < i32 undef, i32 undef, i32 7, i32 2 > ; <<4 x float>> [#uses=1]
	ret <4 x float> %V3			ret <4 x float> %V3
	}			}

	Show All 27 Lines

llvm/test/CodeGen/PowerPC/vec_shuffle_p8vector.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -verify-machineinstrs -mcpu=pwr8 -mtriple=powerpc64-unknown-linux-gnu -mattr=+power8-vector < %s \| FileCheck %s			; RUN: llc -verify-machineinstrs -mcpu=pwr8 -mtriple=powerpc64-unknown-linux-gnu -mattr=+power8-vector < %s \| FileCheck %s
	; RUN: llc -verify-machineinstrs -mcpu=pwr8 -mtriple=powerpc64-ibm-aix-xcoff -vec-extabi -mattr=+power8-vector < %s \| FileCheck %s			; RUN: llc -verify-machineinstrs -mcpu=pwr8 -mtriple=powerpc64-ibm-aix-xcoff -vec-extabi -mattr=+power8-vector < %s \| FileCheck %s
	; RUN: llc -verify-machineinstrs -mcpu=pwr7 -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck -check-prefix=CHECK-PWR7 %s			; RUN: llc -verify-machineinstrs -mcpu=pwr7 -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck -check-prefix=CHECK-PWR7 %s
	; RUN: llc -verify-machineinstrs -mcpu=pwr7 -mtriple=powerpc64-ibm-aix-xcoff -vec-extabi < %s \| FileCheck -check-prefix=CHECK-PWR7 %s			; RUN: llc -verify-machineinstrs -mcpu=pwr7 -mtriple=powerpc64-ibm-aix-xcoff -vec-extabi < %s \| FileCheck -check-prefix=CHECK-PWR7-AIX %s

	define void @VPKUDUM_unary(<2 x i64>* %A) {			define void @VPKUDUM_unary(<2 x i64>* %A) {
	; CHECK-LABEL: VPKUDUM_unary:			; CHECK-LABEL: VPKUDUM_unary:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lxvw4x 34, 0, 3			; CHECK-NEXT: lxvw4x 34, 0, 3
	; CHECK-NEXT: vpkudum 2, 2, 2			; CHECK-NEXT: vpkudum 2, 2, 2
	; CHECK-NEXT: stxvw4x 34, 0, 3			; CHECK-NEXT: stxvw4x 34, 0, 3
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	;			;
	; CHECK-PWR7-LABEL: VPKUDUM_unary:			; CHECK-PWR7-LABEL: VPKUDUM_unary:
	; CHECK-PWR7: # %bb.0: # %entry			; CHECK-PWR7: # %bb.0: # %entry
				; CHECK-PWR7-NEXT: addis 4, 2, .LCPI0_0@toc@ha
	; CHECK-PWR7-NEXT: lxvw4x 34, 0, 3			; CHECK-PWR7-NEXT: lxvw4x 34, 0, 3
	; CHECK-PWR7-NEXT: vmrglw 3, 2, 2			; CHECK-PWR7-NEXT: addi 4, 4, .LCPI0_0@toc@l
	; CHECK-PWR7-NEXT: vmrghw 2, 2, 2			; CHECK-PWR7-NEXT: lxvw4x 35, 0, 4
	; CHECK-PWR7-NEXT: vmrglw 2, 2, 3			; CHECK-PWR7-NEXT: vperm 2, 2, 2, 3
	; CHECK-PWR7-NEXT: stxvw4x 34, 0, 3			; CHECK-PWR7-NEXT: stxvw4x 34, 0, 3
	; CHECK-PWR7-NEXT: blr			; CHECK-PWR7-NEXT: blr
				;
				; CHECK-PWR7-AIX-LABEL: VPKUDUM_unary:
				; CHECK-PWR7-AIX: # %bb.0: # %entry
				; CHECK-PWR7-AIX-NEXT: ld 4, L..C0(2) # %const.0
				; CHECK-PWR7-AIX-NEXT: lxvw4x 34, 0, 3
				; CHECK-PWR7-AIX-NEXT: lxvw4x 35, 0, 4
				; CHECK-PWR7-AIX-NEXT: vperm 2, 2, 2, 3
				; CHECK-PWR7-AIX-NEXT: stxvw4x 34, 0, 3
				; CHECK-PWR7-AIX-NEXT: blr
	entry:			entry:
	%tmp = load <2 x i64>, <2 x i64>* %A			%tmp = load <2 x i64>, <2 x i64>* %A
	%tmp2 = bitcast <2 x i64> %tmp to <4 x i32>			%tmp2 = bitcast <2 x i64> %tmp to <4 x i32>
	%tmp3 = extractelement <4 x i32> %tmp2, i32 1			%tmp3 = extractelement <4 x i32> %tmp2, i32 1
	%tmp4 = extractelement <4 x i32> %tmp2, i32 3			%tmp4 = extractelement <4 x i32> %tmp2, i32 3
	%tmp5 = insertelement <4 x i32> undef, i32 %tmp3, i32 0			%tmp5 = insertelement <4 x i32> undef, i32 %tmp3, i32 0
	%tmp6 = insertelement <4 x i32> %tmp5, i32 %tmp4, i32 1			%tmp6 = insertelement <4 x i32> %tmp5, i32 %tmp4, i32 1
	%tmp7 = insertelement <4 x i32> %tmp6, i32 %tmp3, i32 2			%tmp7 = insertelement <4 x i32> %tmp6, i32 %tmp3, i32 2
	Show All 9 Lines
	; CHECK-NEXT: lxvw4x 34, 0, 3			; CHECK-NEXT: lxvw4x 34, 0, 3
	; CHECK-NEXT: lxvw4x 35, 0, 4			; CHECK-NEXT: lxvw4x 35, 0, 4
	; CHECK-NEXT: vpkudum 2, 2, 3			; CHECK-NEXT: vpkudum 2, 2, 3
	; CHECK-NEXT: stxvw4x 34, 0, 3			; CHECK-NEXT: stxvw4x 34, 0, 3
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	;			;
	; CHECK-PWR7-LABEL: VPKUDUM:			; CHECK-PWR7-LABEL: VPKUDUM:
	; CHECK-PWR7: # %bb.0: # %entry			; CHECK-PWR7: # %bb.0: # %entry
	; CHECK-PWR7-NEXT: lxvw4x 34, 0, 3			; CHECK-PWR7-NEXT: addis 5, 2, .LCPI1_0@toc@ha
	; CHECK-PWR7-NEXT: lxvw4x 35, 0, 4			; CHECK-PWR7-NEXT: lxvw4x 34, 0, 4
	; CHECK-PWR7-NEXT: vmrglw 4, 2, 3			; CHECK-PWR7-NEXT: lxvw4x 35, 0, 3
	; CHECK-PWR7-NEXT: vmrghw 2, 2, 3			; CHECK-PWR7-NEXT: addi 4, 5, .LCPI1_0@toc@l
	; CHECK-PWR7-NEXT: vmrglw 2, 2, 4			; CHECK-PWR7-NEXT: lxvw4x 36, 0, 4
				; CHECK-PWR7-NEXT: vperm 2, 3, 2, 4
	; CHECK-PWR7-NEXT: stxvw4x 34, 0, 3			; CHECK-PWR7-NEXT: stxvw4x 34, 0, 3
	; CHECK-PWR7-NEXT: blr			; CHECK-PWR7-NEXT: blr
				;
				; CHECK-PWR7-AIX-LABEL: VPKUDUM:
				; CHECK-PWR7-AIX: # %bb.0: # %entry
				; CHECK-PWR7-AIX-NEXT: ld 5, L..C1(2) # %const.0
				; CHECK-PWR7-AIX-NEXT: lxvw4x 34, 0, 4
				; CHECK-PWR7-AIX-NEXT: lxvw4x 35, 0, 3
				; CHECK-PWR7-AIX-NEXT: lxvw4x 36, 0, 5
				; CHECK-PWR7-AIX-NEXT: vperm 2, 3, 2, 4
				; CHECK-PWR7-AIX-NEXT: stxvw4x 34, 0, 3
				; CHECK-PWR7-AIX-NEXT: blr
	entry:			entry:
	%tmp = load <2 x i64>, <2 x i64>* %A			%tmp = load <2 x i64>, <2 x i64>* %A
	%tmp2 = bitcast <2 x i64> %tmp to <4 x i32>			%tmp2 = bitcast <2 x i64> %tmp to <4 x i32>
	%tmp3 = load <2 x i64>, <2 x i64>* %B			%tmp3 = load <2 x i64>, <2 x i64>* %B
	%tmp4 = bitcast <2 x i64> %tmp3 to <4 x i32>			%tmp4 = bitcast <2 x i64> %tmp3 to <4 x i32>
	%tmp5 = extractelement <4 x i32> %tmp2, i32 1			%tmp5 = extractelement <4 x i32> %tmp2, i32 1
	%tmp6 = extractelement <4 x i32> %tmp2, i32 3			%tmp6 = extractelement <4 x i32> %tmp2, i32 3
	%tmp7 = extractelement <4 x i32> %tmp4, i32 1			%tmp7 = extractelement <4 x i32> %tmp4, i32 1
	Show All 10 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Disable perfect shuffle by defaultClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 413329

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/test/CodeGen/PowerPC/2006-08-11-RetVector.ll

llvm/test/CodeGen/PowerPC/aix-p9-xxinsertw-xxextractuw.ll

llvm/test/CodeGen/PowerPC/aix-vsx-splatimm.ll

llvm/test/CodeGen/PowerPC/aix32-p8-scalar_vector_conversions.ll

llvm/test/CodeGen/PowerPC/extract-and-store.ll

llvm/test/CodeGen/PowerPC/load-and-splat.ll

llvm/test/CodeGen/PowerPC/p8altivec-shuffles-pred.ll

llvm/test/CodeGen/PowerPC/perfect-shuffle.ll

llvm/test/CodeGen/PowerPC/ppc-32bit-build-vector.ll

llvm/test/CodeGen/PowerPC/pr27078.ll

llvm/test/CodeGen/PowerPC/scalar_vector_test_4.ll

llvm/test/CodeGen/PowerPC/test-vector-insert.ll

llvm/test/CodeGen/PowerPC/vec_extract_p9.ll

llvm/test/CodeGen/PowerPC/vec_perf_shuffle.ll

llvm/test/CodeGen/PowerPC/vec_shuffle_p8vector.ll

[PowerPC] Disable perfect shuffle by default
ClosedPublic