Diff 373045

llvm/lib/Target/PowerPC/PPCInstrVSX.td

Show First 20 Lines • Show All 2,803 Lines • ▼ Show 20 Lines	def : Pat<(v4i32 (build_vector DblToUInt.A, DblToUInt.A,
DblToUInt.A, DblToUInt.A)),		DblToUInt.A, DblToUInt.A)),
(v4i32 (XXSPLTW (SUBREG_TO_REG (i64 1), (XSCVDPUXWS $A), sub_64), 1))>;		(v4i32 (XXSPLTW (SUBREG_TO_REG (i64 1), (XSCVDPUXWS $A), sub_64), 1))>;
def : Pat<(v2i64 (build_vector DblToLong.A, DblToLong.A)),		def : Pat<(v2i64 (build_vector DblToLong.A, DblToLong.A)),
(v2i64 (XXPERMDI (SUBREG_TO_REG (i64 1), (XSCVDPSXDS $A), sub_64),		(v2i64 (XXPERMDI (SUBREG_TO_REG (i64 1), (XSCVDPSXDS $A), sub_64),
(SUBREG_TO_REG (i64 1), (XSCVDPSXDS $A), sub_64), 0))>;		(SUBREG_TO_REG (i64 1), (XSCVDPSXDS $A), sub_64), 0))>;
def : Pat<(v2i64 (build_vector DblToULong.A, DblToULong.A)),		def : Pat<(v2i64 (build_vector DblToULong.A, DblToULong.A)),
(v2i64 (XXPERMDI (SUBREG_TO_REG (i64 1), (XSCVDPUXDS $A), sub_64),		(v2i64 (XXPERMDI (SUBREG_TO_REG (i64 1), (XSCVDPUXDS $A), sub_64),
(SUBREG_TO_REG (i64 1), (XSCVDPUXDS $A), sub_64), 0))>;		(SUBREG_TO_REG (i64 1), (XSCVDPUXDS $A), sub_64), 0))>;
		def : Pat<(v4i32 (PPCSToV DblToInt.A)),
		(v4i32 (SUBREG_TO_REG (i64 1), (XSCVDPSXWS f64:$A), sub_64))>;
		def : Pat<(v4i32 (PPCSToV DblToUInt.A)),
		(v4i32 (SUBREG_TO_REG (i64 1), (XSCVDPSXWS f64:$A), sub_64))>;
		amykUnsubmitted Done Reply Inline Actions This should be `XSCVDPUXWS`? amyk: This should be `XSCVDPUXWS`?
defm : ScalToVecWPermute<		defm : ScalToVecWPermute<
v4i32, FltToIntLoad.A,		v4i32, FltToIntLoad.A,
(XXSPLTW (SUBREG_TO_REG (i64 1), (XSCVDPSXWSs (XFLOADf32 ForceXForm:$A)), sub_64), 1),		(XXSPLTW (SUBREG_TO_REG (i64 1), (XSCVDPSXWSs (XFLOADf32 ForceXForm:$A)), sub_64), 1),
(SUBREG_TO_REG (i64 1), (XSCVDPSXWSs (XFLOADf32 ForceXForm:$A)), sub_64)>;		(SUBREG_TO_REG (i64 1), (XSCVDPSXWSs (XFLOADf32 ForceXForm:$A)), sub_64)>;
defm : ScalToVecWPermute<		defm : ScalToVecWPermute<
v4i32, FltToUIntLoad.A,		v4i32, FltToUIntLoad.A,
(XXSPLTW (SUBREG_TO_REG (i64 1), (XSCVDPUXWSs (XFLOADf32 ForceXForm:$A)), sub_64), 1),		(XXSPLTW (SUBREG_TO_REG (i64 1), (XSCVDPUXWSs (XFLOADf32 ForceXForm:$A)), sub_64), 1),
(SUBREG_TO_REG (i64 1), (XSCVDPUXWSs (XFLOADf32 ForceXForm:$A)), sub_64)>;		(SUBREG_TO_REG (i64 1), (XSCVDPUXWSs (XFLOADf32 ForceXForm:$A)), sub_64)>;
▲ Show 20 Lines • Show All 1,313 Lines • ▼ Show 20 Lines
def : Pat<(f64 (PPCfcfidu (f64 (PPCmtvsrz (i32 (extractelt v4i32:$A, 1)))))),		def : Pat<(f64 (PPCfcfidu (f64 (PPCmtvsrz (i32 (extractelt v4i32:$A, 1)))))),
(f64 (XSCVUXDDP (XXEXTRACTUW $A, 4)))>;		(f64 (XSCVUXDDP (XXEXTRACTUW $A, 4)))>;
def : Pat<(f64 (PPCfcfidu (f64 (PPCmtvsrz (i32 (extractelt v4i32:$A, 2)))))),		def : Pat<(f64 (PPCfcfidu (f64 (PPCmtvsrz (i32 (extractelt v4i32:$A, 2)))))),
(f64 (XSCVUXDDP (XXEXTRACTUW $A, 8)))>;		(f64 (XSCVUXDDP (XXEXTRACTUW $A, 8)))>;
def : Pat<(f64 (PPCfcfidu (f64 (PPCmtvsrz (i32 (extractelt v4i32:$A, 3)))))),		def : Pat<(f64 (PPCfcfidu (f64 (PPCmtvsrz (i32 (extractelt v4i32:$A, 3)))))),
(f64 (XSCVUXDDP (XXEXTRACTUW $A, 12)))>;		(f64 (XSCVUXDDP (XXEXTRACTUW $A, 12)))>;
def : Pat<(v4i32 (insertelt v4i32:$A, i32:$B, 0)),		def : Pat<(v4i32 (insertelt v4i32:$A, i32:$B, 0)),
(v4i32 (XXINSERTW v4i32:$A, AlignValues.I32_TO_BE_WORD1, 0))>;		(v4i32 (XXINSERTW v4i32:$A, AlignValues.I32_TO_BE_WORD1, 0))>;
def : Pat<(v4i32 (insertelt v4i32:$A, i32:$B, 1)),		def : Pat<(v4i32 (insertelt v4i32:$A, i32:$B, 1)),
		nemanjaiUnsubmitted Done Reply Inline Actions I assume this is the big endian Power9 block (and the below is the little endian). However, I can't confirm that since the context for the patch has disappeared somehow. nemanjai: I assume this is the big endian Power9 block (and the below is the little endian). However, I…
(v4i32 (XXINSERTW v4i32:$A, AlignValues.I32_TO_BE_WORD1, 4))>;		(v4i32 (XXINSERTW v4i32:$A, AlignValues.I32_TO_BE_WORD1, 4))>;
def : Pat<(v4i32 (insertelt v4i32:$A, i32:$B, 2)),		def : Pat<(v4i32 (insertelt v4i32:$A, i32:$B, 2)),
(v4i32 (XXINSERTW v4i32:$A, AlignValues.I32_TO_BE_WORD1, 8))>;		(v4i32 (XXINSERTW v4i32:$A, AlignValues.I32_TO_BE_WORD1, 8))>;
def : Pat<(v4i32 (insertelt v4i32:$A, i32:$B, 3)),		def : Pat<(v4i32 (insertelt v4i32:$A, i32:$B, 3)),
(v4i32 (XXINSERTW v4i32:$A, AlignValues.I32_TO_BE_WORD1, 12))>;		(v4i32 (XXINSERTW v4i32:$A, AlignValues.I32_TO_BE_WORD1, 12))>;
		nemanjaiUnsubmitted Done Reply Inline Actions What am I missing here? It appears to me that this pattern is exactly the same as the one above it. The same appears to be the case for all of these. Also, why the change in naming convention? nemanjai: What am I missing here? It appears to me that this pattern is exactly the same as the one above…
		ConanapAuthorUnsubmitted Done Reply Inline Actions This one is for the unsigned version, the above is for the signed version. Originally, using `DblToInt.A` gave me problems as `$A` are now used in two places, so I've changed the other variable names instead. I'll use `DblToInt.B` instead to match the convention, thanks! Conanap: This one is for the unsigned version, the above is for the signed version. Originally, using…
def : Pat<(v4f32 (insertelt v4f32:$A, f32:$B, 0)),		def : Pat<(v4f32 (insertelt v4f32:$A, f32:$B, 0)),
(v4f32 (XXINSERTW v4f32:$A, AlignValues.F32_TO_BE_WORD1, 0))>;		(v4f32 (XXINSERTW v4f32:$A, AlignValues.F32_TO_BE_WORD1, 0))>;
def : Pat<(v4f32 (insertelt v4f32:$A, f32:$B, 1)),		def : Pat<(v4f32 (insertelt v4f32:$A, f32:$B, 1)),
(v4f32 (XXINSERTW v4f32:$A, AlignValues.F32_TO_BE_WORD1, 4))>;		(v4f32 (XXINSERTW v4f32:$A, AlignValues.F32_TO_BE_WORD1, 4))>;
def : Pat<(v4f32 (insertelt v4f32:$A, f32:$B, 2)),		def : Pat<(v4f32 (insertelt v4f32:$A, f32:$B, 2)),
(v4f32 (XXINSERTW v4f32:$A, AlignValues.F32_TO_BE_WORD1, 8))>;		(v4f32 (XXINSERTW v4f32:$A, AlignValues.F32_TO_BE_WORD1, 8))>;
def : Pat<(v4f32 (insertelt v4f32:$A, f32:$B, 3)),		def : Pat<(v4f32 (insertelt v4f32:$A, f32:$B, 3)),
(v4f32 (XXINSERTW v4f32:$A, AlignValues.F32_TO_BE_WORD1, 12))>;		(v4f32 (XXINSERTW v4f32:$A, AlignValues.F32_TO_BE_WORD1, 12))>;
▲ Show 20 Lines • Show All 863 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/test-vector-insert.ll

This file was added.

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py

; xscvdpsxws and uxws is only available on Power7 and above

nemanjaiUnsubmitted

Not Done

Test cases where we improve code generation should be pre-committed as an NFC change so that the review shows just the differences in code generation. It is not easy to evaluate whether the patch improves the code or not without seeing how it changed.

nemanjai: Test cases where we improve code generation should be pre-committed as an NFC change so that…

; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu \

amykUnsubmitted

Done

nit: Move this comment under the RUN lines.

amyk: nit: Move this comment under the RUN lines.

; RUN: < %s | FileCheck %s --check-prefix=CHECK-LE

amykUnsubmitted

Done

I'm not sure why P8 is LE run only line, and P7 is BE run line only.
Maybe we should have LE/BE run lines for both P7 and P8 for more coverage.
Furthermore, if both the LE/BE checks end up the same, we can do CHECK-P7 and CHECK-P8.

Also, since this looks like it's a Linux test, please add -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr.

amyk: I'm not sure why P8 is LE run only line, and P7 is BE run line only. Maybe we should have…

; RUN: llc -verify-machineinstrs -mtriple=powerpc64-unknown-linux-gnu \

; RUN: -mcpu=pwr7 < %s | FileCheck %s --check-prefix=CHECK-BE

nemanjaiUnsubmitted

Not Done

Code generation on Power9 is important as well. Please add that test.

nemanjai: Code generation on Power9 is important as well. Please add that test.

; RUN: llc -verify-machineinstrs -mtriple=powerpc64-unknown-aix \

; RUN: -mcpu=pwr7 < %s | FileCheck %s

kamaubUnsubmitted

Done

It seems like this run line is redundant, it produces the same assembly as the big endian specific line above. Maybe the -mcpu=pwr7 can be moved to the first Little-endian specific run line? That line currently only test the target cpu of the test machine.

kamaub: It seems like this run line is redundant, it produces the same assembly as the big endian…

ConanapAuthorUnsubmitted

Done

good point, thanks!

Conanap: good point, thanks!

define dso_local <4 x i32> @test(<4 x i32> %a, double %b) {

; CHECK-LE-LABEL: test:

; CHECK-LE: # %bb.0: # %entry

; CHECK-LE-NEXT: xscvdpsxws 35, 1

; CHECK-LE-NEXT: addis 3, 2, .LCPI0_0@toc@ha

; CHECK-LE-NEXT: addi 3, 3, .LCPI0_0@toc@l

; CHECK-LE-NEXT: lvx 4, 0, 3

nemanjaiUnsubmitted

Not Done

nit: s/Codgen/Codegen

nemanjai: nit: s/Codgen/Codegen

; CHECK-LE-NEXT: vperm 2, 3, 2, 4

; CHECK-LE-NEXT: blr

;

; CHECK-BE-LABEL: test:

amykUnsubmitted

Not Done

; RUN: -mcpu=pwr9 < %s | FileCheck %s --check-prefix=CHECK-BE-P9

- ; xscvdpsxws and uxws is only available on Power7 and above

+ ; xscvdpsxws and xscvdpuxws is only available on Power7 and above.

; Codgen is different for LE Power7 and Power8

amyk:

; CHECK-BE: # %bb.0: # %entry

amykUnsubmitted

Not Done

; xscvdpsxws and uxws is only available on Power7 and above

- ; Codgen is different for LE Power7 and Power8

+ ; Codegen is different for Power8, Power8 and Power9.

define dso_local <4 x i32> @test(<4 x i32> %a, double %b) {

amyk:

; CHECK-BE-NEXT: xscvdpsxws 0, 1

; CHECK-BE-NEXT: addi 3, 1, -4

; CHECK-BE-NEXT: stfiwx 0, 0, 3

; CHECK-BE-NEXT: lwz 3, -4(1)

; CHECK-BE-NEXT: xxsldwi 0, 34, 34, 3

; CHECK-BE-NEXT: stw 3, -32(1)

; CHECK-BE-NEXT: addi 3, 1, -32

; CHECK-BE-NEXT: lxvw4x 1, 0, 3

; CHECK-BE-NEXT: xxsldwi 34, 0, 1, 1

; CHECK-BE-NEXT: blr

;

; CHECK-LABEL: test:

; CHECK: # %bb.0: # %entry

; CHECK-NEXT: xscvdpsxws 0, 1

; CHECK-NEXT: addi 3, 1, -4

; CHECK-NEXT: stfiwx 0, 0, 3

; CHECK-NEXT: lwz 3, -4(1)

; CHECK-NEXT: xxsldwi 0, 34, 34, 3

; CHECK-NEXT: stw 3, -32(1)

; CHECK-NEXT: addi 3, 1, -32

; CHECK-NEXT: lxvw4x 1, 0, 3

; CHECK-NEXT: xxsldwi 34, 0, 1, 1

; CHECK-NEXT: blr

entry:

%conv = fptosi double %b to i32

%vecins = insertelement <4 x i32> %a, i32 %conv, i32 3

ret <4 x i32> %vecins

}

define dso_local <4 x i32> @test2(<4 x i32> %a, float %b) {

; CHECK-LE-LABEL: test2:

; CHECK-LE: # %bb.0: # %entry

; CHECK-LE-NEXT: xscvdpsxws 35, 1

; CHECK-LE-NEXT: addis 3, 2, .LCPI1_0@toc@ha

; CHECK-LE-NEXT: addi 3, 3, .LCPI1_0@toc@l

; CHECK-LE-NEXT: lvx 4, 0, 3

; CHECK-LE-NEXT: vperm 2, 3, 2, 4

; CHECK-LE-NEXT: blr

;

; CHECK-BE-LABEL: test2:

; CHECK-BE: # %bb.0: # %entry

; CHECK-BE-NEXT: xscvdpsxws 0, 1

; CHECK-BE-NEXT: addi 3, 1, -4

; CHECK-BE-NEXT: stfiwx 0, 0, 3

; CHECK-BE-NEXT: lwz 3, -4(1)

; CHECK-BE-NEXT: xxsldwi 0, 34, 34, 3

; CHECK-BE-NEXT: stw 3, -32(1)

; CHECK-BE-NEXT: addi 3, 1, -32

; CHECK-BE-NEXT: lxvw4x 1, 0, 3

; CHECK-BE-NEXT: xxsldwi 34, 0, 1, 1

; CHECK-BE-NEXT: blr

;

; CHECK-LABEL: test2:

; CHECK: # %bb.0: # %entry

; CHECK-NEXT: xscvdpsxws 0, 1

; CHECK-NEXT: addi 3, 1, -4

; CHECK-NEXT: stfiwx 0, 0, 3

; CHECK-NEXT: lwz 3, -4(1)

; CHECK-NEXT: xxsldwi 0, 34, 34, 3

; CHECK-NEXT: stw 3, -32(1)

; CHECK-NEXT: addi 3, 1, -32

; CHECK-NEXT: lxvw4x 1, 0, 3

; CHECK-NEXT: xxsldwi 34, 0, 1, 1

; CHECK-NEXT: blr

entry:

%conv = fptosi float %b to i32

%vecins = insertelement <4 x i32> %a, i32 %conv, i32 3

ret <4 x i32> %vecins

}

define dso_local <4 x i32> @test3(<4 x i32> %a, double %b) {

; CHECK-LE-LABEL: test3:

; CHECK-LE: # %bb.0: # %entry

; CHECK-LE-NEXT: xscvdpsxws 35, 1

; CHECK-LE-NEXT: addis 3, 2, .LCPI2_0@toc@ha

; CHECK-LE-NEXT: addi 3, 3, .LCPI2_0@toc@l

; CHECK-LE-NEXT: lvx 4, 0, 3

; CHECK-LE-NEXT: vperm 2, 3, 2, 4

; CHECK-LE-NEXT: blr

;

; CHECK-BE-LABEL: test3:

; CHECK-BE: # %bb.0: # %entry

; CHECK-BE-NEXT: xscvdpuxws 0, 1

; CHECK-BE-NEXT: addi 3, 1, -4

; CHECK-BE-NEXT: stfiwx 0, 0, 3

; CHECK-BE-NEXT: lwz 3, -4(1)

; CHECK-BE-NEXT: xxsldwi 0, 34, 34, 3

; CHECK-BE-NEXT: stw 3, -32(1)

; CHECK-BE-NEXT: addi 3, 1, -32

; CHECK-BE-NEXT: lxvw4x 1, 0, 3

; CHECK-BE-NEXT: xxsldwi 34, 0, 1, 1

; CHECK-BE-NEXT: blr

;

; CHECK-LABEL: test3:

; CHECK: # %bb.0: # %entry

; CHECK-NEXT: xscvdpuxws 0, 1

; CHECK-NEXT: addi 3, 1, -4

; CHECK-NEXT: stfiwx 0, 0, 3

; CHECK-NEXT: lwz 3, -4(1)

; CHECK-NEXT: xxsldwi 0, 34, 34, 3

; CHECK-NEXT: stw 3, -32(1)

; CHECK-NEXT: addi 3, 1, -32

; CHECK-NEXT: lxvw4x 1, 0, 3

; CHECK-NEXT: xxsldwi 34, 0, 1, 1

; CHECK-NEXT: blr

entry:

%conv = fptoui double %b to i32

%vecins = insertelement <4 x i32> %a, i32 %conv, i32 3

ret <4 x i32> %vecins

}

define dso_local <4 x i32> @test4(<4 x i32> %a, float %b) {

; CHECK-LE-LABEL: test4:

; CHECK-LE: # %bb.0: # %entry

; CHECK-LE-NEXT: xscvdpsxws 35, 1

; CHECK-LE-NEXT: addis 3, 2, .LCPI3_0@toc@ha

; CHECK-LE-NEXT: addi 3, 3, .LCPI3_0@toc@l

; CHECK-LE-NEXT: lvx 4, 0, 3

; CHECK-LE-NEXT: vperm 2, 3, 2, 4

; CHECK-LE-NEXT: blr

;

; CHECK-BE-LABEL: test4:

; CHECK-BE: # %bb.0: # %entry

; CHECK-BE-NEXT: xscvdpuxws 0, 1

; CHECK-BE-NEXT: addi 3, 1, -4

; CHECK-BE-NEXT: stfiwx 0, 0, 3

; CHECK-BE-NEXT: lwz 3, -4(1)

; CHECK-BE-NEXT: xxsldwi 0, 34, 34, 3

; CHECK-BE-NEXT: stw 3, -32(1)

; CHECK-BE-NEXT: addi 3, 1, -32

; CHECK-BE-NEXT: lxvw4x 1, 0, 3

; CHECK-BE-NEXT: xxsldwi 34, 0, 1, 1

; CHECK-BE-NEXT: blr

;

; CHECK-LABEL: test4:

; CHECK: # %bb.0: # %entry

; CHECK-NEXT: xscvdpuxws 0, 1

; CHECK-NEXT: addi 3, 1, -4

; CHECK-NEXT: stfiwx 0, 0, 3

; CHECK-NEXT: lwz 3, -4(1)

; CHECK-NEXT: xxsldwi 0, 34, 34, 3

; CHECK-NEXT: stw 3, -32(1)

; CHECK-NEXT: addi 3, 1, -32

; CHECK-NEXT: lxvw4x 1, 0, 3

; CHECK-NEXT: xxsldwi 34, 0, 1, 1

; CHECK-NEXT: blr

entry:

%conv = fptoui float %b to i32

%vecins = insertelement <4 x i32> %a, i32 %conv, i32 3

ret <4 x i32> %vecins

}

llvm/test/CodeGen/PowerPC/vec_conv_fp64_to_i32_elts.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu \		; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu \
; RUN: -mcpu=pwr8 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr < %s \| \		; RUN: -mcpu=pwr8 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr < %s \| \
; RUN: FileCheck %s --check-prefix=CHECK-P8		; RUN: FileCheck %s --check-prefix=CHECK-P8
; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu \		; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu \
; RUN: -mcpu=pwr9 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr < %s \| \		; RUN: -mcpu=pwr9 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr < %s \| \
; RUN: FileCheck %s --check-prefix=CHECK-P9		; RUN: FileCheck %s --check-prefix=CHECK-P9
; RUN: llc -verify-machineinstrs -mtriple=powerpc64-unknown-linux-gnu \		; RUN: llc -verify-machineinstrs -mtriple=powerpc64-unknown-linux-gnu \
; RUN: -mcpu=pwr9 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr < %s \| \		; RUN: -mcpu=pwr9 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr < %s \| \
; RUN: FileCheck %s --check-prefix=CHECK-BE		; RUN: FileCheck %s --check-prefix=CHECK-BE

define i64 @test2elt(<2 x double> %a) local_unnamed_addr #0 {		define i64 @test2elt(<2 x double> %a) local_unnamed_addr #0 {
; CHECK-P8-LABEL: test2elt:		; CHECK-P8-LABEL: test2elt:
; CHECK-P8: # %bb.0: # %entry		; CHECK-P8: # %bb.0: # %entry
; CHECK-P8-NEXT: xxswapd vs0, v2		; CHECK-P8-NEXT: xxswapd vs0, v2
; CHECK-P8-NEXT: xscvdpuxws f1, v2		; CHECK-P8-NEXT: xscvdpsxws v2, v2
; CHECK-P8-NEXT: xscvdpuxws f0, f0		; CHECK-P8-NEXT: xscvdpsxws v3, f0
		amykUnsubmitted Not Done Reply Inline Actions This is an unsigned test case, so should be `xscvdpuxws`, right? amyk: This is an unsigned test case, so should be `xscvdpuxws`, right?
; CHECK-P8-NEXT: mffprwz r3, f1
; CHECK-P8-NEXT: mtvsrwz v2, r3
; CHECK-P8-NEXT: mffprwz r4, f0
; CHECK-P8-NEXT: mtvsrwz v3, r4
; CHECK-P8-NEXT: vmrghw v2, v2, v3		; CHECK-P8-NEXT: vmrghw v2, v2, v3
; CHECK-P8-NEXT: xxswapd vs0, v2		; CHECK-P8-NEXT: xxswapd vs0, v2
; CHECK-P8-NEXT: mffprd r3, f0		; CHECK-P8-NEXT: mffprd r3, f0
; CHECK-P8-NEXT: blr		; CHECK-P8-NEXT: blr
;		;
; CHECK-P9-LABEL: test2elt:		; CHECK-P9-LABEL: test2elt:
; CHECK-P9: # %bb.0: # %entry		; CHECK-P9: # %bb.0: # %entry
; CHECK-P9-NEXT: xscvdpuxws f0, v2
; CHECK-P9-NEXT: mffprwz r3, f0
; CHECK-P9-NEXT: xxswapd vs0, v2		; CHECK-P9-NEXT: xxswapd vs0, v2
; CHECK-P9-NEXT: mtvsrwz v3, r3		; CHECK-P9-NEXT: xscvdpsxws v3, v2
; CHECK-P9-NEXT: xscvdpuxws f0, f0		; CHECK-P9-NEXT: xscvdpsxws v2, f0
; CHECK-P9-NEXT: mffprwz r3, f0
; CHECK-P9-NEXT: mtvsrwz v2, r3
; CHECK-P9-NEXT: vmrghw v2, v3, v2		; CHECK-P9-NEXT: vmrghw v2, v3, v2
; CHECK-P9-NEXT: mfvsrld r3, v2		; CHECK-P9-NEXT: mfvsrld r3, v2
; CHECK-P9-NEXT: blr		; CHECK-P9-NEXT: blr
;		;
; CHECK-BE-LABEL: test2elt:		; CHECK-BE-LABEL: test2elt:
; CHECK-BE: # %bb.0: # %entry		; CHECK-BE: # %bb.0: # %entry
; CHECK-BE-NEXT: xscvdpuxws f0, v2
; CHECK-BE-NEXT: mffprwz r3, f0
; CHECK-BE-NEXT: xxswapd vs0, v2		; CHECK-BE-NEXT: xxswapd vs0, v2
; CHECK-BE-NEXT: mtvsrwz v3, r3		; CHECK-BE-NEXT: xscvdpsxws v3, v2
; CHECK-BE-NEXT: xscvdpuxws f0, f0		; CHECK-BE-NEXT: xscvdpsxws v2, f0
; CHECK-BE-NEXT: mffprwz r3, f0
; CHECK-BE-NEXT: mtvsrwz v2, r3
; CHECK-BE-NEXT: vmrgow v2, v3, v2		; CHECK-BE-NEXT: vmrgow v2, v3, v2
; CHECK-BE-NEXT: mfvsrd r3, v2		; CHECK-BE-NEXT: mfvsrd r3, v2
; CHECK-BE-NEXT: blr		; CHECK-BE-NEXT: blr
entry:		entry:
%0 = fptoui <2 x double> %a to <2 x i32>		%0 = fptoui <2 x double> %a to <2 x i32>
%1 = bitcast <2 x i32> %0 to i64		%1 = bitcast <2 x i32> %0 to i64
ret i64 %1		ret i64 %1
}		}
▲ Show 20 Lines • Show All 243 Lines • ▼ Show 20 Lines	entry:
store <16 x i32> %1, <16 x i32>* %agg.result, align 64		store <16 x i32> %1, <16 x i32>* %agg.result, align 64
ret void		ret void
}		}

define i64 @test2elt_signed(<2 x double> %a) local_unnamed_addr #0 {		define i64 @test2elt_signed(<2 x double> %a) local_unnamed_addr #0 {
; CHECK-P8-LABEL: test2elt_signed:		; CHECK-P8-LABEL: test2elt_signed:
; CHECK-P8: # %bb.0: # %entry		; CHECK-P8: # %bb.0: # %entry
; CHECK-P8-NEXT: xxswapd vs0, v2		; CHECK-P8-NEXT: xxswapd vs0, v2
; CHECK-P8-NEXT: xscvdpsxws f1, v2		; CHECK-P8-NEXT: xscvdpsxws v2, v2
; CHECK-P8-NEXT: xscvdpsxws f0, f0		; CHECK-P8-NEXT: xscvdpsxws v3, f0
; CHECK-P8-NEXT: mffprwz r3, f1
; CHECK-P8-NEXT: mtvsrwz v2, r3
; CHECK-P8-NEXT: mffprwz r4, f0
; CHECK-P8-NEXT: mtvsrwz v3, r4
; CHECK-P8-NEXT: vmrghw v2, v2, v3		; CHECK-P8-NEXT: vmrghw v2, v2, v3
; CHECK-P8-NEXT: xxswapd vs0, v2		; CHECK-P8-NEXT: xxswapd vs0, v2
; CHECK-P8-NEXT: mffprd r3, f0		; CHECK-P8-NEXT: mffprd r3, f0
; CHECK-P8-NEXT: blr		; CHECK-P8-NEXT: blr
;		;
; CHECK-P9-LABEL: test2elt_signed:		; CHECK-P9-LABEL: test2elt_signed:
; CHECK-P9: # %bb.0: # %entry		; CHECK-P9: # %bb.0: # %entry
; CHECK-P9-NEXT: xscvdpsxws f0, v2
; CHECK-P9-NEXT: mffprwz r3, f0
; CHECK-P9-NEXT: xxswapd vs0, v2		; CHECK-P9-NEXT: xxswapd vs0, v2
; CHECK-P9-NEXT: mtvsrwz v3, r3		; CHECK-P9-NEXT: xscvdpsxws v3, v2
; CHECK-P9-NEXT: xscvdpsxws f0, f0		; CHECK-P9-NEXT: xscvdpsxws v2, f0
; CHECK-P9-NEXT: mffprwz r3, f0
; CHECK-P9-NEXT: mtvsrwz v2, r3
; CHECK-P9-NEXT: vmrghw v2, v3, v2		; CHECK-P9-NEXT: vmrghw v2, v3, v2
; CHECK-P9-NEXT: mfvsrld r3, v2		; CHECK-P9-NEXT: mfvsrld r3, v2
; CHECK-P9-NEXT: blr		; CHECK-P9-NEXT: blr
;		;
; CHECK-BE-LABEL: test2elt_signed:		; CHECK-BE-LABEL: test2elt_signed:
; CHECK-BE: # %bb.0: # %entry		; CHECK-BE: # %bb.0: # %entry
; CHECK-BE-NEXT: xscvdpsxws f0, v2
; CHECK-BE-NEXT: mffprwz r3, f0
; CHECK-BE-NEXT: xxswapd vs0, v2		; CHECK-BE-NEXT: xxswapd vs0, v2
; CHECK-BE-NEXT: mtvsrwz v3, r3		; CHECK-BE-NEXT: xscvdpsxws v3, v2
; CHECK-BE-NEXT: xscvdpsxws f0, f0		; CHECK-BE-NEXT: xscvdpsxws v2, f0
; CHECK-BE-NEXT: mffprwz r3, f0
; CHECK-BE-NEXT: mtvsrwz v2, r3
; CHECK-BE-NEXT: vmrgow v2, v3, v2		; CHECK-BE-NEXT: vmrgow v2, v3, v2
; CHECK-BE-NEXT: mfvsrd r3, v2		; CHECK-BE-NEXT: mfvsrd r3, v2
; CHECK-BE-NEXT: blr		; CHECK-BE-NEXT: blr
entry:		entry:
%0 = fptosi <2 x double> %a to <2 x i32>		%0 = fptosi <2 x double> %a to <2 x i32>
%1 = bitcast <2 x i32> %0 to i64		%1 = bitcast <2 x i32> %0 to i64
ret i64 %1		ret i64 %1
}		}
▲ Show 20 Lines • Show All 246 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Improved codegen related to xscvdpsxws/xscvdpuxws
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 373045

llvm/lib/Target/PowerPC/PPCInstrVSX.td

llvm/test/CodeGen/PowerPC/test-vector-insert.ll

llvm/test/CodeGen/PowerPC/vec_conv_fp64_to_i32_elts.ll

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Improved codegen related to xscvdpsxws/xscvdpuxwsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 373045

llvm/lib/Target/PowerPC/PPCInstrVSX.td

llvm/test/CodeGen/PowerPC/test-vector-insert.ll

llvm/test/CodeGen/PowerPC/vec_conv_fp64_to_i32_elts.ll

[PowerPC] Improved codegen related to xscvdpsxws/xscvdpuxws
ClosedPublic