Diff 148269

llvm/trunk/lib/Target/PowerPC/PPCInstrVSX.td

Show First 20 Lines • Show All 3,146 Lines • ▼ Show 20 Lines	def DFSTOREf64 : Pseudo<(outs), (ins vsfrc:$XT, memrix:$dst),
"#DFSTOREf64",		"#DFSTOREf64",
[(store f64:$XT, ixaddr:$dst)]>;		[(store f64:$XT, ixaddr:$dst)]>;
}		}
def : Pat<(f64 (extloadf32 ixaddr:$src)),		def : Pat<(f64 (extloadf32 ixaddr:$src)),
(COPY_TO_REGCLASS (DFLOADf32 ixaddr:$src), VSFRC)>;		(COPY_TO_REGCLASS (DFLOADf32 ixaddr:$src), VSFRC)>;
def : Pat<(f32 (fpround (f64 (extloadf32 ixaddr:$src)))),		def : Pat<(f32 (fpround (f64 (extloadf32 ixaddr:$src)))),
(f32 (DFLOADf32 ixaddr:$src))>;		(f32 (DFLOADf32 ixaddr:$src))>;

		let Predicates = [IsBigEndian, HasP9Vector] in {

// (Un)Signed DWord vector extract -> QP		// (Un)Signed DWord vector extract -> QP
let Predicates = [IsBigEndian] in {
def : Pat<(f128 (sint_to_fp (i64 (extractelt v2i64:$src, 0)))),		def : Pat<(f128 (sint_to_fp (i64 (extractelt v2i64:$src, 0)))),
(f128 (XSCVSDQP (COPY_TO_REGCLASS $src, VFRC)))>;		(f128 (XSCVSDQP (COPY_TO_REGCLASS $src, VFRC)))>;
def : Pat<(f128 (sint_to_fp (i64 (extractelt v2i64:$src, 1)))),		def : Pat<(f128 (sint_to_fp (i64 (extractelt v2i64:$src, 1)))),
(f128 (XSCVSDQP		(f128 (XSCVSDQP
(EXTRACT_SUBREG (XXPERMDI $src, $src, 3), sub_64)))>;		(EXTRACT_SUBREG (XXPERMDI $src, $src, 3), sub_64)))>;
def : Pat<(f128 (uint_to_fp (i64 (extractelt v2i64:$src, 0)))),		def : Pat<(f128 (uint_to_fp (i64 (extractelt v2i64:$src, 0)))),
(f128 (XSCVUDQP (COPY_TO_REGCLASS $src, VFRC)))>;		(f128 (XSCVUDQP (COPY_TO_REGCLASS $src, VFRC)))>;
def : Pat<(f128 (uint_to_fp (i64 (extractelt v2i64:$src, 1)))),		def : Pat<(f128 (uint_to_fp (i64 (extractelt v2i64:$src, 1)))),
(f128 (XSCVUDQP		(f128 (XSCVUDQP
(EXTRACT_SUBREG (XXPERMDI $src, $src, 3), sub_64)))>;		(EXTRACT_SUBREG (XXPERMDI $src, $src, 3), sub_64)))>;

		// (Un)Signed Word vector extract -> QP
		def : Pat<(f128 (sint_to_fp (i32 (extractelt v4i32:$src, 1)))),
		(f128 (XSCVSDQP (EXTRACT_SUBREG (VEXTSW2D $src), sub_64)))>;
		foreach Idx = [0,2,3] in {
		def : Pat<(f128 (sint_to_fp (i32 (extractelt v4i32:$src, Idx)))),
		(f128 (XSCVSDQP (EXTRACT_SUBREG
		(VEXTSW2D (VSPLTW Idx, $src)), sub_64)))>;
		}
		foreach Idx = 0-3 in {
		def : Pat<(f128 (uint_to_fp (i32 (extractelt v4i32:$src, Idx)))),
		(f128 (XSCVUDQP (XXEXTRACTUW $src, !shl(Idx, 2))))>;
}		}

let Predicates = [IsLittleEndian] in {		} // IsBigEndian, HasP9Vector

		let Predicates = [IsLittleEndian, HasP9Vector] in {

		// (Un)Signed DWord vector extract -> QP
def : Pat<(f128 (sint_to_fp (i64 (extractelt v2i64:$src, 0)))),		def : Pat<(f128 (sint_to_fp (i64 (extractelt v2i64:$src, 0)))),
(f128 (XSCVSDQP		(f128 (XSCVSDQP
(EXTRACT_SUBREG (XXPERMDI $src, $src, 3), sub_64)))>;		(EXTRACT_SUBREG (XXPERMDI $src, $src, 3), sub_64)))>;
def : Pat<(f128 (sint_to_fp (i64 (extractelt v2i64:$src, 1)))),		def : Pat<(f128 (sint_to_fp (i64 (extractelt v2i64:$src, 1)))),
(f128 (XSCVSDQP (COPY_TO_REGCLASS $src, VFRC)))>;		(f128 (XSCVSDQP (COPY_TO_REGCLASS $src, VFRC)))>;
def : Pat<(f128 (uint_to_fp (i64 (extractelt v2i64:$src, 0)))),		def : Pat<(f128 (uint_to_fp (i64 (extractelt v2i64:$src, 0)))),
(f128 (XSCVUDQP		(f128 (XSCVUDQP
(EXTRACT_SUBREG (XXPERMDI $src, $src, 3), sub_64)))>;		(EXTRACT_SUBREG (XXPERMDI $src, $src, 3), sub_64)))>;
def : Pat<(f128 (uint_to_fp (i64 (extractelt v2i64:$src, 1)))),		def : Pat<(f128 (uint_to_fp (i64 (extractelt v2i64:$src, 1)))),
(f128 (XSCVUDQP (COPY_TO_REGCLASS $src, VFRC)))>;		(f128 (XSCVUDQP (COPY_TO_REGCLASS $src, VFRC)))>;

		// (Un)Signed Word vector extract -> QP
		foreach Idx = [[0,3],[1,2],[3,0]] in {
		def : Pat<(f128 (sint_to_fp (i32 (extractelt v4i32:$src, !head(Idx))))),
		(f128 (XSCVSDQP (EXTRACT_SUBREG
		(VEXTSW2D (VSPLTW !head(!tail(Idx)), $src)),
		sub_64)))>;
}		}
		def : Pat<(f128 (sint_to_fp (i32 (extractelt v4i32:$src, 2)))),
		(f128 (XSCVSDQP (EXTRACT_SUBREG (VEXTSW2D $src), sub_64)))>;

		foreach Idx = [[0,12],[1,8],[2,4],[3,0]] in {
		def : Pat<(f128 (uint_to_fp (i32 (extractelt v4i32:$src, !head(Idx))))),
		(f128 (XSCVUDQP (XXEXTRACTUW $src, !head(!tail(Idx)))))>;
		}
		} // IsLittleEndian, HasP9Vector

// Convert (Un)Signed DWord in memory -> QP		// Convert (Un)Signed DWord in memory -> QP
def : Pat<(f128 (sint_to_fp (i64 (load xaddr:$src)))),		def : Pat<(f128 (sint_to_fp (i64 (load xaddr:$src)))),
(f128 (XSCVSDQP (LXSDX xaddr:$src)))>;		(f128 (XSCVSDQP (LXSDX xaddr:$src)))>;
def : Pat<(f128 (sint_to_fp (i64 (load ixaddr:$src)))),		def : Pat<(f128 (sint_to_fp (i64 (load ixaddr:$src)))),
(f128 (XSCVSDQP (LXSD ixaddr:$src)))>;		(f128 (XSCVSDQP (LXSD ixaddr:$src)))>;
def : Pat<(f128 (uint_to_fp (i64 (load xaddr:$src)))),		def : Pat<(f128 (uint_to_fp (i64 (load xaddr:$src)))),
(f128 (XSCVUDQP (LXSDX xaddr:$src)))>;		(f128 (XSCVUDQP (LXSDX xaddr:$src)))>;
▲ Show 20 Lines • Show All 469 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/PowerPC/f128-vecExtractNconv.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mcpu=pwr9 -mtriple=powerpc64le-unknown-unknown \			; RUN: llc -mcpu=pwr9 -mtriple=powerpc64le-unknown-unknown \
	; RUN: -verify-machineinstrs -enable-ppc-quad-precision < %s \| FileCheck %s			; RUN: -verify-machineinstrs -enable-ppc-quad-precision < %s \| FileCheck %s
	; RUN: llc -mcpu=pwr9 -mtriple=powerpc64-unknown-unknown \			; RUN: llc -mcpu=pwr9 -mtriple=powerpc64-unknown-unknown \
	; RUN: -verify-machineinstrs -enable-ppc-quad-precision < %s \| \			; RUN: -verify-machineinstrs -enable-ppc-quad-precision < %s \| \
	; RUN: FileCheck %s -check-prefix=CHECK-BE			; RUN: FileCheck %s -check-prefix=CHECK-BE

				; Vector extract DWord and convert to quad precision.

	@sdwVecMem = global <2 x i64> <i64 88, i64 99>, align 16			@sdwVecMem = global <2 x i64> <i64 88, i64 99>, align 16
	@udwVecMem = global <2 x i64> <i64 88, i64 99>, align 16			@udwVecMem = global <2 x i64> <i64 88, i64 99>, align 16

	; Function Attrs: norecurse nounwind			; Function Attrs: norecurse nounwind
	define void @sdwVecConv2qp(fp128* nocapture %a, <2 x i64> %b) {			define void @sdwVecConv2qp(fp128* nocapture %a, <2 x i64> %b) {
	; CHECK-LABEL: sdwVecConv2qp:			; CHECK-LABEL: sdwVecConv2qp:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: xxspltd 34, 34, 1			; CHECK-NEXT: xxspltd 34, 34, 1
	▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	%0 = load <2 x i64>, <2 x i64>* %b, align 16			%0 = load <2 x i64>, <2 x i64>* %b, align 16
	%vecext = extractelement <2 x i64> %0, i32 0			%vecext = extractelement <2 x i64> %0, i32 0
	%conv = uitofp i64 %vecext to fp128			%conv = uitofp i64 %vecext to fp128
	store fp128 %conv, fp128* %a, align 16			store fp128 %conv, fp128* %a, align 16
	ret void			ret void
	}			}

				; Vector extract Word and convert to quad precision.

				@swVecMem = global <4 x i32> <i32 88, i32 99, i32 100, i32 2>, align 16
				@uwVecMem = global <4 x i32> <i32 89, i32 89, i32 200, i32 3>, align 16

				; Function Attrs: norecurse nounwind
				define void @swVecConv2qp(fp128* nocapture %a, <4 x i32> %b) {
				; CHECK-LABEL: swVecConv2qp:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vspltw 2, 2, 3
				; CHECK-NEXT: vextsw2d 2, 2
				; CHECK-NEXT: xscvsdqp 2, 2
				; CHECK-NEXT: stxv 34, 0(3)
				; CHECK-NEXT: blr

				; CHECK-BE-LABEL: swVecConv2qp:
				; CHECK-BE: vspltw 2, 2, 0
				; CHECK-BE-NEXT: vextsw2d 2, 2
				; CHECK-BE-NEXT: xscvsdqp 2, 2
				; CHECK-BE-NEXT: stxv 34, 0(3)
				; CHECK-BE-NEXT: blr
				entry:
				%vecext = extractelement <4 x i32> %b, i32 0
				%conv = sitofp i32 %vecext to fp128
				store fp128 %conv, fp128* %a, align 16
				ret void
				}

				; Function Attrs: norecurse nounwind
				define void @swVecConv2qp1(fp128* nocapture %a, <4 x i32> %b) {
				; CHECK-LABEL: swVecConv2qp1:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vspltw 2, 2, 2
				; CHECK-NEXT: vextsw2d 2, 2
				; CHECK-NEXT: xscvsdqp 2, 2
				; CHECK-NEXT: stxv 34, 0(3)
				; CHECK-NEXT: blr

				; CHECK-BE-LABEL: swVecConv2qp1:
				; CHECK-BE: vextsw2d 2, 2
				; CHECK-BE-NEXT: xscvsdqp 2, 2
				; CHECK-BE-NEXT: stxv 34, 0(3)
				; CHECK-BE-NEXT: blr
				entry:
				%vecext = extractelement <4 x i32> %b, i32 1
				%conv = sitofp i32 %vecext to fp128
				store fp128 %conv, fp128* %a, align 16
				ret void
				}

				; Function Attrs: norecurse nounwind
				define void @swVecConv2qp2(fp128* nocapture %a, <4 x i32> %b) {
				; CHECK-LABEL: swVecConv2qp2:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vextsw2d 2, 2
				; CHECK-NEXT: xscvsdqp 2, 2
				; CHECK-NEXT: stxv 34, 0(3)
				; CHECK-NEXT: blr

				; CHECK-BE-LABEL: swVecConv2qp2:
				; CHECK-BE: vspltw 2, 2, 2
				; CHECK-BE-NEXT: vextsw2d 2, 2
				; CHECK-BE-NEXT: xscvsdqp 2, 2
				; CHECK-BE-NEXT: stxv 34, 0(3)
				; CHECK-BE-NEXT: blr
				entry:
				%vecext = extractelement <4 x i32> %b, i32 2
				%conv = sitofp i32 %vecext to fp128
				store fp128 %conv, fp128* %a, align 16
				ret void
				}

				; Function Attrs: norecurse nounwind
				define void @swVecConv2qp3(fp128* nocapture %a, <4 x i32> %b) {
				; CHECK-LABEL: swVecConv2qp3:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vspltw 2, 2, 0
				; CHECK-NEXT: vextsw2d 2, 2
				; CHECK-NEXT: xscvsdqp 2, 2
				; CHECK-NEXT: stxv 34, 0(3)
				; CHECK-NEXT: blr

				; CHECK-BE-LABEL: swVecConv2qp3:
				; CHECK-BE: vspltw 2, 2, 3
				; CHECK-BE-NEXT: vextsw2d 2, 2
				; CHECK-BE-NEXT: xscvsdqp 2, 2
				; CHECK-BE-NEXT: stxv 34, 0(3)
				; CHECK-BE-NEXT: blr
				entry:
				%vecext = extractelement <4 x i32> %b, i32 3
				%conv = sitofp i32 %vecext to fp128
				store fp128 %conv, fp128* %a, align 16
				ret void
				}

				; Function Attrs: norecurse nounwind
				define void @uwVecConv2qp(fp128* nocapture %a, <4 x i32> %b) {
				; CHECK-LABEL: uwVecConv2qp:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: xxextractuw 34, 34, 12
				; CHECK-NEXT: xscvudqp 2, 2
				; CHECK-NEXT: stxv 34, 0(3)
				; CHECK-NEXT: blr

				; CHECK-BE-LABEL: uwVecConv2qp:
				; CHECK-BE: xxextractuw 34, 34, 0
				; CHECK-BE-NEXT: xscvudqp 2, 2
				; CHECK-BE-NEXT: stxv 34, 0(3)
				; CHECK-BE-NEXT: blr
				entry:
				%vecext = extractelement <4 x i32> %b, i32 0
				%conv = uitofp i32 %vecext to fp128
				store fp128 %conv, fp128* %a, align 16
				ret void
				}

				; Function Attrs: norecurse nounwind
				define void @uwVecConv2qp1(fp128* nocapture %a, <4 x i32> %b) {
				; CHECK-LABEL: uwVecConv2qp1:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: xxextractuw 34, 34, 8
				; CHECK-NEXT: xscvudqp 2, 2
				; CHECK-NEXT: stxv 34, 0(3)
				; CHECK-NEXT: blr

				; CHECK-BE-LABEL: uwVecConv2qp1:
				; CHECK-BE: xxextractuw 34, 34, 4
				; CHECK-BE-NEXT: xscvudqp 2, 2
				; CHECK-BE-NEXT: stxv 34, 0(3)
				; CHECK-BE-NEXT: blr
				entry:
				%vecext = extractelement <4 x i32> %b, i32 1
				%conv = uitofp i32 %vecext to fp128
				store fp128 %conv, fp128* %a, align 16
				ret void
				}

				; Function Attrs: norecurse nounwind
				define void @uwVecConv2qp2(fp128* nocapture %a, <4 x i32> %b) {
				; CHECK-LABEL: uwVecConv2qp2:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: xxextractuw 34, 34, 4
				; CHECK-NEXT: xscvudqp 2, 2
				; CHECK-NEXT: stxv 34, 0(3)
				; CHECK-NEXT: blr

				; CHECK-BE-LABEL: uwVecConv2qp2:
				; CHECK-BE: xxextractuw 34, 34, 8
				; CHECK-BE-NEXT: xscvudqp 2, 2
				; CHECK-BE-NEXT: stxv 34, 0(3)
				; CHECK-BE-NEXT: blr
				entry:
				%vecext = extractelement <4 x i32> %b, i32 2
				%conv = uitofp i32 %vecext to fp128
				store fp128 %conv, fp128* %a, align 16
				ret void
				}

				; Function Attrs: norecurse nounwind
				define void @uwVecConv2qp3(fp128* nocapture %a, <4 x i32> %b) {
				; CHECK-LABEL: uwVecConv2qp3:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: xxextractuw 34, 34, 0
				; CHECK-NEXT: xscvudqp 2, 2
				; CHECK-NEXT: stxv 34, 0(3)
				; CHECK-NEXT: blr

				; CHECK-BE-LABEL: uwVecConv2qp3:
				; CHECK-BE: xxextractuw 34, 34, 12
				; CHECK-BE-NEXT: xscvudqp 2, 2
				; CHECK-BE-NEXT: stxv 34, 0(3)
				; CHECK-BE-NEXT: blr
				entry:
				%vecext = extractelement <4 x i32> %b, i32 3
				%conv = uitofp i32 %vecext to fp128
				store fp128 %conv, fp128* %a, align 16
				ret void
				}

This is an archive of the discontinued LLVM Phabricator instance.

[Power9]Legalize and emit code for W vector extract and convert to Quad-Precision
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 148269

llvm/trunk/lib/Target/PowerPC/PPCInstrVSX.td

llvm/trunk/test/CodeGen/PowerPC/f128-vecExtractNconv.ll

This is an archive of the discontinued LLVM Phabricator instance.

[Power9]Legalize and emit code for W vector extract and convert to Quad-Precision ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 148269

llvm/trunk/lib/Target/PowerPC/PPCInstrVSX.td

llvm/trunk/test/CodeGen/PowerPC/f128-vecExtractNconv.ll

[Power9]Legalize and emit code for W vector extract and convert to Quad-Precision
ClosedPublic