This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/trunk/
-
trunk/
-
lib/Target/PowerPC/
-
Target/
-
PowerPC/
-
PPCInstrVSX.td
-
test/CodeGen/PowerPC/
-
CodeGen/
-
PowerPC/
-
builtins-ppc-p9-f128.ll

Differential D48218

[Power9] Add remaining __flaot128 builtin support for FMA round to odd
ClosedPublic

Authored by stefanp on Jun 15 2018, 6:58 AM.

Download Raw Diff

Details

Reviewers

nemanjai
kbarton
hfinkel
syzaara
sfertile
lei

Commits

rGb9d01aa29e5d: [Power9] Add remaining __flaot128 builtin support for FMA round to odd
rL336754: [Power9] Add remaining __flaot128 builtin support for FMA round to odd

Summary

Implement this as it is done on GCC:

__float128 a, b, c, d;
a = __builtin_fmaf128_round_to_odd (b, c, d);                      // generates xsmaddqpo
a = __builtin_fmaf128_round_to_odd (b, c, -d);                     // generates xsmsubqpo
a = - __builtin_fmaf128_round_to_odd (b, c, d);                    // generates xsnmaddqpo
a = - __builtin_fmaf128_round_to_odd (b, c, -d);                   // generates xsnmsubpqp

Diff Detail

Repository: rL LLVM

Event Timeline

stefanp created this revision.Jun 15 2018, 6:58 AM

stefanp added a parent revision: D47550: [Power9] Add __float128 builtins for Round To Odd.

lei added inline comments.Jun 26 2018, 6:36 AM

lib/Target/PowerPC/PPCInstrVSX.td
2488 ↗	(On Diff #151502)	indentation for these patterns are wrong.
2496 ↗	(On Diff #151502)	Same issue with indentation. See `XSNMADDQP` for reference.
test/CodeGen/PowerPC/builtins-ppc-p9-f128.ll
51 ↗	(On Diff #151502)	Might be good to actually have the registers stated here to ensure we are acting on the proper values.

Once Lei's comments are addressed, this LGTM. Feel free to add the updates on the commit.

test/CodeGen/PowerPC/builtins-ppc-p9-f128.ll
51 ↗	(On Diff #151502)	+1

This revision is now accepted and ready to land.Jul 4 2018, 4:52 AM

Closed by commit rL336754: [Power9] Add remaining __flaot128 builtin support for FMA round to odd (authored by stefanp). · Explain WhyJul 10 2018, 6:47 PM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

PowerPC/

PPCInstrVSX.td

15 lines

test/

CodeGen/

PowerPC/

builtins-ppc-p9-f128.ll

97 lines

Diff 154920

llvm/trunk/lib/Target/PowerPC/PPCInstrVSX.td

Show First 20 Lines • Show All 2,492 Lines • ▼ Show 20 Lines	def XSMADDQPO : X_VT5_VA5_VB5_FMA_Ro<63, 388, "xsmaddqpo",
[(set f128:$vT,		[(set f128:$vT,
(int_ppc_fmaf128_round_to_odd		(int_ppc_fmaf128_round_to_odd
f128:$vA,f128:$vB,f128:$vTi))]>;		f128:$vA,f128:$vB,f128:$vTi))]>;

def XSMSUBQP : X_VT5_VA5_VB5_FMA <63, 420, "xsmsubqp" ,		def XSMSUBQP : X_VT5_VA5_VB5_FMA <63, 420, "xsmsubqp" ,
[(set f128:$vT,		[(set f128:$vT,
(fma f128:$vA, f128:$vB,		(fma f128:$vA, f128:$vB,
(fneg f128:$vTi)))]>;		(fneg f128:$vTi)))]>;
def XSMSUBQPO : X_VT5_VA5_VB5_FMA_Ro<63, 420, "xsmsubqpo" , []>;		def XSMSUBQPO : X_VT5_VA5_VB5_FMA_Ro<63, 420, "xsmsubqpo" ,
		[(set f128:$vT,
		(int_ppc_fmaf128_round_to_odd
		f128:$vA, f128:$vB, (fneg f128:$vTi)))]>;
def XSNMADDQP : X_VT5_VA5_VB5_FMA <63, 452, "xsnmaddqp",		def XSNMADDQP : X_VT5_VA5_VB5_FMA <63, 452, "xsnmaddqp",
[(set f128:$vT,		[(set f128:$vT,
(fneg (fma f128:$vA, f128:$vB,		(fneg (fma f128:$vA, f128:$vB,
f128:$vTi)))]>;		f128:$vTi)))]>;
def XSNMADDQPO: X_VT5_VA5_VB5_FMA_Ro<63, 452, "xsnmaddqpo", []>;		def XSNMADDQPO: X_VT5_VA5_VB5_FMA_Ro<63, 452, "xsnmaddqpo",
		[(set f128:$vT,
		(fneg (int_ppc_fmaf128_round_to_odd
		f128:$vA, f128:$vB, f128:$vTi)))]>;
def XSNMSUBQP : X_VT5_VA5_VB5_FMA <63, 484, "xsnmsubqp",		def XSNMSUBQP : X_VT5_VA5_VB5_FMA <63, 484, "xsnmsubqp",
[(set f128:$vT,		[(set f128:$vT,
(fneg (fma f128:$vA, f128:$vB,		(fneg (fma f128:$vA, f128:$vB,
(fneg f128:$vTi))))]>;		(fneg f128:$vTi))))]>;
def XSNMSUBQPO: X_VT5_VA5_VB5_FMA_Ro<63, 484, "xsnmsubqpo", []>;		def XSNMSUBQPO: X_VT5_VA5_VB5_FMA_Ro<63, 484, "xsnmsubqpo",
		[(set f128:$vT,
		(fneg (int_ppc_fmaf128_round_to_odd
		f128:$vA, f128:$vB, (fneg f128:$vTi))))]>;

// Additional fnmsub patterns: -ac + b == -(ac - b)		// Additional fnmsub patterns: -ac + b == -(ac - b)
def : Pat<(fma (fneg f128:$A), f128:$C, f128:$B), (XSNMSUBQP $B, $C, $A)>;		def : Pat<(fma (fneg f128:$A), f128:$C, f128:$B), (XSNMSUBQP $B, $C, $A)>;
def : Pat<(fma f128:$A, (fneg f128:$C), f128:$B), (XSNMSUBQP $B, $C, $A)>;		def : Pat<(fma f128:$A, (fneg f128:$C), f128:$B), (XSNMSUBQP $B, $C, $A)>;

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// Quad/Double-Precision Compare Instructions:		// Quad/Double-Precision Compare Instructions:

▲ Show 20 Lines • Show All 1,320 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/PowerPC/builtins-ppc-p9-f128.ll

	; RUN: llc -verify-machineinstrs -mcpu=pwr9 -enable-ppc-quad-precision \			; RUN: llc -verify-machineinstrs -mcpu=pwr9 -enable-ppc-quad-precision \
	; RUN: -mtriple=powerpc64le-unknown-unknown < %s \| FileCheck %s			; RUN: -mtriple=powerpc64le-unknown-unknown -ppc-vsr-nums-as-vr \
				; RUN: -ppc-asm-full-reg-names < %s \| FileCheck %s

	@A = common global fp128 0xL00000000000000000000000000000000, align 16			@A = common global fp128 0xL00000000000000000000000000000000, align 16
	@B = common global fp128 0xL00000000000000000000000000000000, align 16			@B = common global fp128 0xL00000000000000000000000000000000, align 16
	@C = common global fp128 0xL00000000000000000000000000000000, align 16			@C = common global fp128 0xL00000000000000000000000000000000, align 16
				@D = common global fp128 0xL00000000000000000000000000000000, align 16

	define fp128 @testSqrtOdd() {			define fp128 @testSqrtOdd(fp128 %a) {
	entry:			entry:
	%0 = load fp128, fp128* @A, align 16			%0 = call fp128 @llvm.ppc.sqrtf128.round.to.odd(fp128 %a)
	%1 = call fp128 @llvm.ppc.sqrtf128.round.to.odd(fp128 %0)			ret fp128 %0
	ret fp128 %1
	; CHECK-LABEL: testSqrtOdd			; CHECK-LABEL: testSqrtOdd
	; CHECK: xssqrtqpo			; CHECK: xssqrtqpo v2, v2
				; CHECK: blr
	}			}

	declare fp128 @llvm.ppc.sqrtf128.round.to.odd(fp128)			declare fp128 @llvm.ppc.sqrtf128.round.to.odd(fp128)

	define fp128 @testFMAOdd() {			define void @testFMAOdd(fp128 %a, fp128 %b, fp128 %c) {
	entry:			entry:
	%0 = load fp128, fp128* @A, align 16			%0 = call fp128 @llvm.ppc.fmaf128.round.to.odd(fp128 %a, fp128 %b, fp128 %c)
	%1 = load fp128, fp128* @B, align 16			store fp128 %0, fp128* @A, align 16
	%2 = load fp128, fp128* @C, align 16			%sub = fsub fp128 0xL00000000000000008000000000000000, %c
	%3 = call fp128 @llvm.ppc.fmaf128.round.to.odd(fp128 %0, fp128 %1, fp128 %2)			%1 = call fp128 @llvm.ppc.fmaf128.round.to.odd(fp128 %a, fp128 %b, fp128 %sub)
	ret fp128 %3			store fp128 %1, fp128* @B, align 16
				%2 = call fp128 @llvm.ppc.fmaf128.round.to.odd(fp128 %a, fp128 %b, fp128 %c)
				%sub1 = fsub fp128 0xL00000000000000008000000000000000, %2
				store fp128 %sub1, fp128* @C, align 16
				%sub2 = fsub fp128 0xL00000000000000008000000000000000, %c
				%3 = call fp128 @llvm.ppc.fmaf128.round.to.odd(fp128 %a, fp128 %b, fp128 %sub2)
				%sub3 = fsub fp128 0xL00000000000000008000000000000000, %3
				store fp128 %sub3, fp128* @D, align 16
				ret void
	; CHECK-LABEL: testFMAOdd			; CHECK-LABEL: testFMAOdd
	; CHECK: xsmaddqpo			; CHECK-DAG: xsmaddqpo v{{[0-9]+}}, v2, v3
				; CHECK-DAG: xsmsubqpo v{{[0-9]+}}, v2, v3
				; CHECK-DAG: xsnmaddqpo v{{[0-9]+}}, v2, v3
				; CHECK-DAG: xsnmsubqpo v{{[0-9]+}}, v2, v3
				; CHECK: blr
	}			}

	declare fp128 @llvm.ppc.fmaf128.round.to.odd(fp128, fp128, fp128)			declare fp128 @llvm.ppc.fmaf128.round.to.odd(fp128, fp128, fp128)

	define fp128 @testAddOdd() {			define fp128 @testAddOdd(fp128 %a, fp128 %b) {
	entry:			entry:
	%0 = load fp128, fp128* @A, align 16			%0 = call fp128 @llvm.ppc.addf128.round.to.odd(fp128 %a, fp128 %b)
	%1 = load fp128, fp128* @B, align 16			ret fp128 %0
	%2 = call fp128 @llvm.ppc.addf128.round.to.odd(fp128 %0, fp128 %1)
	ret fp128 %2
	; CHECK-LABEL: testAddOdd			; CHECK-LABEL: testAddOdd
	; CHECK: xsaddqpo			; CHECK: xsaddqpo v2, v2, v3
				; CHECK: blr
	}			}

	declare fp128 @llvm.ppc.addf128.round.to.odd(fp128, fp128)			declare fp128 @llvm.ppc.addf128.round.to.odd(fp128, fp128)

	define fp128 @testSubOdd() {			define fp128 @testSubOdd(fp128 %a, fp128 %b) {
	entry:			entry:
	%0 = load fp128, fp128* @A, align 16			%0 = call fp128 @llvm.ppc.subf128.round.to.odd(fp128 %a, fp128 %b)
	%1 = load fp128, fp128* @B, align 16			ret fp128 %0
	%2 = call fp128 @llvm.ppc.subf128.round.to.odd(fp128 %0, fp128 %1)
	ret fp128 %2
	; CHECK-LABEL: testSubOdd			; CHECK-LABEL: testSubOdd
	; CHECK: xssubqpo			; CHECK: xssubqpo v2, v2, v3
				; CHECK: blr
	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	declare fp128 @llvm.ppc.subf128.round.to.odd(fp128, fp128)			declare fp128 @llvm.ppc.subf128.round.to.odd(fp128, fp128)

	; Function Attrs: noinline nounwind optnone			; Function Attrs: noinline nounwind optnone
	define fp128 @testMulOdd() {			define fp128 @testMulOdd(fp128 %a, fp128 %b) {
	entry:			entry:
	%0 = load fp128, fp128* @A, align 16			%0 = call fp128 @llvm.ppc.mulf128.round.to.odd(fp128 %a, fp128 %b)
	%1 = load fp128, fp128* @B, align 16			ret fp128 %0
	%2 = call fp128 @llvm.ppc.mulf128.round.to.odd(fp128 %0, fp128 %1)
	ret fp128 %2
	; CHECK-LABEL: testMulOdd			; CHECK-LABEL: testMulOdd
	; CHECK: xsmulqpo			; CHECK: xsmulqpo v2, v2, v3
				; CHECK: blr
	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	declare fp128 @llvm.ppc.mulf128.round.to.odd(fp128, fp128)			declare fp128 @llvm.ppc.mulf128.round.to.odd(fp128, fp128)

	define fp128 @testDivOdd() {			define fp128 @testDivOdd(fp128 %a, fp128 %b) {
	entry:			entry:
	%0 = load fp128, fp128* @A, align 16			%0 = call fp128 @llvm.ppc.divf128.round.to.odd(fp128 %a, fp128 %b)
	%1 = load fp128, fp128* @B, align 16			ret fp128 %0
	%2 = call fp128 @llvm.ppc.divf128.round.to.odd(fp128 %0, fp128 %1)
	ret fp128 %2
	; CHECK-LABEL: testDivOdd			; CHECK-LABEL: testDivOdd
	; CHECK: xsdivqpo			; CHECK: xsdivqpo v2, v2, v3
				; CHECK: blr
	}			}

	declare fp128 @llvm.ppc.divf128.round.to.odd(fp128, fp128)			declare fp128 @llvm.ppc.divf128.round.to.odd(fp128, fp128)

	define double @testTruncOdd() {			define double @testTruncOdd(fp128 %a) {
	entry:			entry:
	%0 = load fp128, fp128* @A, align 16			%0 = call double @llvm.ppc.truncf128.round.to.odd(fp128 %a)
	%1 = call double @llvm.ppc.truncf128.round.to.odd(fp128 %0)			ret double %0
	ret double %1
	; CHECK-LABEL: testTruncOdd			; CHECK-LABEL: testTruncOdd
	; CHECK: xscvqpdpo			; CHECK: xscvqpdpo v2, v2
				; CHECK: xxlor f1, v2, v2
				; CHECK: blr
	}			}

	declare double @llvm.ppc.truncf128.round.to.odd(fp128)			declare double @llvm.ppc.truncf128.round.to.odd(fp128)