Diff 314821

llvm/include/llvm/Target/TargetSelectionDAG.td

Show First 20 Lines • Show All 244 Lines • ▼ Show 20 Lines	def SDTVecExtract : SDTypeProfile<1, 2, [ // vector extract
SDTCisEltOfVec<0, 1>, SDTCisPtrTy<2>		SDTCisEltOfVec<0, 1>, SDTCisPtrTy<2>
]>;		]>;
def SDTVecInsert : SDTypeProfile<1, 3, [ // vector insert		def SDTVecInsert : SDTypeProfile<1, 3, [ // vector insert
SDTCisEltOfVec<2, 1>, SDTCisSameAs<0, 1>, SDTCisPtrTy<3>		SDTCisEltOfVec<2, 1>, SDTCisSameAs<0, 1>, SDTCisPtrTy<3>
]>;		]>;
def SDTVecReduce : SDTypeProfile<1, 1, [ // vector reduction		def SDTVecReduce : SDTypeProfile<1, 1, [ // vector reduction
SDTCisInt<0>, SDTCisVec<1>		SDTCisInt<0>, SDTCisVec<1>
]>;		]>;
		def SDTFPVecReduce : SDTypeProfile<1, 1, [ // FP vector reduction
		SDTCisFP<0>, SDTCisVec<1>
		]>;


def SDTSubVecExtract : SDTypeProfile<1, 2, [// subvector extract		def SDTSubVecExtract : SDTypeProfile<1, 2, [// subvector extract
SDTCisSubVecOfVec<0,1>, SDTCisInt<2>		SDTCisSubVecOfVec<0,1>, SDTCisInt<2>
]>;		]>;
def SDTSubVecInsert : SDTypeProfile<1, 3, [ // subvector insert		def SDTSubVecInsert : SDTypeProfile<1, 3, [ // subvector insert
SDTCisSubVecOfVec<2, 1>, SDTCisSameAs<0,1>, SDTCisInt<3>		SDTCisSubVecOfVec<2, 1>, SDTCisSameAs<0,1>, SDTCisInt<3>
]>;		]>;

▲ Show 20 Lines • Show All 173 Lines • ▼ Show 20 Lines
def extractelt : SDNode<"ISD::EXTRACT_VECTOR_ELT", SDTVecExtract>;		def extractelt : SDNode<"ISD::EXTRACT_VECTOR_ELT", SDTVecExtract>;
def insertelt : SDNode<"ISD::INSERT_VECTOR_ELT", SDTVecInsert>;		def insertelt : SDNode<"ISD::INSERT_VECTOR_ELT", SDTVecInsert>;

def vecreduce_add : SDNode<"ISD::VECREDUCE_ADD", SDTVecReduce>;		def vecreduce_add : SDNode<"ISD::VECREDUCE_ADD", SDTVecReduce>;
def vecreduce_smax : SDNode<"ISD::VECREDUCE_SMAX", SDTVecReduce>;		def vecreduce_smax : SDNode<"ISD::VECREDUCE_SMAX", SDTVecReduce>;
def vecreduce_umax : SDNode<"ISD::VECREDUCE_UMAX", SDTVecReduce>;		def vecreduce_umax : SDNode<"ISD::VECREDUCE_UMAX", SDTVecReduce>;
def vecreduce_smin : SDNode<"ISD::VECREDUCE_SMIN", SDTVecReduce>;		def vecreduce_smin : SDNode<"ISD::VECREDUCE_SMIN", SDTVecReduce>;
def vecreduce_umin : SDNode<"ISD::VECREDUCE_UMIN", SDTVecReduce>;		def vecreduce_umin : SDNode<"ISD::VECREDUCE_UMIN", SDTVecReduce>;
		def vecreduce_fadd : SDNode<"ISD::VECREDUCE_FADD", SDTFPVecReduce>;

def fadd : SDNode<"ISD::FADD" , SDTFPBinOp, [SDNPCommutative]>;		def fadd : SDNode<"ISD::FADD" , SDTFPBinOp, [SDNPCommutative]>;
def fsub : SDNode<"ISD::FSUB" , SDTFPBinOp>;		def fsub : SDNode<"ISD::FSUB" , SDTFPBinOp>;
def fmul : SDNode<"ISD::FMUL" , SDTFPBinOp, [SDNPCommutative]>;		def fmul : SDNode<"ISD::FMUL" , SDTFPBinOp, [SDNPCommutative]>;
def fdiv : SDNode<"ISD::FDIV" , SDTFPBinOp>;		def fdiv : SDNode<"ISD::FDIV" , SDTFPBinOp>;
def frem : SDNode<"ISD::FREM" , SDTFPBinOp>;		def frem : SDNode<"ISD::FREM" , SDTFPBinOp>;
def fma : SDNode<"ISD::FMA" , SDTFPTernaryOp, [SDNPCommutative]>;		def fma : SDNode<"ISD::FMA" , SDTFPTernaryOp, [SDNPCommutative]>;
def fmad : SDNode<"ISD::FMAD" , SDTFPTernaryOp, [SDNPCommutative]>;		def fmad : SDNode<"ISD::FMAD" , SDTFPTernaryOp, [SDNPCommutative]>;
▲ Show 20 Lines • Show All 1,188 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 993 Lines • ▼ Show 20 Lines	for (MVT VT : { MVT::v8i8, MVT::v4i16, MVT::v2i32,
setOperationAction(ISD::USUBSAT, VT, Legal);		setOperationAction(ISD::USUBSAT, VT, Legal);
}		}

// Vector reductions		// Vector reductions
for (MVT VT : { MVT::v4f16, MVT::v2f32,		for (MVT VT : { MVT::v4f16, MVT::v2f32,
MVT::v8f16, MVT::v4f32, MVT::v2f64 }) {		MVT::v8f16, MVT::v4f32, MVT::v2f64 }) {
setOperationAction(ISD::VECREDUCE_FMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_FMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_FMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_FMIN, VT, Custom);

		if (VT.getVectorElementType() != MVT::f16 \|\| Subtarget->hasFullFP16())
		setOperationAction(ISD::VECREDUCE_FADD, VT, Legal);
}		}
for (MVT VT : { MVT::v8i8, MVT::v4i16, MVT::v2i32,		for (MVT VT : { MVT::v8i8, MVT::v4i16, MVT::v2i32,
MVT::v16i8, MVT::v8i16, MVT::v4i32 }) {		MVT::v16i8, MVT::v8i16, MVT::v4i32 }) {
setOperationAction(ISD::VECREDUCE_ADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_ADD, VT, Custom);
setOperationAction(ISD::VECREDUCE_SMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_SMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_SMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_SMIN, VT, Custom);
setOperationAction(ISD::VECREDUCE_UMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_UMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_UMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_UMIN, VT, Custom);
▲ Show 20 Lines • Show All 15,978 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrInfo.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 4,983 Lines • ▼ Show 20 Lines
	//----------------------------------------------------------------------------			//----------------------------------------------------------------------------

	defm ADDP : SIMDPairwiseScalarD<0, 0b11011, "addp">;			defm ADDP : SIMDPairwiseScalarD<0, 0b11011, "addp">;
	defm FADDP : SIMDFPPairwiseScalar<0, 0b01101, "faddp">;			defm FADDP : SIMDFPPairwiseScalar<0, 0b01101, "faddp">;
	defm FMAXNMP : SIMDFPPairwiseScalar<0, 0b01100, "fmaxnmp">;			defm FMAXNMP : SIMDFPPairwiseScalar<0, 0b01100, "fmaxnmp">;
	defm FMAXP : SIMDFPPairwiseScalar<0, 0b01111, "fmaxp">;			defm FMAXP : SIMDFPPairwiseScalar<0, 0b01111, "fmaxp">;
	defm FMINNMP : SIMDFPPairwiseScalar<1, 0b01100, "fminnmp">;			defm FMINNMP : SIMDFPPairwiseScalar<1, 0b01100, "fminnmp">;
	defm FMINP : SIMDFPPairwiseScalar<1, 0b01111, "fminp">;			defm FMINP : SIMDFPPairwiseScalar<1, 0b01111, "fminp">;

				let Predicates = [HasFullFP16] in {
				def : Pat<(f16 (vecreduce_fadd (v8f16 V128:$Rn))),
				(FADDPv2i16p
				(EXTRACT_SUBREG
				(FADDPv8f16 (FADDPv8f16 V128:$Rn, (v8f16 (IMPLICIT_DEF))), (v8f16 (IMPLICIT_DEF))),
				dsub))>;
				def : Pat<(f16 (vecreduce_fadd (v4f16 V64:$Rn))),
				(FADDPv2i16p (FADDPv4f16 V64:$Rn, (v4f16 (IMPLICIT_DEF))))>;
				}
				def : Pat<(f32 (vecreduce_fadd (v4f32 V128:$Rn))),
				(FADDPv2i32p
				(EXTRACT_SUBREG
				(FADDPv4f32 V128:$Rn, (v4f32 (IMPLICIT_DEF))),
				dsub))>;
				def : Pat<(f32 (vecreduce_fadd (v2f32 V64:$Rn))),
				(FADDPv2i32p V64:$Rn)>;
				def : Pat<(f64 (vecreduce_fadd (v2f64 V128:$Rn))),
				(FADDPv2i64p V128:$Rn)>;

	def : Pat<(v2i64 (AArch64saddv V128:$Rn)),			def : Pat<(v2i64 (AArch64saddv V128:$Rn)),
	(INSERT_SUBREG (v2i64 (IMPLICIT_DEF)), (ADDPv2i64p V128:$Rn), dsub)>;			(INSERT_SUBREG (v2i64 (IMPLICIT_DEF)), (ADDPv2i64p V128:$Rn), dsub)>;
	def : Pat<(v2i64 (AArch64uaddv V128:$Rn)),			def : Pat<(v2i64 (AArch64uaddv V128:$Rn)),
	(INSERT_SUBREG (v2i64 (IMPLICIT_DEF)), (ADDPv2i64p V128:$Rn), dsub)>;			(INSERT_SUBREG (v2i64 (IMPLICIT_DEF)), (ADDPv2i64p V128:$Rn), dsub)>;
	def : Pat<(f32 (int_aarch64_neon_faddv (v2f32 V64:$Rn))),			def : Pat<(f32 (int_aarch64_neon_faddv (v2f32 V64:$Rn))),
	(FADDPv2i32p V64:$Rn)>;			(FADDPv2i32p V64:$Rn)>;
	def : Pat<(f32 (int_aarch64_neon_faddv (v4f32 V128:$Rn))),			def : Pat<(f32 (int_aarch64_neon_faddv (v4f32 V128:$Rn))),
	(FADDPv2i32p (EXTRACT_SUBREG (FADDPv4f32 V128:$Rn, V128:$Rn), dsub))>;			(FADDPv2i32p (EXTRACT_SUBREG (FADDPv4f32 V128:$Rn, V128:$Rn), dsub))>;
	▲ Show 20 Lines • Show All 2,788 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/vecreduce-fadd-legalization.ll

	Show First 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	}			}

	define float @test_v3f32(<3 x float> %a) nounwind {			define float @test_v3f32(<3 x float> %a) nounwind {
	; CHECK-LABEL: test_v3f32:			; CHECK-LABEL: test_v3f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #-2147483648			; CHECK-NEXT: mov w8, #-2147483648
	; CHECK-NEXT: fmov s1, w8			; CHECK-NEXT: fmov s1, w8
	; CHECK-NEXT: mov v0.s[3], v1.s[0]			; CHECK-NEXT: mov v0.s[3], v1.s[0]
	; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8			; CHECK-NEXT: faddp v0.4s, v0.4s, v0.4s
	; CHECK-NEXT: fadd v0.2s, v0.2s, v1.2s
	; CHECK-NEXT: faddp s0, v0.2s			; CHECK-NEXT: faddp s0, v0.2s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b = call reassoc float @llvm.vector.reduce.fadd.f32.v3f32(float -0.0, <3 x float> %a)			%b = call reassoc float @llvm.vector.reduce.fadd.f32.v3f32(float -0.0, <3 x float> %a)
	ret float %b			ret float %b
	}			}

	define float @test_v5f32(<5 x float> %a) nounwind {			define float @test_v5f32(<5 x float> %a) nounwind {
	; CHECK-LABEL: test_v5f32:			; CHECK-LABEL: test_v5f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: // kill: def $s0 killed $s0 def $q0			; CHECK-NEXT: // kill: def $s0 killed $s0 def $q0
	; CHECK-NEXT: // kill: def $s1 killed $s1 def $q1			; CHECK-NEXT: // kill: def $s1 killed $s1 def $q1
	; CHECK-NEXT: // kill: def $s2 killed $s2 def $q2			; CHECK-NEXT: // kill: def $s2 killed $s2 def $q2
	; CHECK-NEXT: movi v5.4s, #128, lsl #24			; CHECK-NEXT: movi v5.4s, #128, lsl #24
	; CHECK-NEXT: mov v0.s[1], v1.s[0]			; CHECK-NEXT: mov v0.s[1], v1.s[0]
	; CHECK-NEXT: mov v0.s[2], v2.s[0]			; CHECK-NEXT: mov v0.s[2], v2.s[0]
	; CHECK-NEXT: // kill: def $s4 killed $s4 def $q4			; CHECK-NEXT: // kill: def $s4 killed $s4 def $q4
	; CHECK-NEXT: // kill: def $s3 killed $s3 def $q3			; CHECK-NEXT: // kill: def $s3 killed $s3 def $q3
	; CHECK-NEXT: mov v0.s[3], v3.s[0]			; CHECK-NEXT: mov v0.s[3], v3.s[0]
	; CHECK-NEXT: mov v5.s[0], v4.s[0]			; CHECK-NEXT: mov v5.s[0], v4.s[0]
	; CHECK-NEXT: fadd v0.4s, v0.4s, v5.4s			; CHECK-NEXT: fadd v0.4s, v0.4s, v5.4s
	; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8			; CHECK-NEXT: faddp v0.4s, v0.4s, v0.4s
	; CHECK-NEXT: fadd v0.2s, v0.2s, v1.2s
	; CHECK-NEXT: faddp s0, v0.2s			; CHECK-NEXT: faddp s0, v0.2s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b = call reassoc float @llvm.vector.reduce.fadd.f32.v5f32(float -0.0, <5 x float> %a)			%b = call reassoc float @llvm.vector.reduce.fadd.f32.v5f32(float -0.0, <5 x float> %a)
	ret float %b			ret float %b
	}			}

	define fp128 @test_v2f128(<2 x fp128> %a) nounwind {			define fp128 @test_v2f128(<2 x fp128> %a) nounwind {
	; CHECK-LABEL: test_v2f128:			; CHECK-LABEL: test_v2f128:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: b __addtf3			; CHECK-NEXT: b __addtf3
	%b = call reassoc fp128 @llvm.vector.reduce.fadd.f128.v2f128(fp128 0xL00000000000000008000000000000000, <2 x fp128> %a)			%b = call reassoc fp128 @llvm.vector.reduce.fadd.f128.v2f128(fp128 0xL00000000000000008000000000000000, <2 x fp128> %a)
	ret fp128 %b			ret fp128 %b
	}			}

	define float @test_v16f32(<16 x float> %a) nounwind {			define float @test_v16f32(<16 x float> %a) nounwind {
	; CHECK-LABEL: test_v16f32:			; CHECK-LABEL: test_v16f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: fadd v1.4s, v1.4s, v3.4s			; CHECK-NEXT: fadd v1.4s, v1.4s, v3.4s
	; CHECK-NEXT: fadd v0.4s, v0.4s, v2.4s			; CHECK-NEXT: fadd v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: fadd v0.4s, v0.4s, v1.4s			; CHECK-NEXT: fadd v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8			; CHECK-NEXT: faddp v0.4s, v0.4s, v0.4s
	; CHECK-NEXT: fadd v0.2s, v0.2s, v1.2s
	; CHECK-NEXT: faddp s0, v0.2s			; CHECK-NEXT: faddp s0, v0.2s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b = call reassoc float @llvm.vector.reduce.fadd.f32.v16f32(float -0.0, <16 x float> %a)			%b = call reassoc float @llvm.vector.reduce.fadd.f32.v16f32(float -0.0, <16 x float> %a)
	ret float %b			ret float %b
	}			}

llvm/test/CodeGen/AArch64/vecreduce-fadd.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc --mtriple=aarch64-eabi -aarch64-neon-syntax=generic -mattr=+fullfp16 < %s \| FileCheck %s		; RUN: llc --mtriple=aarch64-eabi -aarch64-neon-syntax=generic -mattr=+fullfp16 < %s \| FileCheck %s
; RUN: llc --mtriple=aarch64-eabi -aarch64-neon-syntax=generic < %s \| FileCheck %s --check-prefix=CHECKNOFP16		; RUN: llc --mtriple=aarch64-eabi -aarch64-neon-syntax=generic < %s \| FileCheck %s --check-prefix=CHECKNOFP16

define float @add_HalfS(<2 x float> %bin.rdx) {		define float @add_HalfS(<2 x float> %bin.rdx) {
; CHECK-LABEL: add_HalfS:		; CHECK-LABEL: add_HalfS:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0
; CHECK-NEXT: faddp s0, v0.2s		; CHECK-NEXT: faddp s0, v0.2s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECKNOFP16-LABEL: add_HalfS:		; CHECKNOFP16-LABEL: add_HalfS:
; CHECKNOFP16: // %bb.0:		; CHECKNOFP16: // %bb.0:
; CHECKNOFP16-NEXT: // kill: def $d0 killed $d0 def $q0
; CHECKNOFP16-NEXT: faddp s0, v0.2s		; CHECKNOFP16-NEXT: faddp s0, v0.2s
; CHECKNOFP16-NEXT: ret		; CHECKNOFP16-NEXT: ret
%r = call fast float @llvm.vector.reduce.fadd.f32.v2f32(float -0.0, <2 x float> %bin.rdx)		%r = call fast float @llvm.vector.reduce.fadd.f32.v2f32(float -0.0, <2 x float> %bin.rdx)
ret float %r		ret float %r
}		}

define half @add_HalfH(<4 x half> %bin.rdx) {		define half @add_HalfH(<4 x half> %bin.rdx) {
; CHECK-LABEL: add_HalfH:		; CHECK-LABEL: add_HalfH:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0		; CHECK-NEXT: faddp v0.4h, v0.4h, v0.4h
; CHECK-NEXT: mov h1, v0.h[3]
; CHECK-NEXT: mov h2, v0.h[2]
; CHECK-NEXT: faddp h0, v0.2h		; CHECK-NEXT: faddp h0, v0.2h
; CHECK-NEXT: fadd h0, h0, h2
; CHECK-NEXT: fadd h0, h0, h1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECKNOFP16-LABEL: add_HalfH:		; CHECKNOFP16-LABEL: add_HalfH:
; CHECKNOFP16: // %bb.0:		; CHECKNOFP16: // %bb.0:
; CHECKNOFP16-NEXT: // kill: def $d0 killed $d0 def $q0		; CHECKNOFP16-NEXT: // kill: def $d0 killed $d0 def $q0
; CHECKNOFP16-NEXT: mov h3, v0.h[1]		; CHECKNOFP16-NEXT: mov h3, v0.h[1]
; CHECKNOFP16-NEXT: mov h1, v0.h[3]		; CHECKNOFP16-NEXT: mov h1, v0.h[3]
; CHECKNOFP16-NEXT: mov h2, v0.h[2]		; CHECKNOFP16-NEXT: mov h2, v0.h[2]
Show All 13 Lines	; CHECKNOFP16-NEXT: ret
%r = call fast half @llvm.vector.reduce.fadd.f16.v4f16(half -0.0, <4 x half> %bin.rdx)		%r = call fast half @llvm.vector.reduce.fadd.f16.v4f16(half -0.0, <4 x half> %bin.rdx)
ret half %r		ret half %r
}		}


define half @add_H(<8 x half> %bin.rdx) {		define half @add_H(<8 x half> %bin.rdx) {
; CHECK-LABEL: add_H:		; CHECK-LABEL: add_H:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8		; CHECK-NEXT: faddp v0.8h, v0.8h, v0.8h
; CHECK-NEXT: fadd v0.4h, v0.4h, v1.4h		; CHECK-NEXT: faddp v0.8h, v0.8h, v0.8h
; CHECK-NEXT: mov h1, v0.h[2]		; CHECK-NEXT: faddp h0, v0.2h
; CHECK-NEXT: faddp h2, v0.2h
; CHECK-NEXT: fadd h1, h2, h1
; CHECK-NEXT: mov h0, v0.h[3]
; CHECK-NEXT: fadd h0, h1, h0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECKNOFP16-LABEL: add_H:		; CHECKNOFP16-LABEL: add_H:
; CHECKNOFP16: // %bb.0:		; CHECKNOFP16: // %bb.0:
; CHECKNOFP16-NEXT: mov h7, v0.h[1]		; CHECKNOFP16-NEXT: mov h7, v0.h[1]
; CHECKNOFP16-NEXT: mov h1, v0.h[7]		; CHECKNOFP16-NEXT: mov h1, v0.h[7]
; CHECKNOFP16-NEXT: mov h2, v0.h[6]		; CHECKNOFP16-NEXT: mov h2, v0.h[6]
; CHECKNOFP16-NEXT: mov h3, v0.h[5]		; CHECKNOFP16-NEXT: mov h3, v0.h[5]
Show All 31 Lines
; CHECKNOFP16-NEXT: ret		; CHECKNOFP16-NEXT: ret
%r = call fast half @llvm.vector.reduce.fadd.f16.v8f16(half -0.0, <8 x half> %bin.rdx)		%r = call fast half @llvm.vector.reduce.fadd.f16.v8f16(half -0.0, <8 x half> %bin.rdx)
ret half %r		ret half %r
}		}

define float @add_S(<4 x float> %bin.rdx) {		define float @add_S(<4 x float> %bin.rdx) {
; CHECK-LABEL: add_S:		; CHECK-LABEL: add_S:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8		; CHECK-NEXT: faddp v0.4s, v0.4s, v0.4s
; CHECK-NEXT: fadd v0.2s, v0.2s, v1.2s
; CHECK-NEXT: faddp s0, v0.2s		; CHECK-NEXT: faddp s0, v0.2s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECKNOFP16-LABEL: add_S:		; CHECKNOFP16-LABEL: add_S:
; CHECKNOFP16: // %bb.0:		; CHECKNOFP16: // %bb.0:
; CHECKNOFP16-NEXT: ext v1.16b, v0.16b, v0.16b, #8		; CHECKNOFP16-NEXT: faddp v0.4s, v0.4s, v0.4s
; CHECKNOFP16-NEXT: fadd v0.2s, v0.2s, v1.2s
; CHECKNOFP16-NEXT: faddp s0, v0.2s		; CHECKNOFP16-NEXT: faddp s0, v0.2s
; CHECKNOFP16-NEXT: ret		; CHECKNOFP16-NEXT: ret
%r = call fast float @llvm.vector.reduce.fadd.f32.v4f32(float -0.0, <4 x float> %bin.rdx)		%r = call fast float @llvm.vector.reduce.fadd.f32.v4f32(float -0.0, <4 x float> %bin.rdx)
		dmgreenUnsubmitted Done Reply Inline Actions Can you make sure there is some test where the first element isn't -0.0. (I think it should work fine, but it would be good to make sure there is a test for it) dmgreen: Can you make sure there is some test where the first element isn't -0.0. (I think it should…
ret float %r		ret float %r
}		}

define double @add_D(<2 x double> %bin.rdx) {		define double @add_D(<2 x double> %bin.rdx) {
; CHECK-LABEL: add_D:		; CHECK-LABEL: add_D:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: faddp d0, v0.2d		; CHECK-NEXT: faddp d0, v0.2d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECKNOFP16-LABEL: add_D:		; CHECKNOFP16-LABEL: add_D:
; CHECKNOFP16: // %bb.0:		; CHECKNOFP16: // %bb.0:
; CHECKNOFP16-NEXT: faddp d0, v0.2d		; CHECKNOFP16-NEXT: faddp d0, v0.2d
; CHECKNOFP16-NEXT: ret		; CHECKNOFP16-NEXT: ret
%r = call fast double @llvm.vector.reduce.fadd.f64.v2f64(double -0.0, <2 x double> %bin.rdx)		%r = call fast double @llvm.vector.reduce.fadd.f64.v2f64(double -0.0, <2 x double> %bin.rdx)
ret double %r		ret double %r
}		}

define half @add_2H(<16 x half> %bin.rdx) {		define half @add_2H(<16 x half> %bin.rdx) {
; CHECK-LABEL: add_2H:		; CHECK-LABEL: add_2H:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: fadd v0.8h, v0.8h, v1.8h		; CHECK-NEXT: fadd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8		; CHECK-NEXT: faddp v0.8h, v0.8h, v0.8h
; CHECK-NEXT: fadd v0.4h, v0.4h, v1.4h		; CHECK-NEXT: faddp v0.8h, v0.8h, v0.8h
; CHECK-NEXT: mov h1, v0.h[2]		; CHECK-NEXT: faddp h0, v0.2h
; CHECK-NEXT: faddp h2, v0.2h
; CHECK-NEXT: fadd h1, h2, h1
; CHECK-NEXT: mov h0, v0.h[3]
; CHECK-NEXT: fadd h0, h1, h0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECKNOFP16-LABEL: add_2H:		; CHECKNOFP16-LABEL: add_2H:
; CHECKNOFP16: // %bb.0:		; CHECKNOFP16: // %bb.0:
; CHECKNOFP16-NEXT: mov h2, v1.h[1]		; CHECKNOFP16-NEXT: mov h2, v1.h[1]
; CHECKNOFP16-NEXT: mov h3, v0.h[1]		; CHECKNOFP16-NEXT: mov h3, v0.h[1]
; CHECKNOFP16-NEXT: mov h6, v1.h[2]		; CHECKNOFP16-NEXT: mov h6, v1.h[2]
; CHECKNOFP16-NEXT: mov h7, v0.h[2]		; CHECKNOFP16-NEXT: mov h7, v0.h[2]
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	; CHECKNOFP16-NEXT: ret
%r = call fast half @llvm.vector.reduce.fadd.f16.v16f16(half -0.0, <16 x half> %bin.rdx)		%r = call fast half @llvm.vector.reduce.fadd.f16.v16f16(half -0.0, <16 x half> %bin.rdx)
ret half %r		ret half %r
}		}

define float @add_2S(<8 x float> %bin.rdx) {		define float @add_2S(<8 x float> %bin.rdx) {
; CHECK-LABEL: add_2S:		; CHECK-LABEL: add_2S:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: fadd v0.4s, v0.4s, v1.4s		; CHECK-NEXT: fadd v0.4s, v0.4s, v1.4s
; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8		; CHECK-NEXT: faddp v0.4s, v0.4s, v0.4s
; CHECK-NEXT: fadd v0.2s, v0.2s, v1.2s
; CHECK-NEXT: faddp s0, v0.2s		; CHECK-NEXT: faddp s0, v0.2s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECKNOFP16-LABEL: add_2S:		; CHECKNOFP16-LABEL: add_2S:
; CHECKNOFP16: // %bb.0:		; CHECKNOFP16: // %bb.0:
; CHECKNOFP16-NEXT: fadd v0.4s, v0.4s, v1.4s		; CHECKNOFP16-NEXT: fadd v0.4s, v0.4s, v1.4s
; CHECKNOFP16-NEXT: ext v1.16b, v0.16b, v0.16b, #8		; CHECKNOFP16-NEXT: faddp v0.4s, v0.4s, v0.4s
; CHECKNOFP16-NEXT: fadd v0.2s, v0.2s, v1.2s
; CHECKNOFP16-NEXT: faddp s0, v0.2s		; CHECKNOFP16-NEXT: faddp s0, v0.2s
; CHECKNOFP16-NEXT: ret		; CHECKNOFP16-NEXT: ret
%r = call fast float @llvm.vector.reduce.fadd.f32.v8f32(float -0.0, <8 x float> %bin.rdx)		%r = call fast float @llvm.vector.reduce.fadd.f32.v8f32(float -0.0, <8 x float> %bin.rdx)
ret float %r		ret float %r
}		}

define double @add_2D(<4 x double> %bin.rdx) {		define double @add_2D(<4 x double> %bin.rdx) {
; CHECK-LABEL: add_2D:		; CHECK-LABEL: add_2D:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: fadd v0.2d, v0.2d, v1.2d		; CHECK-NEXT: fadd v0.2d, v0.2d, v1.2d
; CHECK-NEXT: faddp d0, v0.2d		; CHECK-NEXT: faddp d0, v0.2d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECKNOFP16-LABEL: add_2D:		; CHECKNOFP16-LABEL: add_2D:
; CHECKNOFP16: // %bb.0:		; CHECKNOFP16: // %bb.0:
; CHECKNOFP16-NEXT: fadd v0.2d, v0.2d, v1.2d		; CHECKNOFP16-NEXT: fadd v0.2d, v0.2d, v1.2d
; CHECKNOFP16-NEXT: faddp d0, v0.2d		; CHECKNOFP16-NEXT: faddp d0, v0.2d
; CHECKNOFP16-NEXT: ret		; CHECKNOFP16-NEXT: ret
%r = call fast double @llvm.vector.reduce.fadd.f64.v4f64(double -0.0, <4 x double> %bin.rdx)		%r = call fast double @llvm.vector.reduce.fadd.f64.v4f64(double -0.0, <4 x double> %bin.rdx)
ret double %r		ret double %r
}		}

		; Added at least one test where the start value is not -0.0.
		define float @add_S_init_42(<4 x float> %bin.rdx) {
		; CHECK-LABEL: add_S_init_42:
		; CHECK: // %bb.0:
		; CHECK-NEXT: faddp v0.4s, v0.4s, v0.4s
		; CHECK-NEXT: mov w8, #1109917696
		; CHECK-NEXT: faddp s0, v0.2s
		; CHECK-NEXT: fmov s1, w8
		; CHECK-NEXT: fadd s0, s0, s1
		; CHECK-NEXT: ret
		;
		; CHECKNOFP16-LABEL: add_S_init_42:
		; CHECKNOFP16: // %bb.0:
		; CHECKNOFP16-NEXT: faddp v0.4s, v0.4s, v0.4s
		; CHECKNOFP16-NEXT: mov w8, #1109917696
		; CHECKNOFP16-NEXT: faddp s0, v0.2s
		; CHECKNOFP16-NEXT: fmov s1, w8
		; CHECKNOFP16-NEXT: fadd s0, s0, s1
		; CHECKNOFP16-NEXT: ret
		%r = call fast float @llvm.vector.reduce.fadd.f32.v4f32(float 42.0, <4 x float> %bin.rdx)
		ret float %r
		}

; Function Attrs: nounwind readnone		; Function Attrs: nounwind readnone
declare half @llvm.vector.reduce.fadd.f16.v4f16(half, <4 x half>)		declare half @llvm.vector.reduce.fadd.f16.v4f16(half, <4 x half>)
declare half @llvm.vector.reduce.fadd.f16.v8f16(half, <8 x half>)		declare half @llvm.vector.reduce.fadd.f16.v8f16(half, <8 x half>)
declare half @llvm.vector.reduce.fadd.f16.v16f16(half, <16 x half>)		declare half @llvm.vector.reduce.fadd.f16.v16f16(half, <16 x half>)
declare float @llvm.vector.reduce.fadd.f32.v2f32(float, <2 x float>)		declare float @llvm.vector.reduce.fadd.f32.v2f32(float, <2 x float>)
declare float @llvm.vector.reduce.fadd.f32.v4f32(float, <4 x float>)		declare float @llvm.vector.reduce.fadd.f32.v4f32(float, <4 x float>)
declare float @llvm.vector.reduce.fadd.f32.v8f32(float, <8 x float>)		declare float @llvm.vector.reduce.fadd.f32.v8f32(float, <8 x float>)
declare double @llvm.vector.reduce.fadd.f64.v2f64(double, <2 x double>)		declare double @llvm.vector.reduce.fadd.f64.v2f64(double, <2 x double>)
declare double @llvm.vector.reduce.fadd.f64.v4f64(double, <4 x double>)		declare double @llvm.vector.reduce.fadd.f64.v4f64(double, <4 x double>)

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Use faddp to implement fadd reductions.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 314821

llvm/include/llvm/Target/TargetSelectionDAG.td

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/test/CodeGen/AArch64/vecreduce-fadd-legalization.ll

llvm/test/CodeGen/AArch64/vecreduce-fadd.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Use faddp to implement fadd reductions.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 314821

llvm/include/llvm/Target/TargetSelectionDAG.td

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/test/CodeGen/AArch64/vecreduce-fadd-legalization.ll

llvm/test/CodeGen/AArch64/vecreduce-fadd.ll

[AArch64] Use faddp to implement fadd reductions.
ClosedPublic