This is an archive of the discontinued LLVM Phabricator instance.

[X86] Custom codegen 512-bit cvt(u)qq2tops, cvt(u)qqtopd, and cvt(u)dqtops intrinsics.
ClosedPublic

Authored by craig.topper on Jan 20 2019, 10:32 PM.

Download Raw Diff

Details

Reviewers

RKSimon
spatel

Commits

rGbd7884ed7986: [X86] Custom codegen 512-bit cvt(u)qq2tops, cvt(u)qqtopd, and cvt(u)dqtops…
rC352267: [X86] Custom codegen 512-bit cvt(u)qq2tops, cvt(u)qqtopd, and cvt(u)dqtops…
rL352267: [X86] Custom codegen 512-bit cvt(u)qq2tops, cvt(u)qqtopd, and cvt(u)dqtops…

Summary

The 512-bit cvt(u)qq2tops, cvt(u)qqtopd, and cvt(u)dqtops intrinsics all have the possibility of taking an explicit rounding mode argument. If the rounding mode is CUR_DIRECTION we'd like to emit a sitofp/uitofp instruction and a select like we do for 256-bit intrinsics.

For cvt(u)qqtopd and cvt(u)dqtops we do this when the form of the software intrinsics that doesn't take a rounding mode argument is used. This is done by using convertvector in the header with the select builtin. But if the explicit rounding mode form of the intrinsic is used and CUR_DIRECTION is passed, we don't do this. We shouldn't have this inconsistency.

For cvt(u)qqtops nothing is done because we can't use the select builtin in the header without avx512vl. So we need to use custom codegen for this.

Even when the rounding mode isn't CUR_DIRECTION we should also use select in IR for consistency. And it will remove another scalar integer mask from our intrinsics.

To accomplish all of these goals I've taken a slightly unusual approach. I've added two new X86 specific intrinsics for sitofp/uitofp with rounding. These intrinsics are variadic on the input and output type so we only need 2 instead of 6. This avoids the need for a switch to map them in CGBuiltin.cpp. We just need to check signed vs unsigned. I believe other targets also use variadic intrinsics like this.

So if the rounding mode is CUR_DIRECTION we'll use an sitofp/uitofp instruction. Otherwise we'll use one of the new intrinsics. After that we'll emit a select instruction if needed.

Diff Detail

Repository: rL LLVM

Event Timeline

craig.topper created this revision.Jan 20 2019, 10:32 PM

Herald added a subscriber: cfe-commits. · View Herald TranscriptJan 20 2019, 10:32 PM

Harbormaster completed remote builds in B27114: Diff 182745.Jan 20 2019, 10:32 PM

craig.topper mentioned this in D56999: [X86] Remove GCCBuiltins from 512-bit cvt(u)qqtops, cvt(u)qqtopd, and cvt(u)dqtops intrinsics. Add new variadic uitofp/sitofp with rounding mode intrinsics..Jan 20 2019, 10:34 PM

craig.topper retitled this revision from [X86] Custom codegen 512 integer to fp conversion intrinsics. to [X86] Custom codegen 512-bit cvt(u)qq2tops, cvt(u)qqtopd, and cvt(u)dqtops intrinsics..Jan 20 2019, 10:35 PM

craig.topper added a reviewer: spatel.

craig.topper removed a subscriber: spatel.

Rename the intrinics to include avx512 prefix

Harbormaster completed remote builds in B27140: Diff 182837.Jan 21 2019, 4:22 PM

Ping

LGTM

This revision is now accepted and ready to land.Jan 25 2019, 10:35 AM

Closed by commit rL352267: [X86] Custom codegen 512-bit cvt(u)qq2tops, cvt(u)qqtopd, and cvt(u)dqtops… (authored by ctopper). · Explain WhyJan 25 2019, 6:42 PM

This revision was automatically updated to reflect the committed changes.

Diffusion mentioned this in rL352266: [X86] Remove GCCBuiltins from 512-bit cvt(u)qqtops, cvt(u)qqtopd, and cvt….

Herald added a subscriber: llvm-commits. · View Herald TranscriptJan 25 2019, 6:42 PM

Revision Contents

Path

Size

cfe/

trunk/

lib/

CodeGen/

CGBuiltin.cpp

28 lines

test/

CodeGen/

avx512dq-builtins.c

48 lines

avx512f-builtins.c

16 lines

Diff 183680

cfe/trunk/lib/CodeGen/CGBuiltin.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 9,322 Lines • ▼ Show 20 Lines	static Value *EmitX86MaskedCompare(CodeGenFunction &CGF, unsigned CC,
return EmitX86MaskedCompareResult(CGF, Cmp, NumElts, MaskIn);		return EmitX86MaskedCompareResult(CGF, Cmp, NumElts, MaskIn);
}		}

static Value EmitX86ConvertToMask(CodeGenFunction &CGF, Value In) {		static Value EmitX86ConvertToMask(CodeGenFunction &CGF, Value In) {
Value *Zero = Constant::getNullValue(In->getType());		Value *Zero = Constant::getNullValue(In->getType());
return EmitX86MaskedCompare(CGF, 1, true, { In, Zero });		return EmitX86MaskedCompare(CGF, 1, true, { In, Zero });
}		}

		static Value *EmitX86ConvertIntToFp(CodeGenFunction &CGF,
		ArrayRef<Value *> Ops, bool IsSigned) {
		unsigned Rnd = cast<llvm::ConstantInt>(Ops[3])->getZExtValue();
		llvm::Type *Ty = Ops[1]->getType();

		Value *Res;
		if (Rnd != 4) {
		Intrinsic::ID IID = IsSigned ? Intrinsic::x86_avx512_sitofp_round
		: Intrinsic::x86_avx512_uitofp_round;
		Function *F = CGF.CGM.getIntrinsic(IID, { Ty, Ops[0]->getType() });
		Res = CGF.Builder.CreateCall(F, { Ops[0], Ops[3] });
		} else {
		Res = IsSigned ? CGF.Builder.CreateSIToFP(Ops[0], Ty)
		: CGF.Builder.CreateUIToFP(Ops[0], Ty);
		}

		return EmitX86Select(CGF, Ops[2], Res, Ops[1]);
		}

static Value EmitX86Abs(CodeGenFunction &CGF, ArrayRef<Value > Ops) {		static Value EmitX86Abs(CodeGenFunction &CGF, ArrayRef<Value > Ops) {

llvm::Type *Ty = Ops[0]->getType();		llvm::Type *Ty = Ops[0]->getType();
Value *Zero = llvm::Constant::getNullValue(Ty);		Value *Zero = llvm::Constant::getNullValue(Ty);
Value *Sub = CGF.Builder.CreateSub(Zero, Ops[0]);		Value *Sub = CGF.Builder.CreateSub(Zero, Ops[0]);
Value *Cmp = CGF.Builder.CreateICmp(ICmpInst::ICMP_SGT, Ops[0], Zero);		Value *Cmp = CGF.Builder.CreateICmp(ICmpInst::ICMP_SGT, Ops[0], Zero);
Value *Res = CGF.Builder.CreateSelect(Cmp, Ops[0], Sub);		Value *Res = CGF.Builder.CreateSelect(Cmp, Ops[0], Sub);
return Res;		return Res;
▲ Show 20 Lines • Show All 645 Lines • ▼ Show 20 Lines	#undef INTRINSIC_X86_XSAVE_ID
case X86::BI__builtin_ia32_cvtd2mask128:		case X86::BI__builtin_ia32_cvtd2mask128:
case X86::BI__builtin_ia32_cvtd2mask256:		case X86::BI__builtin_ia32_cvtd2mask256:
case X86::BI__builtin_ia32_cvtd2mask512:		case X86::BI__builtin_ia32_cvtd2mask512:
case X86::BI__builtin_ia32_cvtq2mask128:		case X86::BI__builtin_ia32_cvtq2mask128:
case X86::BI__builtin_ia32_cvtq2mask256:		case X86::BI__builtin_ia32_cvtq2mask256:
case X86::BI__builtin_ia32_cvtq2mask512:		case X86::BI__builtin_ia32_cvtq2mask512:
return EmitX86ConvertToMask(*this, Ops[0]);		return EmitX86ConvertToMask(*this, Ops[0]);

		case X86::BI__builtin_ia32_cvtdq2ps512_mask:
		case X86::BI__builtin_ia32_cvtqq2ps512_mask:
		case X86::BI__builtin_ia32_cvtqq2pd512_mask:
		return EmitX86ConvertIntToFp(this, Ops, /IsSigned*/true);
		case X86::BI__builtin_ia32_cvtudq2ps512_mask:
		case X86::BI__builtin_ia32_cvtuqq2ps512_mask:
		case X86::BI__builtin_ia32_cvtuqq2pd512_mask:
		return EmitX86ConvertIntToFp(this, Ops, /IsSigned*/false);

case X86::BI__builtin_ia32_vfmaddss3:		case X86::BI__builtin_ia32_vfmaddss3:
case X86::BI__builtin_ia32_vfmaddsd3:		case X86::BI__builtin_ia32_vfmaddsd3:
case X86::BI__builtin_ia32_vfmaddss3_mask:		case X86::BI__builtin_ia32_vfmaddss3_mask:
case X86::BI__builtin_ia32_vfmaddsd3_mask:		case X86::BI__builtin_ia32_vfmaddsd3_mask:
return EmitScalarFMAExpr(*this, Ops, Ops[0]);		return EmitScalarFMAExpr(*this, Ops, Ops[0]);
case X86::BI__builtin_ia32_vfmaddss:		case X86::BI__builtin_ia32_vfmaddss:
case X86::BI__builtin_ia32_vfmaddsd:		case X86::BI__builtin_ia32_vfmaddsd:
return EmitScalarFMAExpr(*this, Ops,		return EmitScalarFMAExpr(*this, Ops,
▲ Show 20 Lines • Show All 3,797 Lines • Show Last 20 Lines

cfe/trunk/test/CodeGen/avx512dq-builtins.c

Show First 20 Lines • Show All 607 Lines • ▼ Show 20 Lines	__m512d test_mm512_maskz_cvtepi64_pd(__mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_maskz_cvtepi64_pd		// CHECK-LABEL: @test_mm512_maskz_cvtepi64_pd
// CHECK: sitofp <8 x i64> %{{.*}} to <8 x double>		// CHECK: sitofp <8 x i64> %{{.*}} to <8 x double>
// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_maskz_cvtepi64_pd(__U, __A);		return _mm512_maskz_cvtepi64_pd(__U, __A);
}		}

__m512d test_mm512_cvt_roundepi64_pd(__m512i __A) {		__m512d test_mm512_cvt_roundepi64_pd(__m512i __A) {
// CHECK-LABEL: @test_mm512_cvt_roundepi64_pd		// CHECK-LABEL: @test_mm512_cvt_roundepi64_pd
// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512		// CHECK: @llvm.x86.avx512.sitofp.round.v8f64.v8i64
return _mm512_cvt_roundepi64_pd(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_cvt_roundepi64_pd(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512d test_mm512_mask_cvt_roundepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) {		__m512d test_mm512_mask_cvt_roundepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_pd		// CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_pd
// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512		// CHECK: @llvm.x86.avx512.sitofp.round.v8f64.v8i64
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_mask_cvt_roundepi64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_mask_cvt_roundepi64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512d test_mm512_maskz_cvt_roundepi64_pd(__mmask8 __U, __m512i __A) {		__m512d test_mm512_maskz_cvt_roundepi64_pd(__mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_pd		// CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_pd
// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512		// CHECK: @llvm.x86.avx512.sitofp.round.v8f64.v8i64
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_maskz_cvt_roundepi64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_maskz_cvt_roundepi64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m256 test_mm512_cvtepi64_ps(__m512i __A) {		__m256 test_mm512_cvtepi64_ps(__m512i __A) {
// CHECK-LABEL: @test_mm512_cvtepi64_ps		// CHECK-LABEL: @test_mm512_cvtepi64_ps
// CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512		// CHECK: sitofp <8 x i64> %{{.*}} to <8 x float>
return _mm512_cvtepi64_ps(__A);		return _mm512_cvtepi64_ps(__A);
}		}

__m256 test_mm512_mask_cvtepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) {		__m256 test_mm512_mask_cvtepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_mask_cvtepi64_ps		// CHECK-LABEL: @test_mm512_mask_cvtepi64_ps
// CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512		// CHECK: sitofp <8 x i64> %{{.*}} to <8 x float>
		// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
return _mm512_mask_cvtepi64_ps(__W, __U, __A);		return _mm512_mask_cvtepi64_ps(__W, __U, __A);
}		}

__m256 test_mm512_maskz_cvtepi64_ps(__mmask8 __U, __m512i __A) {		__m256 test_mm512_maskz_cvtepi64_ps(__mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_maskz_cvtepi64_ps		// CHECK-LABEL: @test_mm512_maskz_cvtepi64_ps
// CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512		// CHECK: sitofp <8 x i64> %{{.*}} to <8 x float>
		// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
return _mm512_maskz_cvtepi64_ps(__U, __A);		return _mm512_maskz_cvtepi64_ps(__U, __A);
}		}

__m256 test_mm512_cvt_roundepi64_ps(__m512i __A) {		__m256 test_mm512_cvt_roundepi64_ps(__m512i __A) {
// CHECK-LABEL: @test_mm512_cvt_roundepi64_ps		// CHECK-LABEL: @test_mm512_cvt_roundepi64_ps
// CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512		// CHECK: @llvm.x86.avx512.sitofp.round.v8f32.v8i64
return _mm512_cvt_roundepi64_ps(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_cvt_roundepi64_ps(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m256 test_mm512_mask_cvt_roundepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) {		__m256 test_mm512_mask_cvt_roundepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_ps		// CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_ps
// CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512		// CHECK: @llvm.x86.avx512.sitofp.round.v8f32.v8i64
		// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
return _mm512_mask_cvt_roundepi64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_mask_cvt_roundepi64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m256 test_mm512_maskz_cvt_roundepi64_ps(__mmask8 __U, __m512i __A) {		__m256 test_mm512_maskz_cvt_roundepi64_ps(__mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_ps		// CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_ps
// CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512		// CHECK: @llvm.x86.avx512.sitofp.round.v8f32.v8i64
		// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
return _mm512_maskz_cvt_roundepi64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_maskz_cvt_roundepi64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512i test_mm512_cvttpd_epi64(__m512d __A) {		__m512i test_mm512_cvttpd_epi64(__m512d __A) {
// CHECK-LABEL: @test_mm512_cvttpd_epi64		// CHECK-LABEL: @test_mm512_cvttpd_epi64
// CHECK: @llvm.x86.avx512.mask.cvttpd2qq.512		// CHECK: @llvm.x86.avx512.mask.cvttpd2qq.512
return _mm512_cvttpd_epi64(__A);		return _mm512_cvttpd_epi64(__A);
}		}
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines	__m512d test_mm512_maskz_cvtepu64_pd(__mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_maskz_cvtepu64_pd		// CHECK-LABEL: @test_mm512_maskz_cvtepu64_pd
// CHECK: uitofp <8 x i64> %{{.*}} to <8 x double>		// CHECK: uitofp <8 x i64> %{{.*}} to <8 x double>
// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_maskz_cvtepu64_pd(__U, __A);		return _mm512_maskz_cvtepu64_pd(__U, __A);
}		}

__m512d test_mm512_cvt_roundepu64_pd(__m512i __A) {		__m512d test_mm512_cvt_roundepu64_pd(__m512i __A) {
// CHECK-LABEL: @test_mm512_cvt_roundepu64_pd		// CHECK-LABEL: @test_mm512_cvt_roundepu64_pd
// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512		// CHECK: @llvm.x86.avx512.uitofp.round.v8f64.v8i64
return _mm512_cvt_roundepu64_pd(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_cvt_roundepu64_pd(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512d test_mm512_mask_cvt_roundepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) {		__m512d test_mm512_mask_cvt_roundepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_pd		// CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_pd
// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512		// CHECK: @llvm.x86.avx512.uitofp.round.v8f64.v8i64
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_mask_cvt_roundepu64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_mask_cvt_roundepu64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512d test_mm512_maskz_cvt_roundepu64_pd(__mmask8 __U, __m512i __A) {		__m512d test_mm512_maskz_cvt_roundepu64_pd(__mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_pd		// CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_pd
// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512		// CHECK: @llvm.x86.avx512.uitofp.round.v8f64.v8i64
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_maskz_cvt_roundepu64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_maskz_cvt_roundepu64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m256 test_mm512_cvtepu64_ps(__m512i __A) {		__m256 test_mm512_cvtepu64_ps(__m512i __A) {
// CHECK-LABEL: @test_mm512_cvtepu64_ps		// CHECK-LABEL: @test_mm512_cvtepu64_ps
// CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512		// CHECK: uitofp <8 x i64> %{{.*}} to <8 x float>
return _mm512_cvtepu64_ps(__A);		return _mm512_cvtepu64_ps(__A);
}		}

__m256 test_mm512_mask_cvtepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) {		__m256 test_mm512_mask_cvtepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_mask_cvtepu64_ps		// CHECK-LABEL: @test_mm512_mask_cvtepu64_ps
// CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512		// CHECK: uitofp <8 x i64> %{{.*}} to <8 x float>
		// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
return _mm512_mask_cvtepu64_ps(__W, __U, __A);		return _mm512_mask_cvtepu64_ps(__W, __U, __A);
}		}

__m256 test_mm512_maskz_cvtepu64_ps(__mmask8 __U, __m512i __A) {		__m256 test_mm512_maskz_cvtepu64_ps(__mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_maskz_cvtepu64_ps		// CHECK-LABEL: @test_mm512_maskz_cvtepu64_ps
// CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512		// CHECK: uitofp <8 x i64> %{{.*}} to <8 x float>
		// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
return _mm512_maskz_cvtepu64_ps(__U, __A);		return _mm512_maskz_cvtepu64_ps(__U, __A);
}		}

__m256 test_mm512_cvt_roundepu64_ps(__m512i __A) {		__m256 test_mm512_cvt_roundepu64_ps(__m512i __A) {
// CHECK-LABEL: @test_mm512_cvt_roundepu64_ps		// CHECK-LABEL: @test_mm512_cvt_roundepu64_ps
// CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512		// CHECK: @llvm.x86.avx512.uitofp.round.v8f32.v8i64
return _mm512_cvt_roundepu64_ps(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_cvt_roundepu64_ps(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m256 test_mm512_mask_cvt_roundepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) {		__m256 test_mm512_mask_cvt_roundepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_ps		// CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_ps
// CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512		// CHECK: @llvm.x86.avx512.uitofp.round.v8f32.v8i64
		// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
return _mm512_mask_cvt_roundepu64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_mask_cvt_roundepu64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m256 test_mm512_maskz_cvt_roundepu64_ps(__mmask8 __U, __m512i __A) {		__m256 test_mm512_maskz_cvt_roundepu64_ps(__mmask8 __U, __m512i __A) {
// CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_ps		// CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_ps
// CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512		// CHECK: @llvm.x86.avx512.uitofp.round.v8f32.v8i64
		// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
return _mm512_maskz_cvt_roundepu64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_maskz_cvt_roundepu64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512d test_mm512_range_pd(__m512d __A, __m512d __B) {		__m512d test_mm512_range_pd(__m512d __A, __m512d __B) {
// CHECK-LABEL: @test_mm512_range_pd		// CHECK-LABEL: @test_mm512_range_pd
// CHECK: @llvm.x86.avx512.mask.range.pd.512		// CHECK: @llvm.x86.avx512.mask.range.pd.512
return _mm512_range_pd(__A, __B, 4);		return _mm512_range_pd(__A, __B, 4);
}		}
▲ Show 20 Lines • Show All 638 Lines • Show Last 20 Lines

cfe/trunk/test/CodeGen/avx512f-builtins.c

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,016 Lines • ▼ Show 20 Lines	__m512 test_mm512_maskz_cvt_roundph_ps(__mmask16 __U, __m256i __A)
// CHECK-LABEL: @test_mm512_maskz_cvt_roundph_ps		// CHECK-LABEL: @test_mm512_maskz_cvt_roundph_ps
// CHECK: @llvm.x86.avx512.mask.vcvtph2ps.512		// CHECK: @llvm.x86.avx512.mask.vcvtph2ps.512
return _mm512_maskz_cvt_roundph_ps(__U, __A, _MM_FROUND_CUR_DIRECTION);		return _mm512_maskz_cvt_roundph_ps(__U, __A, _MM_FROUND_CUR_DIRECTION);
}		}

__m512 test_mm512_cvt_roundepi32_ps( __m512i __A)		__m512 test_mm512_cvt_roundepi32_ps( __m512i __A)
{		{
// CHECK-LABEL: @test_mm512_cvt_roundepi32_ps		// CHECK-LABEL: @test_mm512_cvt_roundepi32_ps
// CHECK: @llvm.x86.avx512.mask.cvtdq2ps.512		// CHECK: @llvm.x86.avx512.sitofp.round.v16f32.v16i32
return _mm512_cvt_roundepi32_ps(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_cvt_roundepi32_ps(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512 test_mm512_mask_cvt_roundepi32_ps(__m512 __W, __mmask16 __U, __m512i __A)		__m512 test_mm512_mask_cvt_roundepi32_ps(__m512 __W, __mmask16 __U, __m512i __A)
{		{
// CHECK-LABEL: @test_mm512_mask_cvt_roundepi32_ps		// CHECK-LABEL: @test_mm512_mask_cvt_roundepi32_ps
// CHECK: @llvm.x86.avx512.mask.cvtdq2ps.512		// CHECK: @llvm.x86.avx512.sitofp.round.v16f32.v16i32
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_mask_cvt_roundepi32_ps(__W,__U,__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_mask_cvt_roundepi32_ps(__W,__U,__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512 test_mm512_maskz_cvt_roundepi32_ps(__mmask16 __U, __m512i __A)		__m512 test_mm512_maskz_cvt_roundepi32_ps(__mmask16 __U, __m512i __A)
{		{
// CHECK-LABEL: @test_mm512_maskz_cvt_roundepi32_ps		// CHECK-LABEL: @test_mm512_maskz_cvt_roundepi32_ps
// CHECK: @llvm.x86.avx512.mask.cvtdq2ps.512		// CHECK: @llvm.x86.avx512.sitofp.round.v16f32.v16i32
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_maskz_cvt_roundepi32_ps(__U,__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_maskz_cvt_roundepi32_ps(__U,__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512 test_mm512_cvt_roundepu32_ps(__m512i __A)		__m512 test_mm512_cvt_roundepu32_ps(__m512i __A)
{		{
// CHECK-LABEL: @test_mm512_cvt_roundepu32_ps		// CHECK-LABEL: @test_mm512_cvt_roundepu32_ps
// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.512		// CHECK: @llvm.x86.avx512.uitofp.round.v16f32.v16i32
return _mm512_cvt_roundepu32_ps(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_cvt_roundepu32_ps(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512 test_mm512_mask_cvt_roundepu32_ps(__m512 __W, __mmask16 __U,__m512i __A)		__m512 test_mm512_mask_cvt_roundepu32_ps(__m512 __W, __mmask16 __U,__m512i __A)
{		{
// CHECK-LABEL: @test_mm512_mask_cvt_roundepu32_ps		// CHECK-LABEL: @test_mm512_mask_cvt_roundepu32_ps
// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.512		// CHECK: @llvm.x86.avx512.uitofp.round.v16f32.v16i32
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_mask_cvt_roundepu32_ps(__W,__U,__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_mask_cvt_roundepu32_ps(__W,__U,__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m512 test_mm512_maskz_cvt_roundepu32_ps(__mmask16 __U,__m512i __A)		__m512 test_mm512_maskz_cvt_roundepu32_ps(__mmask16 __U,__m512i __A)
{		{
// CHECK-LABEL: @test_mm512_maskz_cvt_roundepu32_ps		// CHECK-LABEL: @test_mm512_maskz_cvt_roundepu32_ps
// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.512		// CHECK: @llvm.x86.avx512.uitofp.round.v16f32.v16i32
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_maskz_cvt_roundepu32_ps(__U,__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_maskz_cvt_roundepu32_ps(__U,__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
}		}

__m256 test_mm512_cvt_roundpd_ps(__m512d A)		__m256 test_mm512_cvt_roundpd_ps(__m512d A)
{		{
// CHECK-LABEL: @test_mm512_cvt_roundpd_ps		// CHECK-LABEL: @test_mm512_cvt_roundpd_ps
// CHECK: @llvm.x86.avx512.mask.cvtpd2ps.512		// CHECK: @llvm.x86.avx512.mask.cvtpd2ps.512
return _mm512_cvt_roundpd_ps(A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);		return _mm512_cvt_roundpd_ps(A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
▲ Show 20 Lines • Show All 5,770 Lines • Show Last 20 Lines