Diff 127285

lib/CodeGen/CGBuiltin.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 7,479 Lines • ▼ Show 20 Lines	if (Ops.size() == 2)
return Res;		return Res;

assert(Ops.size() == 4);		assert(Ops.size() == 4);
return EmitX86Select(CGF, Ops[3], Res, Ops[2]);		return EmitX86Select(CGF, Ops[3], Res, Ops[2]);
}		}

static Value EmitX86SExtMask(CodeGenFunction &CGF, Value Op,		static Value EmitX86SExtMask(CodeGenFunction &CGF, Value Op,
llvm::Type *DstTy) {		llvm::Type *DstTy) {
unsigned NumberOfElements = DstTy->getVectorNumElements();		unsigned NumberOfElements = DstTy->getVectorNumElements();
Value *Mask = getMaskVecValue(CGF, Op, NumberOfElements);		Value *Mask = getMaskVecValue(CGF, Op, NumberOfElements);
return CGF.Builder.CreateSExt(Mask, DstTy, "vpmovm2");		return CGF.Builder.CreateSExt(Mask, DstTy, "vpmovm2");
}		}

		static Value EmitX86Mask(CodeGenFunction &CGF, ArrayRef<Value > Ops) {
		llvm::Type *Typ1 = Ops[0]->getType();
		Value *Cmp = CGF.Builder.CreateICmp(CmpInst::Predicate::ICMP_SLT, Ops[0],
		llvm::ConstantVector::getNullValue(Typ1));
		Value *BitCast = CGF.Builder.CreateBitCast(
		Cmp, llvm::Type::getIntNTy(CGF.Builder.getContext(),
		Typ1->getVectorNumElements()));
		return (Typ1->getVectorNumElements() < 32)
		? CGF.Builder.CreateZExt(
		BitCast, llvm::Type::getInt32Ty(CGF.getLLVMContext()))
		: BitCast;
		}

		static Value EmitX86MaskFloat(CodeGenFunction &CGF, ArrayRef<Value > Ops) {
		Value *FloatOp = Ops[0];
		unsigned DstTypEle = FloatOp->getType()->getVectorNumElements();
		llvm::Type *IntTy = llvm::Type::getIntNTy(
		CGF.Builder.getContext(), FloatOp->getType()->getScalarSizeInBits());
		llvm::Type *DstTyp = llvm::VectorType::get(IntTy, DstTypEle);
		Value *BitCastFloatToInt = CGF.Builder.CreateBitCast(FloatOp, DstTyp);
		return EmitX86Mask(CGF, BitCastFloatToInt);
		}

Value CodeGenFunction::EmitX86CpuIs(const CallExpr E) {		Value CodeGenFunction::EmitX86CpuIs(const CallExpr E) {
const Expr *CPUExpr = E->getArg(0)->IgnoreParenCasts();		const Expr *CPUExpr = E->getArg(0)->IgnoreParenCasts();
StringRef CPUStr = cast<clang::StringLiteral>(CPUExpr)->getString();		StringRef CPUStr = cast<clang::StringLiteral>(CPUExpr)->getString();
return EmitX86CpuIs(CPUStr);		return EmitX86CpuIs(CPUStr);
}		}

Value *CodeGenFunction::EmitX86CpuIs(StringRef CPUStr) {		Value *CodeGenFunction::EmitX86CpuIs(StringRef CPUStr) {

▲ Show 20 Lines • Show All 354 Lines • ▼ Show 20 Lines	#undef INTRINSIC_X86_XSAVE_ID
case X86::BI__builtin_ia32_cvtmask2d128:		case X86::BI__builtin_ia32_cvtmask2d128:
case X86::BI__builtin_ia32_cvtmask2d256:		case X86::BI__builtin_ia32_cvtmask2d256:
case X86::BI__builtin_ia32_cvtmask2d512:		case X86::BI__builtin_ia32_cvtmask2d512:
case X86::BI__builtin_ia32_cvtmask2q128:		case X86::BI__builtin_ia32_cvtmask2q128:
case X86::BI__builtin_ia32_cvtmask2q256:		case X86::BI__builtin_ia32_cvtmask2q256:
case X86::BI__builtin_ia32_cvtmask2q512:		case X86::BI__builtin_ia32_cvtmask2q512:
return EmitX86SExtMask(*this, Ops[0], ConvertType(E->getType()));		return EmitX86SExtMask(*this, Ops[0], ConvertType(E->getType()));

		case X86::BI__builtin_ia32_pmovmskb128:
		case X86::BI__builtin_ia32_pmovmskb256:
		return EmitX86Mask(*this, Ops);
		case X86::BI__builtin_ia32_movmskps256:
		case X86::BI__builtin_ia32_movmskpd256:
		case X86::BI__builtin_ia32_movmskps:
		case X86::BI__builtin_ia32_movmskpd:
		return EmitX86MaskFloat(*this, Ops);
case X86::BI__builtin_ia32_movdqa32store128_mask:		case X86::BI__builtin_ia32_movdqa32store128_mask:
case X86::BI__builtin_ia32_movdqa64store128_mask:		case X86::BI__builtin_ia32_movdqa64store128_mask:
case X86::BI__builtin_ia32_storeaps128_mask:		case X86::BI__builtin_ia32_storeaps128_mask:
case X86::BI__builtin_ia32_storeapd128_mask:		case X86::BI__builtin_ia32_storeapd128_mask:
case X86::BI__builtin_ia32_movdqa32store256_mask:		case X86::BI__builtin_ia32_movdqa32store256_mask:
case X86::BI__builtin_ia32_movdqa64store256_mask:		case X86::BI__builtin_ia32_movdqa64store256_mask:
case X86::BI__builtin_ia32_storeaps256_mask:		case X86::BI__builtin_ia32_storeaps256_mask:
case X86::BI__builtin_ia32_storeapd256_mask:		case X86::BI__builtin_ia32_storeapd256_mask:
▲ Show 20 Lines • Show All 2,020 Lines • Show Last 20 Lines

test/CodeGen/avx-builtins.c

	Show First 20 Lines • Show All 605 Lines • ▼ Show 20 Lines
	__m256 test_mm256_moveldup_ps(__m256 A) {			__m256 test_mm256_moveldup_ps(__m256 A) {
	// CHECK-LABEL: test_mm256_moveldup_ps			// CHECK-LABEL: test_mm256_moveldup_ps
	// CHECK: shufflevector <8 x float> %{{.}}, <8 x float> %{{.}}, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>			// CHECK: shufflevector <8 x float> %{{.}}, <8 x float> %{{.}}, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>
	return _mm256_moveldup_ps(A);			return _mm256_moveldup_ps(A);
	}			}

	int test_mm256_movemask_pd(__m256d A) {			int test_mm256_movemask_pd(__m256d A) {
	// CHECK-LABEL: test_mm256_movemask_pd			// CHECK-LABEL: test_mm256_movemask_pd
	// CHECK: call i32 @llvm.x86.avx.movmsk.pd.256(<4 x double> %{{.*}})			// CHECK: bitcast <4 x double> %1 to <4 x i64>
				// CHECK: icmp slt <4 x i64> %2, zeroinitializer
				// CHECK: bitcast <4 x i1> %3 to i4
				// CHECK: zext i4 %4 to i32
	return _mm256_movemask_pd(A);			return _mm256_movemask_pd(A);
	}			}

	int test_mm256_movemask_ps(__m256 A) {			int test_mm256_movemask_ps(__m256 A) {
	// CHECK-LABEL: test_mm256_movemask_ps			// CHECK-LABEL: test_mm256_movemask_ps
	// CHECK: call i32 @llvm.x86.avx.movmsk.ps.256(<8 x float> %{{.*}})			// CHECK: load <8 x float>, <8 x float>* %__a.addr.i, align 32
				// CHECK: bitcast <8 x float> %1 to <8 x i32>
				// CHECK: icmp slt <8 x i32> %2, zeroinitializer
				// CHECK: bitcast <8 x i1> %3 to i8
				// CHECK: zext i8 %4 to i32
	return _mm256_movemask_ps(A);			return _mm256_movemask_ps(A);
	}			}

	__m256d test_mm256_mul_pd(__m256d A, __m256d B) {			__m256d test_mm256_mul_pd(__m256d A, __m256d B) {
	// CHECK-LABEL: test_mm256_mul_pd			// CHECK-LABEL: test_mm256_mul_pd
	// CHECK: fmul <4 x double>			// CHECK: fmul <4 x double>
	return _mm256_mul_pd(A, B);			return _mm256_mul_pd(A, B);
	}			}
	▲ Show 20 Lines • Show All 849 Lines • Show Last 20 Lines

test/CodeGen/avx2-builtins.c

Show First 20 Lines • Show All 817 Lines • ▼ Show 20 Lines	__m256i test_mm256_min_epu32(__m256i a, __m256i b) {
// CHECK-LABEL: test_mm256_min_epu32		// CHECK-LABEL: test_mm256_min_epu32
// CHECK: [[CMP:%.]] = icmp ult <8 x i32> [[X:%.]], [[Y:%.*]]		// CHECK: [[CMP:%.]] = icmp ult <8 x i32> [[X:%.]], [[Y:%.*]]
// CHECK-NEXT: select <8 x i1> [[CMP]], <8 x i32> [[X]], <8 x i32> [[Y]]		// CHECK-NEXT: select <8 x i1> [[CMP]], <8 x i32> [[X]], <8 x i32> [[Y]]
return _mm256_min_epu32(a, b);		return _mm256_min_epu32(a, b);
}		}

int test_mm256_movemask_epi8(__m256i a) {		int test_mm256_movemask_epi8(__m256i a) {
// CHECK-LABEL: test_mm256_movemask_epi8		// CHECK-LABEL: test_mm256_movemask_epi8
// CHECK: call i32 @llvm.x86.avx2.pmovmskb(<32 x i8> %{{.*}})		// CHECK: bitcast <4 x i64> %1 to <32 x i8>
		// CHECK: icmp slt <32 x i8> %2, zeroinitializer
		// CHECK: bitcast <32 x i1> %3 to i32
return _mm256_movemask_epi8(a);		return _mm256_movemask_epi8(a);
}		}

__m256i test_mm256_mpsadbw_epu8(__m256i x, __m256i y) {		__m256i test_mm256_mpsadbw_epu8(__m256i x, __m256i y) {
// CHECK-LABEL: test_mm256_mpsadbw_epu8		// CHECK-LABEL: test_mm256_mpsadbw_epu8
// CHECK: call <16 x i16> @llvm.x86.avx2.mpsadbw(<32 x i8> %{{.}}, <32 x i8> %{{.}}, i8 3)		// CHECK: call <16 x i16> @llvm.x86.avx2.mpsadbw(<32 x i8> %{{.}}, <32 x i8> %{{.}}, i8 3)
return _mm256_mpsadbw_epu8(x, y, 3);		return _mm256_mpsadbw_epu8(x, y, 3);
}		}
▲ Show 20 Lines • Show All 408 Lines • Show Last 20 Lines

test/CodeGen/sse-builtins.c

	Show First 20 Lines • Show All 462 Lines • ▼ Show 20 Lines
	__m128 test_mm_movelh_ps(__m128 A, __m128 B) {			__m128 test_mm_movelh_ps(__m128 A, __m128 B) {
	// CHECK-LABEL: test_mm_movelh_ps			// CHECK-LABEL: test_mm_movelh_ps
	// CHECK: shufflevector <4 x float> %{{.}}, <4 x float> %{{.}}, <4 x i32> <i32 0, i32 1, i32 4, i32 5>			// CHECK: shufflevector <4 x float> %{{.}}, <4 x float> %{{.}}, <4 x i32> <i32 0, i32 1, i32 4, i32 5>
	return _mm_movelh_ps(A, B);			return _mm_movelh_ps(A, B);
	}			}

	int test_mm_movemask_ps(__m128 A) {			int test_mm_movemask_ps(__m128 A) {
	// CHECK-LABEL: test_mm_movemask_ps			// CHECK-LABEL: test_mm_movemask_ps
	// CHECK: call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %{{.*}})			//CHECK: bitcast <4 x float> %1 to <4 x i32>
				//CHECK: icmp slt <4 x i32> %2, zeroinitializer
				//CHECK: bitcast <4 x i1> %3 to i4
				//CHECK: zext i4 %4 to i32
	return _mm_movemask_ps(A);			return _mm_movemask_ps(A);
	}			}

	__m128 test_mm_mul_ps(__m128 A, __m128 B) {			__m128 test_mm_mul_ps(__m128 A, __m128 B) {
	// CHECK-LABEL: test_mm_mul_ps			// CHECK-LABEL: test_mm_mul_ps
	// CHECK: fmul <4 x float>			// CHECK: fmul <4 x float>
	return _mm_mul_ps(A, B);			return _mm_mul_ps(A, B);
	}			}
	▲ Show 20 Lines • Show All 346 Lines • Show Last 20 Lines

test/CodeGen/sse2-builtins.c

Show First 20 Lines • Show All 798 Lines • ▼ Show 20 Lines	__m128d test_mm_move_sd(__m128d A, __m128d B) {
// CHECK: insertelement <2 x double> undef, double %{{.*}}, i32 0		// CHECK: insertelement <2 x double> undef, double %{{.*}}, i32 0
// CHECK: extractelement <2 x double> %{{.*}}, i32 1		// CHECK: extractelement <2 x double> %{{.*}}, i32 1
// CHECK: insertelement <2 x double> %{{.}}, double %{{.}}, i32 1		// CHECK: insertelement <2 x double> %{{.}}, double %{{.}}, i32 1
return _mm_move_sd(A, B);		return _mm_move_sd(A, B);
}		}

int test_mm_movemask_epi8(__m128i A) {		int test_mm_movemask_epi8(__m128i A) {
// CHECK-LABEL: test_mm_movemask_epi8		// CHECK-LABEL: test_mm_movemask_epi8
// CHECK: call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %{{.*}})		// CHECK: bitcast <2 x i64> %1 to <16 x i8>
		// CHECK: icmp slt <16 x i8> %2, zeroinitializer
		// CHECK: bitcast <16 x i1> %3 to i16
		// CHECK: zext i16 %4 to i32
return _mm_movemask_epi8(A);		return _mm_movemask_epi8(A);
}		}

int test_mm_movemask_pd(__m128d A) {		int test_mm_movemask_pd(__m128d A) {
// CHECK-LABEL: test_mm_movemask_pd		// CHECK-LABEL: test_mm_movemask_pd
// CHECK: call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %{{.*}})		// CHECK: bitcast <2 x double> %1 to <2 x i64>
		// CHECK: icmp slt <2 x i64> %2, zeroinitializer
		// CHECK: bitcast <2 x i1> %3 to i2
		// CHECK: zext i2 %4 to i32
return _mm_movemask_pd(A);		return _mm_movemask_pd(A);
}		}

__m128i test_mm_mul_epu32(__m128i A, __m128i B) {		__m128i test_mm_mul_epu32(__m128i A, __m128i B) {
// CHECK-LABEL: test_mm_mul_epu32		// CHECK-LABEL: test_mm_mul_epu32
// CHECK: call <2 x i64> @llvm.x86.sse2.pmulu.dq(<4 x i32> %{{.}}, <4 x i32> %{{.}})		// CHECK: call <2 x i64> @llvm.x86.sse2.pmulu.dq(<4 x i32> %{{.}}, <4 x i32> %{{.}})
return _mm_mul_epu32(A, B);		return _mm_mul_epu32(A, B);
}		}
▲ Show 20 Lines • Show All 736 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[LLVM][X86] Converting X86 intrinisics movmsk{ps|pd}{|256} and pmovmskb{128|256}
Needs ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 127285

lib/CodeGen/CGBuiltin.cpp

test/CodeGen/avx-builtins.c

test/CodeGen/avx2-builtins.c

test/CodeGen/sse-builtins.c

test/CodeGen/sse2-builtins.c

This is an archive of the discontinued LLVM Phabricator instance.

[LLVM][X86] Converting X86 intrinisics movmsk{ps|pd}{|256} and pmovmskb{128|256}Needs ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 127285

lib/CodeGen/CGBuiltin.cpp

test/CodeGen/avx-builtins.c

test/CodeGen/avx2-builtins.c

test/CodeGen/sse-builtins.c

test/CodeGen/sse2-builtins.c

[LLVM][X86] Converting X86 intrinisics movmsk{ps|pd}{|256} and pmovmskb{128|256}
Needs ReviewPublic