This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/AMDGPU/
-
Target/
-
AMDGPU/
4/6
AMDGPULibCalls.cpp
-
test/CodeGen/AMDGPU/
-
CodeGen/
-
AMDGPU/
-
amdgpu-simplify-libcall-sincos.defined.ll
-
amdgpu-simplify-libcall-sincos.defined.nobuiltin.ll
-
amdgpu-simplify-libcall-sincos.ll
-
amdgpu-simplify-libcall-sincos.nobuiltins.ll

Differential D156706

AMDGPU: Simplify and improve sincos matching
ClosedPublic

Authored by arsenm on Jul 31 2023, 8:53 AM.

Download Raw Diff

Details

Reviewers

rampitec
vpykhtin
dfukalov
jmmartinez
jhuber6
yaxunl
Pierre-vh

Group Reviewers

Restricted Project

Summary

The first trivial example I tried failed to merge due to the user scan
logic. Remove the complicated scan of users handling with distance
thresholds, with a same block restriction. The actual expansion of
sincos is basically the same size as sin or cos individually. Copy the
technique the generic optimization uses, which is to just use the
input instruction as the insert point or just insert at the start of
the entry block.

Diff Detail

Event Timeline

arsenm created this revision.Jul 31 2023, 8:53 AM

Herald added a project: Restricted Project. · View Herald TranscriptJul 31 2023, 8:53 AM

Herald added subscribers: foad, kerbowa, hiraditya and 4 others. · View Herald Transcript

arsenm requested review of this revision.Jul 31 2023, 8:53 AM

Herald added a project: Restricted Project. · View Herald TranscriptJul 31 2023, 8:53 AM

Herald added a subscriber: wdng. · View Herald Transcript

Harbormaster completed remote builds in B249243: Diff 545694.Jul 31 2023, 8:54 AM

arsenm added a child revision: D156707: AMDGPU: Handle multiple uses when matching sincos.Jul 31 2023, 8:55 AM

arsenm added a parent revision: D156696: AMDGPU: Add more tests for sincos recognition.

jmmartinez added inline comments.Aug 1 2023, 1:53 AM

llvm/lib/Target/AMDGPU/AMDGPULibCalls.cpp
1164–1168	We should also set the debug location for the `Call` to be the one of `Sin`, and the debug locaiton of `Cos` to be the one of `Reload`

arsenm added inline comments.Aug 1 2023, 4:48 PM

llvm/lib/Target/AMDGPU/AMDGPULibCalls.cpp
1164–1168	I couldn't figure out what to do about the debug loc. There didn't seem to be a update-these-two-for-merge function anywhere. Currently it will get the debug loc for the initial call

jmmartinez added inline comments.Aug 2 2023, 1:01 AM

llvm/lib/Target/AMDGPU/AMDGPULibCalls.cpp
1164–1168	There is `Instruction::applyMergedLocation` but it doesn't seem appropiate in this case. If I'm not wrong, crrently it's getting the debug location of the `IRBuilder` insert point (and only if `Arg` is an instruction).

arsenm added inline comments.Aug 2 2023, 5:53 AM

llvm/lib/Target/AMDGPU/AMDGPULibCalls.cpp
1164–1168	You're half wrong. The default is the location for the initially visited instruction. If the incoming argument is an instruction, it breaks it by taking the location from the argument. It's not unset anywhere

arsenm added inline comments.Aug 2 2023, 6:00 AM

llvm/lib/Target/AMDGPU/AMDGPULibCalls.cpp
1164–1168	I'm also not sure SetInsertPointPastAllocas is doing the right thing by not resetting the debug location

arsenm added inline comments.Aug 2 2023, 6:15 AM

llvm/lib/Target/AMDGPU/AMDGPULibCalls.cpp
1164–1168	I think applyMergedLocation is appropriate, the API is just bad and makes you go through the raw DILocation instead of supplying Instruction wrappers

Improve debug info handling

Harbormaster completed remote builds in B249751: Diff 546438.Aug 2 2023, 6:27 AM

jmmartinez accepted this revision.Aug 2 2023, 6:44 AM

This revision is now accepted and ready to land.Aug 2 2023, 6:44 AM

54bda79335ba65b0ab739a97e24030fcd95165b7

arsenm mentioned this in rG54bda79335ba: AMDGPU: Simplify and improve sincos matching.Aug 2 2023, 2:48 PM

Revision Contents

Path

Size

llvm/

lib/

Target/

AMDGPU/

AMDGPULibCalls.cpp

158 lines

test/

CodeGen/

AMDGPU/

amdgpu-simplify-libcall-sincos.defined.ll

30 lines

amdgpu-simplify-libcall-sincos.defined.nobuiltin.ll

9 lines

amdgpu-simplify-libcall-sincos.ll

405 lines

amdgpu-simplify-libcall-sincos.nobuiltins.ll

40 lines

Diff 545694

llvm/lib/Target/AMDGPU/AMDGPULibCalls.cpp

Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	private:
// evaluate calls if calls' arguments are constants.		// evaluate calls if calls' arguments are constants.
bool evaluateScalarMathFunc(const FuncInfo &FInfo, double& Res0,		bool evaluateScalarMathFunc(const FuncInfo &FInfo, double& Res0,
double& Res1, Constant copr0, Constant copr1, Constant *copr2);		double& Res1, Constant copr0, Constant copr1, Constant *copr2);
bool evaluateCall(CallInst *aCI, const FuncInfo &FInfo);		bool evaluateCall(CallInst *aCI, const FuncInfo &FInfo);

// sqrt		// sqrt
bool fold_sqrt(FPMathOperator *FPOp, IRBuilder<> &B, const FuncInfo &FInfo);		bool fold_sqrt(FPMathOperator *FPOp, IRBuilder<> &B, const FuncInfo &FInfo);

		bool insertSinCos(CallInst Sin, CallInst Cos, IRBuilder<> &B,
		const FuncInfo &FInfo);

// sin/cos		// sin/cos
bool fold_sincos(FPMathOperator *FPOp, IRBuilder<> &B, const FuncInfo &FInfo,		bool fold_sincos(FPMathOperator *FPOp, IRBuilder<> &B, const FuncInfo &FInfo,
AliasAnalysis *AA);		AliasAnalysis *AA);

// __read_pipe/__write_pipe		// __read_pipe/__write_pipe
bool fold_read_write_pipe(CallInst *CI, IRBuilder<> &B,		bool fold_read_write_pipe(CallInst *CI, IRBuilder<> &B,
const FuncInfo &FInfo);		const FuncInfo &FInfo);

// llvm.amdgcn.wavefrontsize		// llvm.amdgcn.wavefrontsize
bool fold_wavefrontsize(CallInst *CI, IRBuilder<> &B);		bool fold_wavefrontsize(CallInst *CI, IRBuilder<> &B);

// Get insertion point at entry.
BasicBlock::iterator getEntryIns(CallInst * UI);
// Insert an Alloc instruction.
AllocaInst* insertAlloca(CallInst * UI, IRBuilder<> &B, const char *prefix);
// Get a scalar native builtin single argument FP function		// Get a scalar native builtin single argument FP function
FunctionCallee getNativeFunction(Module *M, const FuncInfo &FInfo);		FunctionCallee getNativeFunction(Module *M, const FuncInfo &FInfo);

protected:		protected:
bool isUnsafeMath(const FPMathOperator *FPOp) const;		bool isUnsafeMath(const FPMathOperator *FPOp) const;

bool canIncreasePrecisionOfConstantFold(const FPMathOperator *FPOp) const;		bool canIncreasePrecisionOfConstantFold(const FPMathOperator *FPOp) const;

▲ Show 20 Lines • Show All 996 Lines • ▼ Show 20 Lines	if (FunctionCallee FPExpr = getNativeFunction(
Value *nval = CreateCallEx(B,FPExpr, opr0, "__sqrt");		Value *nval = CreateCallEx(B,FPExpr, opr0, "__sqrt");
replaceCall(FPOp, nval);		replaceCall(FPOp, nval);
return true;		return true;
}		}
}		}
return false;		return false;
}		}

		bool AMDGPULibCalls::insertSinCos(CallInst Sin, CallInst Cos, IRBuilder<> &B,
		const FuncInfo &fInfo) {
		Value *Arg = Sin->getOperand(0);
		assert(Arg == Cos->getOperand(0));

		Function *F = B.GetInsertBlock()->getParent();
		Module *M = F->getParent();
		// Merge the sin and cos.

		// for OpenCL 2.0 we have only generic implementation of sincos
		// function.
		// FIXME: This is not true anymore
		AMDGPULibFunc nf(AMDGPULibFunc::EI_SINCOS, fInfo);
		nf.getLeads()[0].PtrKind =
		AMDGPULibFunc::getEPtrKindFromAddrSpace(AMDGPUAS::FLAT_ADDRESS);
		FunctionCallee Fsincos = getFunction(M, nf);
		if (!Fsincos)
		return false;

		B.SetInsertPointPastAllocas(F);

		AllocaInst *Alloc = B.CreateAlloca(Sin->getType(), nullptr, "__sincos_");

		if (Instruction *ArgInst = dyn_cast<Instruction>(Arg)) {
		// If the argument is an instruction, it must dominate all uses so put our
		// sincos call there. Otherwise, right after the allocas works well enough
		// if it's an argument or constant.

		B.SetInsertPoint(ArgInst->getParent(), ++ArgInst->getIterator());
		}

		Value *P = Alloc;
		Type *PTy = Fsincos.getFunctionType()->getParamType(1);
		// The allocaInst allocates the memory in private address space. This need
		// to be bitcasted to point to the address space of cos pointer type.
		// In OpenCL 2.0 this is generic, while in 1.2 that is private.
		if (PTy->getPointerAddressSpace() != AMDGPUAS::PRIVATE_ADDRESS)
		P = B.CreateAddrSpaceCast(Alloc, PTy);

		// Intersect the two sets of flags.
		FastMathFlags FMF = cast<FPMathOperator>(Sin)->getFastMathFlags();
		FMF &= cast<FPMathOperator>(Cos)->getFastMathFlags();
		B.setFastMathFlags(FMF);

		CallInst *Call = CreateCallEx2(B, Fsincos, Arg, P);
		LoadInst *Reload = B.CreateLoad(Alloc->getAllocatedType(), Alloc);

		LLVM_DEBUG(errs() << "AMDIC: fold_sincos (" << Sin << ", " << Cos
		<< ") with " << *Call << '\n');

		Sin->replaceAllUsesWith(Call);
		Sin->eraseFromParent();

		Cos->replaceAllUsesWith(Reload);
		Cos->eraseFromParent();
		jmmartinezUnsubmitted Not Done Reply Inline Actions We should also set the debug location for the `Call` to be the one of `Sin`, and the debug locaiton of `Cos` to be the one of `Reload` jmmartinez: We should also set the debug location for the `Call` to be the one of `Sin`, and the debug…
		arsenmAuthorUnsubmitted Done Reply Inline Actions I couldn't figure out what to do about the debug loc. There didn't seem to be a update-these-two-for-merge function anywhere. Currently it will get the debug loc for the initial call arsenm: I couldn't figure out what to do about the debug loc. There didn't seem to be a update-these…
		jmmartinezUnsubmitted Not Done Reply Inline Actions There is `Instruction::applyMergedLocation` but it doesn't seem appropiate in this case. If I'm not wrong, crrently it's getting the debug location of the `IRBuilder` insert point (and only if `Arg` is an instruction). jmmartinez: There is `Instruction::applyMergedLocation` but it doesn't seem appropiate in this case. If…
		arsenmAuthorUnsubmitted Done Reply Inline Actions You're half wrong. The default is the location for the initially visited instruction. If the incoming argument is an instruction, it breaks it by taking the location from the argument. It's not unset anywhere arsenm: You're half wrong. The default is the location for the initially visited instruction. If the…
		arsenmAuthorUnsubmitted Done Reply Inline Actions I'm also not sure SetInsertPointPastAllocas is doing the right thing by not resetting the debug location arsenm: I'm also not sure SetInsertPointPastAllocas is doing the right thing by not resetting the…
		arsenmAuthorUnsubmitted Done Reply Inline Actions I think applyMergedLocation is appropriate, the API is just bad and makes you go through the raw DILocation instead of supplying Instruction wrappers arsenm: I think applyMergedLocation is appropriate, the API is just bad and makes you go through the…

		return true;
		}

// fold sin, cos -> sincos.		// fold sin, cos -> sincos.
bool AMDGPULibCalls::fold_sincos(FPMathOperator *FPOp, IRBuilder<> &B,		bool AMDGPULibCalls::fold_sincos(FPMathOperator *FPOp, IRBuilder<> &B,
const FuncInfo &fInfo, AliasAnalysis *AA) {		const FuncInfo &fInfo, AliasAnalysis *AA) {
assert(fInfo.getId() == AMDGPULibFunc::EI_SIN \|\|		assert(fInfo.getId() == AMDGPULibFunc::EI_SIN \|\|
fInfo.getId() == AMDGPULibFunc::EI_COS);		fInfo.getId() == AMDGPULibFunc::EI_COS);

if ((getArgType(fInfo) != AMDGPULibFunc::F32 &&		if ((getArgType(fInfo) != AMDGPULibFunc::F32 &&
getArgType(fInfo) != AMDGPULibFunc::F64) \|\|		getArgType(fInfo) != AMDGPULibFunc::F64) \|\|
Show All 19 Lines	if (LI && LI->getParent() == CBB) {
CArgVal->replaceAllUsesWith(AvailableVal);		CArgVal->replaceAllUsesWith(AvailableVal);
if (CArgVal->getNumUses() == 0)		if (CArgVal->getNumUses() == 0)
LI->eraseFromParent();		LI->eraseFromParent();
CArgVal = FPOp->getOperand(0);		CArgVal = FPOp->getOperand(0);
}		}
}		}
}		}

Module *M = CI->getModule();
FuncInfo PartnerInfo(isSin ? AMDGPULibFunc::EI_COS : AMDGPULibFunc::EI_SIN,		FuncInfo PartnerInfo(isSin ? AMDGPULibFunc::EI_COS : AMDGPULibFunc::EI_SIN,
fInfo);		fInfo);
const std::string PairName = PartnerInfo.mangle();		const std::string PairName = PartnerInfo.mangle();

CallInst *UI = nullptr;		CallInst *UI = nullptr;

		// TODO: Handle repeated uses, the generic implementation does.
for (User* U : CArgVal->users()) {		for (User* U : CArgVal->users()) {
CallInst *XI = dyn_cast_or_null<CallInst>(U);		CallInst *XI = dyn_cast<CallInst>(U);
if (!XI \|\| XI == CI \|\| XI->getParent() != CBB)		if (!XI \|\| XI->isNoBuiltin())
continue;		continue;

Function *UCallee = XI->getCalledFunction();		Function *UCallee = XI->getCalledFunction();
if (!UCallee \|\| !UCallee->getName().equals(PairName))		if (UCallee && UCallee->getName().equals(PairName))
continue;

BasicBlock::iterator BBI = CI->getIterator();
if (BBI == CI->getParent()->begin())
break;
--BBI;
for (int I = MaxScan; I > 0 && BBI != CBB->begin(); --BBI, --I) {
if (cast<Instruction>(BBI) == XI) {
UI = XI;		UI = XI;
break;		else if (UI)
}		return Changed;
}
if (UI) break;
}		}

if (!UI)		if (!UI)
return Changed;		return Changed;

// Merge the sin and cos.		CallInst *Sin = isSin ? CI : UI;
		CallInst *Cos = isSin ? UI : CI;
// for OpenCL 2.0 we have only generic implementation of sincos		return insertSinCos(Sin, Cos, B, fInfo) \|\| Changed;
// function.
AMDGPULibFunc nf(AMDGPULibFunc::EI_SINCOS, fInfo);
nf.getLeads()[0].PtrKind = AMDGPULibFunc::getEPtrKindFromAddrSpace(AMDGPUAS::FLAT_ADDRESS);
FunctionCallee Fsincos = getFunction(M, nf);
if (!Fsincos)
return Changed;

BasicBlock::iterator ItOld = B.GetInsertPoint();
AllocaInst *Alloc = insertAlloca(UI, B, "__sincos_");
B.SetInsertPoint(UI);

Value *P = Alloc;
Type *PTy = Fsincos.getFunctionType()->getParamType(1);
// The allocaInst allocates the memory in private address space. This need
// to be bitcasted to point to the address space of cos pointer type.
// In OpenCL 2.0 this is generic, while in 1.2 that is private.
if (PTy->getPointerAddressSpace() != AMDGPUAS::PRIVATE_ADDRESS)
P = B.CreateAddrSpaceCast(Alloc, PTy);
CallInst *Call = CreateCallEx2(B, Fsincos, UI->getArgOperand(0), P);

LLVM_DEBUG(errs() << "AMDIC: fold_sincos (" << CI << ", " << UI << ") with "
<< *Call << "\n");

if (!isSin) { // CI->cos, UI->sin
B.SetInsertPoint(&*ItOld);
UI->replaceAllUsesWith(&*Call);
Instruction *Reload = B.CreateLoad(Alloc->getAllocatedType(), Alloc);
CI->replaceAllUsesWith(Reload);
UI->eraseFromParent();
CI->eraseFromParent();
} else { // CI->sin, UI->cos
Instruction *Reload = B.CreateLoad(Alloc->getAllocatedType(), Alloc);
UI->replaceAllUsesWith(Reload);
CI->replaceAllUsesWith(Call);
UI->eraseFromParent();
CI->eraseFromParent();
}
return true;
}		}

bool AMDGPULibCalls::fold_wavefrontsize(CallInst *CI, IRBuilder<> &B) {		bool AMDGPULibCalls::fold_wavefrontsize(CallInst *CI, IRBuilder<> &B) {
if (!TM)		if (!TM)
return false;		return false;

StringRef CPU = TM->getTargetCPU();		StringRef CPU = TM->getTargetCPU();
StringRef Features = TM->getTargetFeatureString();		StringRef Features = TM->getTargetFeatureString();
if ((CPU.empty() \|\| CPU.equals_insensitive("generic")) &&		if ((CPU.empty() \|\| CPU.equals_insensitive("generic")) &&
(Features.empty() \|\| !Features.contains_insensitive("wavefrontsize")))		(Features.empty() \|\| !Features.contains_insensitive("wavefrontsize")))
return false;		return false;

Function *F = CI->getParent()->getParent();		Function *F = CI->getParent()->getParent();
const GCNSubtarget &ST = TM->getSubtarget<GCNSubtarget>(*F);		const GCNSubtarget &ST = TM->getSubtarget<GCNSubtarget>(*F);
unsigned N = ST.getWavefrontSize();		unsigned N = ST.getWavefrontSize();

LLVM_DEBUG(errs() << "AMDIC: fold_wavefrontsize (" << *CI << ") with "		LLVM_DEBUG(errs() << "AMDIC: fold_wavefrontsize (" << *CI << ") with "
<< N << "\n");		<< N << "\n");

CI->replaceAllUsesWith(ConstantInt::get(B.getInt32Ty(), N));		CI->replaceAllUsesWith(ConstantInt::get(B.getInt32Ty(), N));
CI->eraseFromParent();		CI->eraseFromParent();
return true;		return true;
}		}

// Get insertion point at entry.
BasicBlock::iterator AMDGPULibCalls::getEntryIns(CallInst * UI) {
Function * Func = UI->getParent()->getParent();
BasicBlock * BB = &Func->getEntryBlock();
assert(BB && "Entry block not found!");
BasicBlock::iterator ItNew = BB->begin();
return ItNew;
}

// Insert a AllocsInst at the beginning of function entry block.
AllocaInst* AMDGPULibCalls::insertAlloca(CallInst *UI, IRBuilder<> &B,
const char *prefix) {
BasicBlock::iterator ItNew = getEntryIns(UI);
Function *UCallee = UI->getCalledFunction();
Type *RetType = UCallee->getReturnType();
B.SetInsertPoint(&*ItNew);
AllocaInst *Alloc =
B.CreateAlloca(RetType, nullptr, std::string(prefix) + UI->getName());
Alloc->setAlignment(
Align(UCallee->getParent()->getDataLayout().getTypeAllocSize(RetType)));
return Alloc;
}

bool AMDGPULibCalls::evaluateScalarMathFunc(const FuncInfo &FInfo,		bool AMDGPULibCalls::evaluateScalarMathFunc(const FuncInfo &FInfo,
double& Res0, double& Res1,		double& Res0, double& Res1,
Constant copr0, Constant copr1,		Constant copr0, Constant copr1,
Constant *copr2) {		Constant *copr2) {
// By default, opr0/opr1/opr3 holds values of float/double type.		// By default, opr0/opr1/opr3 holds values of float/double type.
// If they are not float/double, each function has to its		// If they are not float/double, each function has to its
// operand separately.		// operand separately.
double opr0=0.0, opr1=0.0, opr2=0.0;		double opr0=0.0, opr1=0.0, opr2=0.0;
▲ Show 20 Lines • Show All 380 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/amdgpu-simplify-libcall-sincos.defined.ll

Show First 20 Lines • Show All 99 Lines • ▼ Show 20 Lines	;
store <2 x float> %result1, ptr %ptr		store <2 x float> %result1, ptr %ptr
ret <2 x float> %result0		ret <2 x float> %result0
}		}

define void @sincos_f32(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32		; CHECK-LABEL: define void @sincos_f32
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x)		%call = tail call contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call contract float @_Z3cosf(float %x)		%call1 = tail call contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define void @sincos_f32_value_is_same_constantfp(ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_value_is_same_constantfp(ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_value_is_same_constantfp		; CHECK-LABEL: define void @sincos_f32_value_is_same_constantfp
; CHECK-SAME: (ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.]]) {		; CHECK-SAME: (ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.]]) {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float 4.200000e+01)		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float 4.200000e+01)		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float 4.200000e+01, ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float 42.0)		%call = tail call contract float @_Z3sinf(float 42.0)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call contract float @_Z3cosf(float 42.0)		%call1 = tail call contract float @_Z3cosf(float 42.0)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define void @sincos_v2f32(<2 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v2f32(<2 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; GCN-LABEL: define void @sincos_v2f32		; GCN-LABEL: define void @sincos_v2f32
; GCN-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {		; GCN-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; GCN-NEXT: entry:		; GCN-NEXT: entry:
; GCN-NEXT: [[CALL:%.*]] = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> [[X]])		; GCN-NEXT: [[CALL:%.*]] = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> [[X]])
; GCN-NEXT: store <2 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8		; GCN-NEXT: store <2 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8
; GCN-NEXT: [[CALL1:%.*]] = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> [[X]])		; GCN-NEXT: [[CALL1:%.*]] = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> [[X]])
; GCN-NEXT: store <2 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8		; GCN-NEXT: store <2 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8
; GCN-NEXT: ret void		; GCN-NEXT: ret void
;		;
; CHECK-LABEL: define void @sincos_v2f32		; CHECK-LABEL: define void @sincos_v2f32
; CHECK-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) {		; CHECK-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <2 x float>, align 8, addrspace(5)
; CHECK-NEXT: store <2 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <2 x float> @_Z6sincosDv2_fPU3AS0S_(<2 x float> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <2 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8		; CHECK-NEXT: [[TMP2:%.*]] = load <2 x float>, ptr addrspace(5) [[__SINCOS_]], align 8
		; CHECK-NEXT: store <2 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
		; CHECK-NEXT: store <2 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> %x)		%call = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> %x)
store <2 x float> %call, ptr addrspace(1) %sin_out, align 8		store <2 x float> %call, ptr addrspace(1) %sin_out, align 8
%call1 = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> %x)		%call1 = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> %x)
store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8		store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8
ret void		ret void
Show All 19 Lines

llvm/test/CodeGen/AMDGPU/amdgpu-simplify-libcall-sincos.defined.nobuiltin.ll

Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	;
store float %result1, ptr %ptr		store float %result1, ptr %ptr
ret float %result0		ret float %result0
}		}

define void @sincos_f32(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32		; CHECK-LABEL: define void @sincos_f32
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[__SINCOS_]])
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = load float, ptr [[__SINCOS_]], align 4
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: store float [[TMP0]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x)		%call = tail call contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call contract float @_Z3cosf(float %x)		%call1 = tail call contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

llvm/test/CodeGen/AMDGPU/amdgpu-simplify-libcall-sincos.ll

Show First 20 Lines • Show All 211 Lines • ▼ Show 20 Lines	entry:
%call1 = tail call contract <16 x half> @_Z3cosDv16_Dh(<16 x half> %x)		%call1 = tail call contract <16 x half> @_Z3cosDv16_Dh(<16 x half> %x)
store <16 x half> %call1, ptr addrspace(1) %cos_out, align 32		store <16 x half> %call1, ptr addrspace(1) %cos_out, align 32
ret void		ret void
}		}


define void @sincos_f32_nocontract(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_nocontract(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_nocontract		; CHECK-LABEL: define void @sincos_f32_nocontract
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call float @_Z3sinf(float %x)		%call = tail call float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call float @_Z3cosf(float %x)		%call1 = tail call float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}


define void @sincos_v2f32_nocontract(<2 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v2f32_nocontract(<2 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v2f32_nocontract		; CHECK-LABEL: define void @sincos_v2f32_nocontract
; CHECK-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call <2 x float> @_Z3sinDv2_f(<2 x float> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <2 x float>, align 8, addrspace(5)
; CHECK-NEXT: store <2 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call <2 x float> @_Z3cosDv2_f(<2 x float> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call <2 x float> @_Z6sincosDv2_fPU3AS0S_(<2 x float> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <2 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8		; CHECK-NEXT: [[TMP2:%.*]] = load <2 x float>, ptr addrspace(5) [[__SINCOS_]], align 8
		; CHECK-NEXT: store <2 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
		; CHECK-NEXT: store <2 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call <2 x float> @_Z3sinDv2_f(<2 x float> %x)		%call = tail call <2 x float> @_Z3sinDv2_f(<2 x float> %x)
store <2 x float> %call, ptr addrspace(1) %sin_out, align 8		store <2 x float> %call, ptr addrspace(1) %sin_out, align 8
%call1 = tail call <2 x float> @_Z3cosDv2_f(<2 x float> %x)		%call1 = tail call <2 x float> @_Z3cosDv2_f(<2 x float> %x)
store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8		store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8
ret void		ret void
}		}


define void @sincos_f32(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32		; CHECK-LABEL: define void @sincos_f32
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x)		%call = tail call contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call contract float @_Z3cosf(float %x)		%call1 = tail call contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define void @sincos_f32_order1(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_order1(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_order1		; CHECK-LABEL: define void @sincos_f32_order1
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call1 = tail call contract float @_Z3cosf(float %x)		%call1 = tail call contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
%call = tail call contract float @_Z3sinf(float %x)		%call = tail call contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
ret void		ret void
}		}

define void @sincos_v2f32(<2 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v2f32(<2 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v2f32		; CHECK-LABEL: define void @sincos_v2f32
; CHECK-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <2 x float>, align 8, addrspace(5)
; CHECK-NEXT: store <2 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <2 x float> @_Z6sincosDv2_fPU3AS0S_(<2 x float> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <2 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8		; CHECK-NEXT: [[TMP2:%.*]] = load <2 x float>, ptr addrspace(5) [[__SINCOS_]], align 8
		; CHECK-NEXT: store <2 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
		; CHECK-NEXT: store <2 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> %x)		%call = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> %x)
store <2 x float> %call, ptr addrspace(1) %sin_out, align 8		store <2 x float> %call, ptr addrspace(1) %sin_out, align 8
%call1 = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> %x)		%call1 = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> %x)
store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8		store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8
ret void		ret void
}		}

define void @sincos_v3f32(<3 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v3f32(<3 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v3f32		; CHECK-LABEL: define void @sincos_v3f32
; CHECK-SAME: (<3 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<3 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <3 x float> @_Z3sinDv3_f(<3 x float> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <3 x float>, align 16, addrspace(5)
; CHECK-NEXT: [[EXTRACTVEC2:%.*]] = shufflevector <3 x float> [[CALL]], <3 x float> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
		; CHECK-NEXT: [[TMP1:%.*]] = call contract <3 x float> @_Z6sincosDv3_fPU3AS0S_(<3 x float> [[X]], ptr [[TMP0]])
		; CHECK-NEXT: [[TMP2:%.*]] = load <3 x float>, ptr addrspace(5) [[__SINCOS_]], align 16
		; CHECK-NEXT: [[EXTRACTVEC2:%.*]] = shufflevector <3 x float> [[TMP1]], <3 x float> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
; CHECK-NEXT: store <4 x float> [[EXTRACTVEC2]], ptr addrspace(1) [[SIN_OUT]], align 16		; CHECK-NEXT: store <4 x float> [[EXTRACTVEC2]], ptr addrspace(1) [[SIN_OUT]], align 16
; CHECK-NEXT: [[CALL5:%.*]] = tail call contract <3 x float> @_Z3cosDv3_f(<3 x float> [[X]])		; CHECK-NEXT: [[EXTRACTVEC6:%.*]] = shufflevector <3 x float> [[TMP2]], <3 x float> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
; CHECK-NEXT: [[EXTRACTVEC6:%.*]] = shufflevector <3 x float> [[CALL5]], <3 x float> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
; CHECK-NEXT: store <4 x float> [[EXTRACTVEC6]], ptr addrspace(1) [[COS_OUT]], align 16		; CHECK-NEXT: store <4 x float> [[EXTRACTVEC6]], ptr addrspace(1) [[COS_OUT]], align 16
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <3 x float> @_Z3sinDv3_f(<3 x float> %x)		%call = tail call contract <3 x float> @_Z3sinDv3_f(<3 x float> %x)
%extractVec2 = shufflevector <3 x float> %call, <3 x float> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>		%extractVec2 = shufflevector <3 x float> %call, <3 x float> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
store <4 x float> %extractVec2, ptr addrspace(1) %sin_out, align 16		store <4 x float> %extractVec2, ptr addrspace(1) %sin_out, align 16
%call5 = tail call contract <3 x float> @_Z3cosDv3_f(<3 x float> %x)		%call5 = tail call contract <3 x float> @_Z3cosDv3_f(<3 x float> %x)
%extractVec6 = shufflevector <3 x float> %call5, <3 x float> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>		%extractVec6 = shufflevector <3 x float> %call5, <3 x float> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
store <4 x float> %extractVec6, ptr addrspace(1) %cos_out, align 16		store <4 x float> %extractVec6, ptr addrspace(1) %cos_out, align 16
ret void		ret void
}		}

define void @sincos_v4f32(<4 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v4f32(<4 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v4f32		; CHECK-LABEL: define void @sincos_v4f32
; CHECK-SAME: (<4 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<4 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <4 x float> @_Z3sinDv4_f(<4 x float> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <4 x float>, align 16, addrspace(5)
; CHECK-NEXT: store <4 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 16		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <4 x float> @_Z3cosDv4_f(<4 x float> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <4 x float> @_Z6sincosDv4_fPU3AS0S_(<4 x float> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <4 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 16		; CHECK-NEXT: [[TMP2:%.*]] = load <4 x float>, ptr addrspace(5) [[__SINCOS_]], align 16
		; CHECK-NEXT: store <4 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 16
		; CHECK-NEXT: store <4 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 16
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <4 x float> @_Z3sinDv4_f(<4 x float> %x)		%call = tail call contract <4 x float> @_Z3sinDv4_f(<4 x float> %x)
store <4 x float> %call, ptr addrspace(1) %sin_out, align 16		store <4 x float> %call, ptr addrspace(1) %sin_out, align 16
%call1 = tail call contract <4 x float> @_Z3cosDv4_f(<4 x float> %x)		%call1 = tail call contract <4 x float> @_Z3cosDv4_f(<4 x float> %x)
store <4 x float> %call1, ptr addrspace(1) %cos_out, align 16		store <4 x float> %call1, ptr addrspace(1) %cos_out, align 16
ret void		ret void
}		}

define void @sincos_v8f32(<8 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v8f32(<8 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v8f32		; CHECK-LABEL: define void @sincos_v8f32
; CHECK-SAME: (<8 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<8 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <8 x float> @_Z3sinDv8_f(<8 x float> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <8 x float>, align 32, addrspace(5)
; CHECK-NEXT: store <8 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 32		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <8 x float> @_Z3cosDv8_f(<8 x float> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <8 x float> @_Z6sincosDv8_fPU3AS0S_(<8 x float> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <8 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 32		; CHECK-NEXT: [[TMP2:%.*]] = load <8 x float>, ptr addrspace(5) [[__SINCOS_]], align 32
		; CHECK-NEXT: store <8 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 32
		; CHECK-NEXT: store <8 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 32
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <8 x float> @_Z3sinDv8_f(<8 x float> %x)		%call = tail call contract <8 x float> @_Z3sinDv8_f(<8 x float> %x)
store <8 x float> %call, ptr addrspace(1) %sin_out, align 32		store <8 x float> %call, ptr addrspace(1) %sin_out, align 32
%call1 = tail call contract <8 x float> @_Z3cosDv8_f(<8 x float> %x)		%call1 = tail call contract <8 x float> @_Z3cosDv8_f(<8 x float> %x)
store <8 x float> %call1, ptr addrspace(1) %cos_out, align 32		store <8 x float> %call1, ptr addrspace(1) %cos_out, align 32
ret void		ret void
}		}

define void @sincos_v16f32(<16 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v16f32(<16 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v16f32		; CHECK-LABEL: define void @sincos_v16f32
; CHECK-SAME: (<16 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<16 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <16 x float> @_Z3sinDv16_f(<16 x float> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <16 x float>, align 64, addrspace(5)
; CHECK-NEXT: store <16 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 64		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <16 x float> @_Z3cosDv16_f(<16 x float> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <16 x float> @_Z6sincosDv16_fPU3AS0S_(<16 x float> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <16 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 64		; CHECK-NEXT: [[TMP2:%.*]] = load <16 x float>, ptr addrspace(5) [[__SINCOS_]], align 64
		; CHECK-NEXT: store <16 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 64
		; CHECK-NEXT: store <16 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 64
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <16 x float> @_Z3sinDv16_f(<16 x float> %x)		%call = tail call contract <16 x float> @_Z3sinDv16_f(<16 x float> %x)
store <16 x float> %call, ptr addrspace(1) %sin_out, align 64		store <16 x float> %call, ptr addrspace(1) %sin_out, align 64
%call1 = tail call contract <16 x float> @_Z3cosDv16_f(<16 x float> %x)		%call1 = tail call contract <16 x float> @_Z3cosDv16_f(<16 x float> %x)
store <16 x float> %call1, ptr addrspace(1) %cos_out, align 64		store <16 x float> %call1, ptr addrspace(1) %cos_out, align 64
ret void		ret void
}		}

define void @sincos_f64_nocontract(double %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f64_nocontract(double %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f64_nocontract		; CHECK-LABEL: define void @sincos_f64_nocontract
; CHECK-SAME: (double [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (double [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call double @_Z3sind(double [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca double, align 8, addrspace(5)
; CHECK-NEXT: store double [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call double @_Z3cosd(double [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call double @_Z6sincosdPU3AS0d(double [[X]], ptr [[TMP0]])
; CHECK-NEXT: store double [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8		; CHECK-NEXT: [[TMP2:%.*]] = load double, ptr addrspace(5) [[__SINCOS_]], align 8
		; CHECK-NEXT: store double [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
		; CHECK-NEXT: store double [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call double @_Z3sind(double %x)		%call = tail call double @_Z3sind(double %x)
store double %call, ptr addrspace(1) %sin_out, align 8		store double %call, ptr addrspace(1) %sin_out, align 8
%call1 = tail call double @_Z3cosd(double %x)		%call1 = tail call double @_Z3cosd(double %x)
store double %call1, ptr addrspace(1) %cos_out, align 8		store double %call1, ptr addrspace(1) %cos_out, align 8
ret void		ret void
}		}


define void @sincos_v2f64_nocontract(<2 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v2f64_nocontract(<2 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v2f64_nocontract		; CHECK-LABEL: define void @sincos_v2f64_nocontract
; CHECK-SAME: (<2 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<2 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call <2 x double> @_Z3sinDv2_d(<2 x double> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <2 x double>, align 16, addrspace(5)
; CHECK-NEXT: store <2 x double> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 16		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call <2 x double> @_Z3cosDv2_d(<2 x double> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call <2 x double> @_Z6sincosDv2_dPU3AS0S_(<2 x double> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <2 x double> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 16		; CHECK-NEXT: [[TMP2:%.*]] = load <2 x double>, ptr addrspace(5) [[__SINCOS_]], align 16
		; CHECK-NEXT: store <2 x double> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 16
		; CHECK-NEXT: store <2 x double> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 16
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call <2 x double> @_Z3sinDv2_d(<2 x double> %x)		%call = tail call <2 x double> @_Z3sinDv2_d(<2 x double> %x)
store <2 x double> %call, ptr addrspace(1) %sin_out, align 16		store <2 x double> %call, ptr addrspace(1) %sin_out, align 16
%call1 = tail call <2 x double> @_Z3cosDv2_d(<2 x double> %x)		%call1 = tail call <2 x double> @_Z3cosDv2_d(<2 x double> %x)
store <2 x double> %call1, ptr addrspace(1) %cos_out, align 16		store <2 x double> %call1, ptr addrspace(1) %cos_out, align 16
ret void		ret void
}		}

define void @sincos_f64(double %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f64(double %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f64		; CHECK-LABEL: define void @sincos_f64
; CHECK-SAME: (double [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (double [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract double @_Z3sind(double [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca double, align 8, addrspace(5)
; CHECK-NEXT: store double [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract double @_Z3cosd(double [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract double @_Z6sincosdPU3AS0d(double [[X]], ptr [[TMP0]])
; CHECK-NEXT: store double [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8		; CHECK-NEXT: [[TMP2:%.*]] = load double, ptr addrspace(5) [[__SINCOS_]], align 8
		; CHECK-NEXT: store double [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
		; CHECK-NEXT: store double [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract double @_Z3sind(double %x)		%call = tail call contract double @_Z3sind(double %x)
store double %call, ptr addrspace(1) %sin_out, align 8		store double %call, ptr addrspace(1) %sin_out, align 8
%call1 = tail call contract double @_Z3cosd(double %x)		%call1 = tail call contract double @_Z3cosd(double %x)
store double %call1, ptr addrspace(1) %cos_out, align 8		store double %call1, ptr addrspace(1) %cos_out, align 8
ret void		ret void
}		}

define void @sincos_f64_order1(double %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f64_order1(double %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f64_order1		; CHECK-LABEL: define void @sincos_f64_order1
; CHECK-SAME: (double [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (double [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract double @_Z3cosd(double [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca double, align 8, addrspace(5)
; CHECK-NEXT: store double [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL:%.*]] = tail call contract double @_Z3sind(double [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract double @_Z6sincosdPU3AS0d(double [[X]], ptr [[TMP0]])
; CHECK-NEXT: store double [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8		; CHECK-NEXT: [[TMP2:%.*]] = load double, ptr addrspace(5) [[__SINCOS_]], align 8
		; CHECK-NEXT: store double [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
		; CHECK-NEXT: store double [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call1 = tail call contract double @_Z3cosd(double %x)		%call1 = tail call contract double @_Z3cosd(double %x)
store double %call1, ptr addrspace(1) %cos_out, align 8		store double %call1, ptr addrspace(1) %cos_out, align 8
%call = tail call contract double @_Z3sind(double %x)		%call = tail call contract double @_Z3sind(double %x)
store double %call, ptr addrspace(1) %sin_out, align 8		store double %call, ptr addrspace(1) %sin_out, align 8
ret void		ret void
}		}

define void @sincos_v2f64(<2 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v2f64(<2 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v2f64		; CHECK-LABEL: define void @sincos_v2f64
; CHECK-SAME: (<2 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<2 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <2 x double> @_Z3sinDv2_d(<2 x double> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <2 x double>, align 16, addrspace(5)
; CHECK-NEXT: store <2 x double> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 16		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <2 x double> @_Z3cosDv2_d(<2 x double> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <2 x double> @_Z6sincosDv2_dPU3AS0S_(<2 x double> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <2 x double> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 16		; CHECK-NEXT: [[TMP2:%.*]] = load <2 x double>, ptr addrspace(5) [[__SINCOS_]], align 16
		; CHECK-NEXT: store <2 x double> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 16
		; CHECK-NEXT: store <2 x double> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 16
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <2 x double> @_Z3sinDv2_d(<2 x double> %x)		%call = tail call contract <2 x double> @_Z3sinDv2_d(<2 x double> %x)
store <2 x double> %call, ptr addrspace(1) %sin_out, align 16		store <2 x double> %call, ptr addrspace(1) %sin_out, align 16
%call1 = tail call contract <2 x double> @_Z3cosDv2_d(<2 x double> %x)		%call1 = tail call contract <2 x double> @_Z3cosDv2_d(<2 x double> %x)
store <2 x double> %call1, ptr addrspace(1) %cos_out, align 16		store <2 x double> %call1, ptr addrspace(1) %cos_out, align 16
ret void		ret void
}		}

define void @sincos_v3f64(<3 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v3f64(<3 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v3f64		; CHECK-LABEL: define void @sincos_v3f64
; CHECK-SAME: (<3 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<3 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <3 x double> @_Z3sinDv3_d(<3 x double> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <3 x double>, align 32, addrspace(5)
; CHECK-NEXT: [[EXTRACTVEC2:%.*]] = shufflevector <3 x double> [[CALL]], <3 x double> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
		; CHECK-NEXT: [[TMP1:%.*]] = call contract <3 x double> @_Z6sincosDv3_dPU3AS0S_(<3 x double> [[X]], ptr [[TMP0]])
		; CHECK-NEXT: [[TMP2:%.*]] = load <3 x double>, ptr addrspace(5) [[__SINCOS_]], align 32
		; CHECK-NEXT: [[EXTRACTVEC2:%.*]] = shufflevector <3 x double> [[TMP1]], <3 x double> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
; CHECK-NEXT: store <4 x double> [[EXTRACTVEC2]], ptr addrspace(1) [[SIN_OUT]], align 32		; CHECK-NEXT: store <4 x double> [[EXTRACTVEC2]], ptr addrspace(1) [[SIN_OUT]], align 32
; CHECK-NEXT: [[CALL5:%.*]] = tail call contract <3 x double> @_Z3cosDv3_d(<3 x double> [[X]])		; CHECK-NEXT: [[EXTRACTVEC6:%.*]] = shufflevector <3 x double> [[TMP2]], <3 x double> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
; CHECK-NEXT: [[EXTRACTVEC6:%.*]] = shufflevector <3 x double> [[CALL5]], <3 x double> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
; CHECK-NEXT: store <4 x double> [[EXTRACTVEC6]], ptr addrspace(1) [[COS_OUT]], align 32		; CHECK-NEXT: store <4 x double> [[EXTRACTVEC6]], ptr addrspace(1) [[COS_OUT]], align 32
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <3 x double> @_Z3sinDv3_d(<3 x double> %x)		%call = tail call contract <3 x double> @_Z3sinDv3_d(<3 x double> %x)
%extractVec2 = shufflevector <3 x double> %call, <3 x double> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>		%extractVec2 = shufflevector <3 x double> %call, <3 x double> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
store <4 x double> %extractVec2, ptr addrspace(1) %sin_out, align 32		store <4 x double> %extractVec2, ptr addrspace(1) %sin_out, align 32
%call5 = tail call contract <3 x double> @_Z3cosDv3_d(<3 x double> %x)		%call5 = tail call contract <3 x double> @_Z3cosDv3_d(<3 x double> %x)
%extractVec6 = shufflevector <3 x double> %call5, <3 x double> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>		%extractVec6 = shufflevector <3 x double> %call5, <3 x double> poison, <4 x i32> <i32 0, i32 1, i32 2, i32 poison>
store <4 x double> %extractVec6, ptr addrspace(1) %cos_out, align 32		store <4 x double> %extractVec6, ptr addrspace(1) %cos_out, align 32
ret void		ret void
}		}

define void @sincos_v4f64(<4 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v4f64(<4 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v4f64		; CHECK-LABEL: define void @sincos_v4f64
; CHECK-SAME: (<4 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<4 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <4 x double> @_Z3sinDv4_d(<4 x double> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <4 x double>, align 32, addrspace(5)
; CHECK-NEXT: store <4 x double> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 32		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <4 x double> @_Z3cosDv4_d(<4 x double> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <4 x double> @_Z6sincosDv4_dPU3AS0S_(<4 x double> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <4 x double> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 32		; CHECK-NEXT: [[TMP2:%.*]] = load <4 x double>, ptr addrspace(5) [[__SINCOS_]], align 32
		; CHECK-NEXT: store <4 x double> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 32
		; CHECK-NEXT: store <4 x double> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 32
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <4 x double> @_Z3sinDv4_d(<4 x double> %x)		%call = tail call contract <4 x double> @_Z3sinDv4_d(<4 x double> %x)
store <4 x double> %call, ptr addrspace(1) %sin_out, align 32		store <4 x double> %call, ptr addrspace(1) %sin_out, align 32
%call1 = tail call contract <4 x double> @_Z3cosDv4_d(<4 x double> %x)		%call1 = tail call contract <4 x double> @_Z3cosDv4_d(<4 x double> %x)
store <4 x double> %call1, ptr addrspace(1) %cos_out, align 32		store <4 x double> %call1, ptr addrspace(1) %cos_out, align 32
ret void		ret void
}		}

define void @sincos_v8f64(<8 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v8f64(<8 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v8f64		; CHECK-LABEL: define void @sincos_v8f64
; CHECK-SAME: (<8 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<8 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <8 x double> @_Z3sinDv8_d(<8 x double> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <8 x double>, align 64, addrspace(5)
; CHECK-NEXT: store <8 x double> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 64		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <8 x double> @_Z3cosDv8_d(<8 x double> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <8 x double> @_Z6sincosDv8_dPU3AS0S_(<8 x double> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <8 x double> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 64		; CHECK-NEXT: [[TMP2:%.*]] = load <8 x double>, ptr addrspace(5) [[__SINCOS_]], align 64
		; CHECK-NEXT: store <8 x double> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 64
		; CHECK-NEXT: store <8 x double> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 64
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <8 x double> @_Z3sinDv8_d(<8 x double> %x)		%call = tail call contract <8 x double> @_Z3sinDv8_d(<8 x double> %x)
store <8 x double> %call, ptr addrspace(1) %sin_out, align 64		store <8 x double> %call, ptr addrspace(1) %sin_out, align 64
%call1 = tail call contract <8 x double> @_Z3cosDv8_d(<8 x double> %x)		%call1 = tail call contract <8 x double> @_Z3cosDv8_d(<8 x double> %x)
store <8 x double> %call1, ptr addrspace(1) %cos_out, align 64		store <8 x double> %call1, ptr addrspace(1) %cos_out, align 64
ret void		ret void
}		}

define void @sincos_v16f64(<16 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v16f64(<16 x double> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v16f64		; CHECK-LABEL: define void @sincos_v16f64
; CHECK-SAME: (<16 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<16 x double> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract <16 x double> @_Z3sinDv16_d(<16 x double> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <16 x double>, align 128, addrspace(5)
; CHECK-NEXT: store <16 x double> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 128		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <16 x double> @_Z3cosDv16_d(<16 x double> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract <16 x double> @_Z6sincosDv16_dPU3AS0S_(<16 x double> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <16 x double> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 128		; CHECK-NEXT: [[TMP2:%.*]] = load <16 x double>, ptr addrspace(5) [[__SINCOS_]], align 128
		; CHECK-NEXT: store <16 x double> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 128
		; CHECK-NEXT: store <16 x double> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 128
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract <16 x double> @_Z3sinDv16_d(<16 x double> %x)		%call = tail call contract <16 x double> @_Z3sinDv16_d(<16 x double> %x)
store <16 x double> %call, ptr addrspace(1) %sin_out, align 128		store <16 x double> %call, ptr addrspace(1) %sin_out, align 128
%call1 = tail call contract <16 x double> @_Z3cosDv16_d(<16 x double> %x)		%call1 = tail call contract <16 x double> @_Z3cosDv16_d(<16 x double> %x)
store <16 x double> %call1, ptr addrspace(1) %cos_out, align 128		store <16 x double> %call1, ptr addrspace(1) %cos_out, align 128
ret void		ret void
}		}



define void @sincos_f32_different_blocks(i1 %cond, float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_different_blocks(i1 %cond, float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_different_blocks		; CHECK-LABEL: define void @sincos_f32_different_blocks
; CHECK-SAME: (i1 [[COND:%.]], float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (i1 [[COND:%.]], float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: br i1 [[COND]], label [[BB0:%.]], label [[BB1:%.]]		; CHECK-NEXT: br i1 [[COND]], label [[BB0:%.]], label [[BB1:%.]]
; CHECK: common.ret:		; CHECK: common.ret:
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
; CHECK: bb0:		; CHECK: bb0:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: br label [[COMMON_RET:%.*]]		; CHECK-NEXT: br label [[COMMON_RET:%.*]]
; CHECK: bb1:		; CHECK: bb1:
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: br label [[COMMON_RET]]		; CHECK-NEXT: br label [[COMMON_RET]]
;		;
entry:		entry:
br i1 %cond, label %bb0, label %bb1		br i1 %cond, label %bb0, label %bb1

bb0:		bb0:
%call = tail call contract float @_Z3sinf(float %x)		%call = tail call contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
ret void		ret void

bb1:		bb1:
%call1 = tail call contract float @_Z3cosf(float %x)		%call1 = tail call contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

; The sin and cos are in different blocks but always execute		; The sin and cos are in different blocks but always execute
define void @sincos_f32_different_blocks_dominating_always_execute(i1 %cond, float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out, ptr addrspace(1) %other) {		define void @sincos_f32_different_blocks_dominating_always_execute(i1 %cond, float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out, ptr addrspace(1) %other) {
; CHECK-LABEL: define void @sincos_f32_different_blocks_dominating_always_execute		; CHECK-LABEL: define void @sincos_f32_different_blocks_dominating_always_execute
; CHECK-SAME: (i1 [[COND:%.]], float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.]], ptr addrspace(1) nocapture writeonly [[OTHER:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (i1 [[COND:%.]], float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.]], ptr addrspace(1) nocapture writeonly [[OTHER:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: br i1 [[COND]], label [[BB0:%.]], label [[BB1:%.]]		; CHECK-NEXT: br i1 [[COND]], label [[BB0:%.]], label [[BB1:%.]]
; CHECK: bb0:		; CHECK: bb0:
; CHECK-NEXT: store i32 0, ptr addrspace(1) [[OTHER]], align 4		; CHECK-NEXT: store i32 0, ptr addrspace(1) [[OTHER]], align 4
; CHECK-NEXT: br label [[BB1]]		; CHECK-NEXT: br label [[BB1]]
; CHECK: bb1:		; CHECK: bb1:
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x)		%call = tail call contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
br i1 %cond, label %bb0, label %bb1		br i1 %cond, label %bb0, label %bb1

bb0:		bb0:
store i32 0, ptr addrspace(1) %other		store i32 0, ptr addrspace(1) %other
br label %bb1		br label %bb1

bb1:		bb1:
%call1 = tail call contract float @_Z3cosf(float %x)		%call1 = tail call contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

; sin dominates cos but cos doesn't always execute.		; sin dominates cos but cos doesn't always execute.
define void @sincos_f32_different_blocks_dominating_conditional_execute(i1 %cond, float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out, ptr addrspace(1) %other) {		define void @sincos_f32_different_blocks_dominating_conditional_execute(i1 %cond, float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out, ptr addrspace(1) %other) {
; CHECK-LABEL: define void @sincos_f32_different_blocks_dominating_conditional_execute		; CHECK-LABEL: define void @sincos_f32_different_blocks_dominating_conditional_execute
; CHECK-SAME: (i1 [[COND:%.]], float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.]], ptr addrspace(1) nocapture readnone [[OTHER:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (i1 [[COND:%.]], float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.]], ptr addrspace(1) nocapture readnone [[OTHER:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: [[SPEC_SELECT:%.*]] = select i1 [[COND]], float [[CALL1]], float 0.000000e+00		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: [[SPEC_SELECT:%.*]] = select i1 [[COND]], float [[TMP2]], float 0.000000e+00
; CHECK-NEXT: store float [[SPEC_SELECT]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: store float [[SPEC_SELECT]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x)		%call = tail call contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
br i1 %cond, label %bb0, label %bb1		br i1 %cond, label %bb0, label %bb1

bb0:		bb0:
%call1 = tail call contract float @_Z3cosf(float %x)		%call1 = tail call contract float @_Z3cosf(float %x)
br label %bb1		br label %bb1

bb1:		bb1:
%phi = phi float [%call1, %bb0], [0.0, %entry]		%phi = phi float [%call1, %bb0], [0.0, %entry]
store float %phi, ptr addrspace(1) %cos_out, align 4		store float %phi, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define float @select_sin_or_cos_f32(i1 %cond, float %x) {		define float @select_sin_or_cos_f32(i1 %cond, float %x) {
; CHECK-LABEL: define float @select_sin_or_cos_f32		; CHECK-LABEL: define float @select_sin_or_cos_f32
; CHECK-SAME: (i1 [[COND:%.]], float [[X:%.]]) local_unnamed_addr #[[ATTR2:[0-9]+]] {		; CHECK-SAME: (i1 [[COND:%.]], float [[X:%.]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[SIN:%.*]] = tail call contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: [[COS:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[SELECT:%.*]] = select i1 [[COND]], float [[SIN]], float [[COS]]		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: [[SELECT:%.*]] = select i1 [[COND]], float [[TMP1]], float [[TMP2]]
; CHECK-NEXT: ret float [[SELECT]]		; CHECK-NEXT: ret float [[SELECT]]
;		;
entry:		entry:
%sin = tail call contract float @_Z3sinf(float %x)		%sin = tail call contract float @_Z3sinf(float %x)
%cos = tail call contract float @_Z3cosf(float %x)		%cos = tail call contract float @_Z3cosf(float %x)
%select = select i1 %cond, float %sin, float %cos		%select = select i1 %cond, float %sin, float %cos
ret float %select		ret float %select
}		}

declare void @func(ptr addrspace(1))		declare void @func(ptr addrspace(1))

define void @sincos_f32_value_is_instr(ptr addrspace(1) %value.ptr, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_value_is_instr(ptr addrspace(1) %value.ptr, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_value_is_instr		; CHECK-LABEL: define void @sincos_f32_value_is_instr
; CHECK-SAME: (ptr addrspace(1) [[VALUE_PTR:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {		; CHECK-SAME: (ptr addrspace(1) [[VALUE_PTR:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[__SINCOS_CALL:%.*]] = alloca float, align 4, addrspace(5)		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: tail call void @func(ptr addrspace(1) [[VALUE_PTR]])		; CHECK-NEXT: tail call void @func(ptr addrspace(1) [[VALUE_PTR]])
; CHECK-NEXT: [[X:%.*]] = load float, ptr addrspace(1) [[VALUE_PTR]], align 4		; CHECK-NEXT: [[X:%.*]] = load float, ptr addrspace(1) [[VALUE_PTR]], align 4
; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_CALL]] to ptr		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_CALL]], align 4
; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
call void @func(ptr addrspace(1) %value.ptr)		call void @func(ptr addrspace(1) %value.ptr)
%x = load float, ptr addrspace(1) %value.ptr		%x = load float, ptr addrspace(1) %value.ptr
%call = tail call contract float @_Z3sinf(float %x)		%call = tail call contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	entry:
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call contract float @_Z3cosf(float %y)		%call1 = tail call contract float @_Z3cosf(float %y)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define void @sincos_f32_flag_intersect0(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_flag_intersect0(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_flag_intersect0		; CHECK-LABEL: define void @sincos_f32_flag_intersect0
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call nnan contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call ninf contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call nnan contract float @_Z3sinf(float %x)		%call = tail call nnan contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call ninf contract float @_Z3cosf(float %x)		%call1 = tail call ninf contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define void @sincos_f32_flag_intersect1(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_flag_intersect1(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_flag_intersect1		; CHECK-LABEL: define void @sincos_f32_flag_intersect1
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call nnan nsz contract float @_Z3sinf(float [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call nnan ninf contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call nnan contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call nnan nsz contract float @_Z3sinf(float %x)		%call = tail call nnan nsz contract float @_Z3sinf(float %x)
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call nnan ninf contract float @_Z3cosf(float %x)		%call1 = tail call nnan ninf contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define void @sincos_v2f32_flag_intersect1(<2 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_v2f32_flag_intersect1(<2 x float> %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_v2f32_flag_intersect1		; CHECK-LABEL: define void @sincos_v2f32_flag_intersect1
; CHECK-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (<2 x float> [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call nnan ninf contract <2 x float> @_Z3sinDv2_f(<2 x float> [[X]])		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <2 x float>, align 8, addrspace(5)
; CHECK-NEXT: store <2 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call nnan nsz contract <2 x float> @_Z3cosDv2_f(<2 x float> [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call nnan contract <2 x float> @_Z6sincosDv2_fPU3AS0S_(<2 x float> [[X]], ptr [[TMP0]])
; CHECK-NEXT: store <2 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8		; CHECK-NEXT: [[TMP2:%.*]] = load <2 x float>, ptr addrspace(5) [[__SINCOS_]], align 8
		; CHECK-NEXT: store <2 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
		; CHECK-NEXT: store <2 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract ninf nnan <2 x float> @_Z3sinDv2_f(<2 x float> %x)		%call = tail call contract ninf nnan <2 x float> @_Z3sinDv2_f(<2 x float> %x)
store <2 x float> %call, ptr addrspace(1) %sin_out, align 8		store <2 x float> %call, ptr addrspace(1) %sin_out, align 8
%call1 = tail call contract nsz nnan <2 x float> @_Z3cosDv2_f(<2 x float> %x)		%call1 = tail call contract nsz nnan <2 x float> @_Z3cosDv2_f(<2 x float> %x)
store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8		store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8
ret void		ret void
}		}

declare void @use_stack_ptrs(ptr addrspace(5), ptr addrspace(5))		declare void @use_stack_ptrs(ptr addrspace(5), ptr addrspace(5))

define void @sincos_f32_alloca_insertpt(float %x) {		define void @sincos_f32_alloca_insertpt(float %x) {
; CHECK-LABEL: define void @sincos_f32_alloca_insertpt		; CHECK-LABEL: define void @sincos_f32_alloca_insertpt
; CHECK-SAME: (float [[X:%.*]]) local_unnamed_addr {		; CHECK-SAME: (float [[X:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[__SINCOS_SIN:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: [[ALLOCA0:%.*]] = alloca i32, align 4, addrspace(5)		; CHECK-NEXT: [[ALLOCA0:%.*]] = alloca i32, align 4, addrspace(5)
; CHECK-NEXT: [[ALLOCA1:%.*]] = alloca i32, align 4, addrspace(5)		; CHECK-NEXT: [[ALLOCA1:%.*]] = alloca i32, align 4, addrspace(5)
; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_SIN]] to ptr		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_SIN]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
; CHECK-NEXT: store float [[TMP1]], ptr addrspace(5) [[ALLOCA0]], align 4		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(5) [[ALLOCA0]], align 4
; CHECK-NEXT: store float [[TMP2]], ptr addrspace(5) [[ALLOCA1]], align 4		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(5) [[ALLOCA1]], align 4
; CHECK-NEXT: call void @use_stack_ptrs(ptr addrspace(5) [[ALLOCA0]], ptr addrspace(5) [[ALLOCA1]])		; CHECK-NEXT: call void @use_stack_ptrs(ptr addrspace(5) [[ALLOCA0]], ptr addrspace(5) [[ALLOCA1]])
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%alloca0 = alloca i32, addrspace(5)		%alloca0 = alloca i32, addrspace(5)
%alloca1 = alloca i32, addrspace(5)		%alloca1 = alloca i32, addrspace(5)
%sin = tail call contract float @_Z3sinf(float %x)		%sin = tail call contract float @_Z3sinf(float %x)
%cos = tail call contract float @_Z3cosf(float %x)		%cos = tail call contract float @_Z3cosf(float %x)
store float %sin, ptr addrspace(5) %alloca0		store float %sin, ptr addrspace(5) %alloca0
store float %cos, ptr addrspace(5) %alloca1		store float %cos, ptr addrspace(5) %alloca1
call void @use_stack_ptrs(ptr addrspace(5) %alloca0, ptr addrspace(5) %alloca1)		call void @use_stack_ptrs(ptr addrspace(5) %alloca0, ptr addrspace(5) %alloca1)
ret void		ret void
}		}

define float @sincos_f32_unused_result_cos(float %x) {		define float @sincos_f32_unused_result_cos(float %x) {
; CHECK-LABEL: define float @sincos_f32_unused_result_cos		; CHECK-LABEL: define float @sincos_f32_unused_result_cos
; CHECK-SAME: (float [[X:%.*]]) local_unnamed_addr {		; CHECK-SAME: (float [[X:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[__SINCOS_SIN:%.*]] = alloca float, align 4, addrspace(5)		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_SIN]] to ptr		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: ret float [[TMP1]]		; CHECK-NEXT: ret float [[TMP1]]
;		;
entry:		entry:
%alloca0 = alloca i32, addrspace(5)		%alloca0 = alloca i32, addrspace(5)
%alloca1 = alloca i32, addrspace(5)		%alloca1 = alloca i32, addrspace(5)
%sin = tail call contract float @_Z3sinf(float %x)		%sin = tail call contract float @_Z3sinf(float %x)
%dead = tail call contract float @_Z3cosf(float %x)		%dead = tail call contract float @_Z3cosf(float %x)
ret float %sin		ret float %sin
}		}

define float @sincos_f32_unused_result_sin(float %x) {		define float @sincos_f32_unused_result_sin(float %x) {
; CHECK-LABEL: define float @sincos_f32_unused_result_sin		; CHECK-LABEL: define float @sincos_f32_unused_result_sin
; CHECK-SAME: (float [[X:%.*]]) local_unnamed_addr {		; CHECK-SAME: (float [[X:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[__SINCOS_DEAD:%.*]] = alloca float, align 4, addrspace(5)		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_DEAD]] to ptr		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_DEAD]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
; CHECK-NEXT: ret float [[TMP2]]		; CHECK-NEXT: ret float [[TMP2]]
;		;
entry:		entry:
%alloca0 = alloca i32, addrspace(5)		%alloca0 = alloca i32, addrspace(5)
%alloca1 = alloca i32, addrspace(5)		%alloca1 = alloca i32, addrspace(5)
%dead = tail call contract float @_Z3sinf(float %x)		%dead = tail call contract float @_Z3sinf(float %x)
%cos = tail call contract float @_Z3cosf(float %x)		%cos = tail call contract float @_Z3cosf(float %x)
ret float %cos		ret float %cos
}		}

define void @sincos_f32_repeated_uses(float %x, ptr addrspace(1) %sin_out, ptr addrspace(1) %cos_out) {		define void @sincos_f32_repeated_uses(float %x, ptr addrspace(1) %sin_out, ptr addrspace(1) %cos_out) {
; CHECK-LABEL: define void @sincos_f32_repeated_uses		; CHECK-LABEL: define void @sincos_f32_repeated_uses
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) [[SIN_OUT:%.]], ptr addrspace(1) [[COS_OUT:%.*]]) local_unnamed_addr {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) [[SIN_OUT:%.]], ptr addrspace(1) [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR2:[0-9]+]] {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[__SINCOS_SIN0:%.*]] = alloca float, align 4, addrspace(5)		; CHECK-NEXT: [[SIN0:%.*]] = tail call contract float @_Z3sinf(float [[X]])
; CHECK-NEXT: [[__SINCOS_SIN1:%.*]] = alloca float, align 4, addrspace(5)		; CHECK-NEXT: store volatile float [[SIN0]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_SIN0]] to ptr		; CHECK-NEXT: store volatile float [[SIN0]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])		; CHECK-NEXT: [[COS0:%.*]] = tail call contract float @_Z3cosf(float [[X]])
; CHECK-NEXT: store volatile float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: store volatile float [[COS0]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: [[TMP2:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_SIN1]] to ptr		; CHECK-NEXT: store volatile float [[COS0]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: [[TMP3:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP2]])		; CHECK-NEXT: store volatile float [[SIN0]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: store volatile float [[TMP3]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: [[TMP4:%.*]] = load float, ptr addrspace(5) [[__SINCOS_SIN1]], align 4
; CHECK-NEXT: store volatile float [[TMP4]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: [[TMP5:%.*]] = load float, ptr addrspace(5) [[__SINCOS_SIN0]], align 4
; CHECK-NEXT: store volatile float [[TMP5]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: [[SIN2:%.*]] = tail call contract float @_Z3sinf(float [[X]])
; CHECK-NEXT: store volatile float [[SIN2]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%sin0 = tail call contract float @_Z3sinf(float %x)		%sin0 = tail call contract float @_Z3sinf(float %x)
store volatile float %sin0, ptr addrspace(1) %sin_out, align 4		store volatile float %sin0, ptr addrspace(1) %sin_out, align 4

%sin1 = tail call contract float @_Z3sinf(float %x)		%sin1 = tail call contract float @_Z3sinf(float %x)
store volatile float %sin1, ptr addrspace(1) %sin_out, align 4		store volatile float %sin1, ptr addrspace(1) %sin_out, align 4
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	entry:
store float %call, ptr addrspace(1) %cos_out, align 4		store float %call, ptr addrspace(1) %cos_out, align 4
%call1 = tail call contract float %func.ptr(float %x)		%call1 = tail call contract float %func.ptr(float %x)
store float %call1, ptr addrspace(1) %sin_out, align 4		store float %call1, ptr addrspace(1) %sin_out, align 4
ret void		ret void
}		}

define void @sincos_f32_preserve_fpmath_0(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_preserve_fpmath_0(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_preserve_fpmath_0		; CHECK-LABEL: define void @sincos_f32_preserve_fpmath_0
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]]), !fpmath !5		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]]), !fpmath !5		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x), !fpmath !5		%call = tail call contract float @_Z3sinf(float %x), !fpmath !5
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call contract float @_Z3cosf(float %x), !fpmath !5		%call1 = tail call contract float @_Z3cosf(float %x), !fpmath !5
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define void @sincos_f32_preserve_fpmath_1(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_preserve_fpmath_1(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_preserve_fpmath_1		; CHECK-LABEL: define void @sincos_f32_preserve_fpmath_1
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]]), !fpmath !5		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]]), !fpmath !6		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x), !fpmath !5		%call = tail call contract float @_Z3sinf(float %x), !fpmath !5
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call contract float @_Z3cosf(float %x), !fpmath !6		%call1 = tail call contract float @_Z3cosf(float %x), !fpmath !6
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

; Should drop the metadata		; Should drop the metadata
define void @sincos_f32_drop_fpmath(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {		define void @sincos_f32_drop_fpmath(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) {
; CHECK-LABEL: define void @sincos_f32_drop_fpmath		; CHECK-LABEL: define void @sincos_f32_drop_fpmath
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]]), !fpmath !5		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]])		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x), !fpmath !5		%call = tail call contract float @_Z3sinf(float %x), !fpmath !5
store float %call, ptr addrspace(1) %sin_out, align 4		store float %call, ptr addrspace(1) %sin_out, align 4
%call1 = tail call contract float @_Z3cosf(float %x)		%call1 = tail call contract float @_Z3cosf(float %x)
store float %call1, ptr addrspace(1) %cos_out, align 4		store float %call1, ptr addrspace(1) %cos_out, align 4
ret void		ret void
}		}

define void @sincos_f32_debuginfo(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) !dbg !15 {		define void @sincos_f32_debuginfo(float %x, ptr addrspace(1) nocapture writeonly %sin_out, ptr addrspace(1) nocapture writeonly %cos_out) !dbg !15 {
; CHECK-LABEL: define void @sincos_f32_debuginfo		; CHECK-LABEL: define void @sincos_f32_debuginfo
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr #[[ATTR1]] !dbg [[DBG7:![0-9]+]] {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr !dbg [[DBG5:![0-9]+]] {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float [[X]]), !dbg [[DBG14:![0-9]+]]		; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5), !dbg [[DBG12:![0-9]+]]
; CHECK-NEXT: call void @llvm.dbg.value(metadata float [[CALL]], metadata [[META11:![0-9]+]], metadata !DIExpression()), !dbg [[DBG14]]		; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr, !dbg [[DBG12]]
; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4, !dbg [[DBG15:![0-9]+]]		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]]), !dbg [[DBG12]]
; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float [[X]]), !dbg [[DBG16:![0-9]+]]		; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4, !dbg [[DBG12]]
; CHECK-NEXT: call void @llvm.dbg.value(metadata float [[CALL1]], metadata [[META13:![0-9]+]], metadata !DIExpression()), !dbg [[DBG16]]		; CHECK-NEXT: call void @llvm.dbg.value(metadata float [[TMP1]], metadata [[META9:![0-9]+]], metadata !DIExpression()), !dbg [[DBG13:![0-9]+]]
; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4, !dbg [[DBG17:![0-9]+]]		; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4, !dbg [[DBG14:![0-9]+]]
; CHECK-NEXT: ret void, !dbg [[DBG18:![0-9]+]]		; CHECK-NEXT: call void @llvm.dbg.value(metadata float [[TMP2]], metadata [[META11:![0-9]+]], metadata !DIExpression()), !dbg [[DBG12]]
		; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4, !dbg [[DBG15:![0-9]+]]
		; CHECK-NEXT: ret void, !dbg [[DBG16:![0-9]+]]
;		;
entry:		entry:
%call = tail call contract float @_Z3sinf(float %x), !dbg !19		%call = tail call contract float @_Z3sinf(float %x), !dbg !19
call void @llvm.dbg.value(metadata float %call, metadata !17, metadata !DIExpression()), !dbg !19		call void @llvm.dbg.value(metadata float %call, metadata !17, metadata !DIExpression()), !dbg !19
store float %call, ptr addrspace(1) %sin_out, align 4, !dbg !20		store float %call, ptr addrspace(1) %sin_out, align 4, !dbg !20
%call1 = tail call contract float @_Z3cosf(float %x), !dbg !21		%call1 = tail call contract float @_Z3cosf(float %x), !dbg !21
call void @llvm.dbg.value(metadata float %call1, metadata !18, metadata !DIExpression()), !dbg !21		call void @llvm.dbg.value(metadata float %call1, metadata !18, metadata !DIExpression()), !dbg !21
store float %call1, ptr addrspace(1) %cos_out, align 4, !dbg !22		store float %call1, ptr addrspace(1) %cos_out, align 4, !dbg !22
ret void, !dbg !23		ret void, !dbg !23
}		}

declare float @_Z6sincosfPU3AS5f(float %x, ptr addrspace(5) %ptr)		declare float @_Z6sincosfPU3AS5f(float %x, ptr addrspace(5) %ptr)

define float @sin_sincos_private_f32(float %x, ptr addrspace(1) %sin_out, ptr addrspace(1) %cos_out) {		define float @sin_sincos_private_f32(float %x, ptr addrspace(1) %sin_out, ptr addrspace(1) %cos_out) {
; CHECK-LABEL: define float @sin_sincos_private_f32		; CHECK-LABEL: define float @sin_sincos_private_f32
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[COS_TMP:%.*]] = alloca float, align 4, addrspace(5)		; CHECK-NEXT: [[COS_TMP:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: [[SIN0:%.*]] = tail call nnan ninf nsz contract float @_Z3sinf(float [[X]]), !fpmath !5		; CHECK-NEXT: [[SIN0:%.*]] = tail call nnan ninf nsz contract float @_Z3sinf(float [[X]]), !fpmath !17
; CHECK-NEXT: store float [[SIN0]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: store float [[SIN0]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: [[SIN1:%.*]] = call nnan contract float @_Z6sincosfPU3AS5f(float [[X]], ptr addrspace(5) [[COS_TMP]]), !fpmath !6		; CHECK-NEXT: [[SIN1:%.*]] = call nnan contract float @_Z6sincosfPU3AS5f(float [[X]], ptr addrspace(5) [[COS_TMP]]), !fpmath !18
; CHECK-NEXT: [[COS1:%.*]] = load float, ptr addrspace(5) [[COS_TMP]], align 4		; CHECK-NEXT: [[COS1:%.*]] = load float, ptr addrspace(5) [[COS_TMP]], align 4
; CHECK-NEXT: store float [[COS1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: store float [[COS1]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret float [[SIN1]]		; CHECK-NEXT: ret float [[SIN1]]
;		;
entry:		entry:
%cos.tmp = alloca float, addrspace(5)		%cos.tmp = alloca float, addrspace(5)
%sin0 = tail call nsz ninf nnan contract float @_Z3sinf(float %x), !fpmath !5		%sin0 = tail call nsz ninf nnan contract float @_Z3sinf(float %x), !fpmath !5
store float %sin0, ptr addrspace(1) %sin_out, align 4		store float %sin0, ptr addrspace(1) %sin_out, align 4
%sin1 = call contract nnan float @_Z6sincosfPU3AS5f(float %x, ptr addrspace(5) %cos.tmp), !fpmath !6		%sin1 = call contract nnan float @_Z6sincosfPU3AS5f(float %x, ptr addrspace(5) %cos.tmp), !fpmath !6
%cos1 = load float, ptr addrspace(5) %cos.tmp		%cos1 = load float, ptr addrspace(5) %cos.tmp
store float %cos1, ptr addrspace(1) %cos_out, align 4		store float %cos1, ptr addrspace(1) %cos_out, align 4
ret float %sin1		ret float %sin1
}		}

declare float @_Z6sincosfPU3AS0f(float %x, ptr %ptr)		declare float @_Z6sincosfPU3AS0f(float %x, ptr %ptr)

define float @sin_sincos_generic_f32(float %x, ptr addrspace(1) %sin_out, ptr addrspace(1) %cos_out) {		define float @sin_sincos_generic_f32(float %x, ptr addrspace(1) %sin_out, ptr addrspace(1) %cos_out) {
; CHECK-LABEL: define float @sin_sincos_generic_f32		; CHECK-LABEL: define float @sin_sincos_generic_f32
; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {		; CHECK-SAME: (float [[X:%.]], ptr addrspace(1) nocapture writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture writeonly [[COS_OUT:%.*]]) local_unnamed_addr {
; CHECK-NEXT: entry:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[COS_TMP:%.*]] = alloca float, align 4, addrspace(5)		; CHECK-NEXT: [[COS_TMP:%.*]] = alloca float, align 4, addrspace(5)
; CHECK-NEXT: [[SIN0:%.*]] = tail call nsz contract float @_Z3sinf(float [[X]]), !fpmath !5		; CHECK-NEXT: [[SIN0:%.*]] = tail call nsz contract float @_Z3sinf(float [[X]]), !fpmath !17
; CHECK-NEXT: store float [[SIN0]], ptr addrspace(1) [[SIN_OUT]], align 4		; CHECK-NEXT: store float [[SIN0]], ptr addrspace(1) [[SIN_OUT]], align 4
; CHECK-NEXT: [[COS_TMP_CAST:%.*]] = addrspacecast ptr addrspace(5) [[COS_TMP]] to ptr		; CHECK-NEXT: [[COS_TMP_CAST:%.*]] = addrspacecast ptr addrspace(5) [[COS_TMP]] to ptr
; CHECK-NEXT: [[SIN1:%.*]] = call ninf nsz contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[COS_TMP_CAST]]), !fpmath !6		; CHECK-NEXT: [[SIN1:%.*]] = call ninf nsz contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[COS_TMP_CAST]]), !fpmath !18
; CHECK-NEXT: [[COS1:%.*]] = load float, ptr addrspace(5) [[COS_TMP]], align 4		; CHECK-NEXT: [[COS1:%.*]] = load float, ptr addrspace(5) [[COS_TMP]], align 4
; CHECK-NEXT: store float [[COS1]], ptr addrspace(1) [[COS_OUT]], align 4		; CHECK-NEXT: store float [[COS1]], ptr addrspace(1) [[COS_OUT]], align 4
; CHECK-NEXT: ret float [[SIN1]]		; CHECK-NEXT: ret float [[SIN1]]
;		;
entry:		entry:
%cos.tmp = alloca float, addrspace(5)		%cos.tmp = alloca float, addrspace(5)
%sin0 = tail call nsz contract float @_Z3sinf(float %x), !fpmath !5		%sin0 = tail call nsz contract float @_Z3sinf(float %x), !fpmath !5
store float %sin0, ptr addrspace(1) %sin_out, align 4		store float %sin0, ptr addrspace(1) %sin_out, align 4
▲ Show 20 Lines • Show All 171 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/amdgpu-simplify-libcall-sincos.nobuiltins.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --check-attributes --check-globals --version 2			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --check-attributes --check-globals --version 2
	; RUN: opt -S -mtriple=amdgcn-- -passes=amdgpu-simplifylib -amdgpu-prelink < %s \| FileCheck %s			; RUN: opt -S -mtriple=amdgcn-- -passes=amdgpu-simplifylib -amdgpu-prelink < %s \| FileCheck %s

	target datalayout = "e-p:64:64-p1:64:64-p2:32:32-p3:32:32-p4:64:64-p5:32:32-p6:32:32-p7:160:256:256:32-p8:128:128-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-v2048:2048-n32:64-S32-A5-G1-ni:7:8"			target datalayout = "e-p:64:64-p1:64:64-p2:32:32-p3:32:32-p4:64:64-p5:32:32-p6:32:32-p7:160:256:256:32-p8:128:128-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-v2048:2048-n32:64-S32-A5-G1-ni:7:8"

	declare float @_Z3sinf(float noundef)			declare float @_Z3sinf(float noundef)
	declare float @_Z3cosf(float noundef)			declare float @_Z3cosf(float noundef)
	declare <2 x float> @_Z3sinDv2_f(<2 x float> noundef)			declare <2 x float> @_Z3sinDv2_f(<2 x float> noundef)
	declare <2 x float> @_Z3cosDv2_f(<2 x float> noundef)			declare <2 x float> @_Z3cosDv2_f(<2 x float> noundef)

	define void @sincos_f32_nobuiltin(float noundef %x, ptr addrspace(1) nocapture noundef writeonly %sin_out, ptr addrspace(1) nocapture noundef writeonly %cos_out) #0 {			define void @sincos_f32_nobuiltin(float noundef %x, ptr addrspace(1) nocapture noundef writeonly %sin_out, ptr addrspace(1) nocapture noundef writeonly %cos_out) #0 {
	; CHECK: Function Attrs: nobuiltin			; CHECK: Function Attrs: nobuiltin
	; CHECK-LABEL: define void @sincos_f32_nobuiltin			; CHECK-LABEL: define void @sincos_f32_nobuiltin
	; CHECK-SAME: (float noundef [[X:%.]], ptr addrspace(1) nocapture noundef writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture noundef writeonly [[COS_OUT:%.*]]) #[[ATTR0:[0-9]+]] {			; CHECK-SAME: (float noundef [[X:%.]], ptr addrspace(1) nocapture noundef writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture noundef writeonly [[COS_OUT:%.*]]) #[[ATTR0:[0-9]+]] {
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float noundef [[X]])			; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
	; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4			; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
	; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float noundef [[X]])			; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
	; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4			; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
				; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
				; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	entry:			entry:
	%call = tail call contract float @_Z3sinf(float noundef %x)			%call = tail call contract float @_Z3sinf(float noundef %x)
	store float %call, ptr addrspace(1) %sin_out, align 4			store float %call, ptr addrspace(1) %sin_out, align 4
	%call1 = tail call contract float @_Z3cosf(float noundef %x)			%call1 = tail call contract float @_Z3cosf(float noundef %x)
	store float %call1, ptr addrspace(1) %cos_out, align 4			store float %call1, ptr addrspace(1) %cos_out, align 4
	ret void			ret void
	}			}

	define void @sincos_v2f32_nobuiltin(<2 x float> noundef %x, ptr addrspace(1) nocapture noundef writeonly %sin_out, ptr addrspace(1) nocapture noundef writeonly %cos_out) #0 {			define void @sincos_v2f32_nobuiltin(<2 x float> noundef %x, ptr addrspace(1) nocapture noundef writeonly %sin_out, ptr addrspace(1) nocapture noundef writeonly %cos_out) #0 {
	; CHECK: Function Attrs: nobuiltin			; CHECK: Function Attrs: nobuiltin
	; CHECK-LABEL: define void @sincos_v2f32_nobuiltin			; CHECK-LABEL: define void @sincos_v2f32_nobuiltin
	; CHECK-SAME: (<2 x float> noundef [[X:%.]], ptr addrspace(1) nocapture noundef writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture noundef writeonly [[COS_OUT:%.*]]) #[[ATTR0]] {			; CHECK-SAME: (<2 x float> noundef [[X:%.]], ptr addrspace(1) nocapture noundef writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture noundef writeonly [[COS_OUT:%.*]]) #[[ATTR0]] {
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[CALL:%.*]] = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> noundef [[X]])			; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <2 x float>, align 8, addrspace(5)
	; CHECK-NEXT: store <2 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8			; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
	; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> noundef [[X]])			; CHECK-NEXT: [[TMP1:%.*]] = call contract <2 x float> @_Z6sincosDv2_fPU3AS0S_(<2 x float> [[X]], ptr [[TMP0]])
	; CHECK-NEXT: store <2 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8			; CHECK-NEXT: [[TMP2:%.*]] = load <2 x float>, ptr addrspace(5) [[__SINCOS_]], align 8
				; CHECK-NEXT: store <2 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
				; CHECK-NEXT: store <2 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	entry:			entry:
	%call = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> noundef %x)			%call = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> noundef %x)
	store <2 x float> %call, ptr addrspace(1) %sin_out, align 8			store <2 x float> %call, ptr addrspace(1) %sin_out, align 8
	%call1 = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> noundef %x)			%call1 = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> noundef %x)
	store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8			store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8
	ret void			ret void
	}			}

	define void @sincos_f32_no_builtins(float noundef %x, ptr addrspace(1) nocapture noundef writeonly %sin_out, ptr addrspace(1) nocapture noundef writeonly %cos_out) #1 {			define void @sincos_f32_no_builtins(float noundef %x, ptr addrspace(1) nocapture noundef writeonly %sin_out, ptr addrspace(1) nocapture noundef writeonly %cos_out) #1 {
	; CHECK-LABEL: define void @sincos_f32_no_builtins			; CHECK-LABEL: define void @sincos_f32_no_builtins
	; CHECK-SAME: (float noundef [[X:%.]], ptr addrspace(1) nocapture noundef writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture noundef writeonly [[COS_OUT:%.*]]) #[[ATTR1:[0-9]+]] {			; CHECK-SAME: (float noundef [[X:%.]], ptr addrspace(1) nocapture noundef writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture noundef writeonly [[COS_OUT:%.*]]) #[[ATTR1:[0-9]+]] {
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[CALL:%.*]] = tail call contract float @_Z3sinf(float noundef [[X]])			; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca float, align 4, addrspace(5)
	; CHECK-NEXT: store float [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 4			; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
	; CHECK-NEXT: [[CALL1:%.*]] = tail call contract float @_Z3cosf(float noundef [[X]])			; CHECK-NEXT: [[TMP1:%.*]] = call contract float @_Z6sincosfPU3AS0f(float [[X]], ptr [[TMP0]])
	; CHECK-NEXT: store float [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 4			; CHECK-NEXT: [[TMP2:%.*]] = load float, ptr addrspace(5) [[__SINCOS_]], align 4
				; CHECK-NEXT: store float [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 4
				; CHECK-NEXT: store float [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 4
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	entry:			entry:
	%call = tail call contract float @_Z3sinf(float noundef %x)			%call = tail call contract float @_Z3sinf(float noundef %x)
	store float %call, ptr addrspace(1) %sin_out, align 4			store float %call, ptr addrspace(1) %sin_out, align 4
	%call1 = tail call contract float @_Z3cosf(float noundef %x)			%call1 = tail call contract float @_Z3cosf(float noundef %x)
	store float %call1, ptr addrspace(1) %cos_out, align 4			store float %call1, ptr addrspace(1) %cos_out, align 4
	ret void			ret void
	}			}

	define void @sincos_v2f32_no_builtins(<2 x float> noundef %x, ptr addrspace(1) nocapture noundef writeonly %sin_out, ptr addrspace(1) nocapture noundef writeonly %cos_out) #1 {			define void @sincos_v2f32_no_builtins(<2 x float> noundef %x, ptr addrspace(1) nocapture noundef writeonly %sin_out, ptr addrspace(1) nocapture noundef writeonly %cos_out) #1 {
	; CHECK-LABEL: define void @sincos_v2f32_no_builtins			; CHECK-LABEL: define void @sincos_v2f32_no_builtins
	; CHECK-SAME: (<2 x float> noundef [[X:%.]], ptr addrspace(1) nocapture noundef writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture noundef writeonly [[COS_OUT:%.*]]) #[[ATTR1]] {			; CHECK-SAME: (<2 x float> noundef [[X:%.]], ptr addrspace(1) nocapture noundef writeonly [[SIN_OUT:%.]], ptr addrspace(1) nocapture noundef writeonly [[COS_OUT:%.*]]) #[[ATTR1]] {
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[CALL:%.*]] = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> noundef [[X]])			; CHECK-NEXT: [[__SINCOS_:%.*]] = alloca <2 x float>, align 8, addrspace(5)
	; CHECK-NEXT: store <2 x float> [[CALL]], ptr addrspace(1) [[SIN_OUT]], align 8			; CHECK-NEXT: [[TMP0:%.*]] = addrspacecast ptr addrspace(5) [[__SINCOS_]] to ptr
	; CHECK-NEXT: [[CALL1:%.*]] = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> noundef [[X]])			; CHECK-NEXT: [[TMP1:%.*]] = call contract <2 x float> @_Z6sincosDv2_fPU3AS0S_(<2 x float> [[X]], ptr [[TMP0]])
	; CHECK-NEXT: store <2 x float> [[CALL1]], ptr addrspace(1) [[COS_OUT]], align 8			; CHECK-NEXT: [[TMP2:%.*]] = load <2 x float>, ptr addrspace(5) [[__SINCOS_]], align 8
				; CHECK-NEXT: store <2 x float> [[TMP1]], ptr addrspace(1) [[SIN_OUT]], align 8
				; CHECK-NEXT: store <2 x float> [[TMP2]], ptr addrspace(1) [[COS_OUT]], align 8
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	entry:			entry:
	%call = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> noundef %x)			%call = tail call contract <2 x float> @_Z3sinDv2_f(<2 x float> noundef %x)
	store <2 x float> %call, ptr addrspace(1) %sin_out, align 8			store <2 x float> %call, ptr addrspace(1) %sin_out, align 8
	%call1 = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> noundef %x)			%call1 = tail call contract <2 x float> @_Z3cosDv2_f(<2 x float> noundef %x)
	store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8			store <2 x float> %call1, ptr addrspace(1) %cos_out, align 8
	ret void			ret void
	▲ Show 20 Lines • Show All 81 Lines • Show Last 20 Lines