很多业务场景中,我们希望通过一个特定的函数来拟合业务数据,以此来预测未来数据的变化趋势。(比如用户的留存变化、付费变化等)
本文主要介绍在 Python 中常用的两种曲线拟合方法:多项式拟合 和 自定义函数拟合。
通过多项式拟合,我们只需要指定想要拟合的多项式的最高项次是多少即可。
运行结果:
对于自定义函数拟合,不仅可以用于直线、二次曲线、三次曲线的拟合,它可以适用于任意形式的曲线的拟合,只要定义好合适的曲线方程即可。
运行结果:
拟合函数是用于曲线拟合的函数。如果您知道y和x有关拟合函数,但不知道是什么关系,只能通过实验得到一组数据,如x=x1时y=y1,x=x2时y=y2,...这里(x1,y1)、(x2,y2)、...都是实验结果,您就可以在直角坐标系中画出各点,描点可得两者的关系曲线。根据曲线的形状您可以选择一个函数,如果类似于直线那就简单了,如果是弯曲的可以选择y是x的多项式函数,如y=a*x*x*x+b*x*x+c*x+d等等,也可以是其拟合函数他形式的函数类型,然后利用最小二乘法或其他拟合方法求出系数a,b,c,d等,即可得到y和x的关系,这个过程就是曲线拟合,这个函数就是拟合函数。由于实验有误差,选择的函数也不一定就很合适,拟合出来的函数一般难以准确通过各点,但可以离各点尽量近,从而近似地表示y和x的关系。
另外,团IDC网上有许多产品团购,便宜有口碑
Matlab有一个功能强大的曲线拟合工具箱 cftool ,使用方便,能实现多种类型的线性、非线性曲线拟合。下面结合我使用的 Matlab R2007b 来简单介绍如何使用这个工具箱。
假设我们要拟合的函数形式是 y=A*x*x + B*x, 且A0,B0。
1、在命令行输入数据:
》x=[110.3323 148.7328 178.064 202.8258033 224.7105 244.5711 262.908 280.0447 296.204 311.5475];
》y=[5 10 15 20 25 30 35 40 45 50];
2、启动曲线拟合工具箱
》cftool
3、进入曲线拟合工具箱界面“Curve Fitting tool”
(1)点击“Data”按钮,弹出“Data”窗口;
(2)利用X data和Y data的下拉菜单读入数据x,y,可修改数据集名“Data set name”,然后点击“Create data set”按钮,退出“Data”窗口,返回工具箱界面,这时会自动画出数据集的曲线图;
(3)点击“Fitting”按钮,弹出“Fitting”窗口;
(4)点击“New fit”按钮,可修改拟合项目名称“Fit name”,通过“Data set”下拉菜单选择数据集,然后通过下拉菜单“Type of fit”选择拟合曲线的类型,工具箱提供的拟合类型有:
Custom Equations:用户自定义的函数类型
Exponential:指数逼近,有2种类型, a*exp(b*x) 、 a*exp(b*x) + c*exp(d*x)
Fourier:傅立叶逼近,有7种类型,基础型是 a0 + a1*cos(x*w) + b1*sin(x*w)
Gaussian:高斯逼近,有8种类型,基础型是 a1*exp(-((x-b1)/c1)^2)
Interpolant:插值逼近,有4种类型,linear、nearest neighbor、cubic spline、shape-preserving
Polynomial:多形式逼近,有9种类型,linear ~、quadratic ~、cubic ~、4-9th degree ~
Power:幂逼近,有2种类型,a*x^b 、a*x^b + c
Rational:有理数逼近,分子、分母共有的类型是linear ~、quadratic ~、cubic ~、4-5th degree ~;此外,分子还包括constant型
Smoothing Spline:平滑逼近(翻译的不大恰当,不好意思)
Sum of Sin Functions:正弦曲线逼近,有8种类型,基础型是 a1*sin(b1*x + c1)
Weibull:只有一种,a*b*x^(b-1)*exp(-a*x^b)
1、首先启动matlab,选择编辑器,再新建一个命令文件。
2、然后在编辑器窗口中输入图示的代码。
3、然后我们点击界面上方菜单栏里的保存图标进行保存。
4、需要注意的是,保存文件的位置要与当前搜索路径的位置保持一致。这可以通过右键编辑窗口的文件,在弹出的下拉框中选择。
5、最后再命令行窗口处输入dxsnh,并敲入键盘上的enter建。可以看出阶数越高,曲线与拟合点拟合得越好。
扩展资料:
函数中所使用的算法都是科研和工程计算中的最新研究成果,而且经过了各种优化和容错处理。在通常情况下,可以用它来代替底层编程语言,如C和C++ 。在计算要求相同的情况下,使用MATLAB的编程工作量会大大减少。
MATLAB的这些函数集包括从最简单最基本的函数到诸如矩阵,特征向量、快速傅立叶变换的复杂函数。
函数所能解决的问题其大致包括矩阵运算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、傅立叶变换和数据的统计分析、工程中的优化问题、稀疏矩阵运算、复数的各种运算、三角函数和其他初等数学运算、多维数组操作以及建模动态仿真等。
题主给出中国人口预测问题(二),可以使用英国经济学家马尔萨斯提出拟合函数的Malthus模型来拟合与预测。其步骤拟合函数:
第一步,自定义Malthus模型函数(指数函数),如
func=@(k,t)N0*exp(D*(t-t0))
这里,N0=60.2;t0=1954;
第二步,利用1954-2005年的数据,分别使用lsqcurvefit函数,求出系数D。即
[D,resnorm,residual,exitflag]=lsqcurvefit(func,a0,t,N);
第三步,计算拟合值,即
x1=func(D,t);
第四步,计算相关系数R^2,即
R2=R2_fun(x,x1);
第五步,预测2010年和2030年的人口数,即
xhat=func(D,2010);
disp(['预测2010年人口数为',num2str(xhat),'千万'])
xhat=func(D,2030);
disp(['预测2030年人口数为',num2str(xhat),'千万'])
第六步,使用plot函数绘制,中国人口数的统计数据与预测模型曲线对比图,即
plot(t,x,'*-',t,x1,'+-')
第七步,标注图例,即
legend('统计数据','Malthus模型')
第八步,编写标题,即
title='中国人口数的统计数据与Malthus模型曲线对比';
第九步,标注坐标轴名称,即
xlabel('年份');ylabel('人口(千万)');
最后,编写程序,并运行可以得到如下结果。
其他问题与上述过程类似。
用wps表格来拟合拟合函数的步骤:1、分两列输入你的数据,比如在A列输入x,B列输入y拟合函数;2、选中两列数据点,点击“插入”-“图表”钮,出现“图表类型”对话框;3、在“图表类型”中选择“散点图”,按“完成”钮;4、在图表中,选中这些点,用鼠标右键菜单中选择“添加趋势线”;5、在出现的类型对话框的“类型”中,选择“多项式”,在右侧的数据框中调整多项式阶数,然后点“确定”钮,就会出现你希望的曲线函数和图