APP下载

非线性回归问题求解例说

2022-07-08郭英秀

中学生数理化·高二版 2022年6期
关键词:回归方程数据量线性

郭英秀

如果题目所给样本点的分布不呈带状分布,即两个变量不呈线性关系,就不能直接利用线性回归方程建立两个变量之间的关系。这时我们可以把散点图和已经学过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出与这些散点拟合最好的函数,然后利用变量置换,把非线性回归方程问题转化为线性回归方程问题来解决,这样就可以利用线性回归模型来建立y和x之间的非线性回归方程了。

具体做法是:

(1)若问题中已给出经验公式,这时可以将变量x进行置换(换元),将变量的非线性关系转化为线性关系,将问题转化为线性回歸问题来解决;

(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种已知函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量置换,将问题化为线性回归分析问题来解决。

例1 (2021年全国高三专题练习文数)人类已经进入大数据时代。目前,数据量级已经从TB(ITB=1 024GB)级别跃升到PB(IPB=1 024TB),EB(lEB=1 024PB),乃至ZB(IZB=1 024EB)级别。国际数据公司(IDC)研究结果表明,2008年全球产生的数据量为0. 49ZB,2009年的数据量为0.8ZB,2010年的数据量增长到1. 2ZB,2011年的数据量更是高达1. 82ZB。表1是国际数据公司(IDC)研究的全球近6年每年产生的数据量(单位:ZB)及相关统计量的值。

点评:对于非线性回归方程的求解,一般要结合题意进行变换,转化为线性回归方程来求解,同时也要注意相应数据的变化。

例2 (2021年贵州理数)某二手车交易市场对2020年某品牌二手车的交易进行了统计,得到频率分布直方图(图1)和散点图(图2)。用z表示该车的使用时间(单位:年),y表示其相应的平均交易价格(单位:万元)。

(l)已知2020年在此交易市场成交的该品牌二手车为100辆,求使用时间在[12,20]的车辆数;

(2)由散点图分析后,可用y-e kx+a作为此交易市场上该种车辆的平均交易价格y关于其使用时间x的回归方程。

点评:本题求解回归方程的关键是能够通过取对数的方式将非线性的回归方程转化为线性回归方程,利用最小二乘法求得线性回归方程后,再变形得到所求回归方程。

例3 (2021年陕西高三二模理数)为了迎接第十四届全运会,提高智慧城市水平,西安公交公司近期推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付。某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,z表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表3所示。

根据以上数据,绘制了散点图(图3)。

(1)根据散点图判断,在推广期内,y—a+ bx与y -c.dx(c,d均为大于零的常数),哪一个适宜作为扫码支付的人次y关于活动推出天数z的回归方程类型?(给出判断即可,不必说明理由)

(2)根据(l)的判断结果及表3中的数据,建立y与x的回归方程,并预测活动推蹦第8天使用扫码支付的人次。

(3)推广期结束后,车队对乘客的支付方式进行统计,结果如表4。

西安公交六公司车队为缓解周边居民出行压力,以90万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0. 66万元。已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有1/6的概率享受7折优惠,有÷的概率享受8折优惠,有1/2的概率享受9折优惠。预计该车队每辆车每个月有2万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,请您估计这批车辆需要几年(结果取整数年)才能盈利。

参考数据如表5。

点评:本题考查非线性回归相关问题的解法,解题的关键是能够通过对指数型回归方程左右同时取对数,转化为线性回归的类型,从而利用最小二乘法求得线性回归方程,最后得到非线性回归方程。

(责任编辑徐利杰)

猜你喜欢

回归方程数据量线性
采用直线回归方程预测桑瘿蚊防治适期
浅谈回归方程在煤质检验中应用时应注意问题
高刷新率不容易显示器需求与接口标准带宽
关于非齐次线性微分方程的一个证明
非齐次线性微分方程的常数变易法
线性耳饰
AMAC
探究向量的线性、坐标运算
5统计案例(回归分析及独立性检验)
电力营销数据分析中的数据集成技术研究