APP下载

2021年全国高考概率与统计命题预测

2021-03-24王娟

广东教育·高中 2021年1期
关键词:方差花店里程

王娟

概率与统计在新高考中的命题大致是“两小一大”(参见2020年高考山东卷),总分为22分. 其中“两小”中的一题比较基础,另一题比较难.“一大”属于概率统计与实际应用相结合问题,难宜适中,正常情况下考生是可以得分的.看看过去、想想今天,我们将面对2021年高考,这是新的开始,那么,高考试题会如何设计呢?我们暂且认定既有“小题”也有“大题”. 这些题将落在何处,以什么样的面孔与考生见面?依据考试说明、命题大纲及近期各地市的模拟试题,谈谈我们对2021年高考全国高考概率统计方面的命题预测,供参考.

一、客观性试题的设计

由于概率统计内容十分丰富,必修三两章、选修2-3整本,于是,“小题”出现在哪里?值得我们认真思考,再想想过往试题,再看看近期试卷,我们认为在以下几个方面设计试题的可能性会很大.

1. 在随机抽样中设计

例1 采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C. 则抽到的人中,做问卷B的人数为( )

A. 7 B. 9 C. 10 D. 15

解析 C. 抽样间隔为30,所以第k组被抽中的号码为9+30(k-1).令451≤9+30(k-1)≤750,15■≤k≤25■,k∈N*,∴做B卷的人数为10人,选C.

点评系统抽样的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.

2. 在特殊数据中设计

例2 由正整数组成的一组数据x1, x2, x3, x4,其平均数和中位数都是2,且标准差等于1,则这组数据的立方和为()

A. 70 B. 60 C. 50 D. 56

解析 D. 不妨设x1≤x2≤x3≤x4, x1, x2, x3, x4∈N*,依题意得x1+x2+x3+x4=8,s=■=1,

即(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4,所以x4≤3.

则只能x1=x2=1,x3=x4=3,则这组数据为1, 1, 3, 3.

于是■+■+■+■=13+13+33+33=56,选D.

例3 “微信运动”是腾讯开发的一个记录跑步或行走情况(步数里程)的公众号用户通过该公众号可查看自己某时间段的运动情况,某人根据2018年1月至2018年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图,根据该折线图,下列结论正确的是()

A. 月跑步里程逐月增加

B. 月跑步里程最大值出现在10月

C. 跑步里程的中位数为5月份对应的里程数

D. 1月至5月的月跑步里程相对于6月至11月波动性更小,变化比较平稳

解析 BCD.由某人2018年1月至2018年11月期间每月跑步的平均里程(单位:公里)的数据绘制的折线图知:

在A中,月跑步平均里程2月、7月、8月和11月减少,故A错误.

在B中,月跑步里程最大值出现在10月,故B正确.

在C中,月跑步里程数按从小到大排列,发现中位数为5月份对应的里程数,故C正确.

在D中,1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,故D正确.

点评平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.

3. 在概率中设计

例4 储物罐中有2个红球,3个白球和3个黑球,现从该罐任取2球,则下列结论中正确的是()

A. 两球都是红球、白球、黑球的概率之比为2 ∶ 3 ∶ 3

B. 两球同色的概率为■

C. 两球为一红一白的概率为■

D. 若两球一红一白为事件A,一白一黑为事件B,则事件A与事件B不是互斥事件

解析 BC. 对于A,两球都是红球、白球、黑球的概率分别为■,■,■,显然,A一正确. 对于B,两球同时色的概率为■=■,选项B正确. 对于C,两球为一红一白的概率为■=■. 对于D,若两球一红一白为事件A,一白一黑为事件B,则事件A与事件B不会同时发生,是互斥事件.

点评概率涉及的内容很丰富,既有古典概型问题,又有离散型随机变量的概率等,在此处设计多选题恰到好处,可以达到一题多考的目的.

4. 在排列组合中设计

例5 设集合A={(x1,x2,x3,x4,x5)|xi∈|-1,0,1|,i=1,2,3,4,5},那么集合A中满足条件“1≤|x1|+|x2|+|x3|+|x4|+|x5|≤3”的元素个数为()

A. 130 B. 120 C. 90 D. 60

(5)A. 其一:|x1|+|x2|+|x3|+|x4|+|x5|=1,此时,从x1, x2, x3,x4, x5中任取一个让其等于1或-1,于是有■■=10.

其二:|x1|+|x2|+|x3|+|x4|+|x5|=2,此時,从x1, x2, x3, x4, x5中任取两个让其都等于1或都等于-1或一个是1另一个是-1,于是有2■+■■ = 40.

其三:|x1|+|x2|+|x3|+|x4|+|x5|=3,此时,从x1, x2, x3, x4, x5中任取三个让其都等于1或都等于-1或两个是1另一个是或两个是-1另一个是1,

于是有2■+■■+■■=80. 选A.

点评求解排列、组合的综合应用问题关键在于分类与分步要非常清晰,在分类上做到不重不漏,在分步上做到层次分明.这样就可以保证结论的准确性.

5. 在二项式定理中设计

例6 设f(x)是(x2+■)6展开式的中间项,则f(x)≤mx在区间 [■,■] 上恒成立的必要不充分条件是()

A. m∈[0, +∞) B. m∈[■, +∞)

C. m∈[■, 5)     D. m∈[5, +∞)

解析 AB. 由于(x2+■)6的展开式共有7项,所以中间项为第4项,

因为(x2+■)6展开式的通项为Tr+1=■(x2)6-r(■)r=(■)r ■x12-3r.

令r=3得T4=■(x2)6-3(■)3=■x3,所以f(x)=■x3.

因为f(x)≤mx在区间[■,■] 上恒成立,∴■x3≤mx在区间[■,■] 上恒成立,∴ m≥■x2在区间[■,■] 上恒成立,当x=■时,■x2有最大值为5.

∴ m≥5,所以f(x)≤mx在区间[■,■] 上恒成立的必要不充分条件,符合条件的是AB.

点评二项式定理中的命题还可以设计求一个三项式展开式某指定项的系数,这也是常考常新的一类试题,同样值得我们关注.

6. 在离散型随机变量的均值与方差中设计

例7 下列命题中,正确的命题的是( )

A. 已知随机变量服从二项分布B(n,p),若E(X)=30,D(X)=20,p=■

B. 将一组数据中的每个数据都加上同一个常数后,均值与方差恒都不变

C. 设随机变量?孜服从正态分布N(0,1),若P(?孜>1)=p,则P(-1<?孜≤0)=■-p

D. 某人在10次射击中,击中目标的次数为X, X~B(10, 0.8),则当X=8时概率最大

解析 ACD. 对于A,随机变量服从二项分布B(n, p),若E(X)=30, D(X)=20可得np=30,np(1-p)=20?圯p=■故A正确. 对于B,根据公式易知,将一组数据中的每个数据都加上同一个常数后,方差恒不变,但均值会改变,故不正确. 对于C随机变量?孜服从正态分布N(0,1),则图像关于y轴对称,若P(?孜>1)=p则P(0<?孜<1)=■-p?圯P(-1<?孜<0)=■-p,故正确. 对于D,因为在10次射击中,击中目标的次数为X, X ~ B(10, 0.8),对应的概率P(x=k)=■×0.8k×0.210-k,当k≥1时,■=■=■≥1?圯1≤k≤■,因为k为整数,所以1≤k≤8即当k=8时,概率X=8最大,故D正确.

点评在离散型随机变量的均值及方差中设计试题,往往不会单独考查某一知识点或技能点,可能会考查多个不同的内容,如本题均值、方差、二项分布及二项分布中概率的最值等,可以看出:有一个不过关,想征服此题根本没可能.

二、主观性试题的设计

主觀性试题,我们首先要关注几个常规的命题点,然后我们再注重试题创新,具体内容请看:

1. 围绕独立性检验进行设计

例8 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:

(Ⅰ)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率.

(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.

(Ⅲ)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:

K2=■

解析(Ⅰ)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,

因此,事件A的概率估计值为0.62.

(Ⅱ)根据箱产量的频率分布直方图得列联表

K2=■≈15.705,

由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.

(Ⅲ)箱产量的频率分布直方图平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.

点评独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断. 独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论.

2. 围绕线性与非线性回归进行设计

例9 下表是近几届奥运会中国代表团获得的金牌数之和y(从26届算起,不包括之前已获得的金牌数)随时间x变化的数据.

作出散点图如图所示.

由图可以看出,金牌数之和y与时间x之间存在线性相关关系.

(Ⅰ)求y关于x的线性回归方程.

(Ⅱ)预测第32届中国代表团获得的金牌数之和为多少?

(Ⅲ)现已知第31届中国代表团实际所获的金牌数为26,求残差■.

参考数据:x=28,y=85.6,■(xi -x)(yi -y)=381,■(xi -x)2=10.

附:对于一组数据(x1, y1),(x2, y2),…,(xn, yn),其回归直线■=■+■x的斜率和截距的最小二乘估计分别为:■=■=■,■=■-■■.

解析(Ⅰ)■=■=■=38.1,

■=■-■■=85.6-38.1×28=-981.2,

所以金牌数之和y关于时间x的线性回归方程为■=38.1x-981.2.

(Ⅱ)由(Ⅰ)知,当x=32时,中国代表团获得的金牌数之和的预测值■=38.1×32-981.2=238,故预测第32届中国代表团获得的金牌数之和为238枚.

(Ⅲ)当x=31时,中国代表团获得的金牌数之和的预测值为:

■=38.1×31-981.2=199.9,

第31届中国代表团获得的金牌数之和的真实值为165+26=191,

所以残差■=191-199.9=-8.9.

点评求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小. 线性回归模型y=bx+a+e,其中e称为随机误差,自变量x称为解释变量,因变量y称为预报变量. 回归直线■=■x+■必过样本点的中心(x,y),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.

3. 围绕均值与方差进行设计

例10 某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售,如果当天卖不完,剩下的玫瑰花作垃圾处理.

(1)若花店一天购进16枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式.

(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:

以100天记录的各需求量的频率作为各需求量发生的概率.

①若花店一天购进16枝玫瑰花,X表示当天的利润(单位:元),求X的分布列、数学期望及方差.

②若花店计划一天购进16枝或17枝玫瑰花,你认为应购进16枝还是17枝?请说明理由.

解析(1)当n≥16时,y=16×(10-5)=80.

当n≤15时,y=5n-5(16-n)=10n-80,得:y=10n-80(n≤15)80       (n≥16)(n∈N).

(2)①X可取60,70,80.

P(X=60)=0.1, P(X=70)=0.2, P(X=80)=0.7.

X的分布列为:

EX=60×0.1+70×0.2+80×0.7=76,

DX=162×0.1+62×0.2+42×0.7=44.

②答案一:

花店一天应购进16枝玫瑰花. 理由如下:

若花店一天购进17枝玫瑰花,Y表示当天的利润(单位:元),那么Y的分布列为:

Y的数学期望为EY=55×0.1+65×0.2+75×0.16+85×0.54=76.4,Y的方差为DY=(55-76.4)2×0.1+(65-76.4)2×0.2+(75-76.4)2×0.16+(85-76.4)2×0.54=112.04,

由以上的计算结果可以看出,DX

另外,雖然EX

答案二:

花店一天应购进17枝玫瑰花. 理由如下:

若花店一天购进17枝玫瑰花,Y表示当天的利润(单位:元),那么Y的分布列为:

Y的数学期望为EY=55×0.1+65×0.2+75×0.16+85×0.54=76.4,

由以上的计算结果可以看出,EX

点评本题与实际问题结合,将分段函数与均值、方差有效的交汇在一起,借助均值做决策的问题,确实是一道非常好的试题,难度不大,但完全征服你有绝对把握吗?

4. 围绕正态分布进行设计

例11 从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:

(Ⅰ)求这500件产品质量指标值的样本平均数 x 和样本方差s2(同一组数据用该区间的中点值作代表).

(Ⅱ)由频率分布直方图可以认为,这种产品的质量指标值Z服从正态分布N(?滋, ?啄2),其中?滋近似为样本平均数 x ,?啄2近似为样本方差s2.

(i)利用该正态分布,求P(187.8

(ii)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i)的结果,求EX.

附:■≈12.2.

若Z~N(?滋,?啄2),则P(?滋-?啄

解析(Ⅰ)抽取产品质量指标值的样本平均数 x 和样本方差s2分别为:

x =170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200.

s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+(10)2×0.24+(20)2×0.08+(30)2×0.02=150.

(Ⅱ)(ⅰ)由(Ⅰ)知Z~N(200, 150),从而

P(187.8

(ⅱ)由(ⅰ)知,一件产品中质量指标值为于区间(187.8, 212.2)的概率为0.6826.

依题意知X~B(100,0.6826),所以EX=100×0.6826=68.26.

点评正态分布是重要的命题点之一,2017年高考全国(I)卷的第19题你看过吗?是一道难得的好题,把正态分布考到了极致. 今天呢?我们也一定要想到正态分布可能还会出现绝妙之题.

5. 围绕综合应用与知识交汇进行设计

例12 新型冠状病毒肺炎疫情发生以来,电子购物平台成为人们的热选择,为提高市场销售业绩,某公司设计了一套产品促销方案,并在某地区部分营销网点进行试点. 运作一年后,对“采用促销”和“没有采用促销”的营销网点各选取了50个,对比上一年度的销售情况,分别统计了它们J的年销售总额,并按年销售总额增长的百分点分成5组:[-5,0),[0,5), [5,10), [10,15), [15,20],分别统计后制成如图所示的频率分布直方图,并规定年销售总额增长10个百分点及以上的营销网点为“精英店”.

(1)请根据题中信息填充下面的列联表,并判断是否有99%的把握认为“精英店与采用促销活动有关”.

(2)某“精英店”为了创造更大的利润,通过分析上一年度的售价xi(单位:元)和日销yi(单位:件)(i=1,2,…,10)的一组数据后决定选择y=a+bx2作为回归模型进行拟合. 具体数据如下表,表中的wi=xi2(i=1,2,…,10)

①根据上表数据计算a,b的值;

②已知该公司产品的成本为10元/件,促销费用平均5元/件,根据所求出的回归模型,分析售价x定为多少时日利润z可以达到最大.

附①:K2=■

附②:对应一组数据(u1,v1),(u2,v2),(u3,v3),…,(un,vn),其回归直线v=α + βu的斜率和截距的最小二乘法估计分别为■=■,■=v- ■■.

解析(1)

因为K2=■≈9.09>6.635.

(2)①由公式可得:b=■=-■,a=y-bw=395.5+■×2413.5=1200.

所以回归方程为y=-■x2+1200.

②若售价为x,单件利润为x-15,日销售量为y=-■x2+1200.

故日利润z=(-■x2+1200)(x-15),z■=-(x+30)(x-40).

当x∈(0, 40)时,z=(-■x2+1200)(x-15)单调递增;

当x∈(40, +∞)时,z=(-■x2+1200)(x-15)单调递减,

故当售价x=40时,日利润达到最大,其值为■元.

点评本题将频率分布直方图、独立性检验、线性回归及函数综合在一起,由于题目中本身给出数据,因此,运算量不大. 但本题的题目较长,求解时,首先要克服心理障碍,让心理不再排斥它,然后再进行常规计算,不出意外的话都能产生结论.

例13 一只蚂蚁在如图所示的棱长为1米的正四面体的棱上爬行,每次当它到达四面体顶点后,会在过此顶点的三条棱中等可能的选择一条棱继续爬行(包含来时的棱),已知蚂蚁每分钟爬行1米,t=0时蚂蚁位于点A处.

(1)2分钟末蚂蚁位于哪点的概率最大;

(2)记第n分钟末蚂蚁位于点A,B,C,D的概率分别为Pn(A), Pn(B), Pn(C), Pn(D).

①求证:Pn(B)=Pn(C)=Pn(D).

②辰辰同学认为,一段时间后蚂蚁位于点A、B、C、D的概率应该相差无几,请你通过计算10分钟末蚂蚁位于各点的概率解释辰辰同学观点的合理性.

附:(■)9≈5×10-5,(■)10=1.7×10-5,(■)9≈1.9×10-9,(■)10=9.8×10-4.

解析(1)由题可知,在1钟末蚂蚁位于A、B、C、D点的概率分别为0,■,■,■.

故2分钟末位于A点的概率P(A)=■·■+■·■+■·■=■.

位于B的概率等于P(B)=■·■+■·■=■.

同理,位于C、D的概率也等于■,

故2分钟末蚂蚁位于点A的概率最大.

(2)①记第n分钟末蚂蚁位于A、B、C、D点的概率分别为Pn(A)、 Pn(B)、 Pn(C)、 Pn(D),则Bn+1=■(An+Cn+Dn)=■(1-Bn),

同理:Cn+1=■(1-Cn),相减得Bn+1-Cn+1=-■(Bn-Cn),

Bn-Cn=(B1-C1)·(-■)n-1,又B1=C1=■,Bn-Cn=0,Bn=Cn,

同理可得Cn=Dn,∴ Bn=Cn=Dn.

②∵ An+1=■(1-An),∴ An+1-■=-■(An-■).

∴數列{An-■}是公比为-■的等比数列,A1-■=-■,

An-■=(-■)(-■)n-1,An=■+(-■)(-■)n-1,

∴ A10=■+(-■)(-■)9,同理B10=■+(■)(-■)9,

∴ A10-B10=(■+(-■)(-■)9)-(■+(■)(-■)9)=(-■)10≈1.7×10-5.

又∵ Bn=Cn=Dn ,∴ 10分钟末蚂蚁位于A、B、C、D点的概率相差无几,第n(n>10)分钟末蚂蚁位于A、B、C、D点的概率之差将会更小,所以辰辰的话合理.

点评本题将独立事件的概率与递推数列及数列运算结合在一起,可以看出第(2)问,基本上就是递推数列的有关运算与推理,尚若数列的有关技能不熟练,即便是概率统计的知识与技能再熟,最终也只能望题兴叹.

关于概率与统计的命题,我们就预测到这里. 请注意:预测与实际命题可能会有距离. 这可能也就是我们与命题专家的区别,若不准确,请不要怪我们. 要怪,就怪命题专家太狡猾.

【本文系中山市2018年重点课题“高中数学学科核心素养之数学建模的教学实践研究”(项目编号:A2018021)研究成果】

责任编辑 徐国坚

猜你喜欢

方差花店里程
方差生活秀
揭秘平均数和方差的变化规律
方差越小越好?
方差在“三数两差”问题中的妙用
信用卡积分如何 兑换航空里程数?
招牌
数学(一)
新疆主要城市与景区公路里程
招牌
你有怪癖吗?