本章借助锂电池生产质检中的例子,介绍概率论的一些基本概念
锂电池的生产与测试中充满了随机性。概率论是一门用数学语言来刻画这些随机事件的学科。一个随机事件的概率是一个介于0与1之间的实数,这个实数的大小反映了这个事件发生的可能性。因此,概率为0意味着这个事件不可能发生(不可能事件),概率为1意味着这个事件必然发生(必然事件)。
以电芯产线上的抽检为例:从产线上随机抽取一只电芯进行检测,结果不是「合格」就是「不合格」。我们先假设合格的概率为 50%(合格与不合格各占一半)。在现实中,如果只抽检少量电芯,合格的频率可能不会恰好是 50%;但当抽检数量不断增加时,合格的频率会越来越接近设定的概率 50%。
如果产线工艺发生变化,合格与不合格的概率就不再相等了。上下拖动屏幕右侧蓝色柱状图来改变「合格 / 不合格」的概率分布(例如把良率调到接近真实产线的 99%)。如果我们用一个实数来表示抽检结果:比如 1 表示合格、0 表示不合格,那么我们称这个数为 随机变量。
一个随机变量的期望刻画的是这个随机变量的概率分布的“中心”。简而言之,当有无穷多来自同一个概率分布的独立样本时,它们的平均值就是期望。数学上对期望的定义是以概率(或密度)为权重的加权平均值。
$$\text{E}[X] = \sum_{x \in \mathcal{X}}xP(x)$$以电芯分容为例:电芯在化成分容后,会按容量被划分到 1 到 6 档(1 档容量最低,6 档最高)。从一大批电芯中随机抽取一只,它落在哪个档位是随机的。先假设六个档位的占比相等(各为 1/6),当抽取的电芯越来越多时,抽到的档位的平均值会慢慢趋向于它的期望 3.5。
上下拖动下方蓝色概率条改变各容量档位的占比(让分布变得不均匀),并观察期望是如何被影响的。
如果说随机变量的期望刻画了它的概率分布的“中心”,那么方差则刻画了概率分布的分散度。方差的定义是一个随机变量与它的期望之间的差的平方的加权平均值。这里的权重仍然是概率(或者密度)。
$$\text{Var}(X) = \text{E}[(X - \text{E}[X])^2]$$下面用一批电芯的容量来演示。每次从这批电芯中随机抽取一只并读取其容量值。当抽取的次数越来越多时,可以观察到样本平方差的平均值(绿色)逐渐趋向于它的方差(蓝色)。
点选下面的卡片来选择纳入抽样的电芯(每张卡片代表一只容量不同的电芯)。