分类目录:《算法设计与分析》总目录
在很多情况下,我们感兴趣的是某个事件,在给定其他事件发生时出现的概率。这种概率叫做条件概率。我们将给定 x = x i x=x_i x=xi?, y = y i y=y_i y=yi?,发生的条件概率记为 P ( y = y i ∣ x = x i ) P(y=y_i|x=x_i) P(y=yi?∣x=xi?)。这个条件概率可以通过下面的公式计算:
P ( y = y i ∣ x = x i ) = P ( x = x i , y = y i ) P ( x = x i ) P(y=y_i|x=x_i)=\frac{P(x=x_i, y=y_i)}{P(x=x_i)} P(y=yi?∣x=xi?)=P(x=xi?)P(x=xi?,y=yi?)?
条件概率只在 P ( x = x i ) > 0 P(x=x_i)>0 P(x=xi?)>0时有定义。我们不能计算给定在永远不会发生的事件上的条件概率。
这里需要注意的是,不要把条件概率和计算当采用某个动作后会发生什么相混淆。假定某个人说德语,那么他是德国人的条件概率是非常高的,但是如果随机选择的一个人会说德语,他的国籍不会因此而改变。计算一个行动的后果被称为干预查询,而干预查询属于因果模型的范畴。
任何多维随机变量的联合概率分布,都可以分解成只有一个变量的条件概率相
乘的形式:
P ( x ( 1 ) , x ( 2 ) , ? ? , x ( n ) ) = P ( x ( 1 ) ) ∏ i = 2 n P ( x ( i ) ∣ x ( 1 ) , x ( 2 ) , ? ? , x ( i ? 1 ) 香港vps ) P(x^{(1)}, x^{(2)}, \cdots, x^{(n)})=P(x^{(1)})\prod_{i=2}^nP(x^{(i)}|x^{(1)}, x^{(2)}, \cdots, x^{(i-1)}) P(x(1),x(2),?,x(n))=P(x(1))i=2∏n?P(x(i)∣x(1),x(2),?,x(i?1))
50237525