Rappels de probabilités

Variables aléatoires

Définition

Une variable aléatoire (v.a.) $X$ est une fonction mesurable définie sur un espace probabilisé $(Ω, F, P)$ à valeurs dans $R$ . On distingue deux types de variables aléatoires :

Discrète : $X$ prend ses valeurs dans un ensemble fini ou dénombrable. Elle est caractérisée par sa fonction de masse (ou loi de probabilité) :

p_{X} (x) = P (X = x)

Continue : $X$ prend ses valeurs dans un ensemble continu. Elle est caractérisée par sa densité de probabilité $f_{X} (x)$ telle que :

P (a \leq X \leq b) = \int_{a}^{b} f_{X} (x) d x

Fonction de répartition

La fonction de répartition de $X$ est définie par :

F_{X} (x) = P (X \leq x)

Elle est croissante, continue à droite, et vérifie $lim_{x \to - \infty} F_{X} (x) = 0$ et $lim_{x \to + \infty} F_{X} (x) = 1$ .

Espérance et variance

Espérance

L'espérance (ou moyenne) d'une variable aléatoire $X$ mesure sa tendance centrale :

Cas discret : $E [X] = \sum_{x} x p_{X} (x)$
Cas continu : $E [X] = \int_{- \infty}^{+ \infty} x f_{X} (x) d x$

Propriétés :

Linéarité : $E [a X + b Y] = a E [X] + b E [Y]$
Si $X$ et $Y$ sont indépendantes : $E [X Y] = E [X] E [Y]$

Variance

La variance mesure la dispersion de $X$ autour de son espérance :

var (X) = E [(X - E [X])^{2}] = E [X^{2}] - (E [X])^{2}

L'écart-type est $σ_{X} = \sqrt{var (X)}$ .

Propriétés :

$var (a X + b) = a^{2} var (X)$
Si $X$ et $Y$ sont indépendantes : $var (X + Y) = var (X) + var (Y)$

Figure 1 : Influence de l'espérance et de la variance sur la forme d'une distribution normale

Covariance

La covariance entre deux variables aléatoires $X$ et $Y$ mesure leur dépendance linéaire :

cov (X, Y) = E [(X - E [X]) (Y - E [Y])] = E [X Y] - E [X] E [Y]

Le coefficient de corrélation normalise la covariance :

ρ_{X Y} = \frac{cov (X, Y)}{σ_{X} σ_{Y}}, - 1 \leq ρ_{X Y} \leq 1

Propriétés :

Si $X$ et $Y$ sont indépendantes, alors $cov (X, Y) = 0$ (la réciproque est fausse en général)
$var (X + Y) = var (X) + var (Y) + 2 cov (X, Y)$

Figure 2 : Nuages de points pour différentes valeurs du coefficient de corrélation ρ

Lois classiques

Lois discrètes

Loi	Notation	Paramètres	Espérance	Variance
Bernoulli	$B (p)$	$p \in [0, 1]$	$p$	$p (1 - p)$
Binomiale	$B (n, p)$	$n \in N^{*}$ , $p \in [0, 1]$	$n p$	$n p (1 - p)$
Poisson	$P (λ)$	$λ > 0$	$λ$	$λ$

Figure 3 : Lois discrètes classiques pour différentes valeurs de paramètres

Lois continues

Loi	Notation	Densité	Espérance	Variance
Uniforme	$U (a, b)$	$\frac{1}{b - a}$ sur $[a, b]$	$\frac{a + b}{2}$	$\frac{(b - a)^{2}}{12}$
Exponentielle	$E (λ)$	$λ e^{- λ x}$ pour $x \geq 0$	$\frac{1}{λ}$	$\frac{1}{λ^{2}}$
Normale	$N (μ, σ^{2})$	$\frac{1}{\sqrt{2 π σ^{2}}} e^{- \frac{(x - μ)^{2}}{2 σ^{2}}}$	$μ$	$σ^{2}$

Figure 4 : Densités de probabilité des lois continues classiques

Loi normale centrée réduite

Si $X \sim N (μ, σ^{2})$ , la variable centrée réduite $Z = \frac{X - μ}{σ}$ suit une loi $N (0, 1)$ .

Cette transformation est fondamentale pour le calcul de probabilités et la construction d'intervalles de confiance.

Vecteurs aléatoires

Définition

Un vecteur aléatoire est un vecteur $X = [X_{1}, \dots, X_{n}]^{T}$ dont les composantes sont des variables aléatoires. Il est caractérisé par :

Son vecteur moyenne :

μ_{X} = E [X] = [E [X_{1}], \dots, E [X_{n}]]^{T}

Sa matrice de covariance :

Σ_{X} = E [(X - μ_{X}) (X - μ_{X})^{T}]

dont l'élément $(i, j)$ est $[Σ_{X}]_{i j} = cov (X_{i}, X_{j})$ .

Propriétés de la matrice de covariance

Symétrique : $Σ_{X} = Σ_{X}^{T}$
Semi-définie positive : $a^{T} Σ_{X} a \geq 0$ pour tout $a \in R^{n}$
Les éléments diagonaux sont les variances : $[Σ_{X}]_{i i} = var (X_{i})$

Transformation linéaire

Si $Y = A X + b$ où $A$ est une matrice et $b$ un vecteur constant, alors :

E [Y] = A μ_{X} + b, Σ_{Y} = A Σ_{X} A^{T}

Vecteur gaussien

Un vecteur aléatoire $X$ suit une loi normale multivariée $N (μ, Σ)$ si sa densité est :

f_{X} (x) = \frac{1}{(2 π)^{n / 2} | Σ |^{1 / 2}} \exp (- \frac{1}{2} (x - μ)^{T} Σ^{- 1} (x - μ))

Propriétés importantes :

Toute combinaison linéaire des composantes est gaussienne
Toute transformation linéaire $A X + b$ est gaussienne
Pour un vecteur gaussien, non-corrélation $\Leftrightarrow$ indépendance

Figure 5 : Densité de la loi normale bivariée pour différentes matrices de covariance

Échantillon i.i.d.

Un échantillon i.i.d. (indépendant et identiquement distribué) est un ensemble de $n$ variables aléatoires $X_{1}, \dots, X_{n}$ qui sont :

Indépendantes : la réalisation de l'une n'affecte pas les autres
Identiquement distribuées : elles suivent toutes la même loi $P_{θ}$

L'échantillon est noté $x = [x_{1}, \dots, x_{n}]$ et constitue la donnée de base pour l'estimation statistique.

Rappels de probabilités ​

Variables aléatoires ​

Définition ​

Fonction de répartition ​

Espérance et variance ​

Espérance ​

Variance ​

Covariance ​

Lois classiques ​

Lois discrètes ​

Lois continues ​

Loi normale centrée réduite ​

Vecteurs aléatoires ​

Définition ​

Propriétés de la matrice de covariance ​

Transformation linéaire ​

Vecteur gaussien ​

Échantillon i.i.d. ​

Rappels de probabilités

Variables aléatoires

Définition

Fonction de répartition

Espérance et variance

Espérance

Variance

Covariance

Lois classiques

Lois discrètes

Lois continues

Loi normale centrée réduite

Vecteurs aléatoires

Définition

Propriétés de la matrice de covariance

Transformation linéaire

Vecteur gaussien

Échantillon i.i.d.