Skip to content

Rappels de probabilités

Variables aléatoires

Définition

Une variable aléatoire (v.a.) X est une fonction mesurable définie sur un espace probabilisé (Ω,F,P) à valeurs dans R. On distingue deux types de variables aléatoires :

  • Discrète : X prend ses valeurs dans un ensemble fini ou dénombrable. Elle est caractérisée par sa fonction de masse (ou loi de probabilité) :
pX(x)=P(X=x)
  • Continue : X prend ses valeurs dans un ensemble continu. Elle est caractérisée par sa densité de probabilité fX(x) telle que :
P(aXb)=abfX(x)dx

Fonction de répartition

La fonction de répartition de X est définie par :

FX(x)=P(Xx)

Elle est croissante, continue à droite, et vérifie limxFX(x)=0 et limx+FX(x)=1.

Espérance et variance

Espérance

L'espérance (ou moyenne) d'une variable aléatoire X mesure sa tendance centrale :

  • Cas discret : E[X]=xxpX(x)
  • Cas continu : E[X]=+xfX(x)dx

Propriétés :

  • Linéarité : E[aX+bY]=aE[X]+bE[Y]
  • Si X et Y sont indépendantes : E[XY]=E[X]E[Y]

Variance

La variance mesure la dispersion de X autour de son espérance :

var(X)=E[(XE[X])2]=E[X2](E[X])2

L'écart-type est σX=var(X).

Propriétés :

  • var(aX+b)=a2var(X)
  • Si X et Y sont indépendantes : var(X+Y)=var(X)+var(Y)
Espérance et variance

Figure 1 : Influence de l'espérance et de la variance sur la forme d'une distribution normale

Covariance

La covariance entre deux variables aléatoires X et Y mesure leur dépendance linéaire :

cov(X,Y)=E[(XE[X])(YE[Y])]=E[XY]E[X]E[Y]

Le coefficient de corrélation normalise la covariance :

ρXY=cov(X,Y)σXσY,1ρXY1

Propriétés :

  • Si X et Y sont indépendantes, alors cov(X,Y)=0 (la réciproque est fausse en général)
  • var(X+Y)=var(X)+var(Y)+2cov(X,Y)
Corrélation entre variables

Figure 2 : Nuages de points pour différentes valeurs du coefficient de corrélation ρ

Lois classiques

Lois discrètes

LoiNotationParamètresEspéranceVariance
BernoulliB(p)p[0,1]pp(1p)
BinomialeB(n,p)nN, p[0,1]npnp(1p)
PoissonP(λ)λ>0λλ
Lois discrètes classiques

Figure 3 : Lois discrètes classiques pour différentes valeurs de paramètres

Lois continues

LoiNotationDensitéEspéranceVariance
UniformeU(a,b)1ba sur [a,b]a+b2(ba)212
ExponentielleE(λ)λeλx pour x01λ1λ2
NormaleN(μ,σ2)12πσ2e(xμ)22σ2μσ2
Lois continues classiques

Figure 4 : Densités de probabilité des lois continues classiques

Loi normale centrée réduite

Si XN(μ,σ2), la variable centrée réduite Z=Xμσ suit une loi N(0,1).

Cette transformation est fondamentale pour le calcul de probabilités et la construction d'intervalles de confiance.

Vecteurs aléatoires

Définition

Un vecteur aléatoire est un vecteur X=[X1,,Xn]T dont les composantes sont des variables aléatoires. Il est caractérisé par :

  • Son vecteur moyenne :
μX=E[X]=[E[X1],,E[Xn]]T
  • Sa matrice de covariance :
ΣX=E[(XμX)(XμX)T]

dont l'élément (i,j) est [ΣX]ij=cov(Xi,Xj).

Propriétés de la matrice de covariance

  • Symétrique : ΣX=ΣXT
  • Semi-définie positive : aTΣXa0 pour tout aRn
  • Les éléments diagonaux sont les variances : [ΣX]ii=var(Xi)

Transformation linéaire

Si Y=AX+bA est une matrice et b un vecteur constant, alors :

E[Y]=AμX+b,ΣY=AΣXAT

Vecteur gaussien

Un vecteur aléatoire X suit une loi normale multivariée N(μ,Σ) si sa densité est :

fX(x)=1(2π)n/2|Σ|1/2exp(12(xμ)TΣ1(xμ))

Propriétés importantes :

  • Toute combinaison linéaire des composantes est gaussienne
  • Toute transformation linéaire AX+b est gaussienne
  • Pour un vecteur gaussien, non-corrélation indépendance
Loi normale bivariée

Figure 5 : Densité de la loi normale bivariée pour différentes matrices de covariance

Échantillon i.i.d.

Un échantillon i.i.d. (indépendant et identiquement distribué) est un ensemble de n variables aléatoires X1,,Xn qui sont :

  • Indépendantes : la réalisation de l'une n'affecte pas les autres
  • Identiquement distribuées : elles suivent toutes la même loi Pθ

L'échantillon est noté x=[x1,,xn] et constitue la donnée de base pour l'estimation statistique.