Tutoriel : Régression polynomiale

Introduction

La régression polynomiale est une application directe du modèle linéaire présenté au Chapitre 2. L'objectif est d'approximer des données par un polynôme de degré fixé.

Problématique

Soit $m$ observations $(t_{1}, x_{1}), \dots, (t_{m}, x_{m})$ où $t_{k}$ sont des abscisses (par exemple des temps) et $x_{k}$ sont des ordonnées bruités. Nous cherchons à modéliser la relation entre $t$ et $x$ par un polynôme de degré $p$ :

x (t) = s_{0} + s_{1} t + s_{2} t^{2} + \dots + s_{p} t^{p}

Formulation en modèle linéaire

Construction de la matrice de design

Bien que nous cherchions un polynôme (non linéaire en $t$ ), le problème est linéaire en les coefficients $s = [s_{0}, s_{1}, \dots, s_{p}]^{T}$ . Nous pouvons écrire :

x = A s + n

où :

$x = [x_{1}, \dots, x_{m}]^{T}$ est le vecteur des observations
$s = [s_{0}, s_{1}, \dots, s_{p}]^{T}$ est le vecteur des coefficients du polynôme ( $(p + 1)$ paramètres)
$n$ est le bruit gaussien
$A \in R^{m \times (p + 1)}$ est la matrice de Vandermonde :

A = [\begin{matrix} 1 & t_{1} & t_{1}^{2} & \dots & t_{1}^{p} \\ 1 & t_{2} & t_{2}^{2} & \dots & t_{2}^{p} \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ \\ 1 & t_{m} & t_{m}^{2} & \dots & t_{m}^{p} \end{matrix}]

Remarque : Chaque ligne $k$ de $A$ contient les puissances successives de $t_{k}$ .

Estimateur des moindres carrés

D'après le chapitre 2, l'estimateur du MLE (qui coïncide avec les moindres carrés) est :

{\hat{s}}_{M L E} = (A^{T} A)^{- 1} A^{T} x

Le polynôme ajusté est alors :

\hat{x} (t) = {\hat{s}}_{0} + {\hat{s}}_{1} t + {\hat{s}}_{2} t^{2} + \dots + {\hat{s}}_{p} t^{p}

Exemple numérique

Données

Considérons $m = 20$ observations générées à partir d'un polynôme de degré 3 bruité :

x (t_{k}) = 1 + 2 t_{k} - 0.5 t_{k}^{2} + 0.1 t_{k}^{3} + n_{k}, t_{k} \in [0, 5]

avec $n_{k} \sim N (0, {0.5}^{2})$ .

Ajustement

Nous cherchons à estimer les coefficients avec un polynôme de degré $p = 3$ (ordre correct).

Matrice de design (premières lignes) :

A = [\begin{matrix} 1 & 0.00 & 0.00 & 0.00 \\ 1 & 0.26 & 0.07 & 0.02 \\ 1 & 0.53 & 0.28 & 0.15 \\ ⋮ & ⋮ & ⋮ & ⋮ \end{matrix}]

Résultats : Le script Python ci-dessous génère les données et estime les coefficients.

Figure 1: Ajustement polynomial de degré 3

Choix de l'ordre du polynôme

Sur-ajustement et sous-ajustement

Sous-ajustement ( $p$ trop petit) : Le modèle est trop simple, l'erreur est élevée
Bon ajustement ( $p$ correct) : Le modèle capture la tendance des données
Sur-ajustement ( $p$ trop grand) : Le modèle colle trop aux données bruitées, mauvaise généralisation

Figure 2: Comparaison de différents ordres de polynômes

Critère de sélection

Pour choisir $p$ , on peut utiliser :

Validation croisée : Séparer données d'entraînement/test
Critères d'information : AIC, BIC qui pénalisent la complexité

Propriétés de l'estimateur

Biais et variance

Biais : $E [{\hat{s}}_{M L E}] = s$ (sans biais)
Matrice de covariance : $Cov ({\hat{s}}_{M L E}) = σ^{2} (A^{T} A)^{- 1}$

Remarque : La matrice $A^{T} A$ peut être mal conditionnée pour $p$ grand, rendant l'inversion numérique instable.

Intervalle de confiance

Pour chaque coefficient $s_{j}$ , un intervalle de confiance asymptotique à 95% est :

I C_{0.95} (s_{j}) = [{\hat{s}}_{j} - 1.96 \sqrt{[Cov (\hat{s})]_{j j}}, {\hat{s}}_{j} + 1.96 \sqrt{[Cov (\hat{s})]_{j j}}]

Exercices

Générer des données polynomiales de degré 2 et ajuster des polynômes de degrés 1, 2, 3, 5
Comparer l'erreur quadratique moyenne pour chaque ordre
Étudier l'effet du nombre d'observations $m$ sur la qualité de l'estimation
Investiguer le conditionnement de $A^{T} A$ en fonction de $p$

Code Python

Le script complet est disponible dans src/polynomial_regression.py.

Tutoriel : Régression polynomiale ​

Introduction ​

Problématique ​

Formulation en modèle linéaire ​

Construction de la matrice de design ​

Estimateur des moindres carrés ​

Exemple numérique ​

Données ​

Ajustement ​

Choix de l'ordre du polynôme ​

Sur-ajustement et sous-ajustement ​

Critère de sélection ​

Propriétés de l'estimateur ​

Biais et variance ​

Intervalle de confiance ​

Exercices ​

Code Python ​