Espaces
12 sept. 2025
Le type de variables détermine :
L’espace mathématique dans lequel elle vit.
Les mesures de distance qu’on peut utiliser.
Les modèles pertinents à utiliser.
→ Il est donc fondamental de connaître l’espace mathématique avant toute modélisation !
Unité statistique - Le choix du niveau d’analyse.
Types de variables - 4 catégories principales.
Espaces associés - Le cadre mathématique \(\mathcal{X}\).
Définition : Élément de base définissant une observation.
C’est un choix du modélisateur qui détermine le niveau d’agrégation de l’analyse.
Exemples :
Enquête sur les revenus
Étude d’un lycée
Imagerie médicale
Exemple : Image médicale
Une image = collection de pixels
Choix 1 :
Pixel comme unité → Variables : RVB, opacité par pixel.
Choix 2 :
Image comme unité → Variables : caractéristiques globales.
4 types principaux pour les scalaires :
Numérique (quantitative)
Ordinale
Nominale symétrique
Nominale asymétrique
Définition
Une variable numérique représente une quantité mesurable.
Exemples :
Revenu en dollars
Masse corporelle
Température
Définition
Une variable qualitative dont les modalités peuvent être ordonnées naturellement, sans que l’écart ne soit quantifiable.
Exemples :
Niveau de revenu : faible < moyen < élevé
Satisfaction : pas du tout < peu < moyennement < très < tout à fait
Définition
Une variable qualitative où toutes les modalités sont aussi informatives les unes que les autres.
Exemples :
Nationalité : française, canadienne, allemande…
Filière : mathématiques, physique, biologie…
Couleur : rouge, vert, bleu…
Définition
Une variable qualitative où une modalité a un statut particulier (souvent “par défaut” ou plus fréquente).
Exemples :
Présence/absence de symptôme
Transaction frauduleuse/normale
Défaut/bon fonctionnement
Courbes et signaux
Textes et séquences de caractères
Images et vidéos
Réseaux et graphes
Données géospatiales
→ Le choix de représentation dépend de l’unité statistique.
Définition
Espace mathématique dans lequel nos variables prennent leurs valeurs.
Cadre formel de travail.
Guide les choix méthodologiques.
Notation : \(\mathcal{X}\) = espace d’observation
Cas général : \(\mathcal{X} = \mathbb{R}\)
Cas restreints :
Taille d’une personne : \(\mathcal{X} = [0, +\infty)\)
Probabilité : \(\mathcal{X} = [0, 1]\)
Pourcentage : \(\mathcal{X} = [0, 100]\)
Exemple : Lancer de dé
\[\mathcal{X} = \{1, 2, 3, 4, 5, 6\}\]
Exemple : Filière d’étude
\[\mathcal{X} = \{\text{Math}, \text{Physique}, \text{Bio}, \text{Info}\}\]
Analyse de courbes : fonctions continues sur \([a,b]\)
\[\mathcal{X} = \mathcal{C}([a,b])\]
Analyse de texte : alphabet
\[\mathcal{X} = \{A, B, C, \ldots, Z\}\]
Observation simultanée : taille + poids + sexe
\[\mathcal{X} = \mathcal{X}_1 \times \mathcal{X}_2 \times \mathcal{X}_3\]
Cas particulier : \(p\) variables numériques \[\mathcal{X} = \mathbb{R}^p\]
Age (numérique) : \(\mathcal{X}_1 = [16, 30]\).
Filière (nominale symétrique) : \(\mathcal{X}_2 = \{\text{Math}, \text{Physique}\}\).
Satisfaction (ordinale) : \(\mathcal{X}_3 = \{\text{Faible}, \text{Moyen}, \text{Élevé}\}\).
\[\mathcal{X} = [16, 30] \times \{\text{Math}, \text{Physique}\} \times \{\text{Faible}, \text{Moyen}, \text{Élevé}\}\]
| Type de variable | Exemple | Espace typique |
|---|---|---|
| Numérique | Âge, revenu | \(\mathbb{R}\), \([0,+\infty)\) |
| Ordinale | Satisfaction | Ensemble ordonné fini |
| Nominale symétrique | Nationalité | Ensemble fini |
| Nominale asymétrique | Présence/absence | \(\{0, 1\}\) |
L’unité statistique définit le niveau d’analyse.
Le type de variable guide le choix de l’espace.
L’espace d’observation \(\mathcal{X}\) est le cadre mathématique.
Variables multiples → produit cartésien d’ensemble.
→ Prochaine étape : Définir des distances dans ces espaces !