Généralités

Espaces

Steven Golovkine

12 sept. 2025

logo

Pourquoi s’intéresser à l’espace mathématique ?


Le type de variables détermine :

  • L’espace mathématique dans lequel elle vit.

  • Les mesures de distance qu’on peut utiliser.

  • Les modèles pertinents à utiliser.

→ Il est donc fondamental de connaître l’espace mathématique avant toute modélisation !

Plan


  1. Unité statistique - Le choix du niveau d’analyse.

  2. Types de variables - 4 catégories principales.

  3. Espaces associés - Le cadre mathématique \(\mathcal{X}\).

Unité statistique


Définition : Élément de base définissant une observation.

C’est un choix du modélisateur qui détermine le niveau d’agrégation de l’analyse.

Exemples :

  • Enquête sur les revenus

  • Étude d’un lycée

  • Imagerie médicale

Attention : Niveaux d’analyse multiples


Exemple : Image médicale

Une image = collection de pixels

Choix 1 :

Pixel comme unité → Variables : RVB, opacité par pixel.

Choix 2 :

Image comme unité → Variables : caractéristiques globales.

Types de variables : Vue d’ensemble


4 types principaux pour les scalaires :

  1. Numérique (quantitative)

  2. Ordinale

  3. Nominale symétrique

  4. Nominale asymétrique

1. Variable numérique

Définition

Une variable numérique représente une quantité mesurable.

Exemples :

  • Revenu en dollars

  • Masse corporelle

  • Température

2. Variable ordinale

Définition

Une variable qualitative dont les modalités peuvent être ordonnées naturellement, sans que l’écart ne soit quantifiable.

Exemples :

  • Niveau de revenu : faible < moyen < élevé

  • Satisfaction : pas du tout < peu < moyennement < très < tout à fait

3. Variable nominale symétrique

Définition

Une variable qualitative où toutes les modalités sont aussi informatives les unes que les autres.

Exemples :

  • Nationalité : française, canadienne, allemande…

  • Filière : mathématiques, physique, biologie…

  • Couleur : rouge, vert, bleu…

4. Variable nominale asymétrique

Définition

Une variable qualitative où une modalité a un statut particulier (souvent “par défaut” ou plus fréquente).

Exemples :

  • Présence/absence de symptôme

  • Transaction frauduleuse/normale

  • Défaut/bon fonctionnement

Au-delà des variables classiques

  • Courbes et signaux

  • Textes et séquences de caractères

  • Images et vidéos

  • Réseaux et graphes

  • Données géospatiales

→ Le choix de représentation dépend de l’unité statistique.

Espaces d’observation \(\mathcal{X}\)

Définition

Espace mathématique dans lequel nos variables prennent leurs valeurs.

  • Cadre formel de travail.

  • Guide les choix méthodologiques.

Notation : \(\mathcal{X}\) = espace d’observation

Variable numérique → \(\mathbb{R}\)


Cas général : \(\mathcal{X} = \mathbb{R}\)

Cas restreints :

  • Taille d’une personne : \(\mathcal{X} = [0, +\infty)\)

  • Probabilité : \(\mathcal{X} = [0, 1]\)

  • Pourcentage : \(\mathcal{X} = [0, 100]\)

Variable nominale → Ensemble fini


Exemple : Lancer de dé

\[\mathcal{X} = \{1, 2, 3, 4, 5, 6\}\]

Exemple : Filière d’étude

\[\mathcal{X} = \{\text{Math}, \text{Physique}, \text{Bio}, \text{Info}\}\]

Espaces plus complexes


Analyse de courbes : fonctions continues sur \([a,b]\)

\[\mathcal{X} = \mathcal{C}([a,b])\]

Analyse de texte : alphabet

\[\mathcal{X} = \{A, B, C, \ldots, Z\}\]

Variables multiples : Produit cartésien


Observation simultanée : taille + poids + sexe

\[\mathcal{X} = \mathcal{X}_1 \times \mathcal{X}_2 \times \mathcal{X}_3\]

Cas particulier : \(p\) variables numériques \[\mathcal{X} = \mathbb{R}^p\]

Exemple concret : étude d’étudiants


  • Age (numérique) : \(\mathcal{X}_1 = [16, 30]\).

  • Filière (nominale symétrique) : \(\mathcal{X}_2 = \{\text{Math}, \text{Physique}\}\).

  • Satisfaction (ordinale) : \(\mathcal{X}_3 = \{\text{Faible}, \text{Moyen}, \text{Élevé}\}\).

  • Espace d’observation :

\[\mathcal{X} = [16, 30] \times \{\text{Math}, \text{Physique}\} \times \{\text{Faible}, \text{Moyen}, \text{Élevé}\}\]

Récapitulatif


Type de variable Exemple Espace typique
Numérique Âge, revenu \(\mathbb{R}\), \([0,+\infty)\)
Ordinale Satisfaction Ensemble ordonné fini
Nominale symétrique Nationalité Ensemble fini
Nominale asymétrique Présence/absence \(\{0, 1\}\)

Conclusion


  1. L’unité statistique définit le niveau d’analyse.

  2. Le type de variable guide le choix de l’espace.

  3. L’espace d’observation \(\mathcal{X}\) est le cadre mathématique.

  4. Variables multiples → produit cartésien d’ensemble.

→ Prochaine étape : Définir des distances dans ces espaces !