STT-2200: Analyse de données

Introduction

Steven Golovkine

02 sept. 2025

logo

Qui suis-je ?


  • Diplôme d’ingénieur en statistique + Maitrise en analyse de données massives à l’ENSAI, France

  • Doctorat en maths appliqués, statistiques à l’ENSAI, France

  • Postdoc en statistique à University of Limerick, Ireland

  • Actuellement, professeur adjoint à ULaval

  • Recherche en analyse de données fonctionnelles

Qui êtes-vous ?

  1. Allez sur wooclap.com

  2. Entrez le code KFFPDJ

Qu’est ce que l’analyse de données ?

  1. Allez sur wooclap.com

  2. Entrez le code KFFPDJ

Qu’est ce que l’analyse de données ?


L’analyse de données est un ensemble de méthodes permettant de retirer de l’information d’un jeu de données. On parle aussi d’apprentissage statistique (statistical learning).

Exemple

Vous travaillez pour l’ONU. Votre mission est d’avoir de l’information sur l’espérance de vie à travers le monde. Pour cela, vous disposez de diverse données sur les différents pays du monde.

Ce qu’on ne fait PAS dans ce cours


mais qui pourrait être inclus dans un cours d’analyse de données.

  • Visualisation de données

  • Développement algorithmique

  • Deep learning

Ce qu’on fait dans ce cours


  • Compréhension des concepts d’analyse de données

  • Développement mathématique des méthodes classiques

  • Practique de l’analyse de données

  • Utilisation des librairies classiques

À quoi ça sert ?


Les méthodes enseignées servent à

  • réduire la dimension des données

  • classifier des individus automatiquement

  • former des groupes d’individus

Contenu du cours


  1. Révisions / Rappels

  2. Généralité sur l’analyse de données

  3. Réduction de la dimension

  4. Classication supervisée

  5. Classification non-supervisée

  6. Éthique

Format du cours


  • Mardi : Laboratoire 1h (mais la salle est réservée pour 2h)

  • Vendredi : Cours magistral 2h

  • Les labs du mardi porteront sur le cours vu le vendredi. Vous pouvez ammener votre propre laptop pour les labs, cependant les ordinateurs de l’université seront utilisable.

  • Les labs consisteront en des exercices (théoriques et pratiques) à faire en autonomie et je serais là pour répondre à vos questions.

Évaluations


  • Intra le 24 octobre \(\longrightarrow\) QCM (30%)

    • Reprise le 30 octobre
  • Examen final le 12 décembre (50%)

    • Reprise le 18 décembre
  • Projet en équipe à rendre le 2 décembre à 17h00 (20%)

  • Présentation du projet le 9 décembre au matin.

Logiciels


Libre à vous de choisir votre logiciel préféré (ou celui que vous maitrisez le mieux)

  1. Allez sur wooclap.com

  2. Entrez le code KFFPDJ

Communications


  • Site du cours MonPortail

  • Notes de cours : stt-2200.netlify.app

  • Une question : forum ou courriel

  • Mon bureau : VCH-2209

Mon rôle


  • Mon but est de vous aider dans votre apprentissage.

  • J’essaie de vous poser des questions, de vous présenter des exemples et de vous aider à utiliser les ressources disponibles pour vous assurer d’avoir bien compris.

  • Mon objectif est de vous donner les bases et les compétences nécessaires pour continuer à apprendre sur ces sujets de manière indépendante, tout en ayant du recul sur l’utilisation des différentes méthodes.

Politique sur la sécurité dans les laboratoires informatiques


Pour utiliser les laboratoires informatiques, il faut avoir pris connaissance de la Politique de sécurité et vous engagez à vous y conformer :

www.fsg.ulaval.ca/securite-labo-info

Pour finir l’introduction


Statistics courses […] tend to resemble horoscopes.

R. McElreath - Statistical Rethinking

Questions ?