1. Accueil
  2. FR
  3. Étudier
  4. Offre de formation
  5. UE
INFO-L402

Logiciels d'analyse de données en santé

année académique
2024-2025

Titulaire(s) du cours

Fati Kirakoya (Coordonnateur)

Crédits ECTS

5

Langue(s) d'enseignement

français

Contenu du cours

  1. Introduction aux logiciels d’analyse de données en santé
  • Présentation de R, Stata et SAS
  • Installation et prise en main (RStudio, interfaces Stata et SAS)
  1. Gestion des bases de données
  • Import/export de données (fichiers .csv, .xls, .dta, .sas7bdat)
  • Nettoyage, transformation, valeurs manquantes
  • Création et gestion de variables
  • Fusion de fichiers
  1. Analyses statistiques
  • Descriptives : résumés numériques, tableaux croisés, graphiques
  • Inférentielles : tests de comparaison (t-test, chi2, ANOVA), corrélations
  • Régression simple (linéaire, logistique)
  1. Exercice intégratif
  • Analyse complète d’un jeu de données de santé avec R, Stata ou SAS

Objectifs (et/ou acquis d'apprentissages spécifiques)

Objectif général du cours

Permettre à l’étudiant d’acquérir les compétences pratiques nécessaires pour gérer, analyser et interpréter des données de santé à l’aide de logiciels statistiques (R, Stata, SAS), depuis l’importation et la préparation des bases de données jusqu’à la réalisation d’analyses descriptives, inférentielles et de modèles de régression simples, en vue de répondre à des problématiques de santé publique.


Objectifs pédagogiques spécifiques

À l’issue du cours, l’étudiant.e sera capable de :

1. Introduction aux logiciels d’analyse de données en santé

  • Installer et configurer R, RStudio, Stata et SAS.

  • Décrire les principales caractéristiques, forces et limites de chaque logiciel.

  • Naviguer efficacement dans les interfaces et environnements de travail.

2. Gestion des bases de données

  • Importer et exporter différents formats de fichiers de données (.csv, .xls, .dta, .sas7bdat).

  • Nettoyer et transformer une base de données (détection et traitement des valeurs manquantes, recodage de variables, création d’indicateurs).

  • Réaliser des opérations de gestion avancées (fusion de fichiers, sous-ensembles, tris).

3. Analyses statistiques

  • Produire des analyses descriptives (résumés numériques, tableaux croisés, représentations graphiques adaptées).

  • Appliquer des tests statistiques inférentiels adaptés (t-test, chi2, ANOVA, corrélations) et interpréter leurs résultats.

  • Mettre en œuvre et interpréter une régression simple (linéaire et logistique) dans un contexte de santé publique.

4. Exercice intégratif (projet pratique)

  • Conduire une analyse complète d’un jeu de données en santé en  considérant chacun des logiciels (R, Stata ou SAS).

  • Documenter et justifier les étapes de préparation et d’analyse.

  • Présenter et interpréter les résultats sous forme structurée 

Pré-requis et Co-requis

Connaissances et compétences pré-requises ou co-requises

SAPUL4012

Cours ayant celui-ci comme co-requis

Méthodes d'enseignement et activités d'apprentissages

L’enseignement repose sur une approche pratique et progressive, permettant aux étudiants de se familiariser avec l’importation, la gestion et l’analyse de données de santé dans R, Stata ou SAS.

1. Exposés interactifs

  • Introduction aux logiciels R, Stata et SAS : environnement, fonctionnalités principales, avantages et limites.

  • Concepts fondamentaux en gestion et analyse de données : import/export, nettoyage, transformation, analyses descriptives et inférentielles, régressions simples.

  • Illustration par des exemples concrets issus de bases de données de santé publique.

2. Démonstrations guidées en salle informatique

  • RStudio : scripts, importation de fichiers, nettoyage et transformation des données, analyses descriptives et graphiques, analyses inférentielles, regressions simples.

  • Stata : commandes de base pour la gestion des données, tableaux croisés, tests statistiques, régressions simples.

  • SAS : procédures de gestion et analyse de données (PROC IMPORT, PROC MEANS, PROC FREQ, PROC REG/LOGISTIC).

  • Les étudiants reproduisent les démonstrations en temps réel sur leur ordinateur.

3. Travaux pratiques dirigés

  • Exercices sur des jeux de données réelles ou simulées.

  • Prise en main des étapes essentielles : nettoyage, création et gestion de variables, fusion de fichiers.

  • Réalisation d’analyses descriptives et tests statistiques simples dans le logiciel .

  • Comparaison de commandes et résultats entre logiciels, pour mieux comprendre les spécificités de chacun.

4. Exercice intégratif (projet pratique)

  • Analyse complète d’un jeu de données de santé publique avec R, Stata ou SAS.

  • Étapes : importation, préparation des données, analyses descriptives, tests statistiques, régression simple.

5. Travail personnel et devoirs à domicile

  • Exercices supplémentaires pour renforcer la pratique du logiciel 

  • Documentation des étapes de traitement et des commandes utilisées.

  • Préparation du projet intégratif.

6. Accompagnement pédagogique

  • Encadrement rapproché en salle informatique par l’enseignante et assistants.

  • Fourniture de tutoriels et fiches pratiques spécifiques à R, Stata et SAS.

  • Feedback sur les exercices et le projet pour consolider la maîtrise du logiciel.

Références, bibliographie et lectures recommandées

via l'UV

Support(s) de cours

  • Université virtuelle

Contribution au profil d'enseignement

  • à la compétence technique n° 4: “réaliser des recherches autour d’enjeux et stratégies de santé publique” et plus spécifiquement la capacité 4.3: “analyser les données qualitatives et quantitatives à travers les techniques et les technologies adaptées aux objectifs visés” et 4.6 “évaluer la qualité et les limites des méthodes de recherche utilisées et des résultats obtenus”

  • à la compétence relationnelle et sociales n°8 : “adopter des stratégies de communication différentes en fonction des partenaires, du public cible et des enjeux de santé publique” et plus spécifiquement la capacité 8.2: “rédiger des documents suivant le format (rapport scientifique, note technique, note de synthèse, poster de conférence, article scientifique, article de divulgation, ...) le mieux adapté au public (groupes cibles, décideurs, grand public, chercheurs, ...) et aux objectifs visés (sensibiliser, informer, conseiller, ...)

Autres renseignements

Contacts

Fati Kirakoya : fati.kirakoya@ulb.be

Campus

Erasme

Evaluation

Méthode(s) d'évaluation

  • Examen pratique

Examen pratique

  • Examen à livre ouvert

L'évaluation se fera sur base de trois parties (ou 2 parties) réalisées au même moment

Logiciel STATA : examen sur ordinateur

Logiciel R : Examen sur ordinateur

Logiciel SAS : Examen sur ordinateur

Construction de la note (en ce compris, la pondération des notes partielles)

Chaque évaluation sur ordinateur sera cotée sur 10 points. La cote globale de l'UE sera une moyenne des trois parties évaluées décrites ci-dessus (STATA, R et SAS) pour les étudiant.es du programme SAPUB.
Pour les autres programmes d'études uniquement STATA et R. La réussite sera effective pour toute note de 10/20 ou plus sur l’ensemble des 3 parties pour SAPUB ( 2 parties pour les autrs programmes d'études ). Si cette note est intérieure à 10/20, l’étudiant représentera l’ensemble des 3 parties.

Langue(s) d'évaluation

  • français

Programmes