1. Accueil
  2. FR
  3. Étudier
  4. Offre de formation
  5. fcsante

STAT 2.7 -Traitement des valeurs extrêmes et des données manquantes avec le logiciel R

STAT 2.7 -Traitement des valeurs extrêmes et des données manquantes avec le logiciel R

Accroche introductive

Comment traiter des valeurs extrêmes & manquantes avec le logiciel R ? 

Accéder aux sections de la fiche

Call to actions

  • Intitulé du programme
    STAT 2.7 -Traitement des valeurs extrêmes et des données manquantes avec le logiciel R
  • mnémonique du programme
    FC-760
  • Programme organisé par
    • Centre de Formation Continue en Santé et Sciences de la vie
    • Université libre de Bruxelles
  • Type de titre
    formation continue
  • Accessible en reprise d'études
    oui
  • Type d'horaire
    En journée
  • Langues d'enseignement
    français
  • Durée de la formation
    courte (2 à 5 jours)
  • Campus
    Erasme
  • Catégorie / Thématique
    Sciences et techniques - Sciences/Santé - Sciences biomédicales et pharmaceutiques

Détails

Informations générales

Type de titre

formation continue

Durée de la formation

courte (2 à 5 jours)

Langue(s) d'enseignement

français

Type d'horaire

En journée

Campus

Erasme

Catégorie(s) - Thématique(s)

Sciences et techniques - Sciences/Santé - Sciences biomédicales et pharmaceutiques

Faculté(s) et université(s) organisatrice(s) Accessible en reprise d'études

oui

Intervenant

  • Philippe Collart, MPH PhD (ULB, Ecole de Santé Publique)

Contacts

02 555 89 95

Plus d'information sur : https://biops.helsci.be/formations/

Présentation

  • Brève introduction à la mise en évidence de valeurs aberrantes
  • Expliquer les 3 types de données manquantes
  • Analyse descriptive et imputation des données manquantes à l’aide du logiciel R. La formation se focalisera essentiellement sur l’imputation des données quantitatives

En journée

4 sessions de 3 heures :
  • Lu 08/11 de 10h à 13h
  • Me 10/11 de 13h à 16h
  • Lu 15/11 de 10h à 13h
  • & Me 17 /11 de 13h à 16h

Calendrier & inscriptions

Calendrier & inscriptions

Programme

Contenu du programme : 

  • Mise en évidence de valeurs aberrantes (Grubbs’s test et Mahalanobis distance)
  • Théorie sur les types de données manquantes (MCAR, MAR, et MNAR).
  • Analyse descriptive des données manquantes par variable (package VIM)
  • Imputation des données manquantes par la moyenne, par corrélation entre variables.
  • Imputation simple et multiple par PCA, Random Forest, … (package missMDA et missForest).
  • Vérification de la qualité de l’imputation multiple par PCA
  • Brève introduction aux autres packages Mice et Amelia
  • Génération aléatoire de données manquantes et vérification de la qualité de l’imputation

Méthodologie :

  • 20 % théorique
  • 80 % exercices