STAT 4.1 - Analyse de données RNA-seq sous Galaxy

Accroche introductive

Utiliser une plateforme de gestion de données open-source pour traiter et analyser des données génomiques...

Accéder aux sections de la fiche

Call to actions

  • Intitulé du programme
    STAT 4.1 - Analyse de données RNA-seq sous Galaxy
  • mnémonique du programme
    FC-682
  • Programme organisé par
    • Centre de Formation Continue en Santé et Sciences de la vie
    • Université libre de Bruxelles
  • Type de titre
    formation continue
  • Accessible en reprise d'études
    oui
  • Durée de la formation
    courte (2 à 5 jours)
  • Campus
    Charleroi Gosselies
  • Catégorie / Thématique
    Sciences et techniques - Sciences/Santé - Sciences biomédicales et pharmaceutiques/Santé - Sciences médicales/Santé - Sciences de la santé publique
  • Complément
    Marie Lebacq
    Biostatisticienne
    Ingénieure de formation ULB HeLSci - BIOPS

Détails

Informations générales

Type de titre

formation continue

Durée de la formation

courte (2 à 5 jours)

Campus

Charleroi Gosselies

Catégorie(s) - Thématique(s)

Sciences et techniques - Sciences/Santé - Sciences biomédicales et pharmaceutiques/Santé - Sciences médicales/Santé - Sciences de la santé publique

Faculté(s) et université(s) organisatrice(s) Accessible en reprise d'études

oui

Tarifs

  • Doctorant ULB : 300 €
  • Secteur public / ASBL : 500 €
  • Entreprise : 700 €

FF

Intervenant & coordination

Intervenant
Matthieu Defrance PhD
Computer Science (Université de Lille)
Professeur (ULB) Senior Researcher at IB2

Coordination
Marie Lebacq
Biostatisticienne
Ingénieure de formation ULB HeLSci - BIOPS
 

Contacts

Besoin d'aide pour vous inscrire, contactez-nous par téléphone ou envoyez-nous un email.

Toute l'équipe de ULB HeLSci est à votre disposition !

Aides (bourses, chèques formations...)

Possibilité d’obtenir une bourse « Chercheur d’emploi » ou « Doctorant ULB », sur base d’une demande motivée, après avoir complété votre dossier d’admission. Une bourse maximum par personne.

Présentation

Connaître les principales méthodes et outils d’analyse des données RNA-seq et pouvoir les mettre en œuvre via l’interface web Galaxy.

Galaxy a pour objectif de rendre la bio-informatique accessible aux chercheurs n'ayant pas de compétence en programmation informatique. Originellement développée pour la recherche en génomique, elle est maintenant largement employée comme un système bio-informatique général de gestion de données.

En journée

  • 2 journées de formation
    • Le 03/12/19
    • Le 04/12/19
  • De 9h15 à 17h00

Calendrier & inscriptions

Pré-requis

Public ciblé

  • Biologistes, responsables de projets, chercheurs du secteur biotechnologique qui sont amenés à réaliser des expériences de RNA-seq
  • 12 personnes maximum

Calendrier & inscriptions

BESOIN D'AIDE POUR VOUS INSCRIRE ?

Contactez-nous par téléphone au 02/555 85 17 ou envoyez-nous un email à l'adresse suivante helsci@ulb.be.

Toute l'équipe de ULB HeLSci est à votre disposition

Programme

PROGRAMME

Introduction 

  • Introduction au NGS et plateformes technologiques
  • Introduction à l’analyse de données NGS
  • Formats de fichiers (e.g FASTA, FASTQ, SAM, BAM)
  • Les banque de données et l’archivage des données
  • Présentation détaillée de Galaxy

En pratique

  • Exploration de banques de données
  • Chargement des données dans Galaxy
  • Contrôle qualité des données

RNA-SEQ

  • Rappel sur l’ARN et l’expression
  • Questions biologiques
    • Quantification de l’expression
    • Expression différentielle
    • Splicing alternatif
    • Découverte de nouveau transcrits
    • mRNA, ncRNA
  • Protocol expérimental RNA-seq
  • Design expérimental
    • Échantillon control & réplicas
    • Stratégie de conception de la librairie (longueurs des séquences, profondeur de séquençage, déplétion des ARN ribosomiques, séquençage orienté…)

En pratique

  • Importation d’une série de données dans Galaxy. Utilisation des collections.
  • Contrôle qualité d’une collection de données et prétraitement.

Analyse de données RNA-SEQ

  • Alignement des séquences sur un génome de référence
    • STAR, Tophat, HITSAT2
  • Construction d’un assemblage de novo
    • Trinity
  • Quantification des transcrits
    • HTSeq
  • Alignement sur transcriptome et quantification
    • Salmon
  • Notions de statistiques essentielles pour les analyses de données de séquences haut-débit
    • Distribution Poisson et binomiale négative
    • Corrections tests multiples
  • Expression différentielle
    • DESeq2, EdgeR
    • Représentation graphique des résultats (Volcano plot, heatmap)
  • Étude des variants d’épissage

A. En pratique – RNA-seq – Des reads au comptages

  • Alignement des reads sur génome de référence
  • QC des reads alignés
  • Couverture
  • Quantification de l’expression

B. En pratique : RNA-seq et et expression différentielle

  • Filtrage des gènes faiblement exprimés
  • Normalisation de l’expression
  • Analyse multivariée et visualisation des échantillons
  • Contrôle de la distribution de l’expression
  • Identification des gènes différentiellement exprimés
  • Visualisation des résultats
 

MÉTHODOLOGIE

  • 60% de théorie
  • 40% de pratique