1. Accueil
  2. FR
  3. Étudier
  4. Offre de formation
  5. UE
STIC-B545

Traitement automatique de corpus

année académique
2024-2025

Titulaire(s) du cours

Max DE WILDE (Coordonnateur)

Crédits ECTS

5

Langue(s) d'enseignement

français

Contenu du cours

Le cours comprendra les éléments suivants: méthodes et outils divers pour la création d’un corpus textuel, notamment dans le contexte du Web; introduction à Python et NLTK pour la transformation de données; usage de diverses méthodes de type “machine learning”, à la fois supervisées (p. ex. linear regression) et non-supervisées (Word2Vec, Topic Modeling) pour la classification de l’information et l’extraction de concepts.

Objectifs (et/ou acquis d'apprentissages spécifiques)

Fournir à l'étudiant les connaissances conceptuelles et techniques en matière de gestion de corpus textuels numériques.

Méthodes d'enseignement et activités d'apprentissages

Combinaison d'exposés "ex cathedra" et de travaux pratiques.

Contribution au profil d'enseignement

Cet enseignement permet d'appréhender le traitement de corpus structurés et non-structurés de manière automatisée. Il complémente les autres cours du Master en STIC en se focalisant plus particulièrement sur la gestion de larges collections de documents textuels via des méthodes programmatiques.

Références, bibliographie et lectures recommandées

Le support de cours, disponible sur l'UV, propose des références bibliographiques.

Support(s) de cours

  • Université virtuelle

Autres renseignements

Contacts

Max De Wilde (max.de.wilde@ulb.be)

Campus

Solbosch

Evaluation

Méthode(s) d'évaluation

  • Travail pratique
  • Examen oral
  • Rapport écrit

Travail pratique

Examen oral

Rapport écrit

Construction de la note (en ce compris, la pondération des notes partielles)

50% pour l'examen oral, et 50% pour les travaux pratiques (y compris le rapport final)

Langue(s) d'évaluation

  • français
  • (éventuellement anglais )

Programmes