Stage de Master 2

INTITULÉ DU STAGE : EXTRACTION ET ANALYSE D’INFORMATION A PARTIR DES RESEAUX SOCIAUX : APPLICATION AUX DONNEES DU PARC NATIONAL DES CALANQUES.

 

A partir d’un corpus déjà constitué (sites web et tweets), il s’agit de réaliser une analyse semi-automatique des contenus des tweets afin d’identifier les entités nommés (organisation, personnes et lieux) et les thématiques abordées dans le texte des tweets. Plus précisément, le stage consistera à intégrer et enrichir des chaines traitement automatique pour :

  • Extraire des entités nommées à partir de listes préalablement fournies d’acteurs et de lieux et en se basant sur la méthode décrite dans (Zenasni et al., 2016) qui permet l’extraction de nouvelles formes de lieux dans les messages courts ;
  • Extraire des thématiques en se basant sur des approches fouilles de textes (Pak et al. 2014) ;
  • Evaluer les résultats obtenus ;
  • Réaliser différentes analyses qualitatives et quantitatives sur les résultats obtenus et notamment répondre aux questions suivantes : Quels sont les acteurs qui s’expriment sur ces lieux/sujets ? Quelles sont les relations entre ces acteurs ? Quelles sont les évolutions observées selon différentes temporalités ?
  • Participer au travail de valorisation des résultats en enrichissant le site Web du projet (en cours de construction). 

 

OFFRE DE STAGE MASTER 2 (avril 2017-août 2017)