Etude des données génomiques textuelles et factuelles
Discipline qui séquence et compare les génomes de plusieurs espèces pour comprendre leurs points communs et leurs différences sur le plan biologique. L'étude des données génomiques permet d'étudier et de concevoir une nouvelle approche pour explorer dans un cadre immersif (i.e. de réalité virtuelle), des données d’une nature spécifique : les données génomiques. Ces données se présentent sous deux formes : la forme factuelle, c’est-à-dire l’ensemble des données structurées provenant des banques de données biologiques, et la forme textuelle, à savoir l’ensemble des données non structurées présentes dans les millions de publications concernant la génomique. Face à la complexité de ces données, l’enjeu est de proposer des paradigmes d’exploration et d’interaction, qui permettent de couvrir le plus largement possible ces données de nature variée. Ces paradigmes doivent être capables de gérer des données massives, et doivent être adaptés à la fois au cadre immersif et aux besoins des biologistes.
Ainsi sur la base de l’étude des besoins des utilisateurs et de leurs usages, un paradigme de représentation a été défini en utilisant les caractéristiques très spécifiques des banques de données génomiques, et dans lequel la sémantique des données étudiées est traduite par des propriétés visuelles, géométriques, ou topologiques, choisies initialement par l’utilisateur. Un prototype a été implémenté pour tester et valider le paradigme précédemment défini, et plusieurs expériences d’analyse de données génomiques ont été menées en collaboration avec des biologistes ou bioinformaticiens, afin de mesurer la pertinence de cette solution d’exploration, face à plusieurs problématiques d’analyse de données génomiques.