Découverte et enrichissement de connaissances à partir de textes pour la recherche d’experts - Laboratoire d'Informatique de Paris-Nord Accéder directement au contenu
Thèse Année : 2021

Knowledge discovery and enrichment from texts for expert finding

Découverte et enrichissement de connaissances à partir de textes pour la recherche d’experts

Résumé

Expert finding consists in the identification of a set of individuals who are considered tobe experts in a particular topic. This is an essential problem in the academic world. Indeed,it is constantly necessary to identify suitable researchers when setting up reading orevaluation committees for research projects, for example. Indeed, it is particularly useful toautomatically identify experts on a specific field from the scientific literature. We suggestan approach for knowledge discovery and enrichment based on a semantic annotation ofscientific articles, on their representation in the form of scientific collaboration networksand their exploration using a graph abstraction method. This method makes it possibleto focus on dense areas of networks and to discover experts and their associated expertiseusing connectivity constraints. The latter make it possible to take into account a validationby peers, materialized by the density of scientific collaboration relations that individualsmaintain with each other. We test our approach on a corpus of scientific publications,propose an original method for evaluating our results and compare our performance toexpert research methods implemented in the LT ExpertFinder evaluation framework. Weobtain better performance than the state of the art and discover that the most decisiveindicators of expertise are the writing of highly cited articles but also the ability to citethe appropriate scientific literature
La recherche d’experts consiste en l’identification d’un ensemble d’individus que l’on considère comme experts d’une thématique particulière. Il s’agit d’une problématique essentielle dans le milieu académique. En effet, il est constamment nécessaire d’identifier des chercheurs appropriés lors de la constitution de comités de lecture ou d’évaluation de projets de recherche, par exemple. De même, il est particulièrement utile d’identifier automatiquement les experts d’un domaine de recherche à partir de la littérature scientifique. Nous proposons une approche de découverte et d’enrichissement de connaissances basée sur une annotation sémantique des articles scientifiques, sur leur représentation sous forme de réseaux de collaboration scientifique et leur fouille à l’aide d’une méthode d’abstraction de graphe. Cette méthode permet de se focaliser sur les zones denses des réseaux et de découvrir des experts et leurs expertises associées à l’aide de contraintes de connectivité. Ces dernières permettent de prendre en compte une validation par les pairs, matérialisée par la densité des relations de collaboration scientifique que les individus entretiennent entre eux. Nous expérimentons notre approche sur un corpus de publications scientifiques, proposons une méthode d’évaluation originale de nos résultats et comparons nos performances aux méthodes de recherche d’experts implémentées dans le cadre d’évaluation LT ExpertFinder. Nous obtenons des performances supérieures à l’état de l’art et découvrons que les indicateurs d’expertise les plus déterminants sont la rédaction d’articles fortement cités mais également la capacité à citer la littérature scientifique appropriée
Fichier principal
Vignette du fichier
edgalilee_th_2021_zevio.pdf (2.39 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03425132 , version 1 (10-11-2021)

Identifiants

  • HAL Id : tel-03425132 , version 1

Citer

Stella Zevio. Découverte et enrichissement de connaissances à partir de textes pour la recherche d’experts. Recherche d'information [cs.IR]. Université Paris-Nord - Paris XIII, 2021. Français. ⟨NNT : 2021PA131019⟩. ⟨tel-03425132⟩
117 Consultations
165 Téléchargements

Partager

Gmail Facebook X LinkedIn More