Exploratory analysis of the hypertext structure linked to diabetes - Laboratoire d'Informatique Médicale et Ingénierie des Connaissances en e-Santé Accéder directement au contenu
Thèse Année : 2020

Exploratory analysis of the hypertext structure linked to diabetes

Analyse exploratoire de la structure hypertextuelle liée au diabète

Résumé

Diabetes as a chronic disease requires continuous medical care and constant patient self-management which involve several stakeholders to improve health outcome. This manuscript makes use of World Wide Web network analysis to highlight how stakeholders, providing information about online diabetes communities, link to each other. Thanks to combined state-of-art tools to crawl and visualize topic-sensitive networks, we created DiaMap which includes 430 diabetes-related websites. Then we apply a community detection algorithm of DiaMap. In the end, a color map is associated to the 5 discovered communities class are presented. For better understanding the common interest shared by the same clusters, each website in DiaMap has been annotated using semantic tags. After we employing the machine learning to study which combinations of tags can predict or explain the clusters, we found the community can have a tagging scheme occasionally but it is still hard to use semantical approach to predict accurately the clusters. Last but not least, DiaMap can enrich and complete information retrieval on diabetes based on the current serach engines. We evaluate this though comparing the results provided by querying DiaMap and 4 traditional Search Engines with 5 given questions. DiaMap presents the map-like information visualization of diabetes-related websites to show the picture of diabetes in a digital world. Different from traditional search engines, DiaMap presents the whole picture and uses tags to identify the relevant websites. It somehow changes the way of navigating online diabetes information and could be an alternative or complementary way to retrieve the information online.
Le diabète en tant que maladie chronique nécessite des soins médicaux continus et une autogestion constante impliquant la mobilisation de plusieurs acteurs afin d’améliorer l’état de santé et la qualité de vie des patients. Ce manuscrit utilise l'analyse du réseau Internet pour mettre en évidence la façon dont les acteurs du diabète en ligne, sont liés les uns aux autres. Grâce à la combinaison d’outils d’exploration et de visualisation des réseaux, nous avons créé DiaMap référençant 430 sites Web liés au diabète. Nous appliquons un algorithme de détection de communauté visant à identifier les nœuds de DiaMap ayant des similitudes. Une carte permet de représenter les 5 communautés découvertes. Pour mieux comprendre les intérêts partagés au sein d’une même communauté, chaque site Web de DiaMap a été annoté à l'aide de balises sémantiques. Après avoir utilisé l'apprentissage automatique pour étudier les combinaisons de balises pouvant predire ou expliquer les communautés, nous avons constaté que la communauté peut présenter un schéma de marquage, mais il reste difficile d'utiliser une approche sémantique pour prédire ces communautés. Enfin, DiaMap peut enrichir la recherche d'informations sur le diabète. Nous évaluons cela en comparant les résultats fournis en interrogeant DiaMap avec les résultats des 4 moteurs de recherche traditionnels sur 5 questions données. DiaMap présente une cartographie des sites web lies au diabète permettant de visualiser l'image de la pathologie dans un monde numérique. Grace à ses balises DiaMap modifie la façon de naviguer au sein des sites web sur le diabète et pourrait être un moyen alternatif ou complémentaire de recherche d’information.
Fichier principal
Vignette du fichier
SHI_Hongyi_2020.PDF (5.29 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03609140 , version 1 (15-03-2022)

Identifiants

  • HAL Id : tel-03609140 , version 1

Citer

Hongyi Shi. Exploratory analysis of the hypertext structure linked to diabetes. Human health and pathology. Sorbonne Université, 2020. English. ⟨NNT : 2020SORUS391⟩. ⟨tel-03609140⟩
136 Consultations
312 Téléchargements

Partager

Gmail Facebook X LinkedIn More