Sélection des concepts et calcul de proximité sémantique pour réduire le silence dans la recherche d'images par le texte : vers des moteurs qui se configurent automatiquement

Debbagh, Farah (2017) Sélection des concepts et calcul de proximité sémantique pour réduire le silence dans la recherche d'images par le texte : vers des moteurs qui se configurent automatiquement. Doctoral thesis, UNIVERSITE DE MOHAMED KHIDER BISKRA.

Preview

Text
These de Doctorat de farah DEBBAGH.pdf
Download (2MB) | Preview

Abstract

Dans la recherche d’images par le texte, la comparaison binaire est une technique qui retrouve pour une requête basée-concept , les images annotées avec . Par conséquent, la performance du système de recherche est très influencée par la qualité d’annotation. Comme il est extrêmement difficile d'avoir une base d’images bien annotée, la recherche ignore de nombreuses images pertinentes parce que tout simplement elles ne sont pas annotées avec les concepts de la requête. Ce problème est communément appelé le silence. Il dégrade considérablement les performances de TBIR. L’objectif principal de cette thèse est de minimiser un tel problème, et par conséquent obtenir une performance supérieure dans les systèmes TBIR. Nous proposons un système TBIR qui intègre la proximité sémantique entre les concepts au sein de la recherche. Pour calculer la proximité sémantique entre les concepts, nous avons utilisé un ensemble d’articles Wikipedia comme source de connaissances externes, le schéma de pondération statistique TF_ICTF (Term Frequency_ Inverse Collection Term Frequency en anglais) et la mesure de similarité cosinus. Par la suite, les résultats de proximité sémantique sont intégrés au sein du mécanisme de recherche. Autrement dit, nous avons calculé la pertinence de chaque image en fonction des valeurs de proximité sémantique entre ses concepts d’annotation et la requête utilisateur. La méthode proposée présente de nombreux avantages. Elle est entièrement automatique, car aucune intervention humaine n'est requise. En outre, elle peut être appliquée soit dans la phase de recherche pour détecter plus d’images pertinentes, ou bien dans la phase d’annotation pour détecter et compléter des concepts pertinents manquants. De plus, la méthode statistique que nous avons adoptée pour calculer la proximité sémantique entre les concepts se caractérise par sa simplicité et sa performance. Elle est plus simple par rapport aux méthodes graphiques probabilistes, et plus performante que d’autres méthodes statistiques. Les résultats expérimentaux ont montré que la méthode proposée a atteint une grande précision dans la détection d’images pertinentes. En outre, la méthode proposée a montré sa performance par rapport à la comparaison binaire et d’autres travaux existants.

Item Type:	Thesis (Doctoral)
Uncontrolled Keywords:	Recherche d’images par le texte, annotation, silence, TF_ICTF, similarité cosinus, proximité sémantique, articles Wikipedia, coefficient de corrélation de Pearson, WordSimilarity-353
Subjects:	Q Science > QA Mathematics > QA76 Computer software
Divisions:	Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie > Département d'informatique
Depositing User:	BFSE
Date Deposited:	16 Apr 2018 09:16
Last Modified:	16 Apr 2018 09:16
URI:	http://thesis.univ-biskra.dz/id/eprint/3442

Actions (login required)

View Item