MOKEDDEM, Mohammed Lakhdar (2025) Deep Learning pour la Localisation et Détection pour l’Imagerie. Doctoral thesis, Faculté des sciences et technologie.
![]() |
Text
PhD these mokeddem.pdf Download (5MB) |
Abstract
Cette thèse traite du problème de détection et de localisation d'objets basé sur des techniques d'apprentissage profond. La détection et la localisation d'objets sont des tâches essentielles en vision par ordinateur, applicables à la conduite autonome, à la surveillance, à l'imagerie médicale et à la robotique. La détection d'objets implique la reconnaissance de l'existence d'objets dans une image ou une vidéo. En revanche, la localisation consiste à déterminer les coordonnées spatiales exactes de ces éléments, généralement représentées par des cadres de délimitation ou des masques de segmentation. Les progrès récents dans l'apprentissage profond, en particulier les réseaux de neurones convolutifs et les architectures basées sur des transformateurs, ont considérablement amélioré la précision et l'efficacité de ces tâches. Des techniques telles que les CNN régionaux, YOLO et SSD sont devenues des méthodes de pointe pour la détection et la localisation d'objets. Ces approches exploitent des ensembles de données à grande échelle, tels que COCO et VOC. Dans ce travail, nous proposons deux modèles, le premier est un nouveau détecteur de masque facial à une étape haute performance basé sur YOLOv4 appelé le détecteur Yolov4FaceMask. Le second est un nouveau détecteur et traqueur de masque facial à deux étages hautes performances avec une caméra monoculaire et un cadre basé sur l'apprentissage en profondeur pour automatiser la tâche de localisation, de détection et de suivi du masque facial à l'aide de séquences vidéo. De plus, nous proposons un nouvel ensemble de données de détection de masque facial composé de 18 000 images avec plus de 30 000 cadres de délimitation serrés et des annotations pour trois étiquettes de classe différentes, à savoir : visage masqué/incorrectement masqué/non masqué. Nous nous basons sur le modèle de détection d'objets Scaled-YOLOv4 pour former le détecteur YOLOv4-P6-FaceMask et le suivi simple en ligne et en temps réel avec une approche de métrique d'association profonde pour le suivi des visages. Nous suggérons d'utiliser DeepSORT pour suivre les visages par attribution d'ID pour enregistrer les visages une seule fois et créer une base de données de visages non masqués. YOLOv4-P6-FaceMask est un modèle de haute précision qui atteint une précision moyenne moyenne de 93 %, un rappel moyen moyen de 92 % et une vitesse en temps réel de 35 ips sur une seule carte graphique GPU Tesla-T4 sur notre ensemble de données proposé. Pour démontrer les performances du modèle proposé, nous comparons les résultats de détection et de suivi avec d'autres modèles de pointe populaires de détection et de suivi des masques faciaux.
Item Type: | Thesis (Doctoral) |
---|---|
Uncontrolled Keywords: | : Identification ; Apprentissage Profond ; Détection ; Localisation ; Descripteurs ; Optimisation |
Subjects: | T Technology > TK Electrical engineering. Electronics Nuclear engineering |
Divisions: | Faculté des Sciences et de la technologie > Département de Génie Electrique |
Depositing User: | Mr. Mourad Kebiel |
Date Deposited: | 01 Jun 2025 08:46 |
Last Modified: | 01 Jun 2025 08:46 |
URI: | http://thesis.univ-biskra.dz/id/eprint/6902 |
Actions (login required)
![]() |
View Item |