Khebbache, Mohib Eddine (2024) Les systèmes de détection d’objets dans le cadre d’un environnement routier. Doctoral thesis, Université Mohamed Khider (Biskra - Algérie).
Text
Thesis_Doctorate in Sciences_CS_Khebbache_FinalVersion.pdf Download (4MB) |
Abstract
La détection d’objets est devenue une composante critique de la perception pour la sécurité dans la conduite autonome. Les progrès en matière de détection d’objets dans les systèmes de conduite automatisée (ADS) sont largement dus au succès des réseaux neuronaux convolutifs (CNN). Cependant, l’apprentissage supervisé passif d’un modèle profond de détection d’objets est coûteux en termes de calcul et nécessite de grandes quantités de données annotées pour couvrir les divers objets et scénarios présents dans les environnements véhiculaires. Cela pose des problèmes en raison de la similarité et de la variabilité visuelles des objets ainsi que du coût de l’étiquetage. Par conséquent, l’acquisition de ces données est un processus long et coûteux, nécessitant souvent l’intervention d’experts pour annoter manuellement des boîtes englobantes de haute qualité. En outre, pour garantir la sécurité fonctionnelle des ADS, des détecteurs d’objets robustes sont indispensables, en particulier dans les situations critiques rencontrées dans ces environnements. Dans ce contexte, le principal défi consiste à atteindre la performance souhaitée en utilisant efficacement un petit ensemble de données étiquetées, tout en équilibrant soigneusement le compromis entre le coût et la précision. Pour répondre à ces enjeux, cette thèse propose et conçoit deux contributions pour la détection d’objets dans la conduite autonome, en tenant compte de leurs caractéristiques et défis : une stratégie de sélection par lots et un cadre d’apprentissage actif profond à coût-effectif (CEDBMAL). Ces solutions visent à concevoir un détecteur d’objets basé sur des CNNs robustes, tout en réduisant les coûts liés à leur développement et à leur déploiement. Contrairement à la stratégie de sélection à critère unique, qui peut sélectionner un échantillon redondant ou aberrant susceptible d’affecter les performances du détecteur, notre stratégie de sélection par lots choisit automatiquement un lot d’échantillons les mieux classés sur la base de critères d’incertitude et de diversité. Ces échantillons sont plus représentatifs, plus informatifs et permettent d’entraîner plus efficacement le détecteur. Pour adapter l’heuristique d’incertitude de la classification à la détection d’objets, nous proposons d’incorporer les prédictions de classification et de régression dans la mesure de l’incertitude, en soutenant que les échantillons induisant de l’incertitude dans le modèle ne sont pas des valeurs aberrantes, mais plutôt des instances présentant une distributio d’objets plus large, susceptibles d’améliorer ses performances. Pour éviter la charge d’annotation liée aux échantillons redondants, nous proposons également l’utilisation de la distance euclidienne comme mesure de représentativité, quantifiant la diversité entre instances en termes de similarité. Afin de pallier les limites liées à la taille des lots, la deuxième proposition (CEDBMAL) combine notre stratégie proposée avec la prédiction du temps d’étiquetage pour concevoir une stratégie consciente des coûts. Initialement, un ensemble de lots de tailles variées est sélectionné par la stratégie proposée. Ensuite, nous proposons d’utiliser la prédiction du temps d’étiquetage et la programmation dynamique pour résoudre le problème de sélection du lot de taille optimale, comme un problème de sac à dos 0-1, sous les contraintes de temps d’annotation, de la taille de l’ensemble de données et des performances souhaitées. Ce processus itératif permet une sélection adaptative des échantillons d’entraînement les plus utiles et diversifiés en fonction du coût de l’étiquetage. En conséquence, il devient possible de gérer efficacement la variation des coûts d’annotation et de réduire de manière significative les coûts liés aux processus d’entraînement et d’étiquetage, tant au niveau de l’instance individuelle que du lot. Pour valider nos approches, des expériences approfondies ont été menées sur l’ensemble de données Caltech Pedestrian afin de fine-tuner un détecteur d’objets profond pré-entraîné (Tiny-YOLOv3) pour la tâche de détection des piétons. Les effets de l’incertitude de la classification, de l’incertitude de la régression, des méthodes d’agrégation des scores et de la taille du lot lors de la sélection des échantillons ont également été étudiés. Les résultats expérimentaux ont montré que l’apprentissage actif profond à coût uniforme, basé sur notre stratégie de sélection par lots, surpasse l’échantillonnage aléatoire et les approches de transfert d’apprentissage. En outre, notre approche DAL à coût effectif a amélioré les performances par rapport à d’autres détecteurs de piétons profonds de référence et aux approches DAL à coût uniforme utilisant un détecteur de piétons profond spécifique. En particulier, nos approches ont permis le développement d’un détecteur de piétons robuste avec beaucoup moins de paramètres, adapté au déploiement sur des appareils à faibles ressources, tout en maintenant un taux d’erreur de détection en dessous de 57 %, économisant jusqu’à 50 % de l’effort d’étiquetage, augmentant le nombre de piétons détectés dans les premiers cycles et atténuant la dépendance à la taille du lot.
Item Type: | Thesis (Doctoral) |
---|---|
Uncontrolled Keywords: | Conduite autonome, détection d’objets, similarité visuelle, apprentissage actif profond, entraînement à coût-efficace, détection de piétons. |
Subjects: | Q Science > Q Science (General) |
Divisions: | Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie > Département d'informatique |
Depositing User: | BFSE |
Date Deposited: | 15 Oct 2024 07:29 |
Last Modified: | 15 Oct 2024 07:29 |
URI: | http://thesis.univ-biskra.dz/id/eprint/6587 |
Actions (login required)
View Item |