Gaze Estimation Using Neural Network And Logistic Regression
Description
Abstract Currently, a large number of mature methods are available for gaze estimation. However, most regular gaze estimation approaches require additional hardware or platforms with professional equipment for data collection or computing that typically involve high costs and are relatively tedious. Besides, the implementation is particularly complex. Traditional gaze estimation approaches usually require systematic prior knowledge or expertise for practical operations. Moreover, they are primarily based on the characteristics of pupil and iris, which uses pupil shapes or infrared light and iris glint to estimate gaze, requiring high-quality images shot in special environments and other light source or professional equipment. We herein propose a two-stage gaze estimation method that relies on deep learning methods and logistic regression, which can be applied to various mobile platforms without additional hardware devices or systematic prior knowledge. A set of automatic and fast data collection mechanism is designed for collecting gaze images through a mobile platform camera. Additionally, we propose a new annotation method that improves the prediction accuracy and outperforms the traditional gridding annotation method. Our method achieves good results and can be adapted to different applications.
Translated Descriptions
Translated Description (Arabic)
الملخص في الوقت الحالي، يتوفر عدد كبير من الطرق الناضجة لتقدير النظرة. ومع ذلك، تتطلب معظم مناهج تقدير النظرة المنتظمة أجهزة أو منصات إضافية مزودة بمعدات احترافية لجمع البيانات أو الحوسبة التي تنطوي عادةً على تكاليف عالية وتكون مملة نسبيًا. إلى جانب ذلك، فإن التنفيذ معقد بشكل خاص. عادة ما تتطلب مناهج تقدير النظرة التقليدية معرفة أو خبرة مسبقة منهجية للعمليات العملية. علاوة على ذلك، فهي تعتمد في المقام الأول على خصائص الحدقة والقزحية، والتي تستخدم أشكال الحدقة أو ضوء الأشعة تحت الحمراء ولمعان القزحية لتقدير النظرة، مما يتطلب صورًا عالية الجودة يتم التقاطها في بيئات خاصة ومصدر ضوء آخر أو معدات احترافية. نقترح هنا طريقة تقدير النظرة على مرحلتين تعتمد على أساليب التعلم العميق والانحدار اللوجستي، والتي يمكن تطبيقها على منصات متنقلة مختلفة دون أجهزة إضافية أو معرفة مسبقة منهجية. تم تصميم مجموعة من آليات جمع البيانات التلقائية والسريعة لجمع صور النظرة من خلال كاميرا منصة متنقلة. بالإضافة إلى ذلك، نقترح طريقة تعليق توضيحي جديدة تعمل على تحسين دقة التنبؤ وتتفوق على طريقة التعليق التوضيحي التقليدية للشبكة. يحقق أسلوبنا نتائج جيدة ويمكن تكييفه مع التطبيقات المختلفة.Translated Description (French)
Résumé Actuellement, un grand nombre de méthodes matures sont disponibles pour l'estimation du regard. Cependant, la plupart des approches d'estimation de regard régulières nécessitent du matériel ou des plates-formes supplémentaires avec un équipement professionnel pour la collecte de données ou l'informatique qui impliquent généralement des coûts élevés et sont relativement fastidieuses. Par ailleurs, la mise en œuvre est particulièrement complexe. Les approches traditionnelles d'estimation du regard nécessitent généralement des connaissances ou une expertise préalables systématiques pour des opérations pratiques. De plus, ils sont principalement basés sur les caractéristiques de la pupille et de l'iris, qui utilisent les formes de la pupille ou la lumière infrarouge et la lueur de l'iris pour estimer le regard, nécessitant des images de haute qualité prises dans des environnements spéciaux et d'autres sources de lumière ou équipements professionnels. Nous proposons ici une méthode d'estimation du regard en deux étapes qui repose sur des méthodes d'apprentissage en profondeur et de régression logistique, qui peut être appliquée à diverses plates-formes mobiles sans dispositifs matériels supplémentaires ni connaissances préalables systématiques. Un ensemble de mécanismes de collecte de données automatiques et rapides est conçu pour collecter des images de regard via une caméra de plate-forme mobile. De plus, nous proposons une nouvelle méthode d'annotation qui améliore la précision de la prédiction et surpasse la méthode d'annotation de maillage traditionnelle. Notre méthode donne de bons résultats et peut être adaptée à différentes applications.Translated Description (Spanish)
Resumen Actualmente, hay un gran número de métodos maduros disponibles para la estimación de la mirada. Sin embargo, la mayoría de los enfoques regulares de estimación de la mirada requieren hardware o plataformas adicionales con equipos profesionales para la recopilación de datos o la computación que generalmente implican altos costos y son relativamente tediosos. Además, la implementación es particularmente compleja. Los enfoques tradicionales de estimación de la mirada generalmente requieren conocimientos previos sistemáticos o experiencia para operaciones prácticas. Además, se basan principalmente en las características de la pupila y el iris, que utilizan las formas de la pupila o la luz infrarroja y el brillo del iris para estimar la mirada, lo que requiere imágenes de alta calidad tomadas en entornos especiales y otras fuentes de luz o equipos profesionales. En este documento proponemos un método de estimación de la mirada en dos etapas que se basa en métodos de aprendizaje profundo y regresión logística, que se puede aplicar a varias plataformas móviles sin dispositivos de hardware adicionales o conocimiento previo sistemático. Un conjunto de mecanismos de recopilación de datos automáticos y rápidos está diseñado para recopilar imágenes de la mirada a través de una cámara de plataforma móvil. Además, proponemos un nuevo método de anotación que mejora la precisión de la predicción y supera el método de anotación de cuadrícula tradicional. Nuestro método logra buenos resultados y se puede adaptar a diferentes aplicaciones.Files
bxab043.pdf.pdf
Files
(93 Bytes)
Name | Size | Download all |
---|---|---|
md5:b0d506893d4802090edf1644f5f082cd
|
93 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- تقدير النظرة باستخدام الشبكة العصبية والانحدار اللوجستي
- Translated title (French)
- Estimation du gaze à l'aide du réseau neuronal et de la régression logistique
- Translated title (Spanish)
- Estimación de la mirada utilizando la red neuronal y la regresión logística
Identifiers
- Other
- https://openalex.org/W3163211053
- DOI
- 10.1093/comjnl/bxab043
References
- https://openalex.org/W1517003397
- https://openalex.org/W1765423497
- https://openalex.org/W1995804330
- https://openalex.org/W1998270668
- https://openalex.org/W2013112874
- https://openalex.org/W2034382626
- https://openalex.org/W2053946567
- https://openalex.org/W2059916030
- https://openalex.org/W2077819131
- https://openalex.org/W2089734092
- https://openalex.org/W2118115984
- https://openalex.org/W2160951686
- https://openalex.org/W2163605009
- https://openalex.org/W2167020116
- https://openalex.org/W2396504611
- https://openalex.org/W2598912124
- https://openalex.org/W2598992495
- https://openalex.org/W2788425872
- https://openalex.org/W2794284562
- https://openalex.org/W2904509106