CNN and Fuzzy Rules Based Text Detection and Recognition from Natural Scenes
Description
In today's real world, an important research part in image processing is scene text detection and recognition.Scene text can be in different languages, fonts, sizes, colours, orientations and structures.Moreover, the aspect ratios and layouts of a scene text may differ significantly.All these variations appear assignificant challenges for the detection and recognition algorithms that are considered for the text in natural scenes.In this paper, a new intelligent text detection and recognition method for detectingthe text from natural scenes and forrecognizing the text by applying the newly proposed Conditional Random Field-based fuzzy rules incorporated Convolutional Neural Network (CR-CNN) has been proposed.Moreover, we have recommended a new text detection method for detecting the exact text from the input natural scene images.For enhancing the presentation of the edge detection process, image pre-processing activities such as edge detection and color modeling have beenapplied in this work.In addition, we have generated new fuzzy rules for making effective decisions on the processes of text detection and recognition.The experiments have been directedusing the standard benchmark datasets such as the ICDAR 2003, the ICDAR 2011, the ICDAR 2005 and the SVT and have achieved better detection accuracy intext detection and recognition.By using these three datasets, five different experiments have been conducted for evaluating the proposed model.And also, we have compared the proposed system with the other classifiers such as the SVM, the MLP and the CNN.In these comparisons, the proposed model has achieved better classification accuracywhen compared with the other existing works.
Translated Descriptions
Translated Description (Arabic)
في عالم اليوم الحقيقي، جزء بحثي مهم في معالجة الصور هو اكتشاف نص المشهد والتعرف عليه. يمكن أن يكون نص المشهد بلغات وخطوط وأحجام وألوان وتوجهات وهياكل مختلفة. علاوة على ذلك، قد تختلف نسب العرض إلى الارتفاع وتخطيطات نص المشهد بشكل كبير. تظهر كل هذه الاختلافات تحديات كبيرة لخوارزميات الكشف والتعرف التي يتم أخذها في الاعتبار للنص في المشاهد الطبيعية. في هذه الورقة، طريقة ذكية جديدة للكشف عن النص والتعرف عليه الكشف عن النص من المشاهد الطبيعية والتعرف على النص من خلال تطبيق القواعد الضبابية العشوائية المشروطة المقترحة حديثًا والتي تم دمجها في الشبكة العصبية التفافية (CR - CNN). علاوة على ذلك، أوصينا بطريقة جديدة للكشف عن النص الدقيق من صور المشهد الطبيعي المدخلة. لتعزيز عرض عملية الكشف عن الحافة، تم تطبيق أنشطة المعالجة المسبقة للصور مثل الكشف عن الحافة ونمذجة الألوان في هذا العمل. بالإضافة إلى ذلك، أنشأنا قواعد ضبابية جديدة لاتخاذ قرارات فعالة بشأن عمليات الكشف عن النص والتعرف عليه. تم توجيه التجارب باستخدام مجموعات البيانات المعيارية القياسية مثل و ICDAR 2003 و ICDAR 2011 و ICDAR 2005 و SVT وحققوا دقة أفضل في الكشف عن النص والتعرف عليه. باستخدام مجموعات البيانات الثلاث هذه، تم إجراء خمس تجارب مختلفة لتقييم النموذج المقترح. وأيضًا، قمنا بمقارنة النظام المقترح مع المصنفات الأخرى مثل SVM و MLP و CNN. في هذه المقارنات، حقق النموذج المقترح دقة تصنيف أفضل عند مقارنته بالأعمال الحالية الأخرى.Translated Description (French)
Dans le monde réel d'aujourd' hui, une partie importante de la recherche dans le traitement d'image est la détection et la reconnaissance de texte de scène. Le texte de scène peut être dans différentes langues, polices, tailles, couleurs, orientations et structures. De plus, les rapports d'aspect et les mises en page d'un texte de scène peuvent différer considérablement. Toutes ces variations apparaissent comme des défis importants pour les algorithmes de détection et de reconnaissance qui sont considérés pour le texte dans les scènes naturelles. Dans cet article, une nouvelle méthode intelligente de détection et de reconnaissance de texte pour détecter le texte à partir de scènes naturelles et reconnaître le texte en appliquant les règles floues basées sur le champ aléatoire conditionnel nouvellement proposées incorporées dans le réseau neuronal convolutionnel (CR-CNN ).En outre, nous avons recommandé une nouvelle méthode de détection de texte pour détecter le texte exact à partir des images de scène naturelles d'entrée.Pour améliorer la présentation du processus de détection des contours, des activités de prétraitement des images telles que la détection des contours et la modélisation des couleurs ont été appliquées dans ce travail.En outre, nous avons généré de nouvelles règles floues pour prendre des décisions efficaces sur les processus de détection et de reconnaissance de texte.Les expériences ont été dirigées en utilisant les ensembles de données de référence standard tels que l'ICDAR 2003, l'ICDAR 2011, l'ICDAR 2005 et le SVT et ont obtenu une meilleure précision de détection dans la détection et la reconnaissance du texte. En utilisant ces trois ensembles de données, cinq expériences différentes ont été menées pour évaluer le modèle proposé. Et aussi, nous avons comparé le système proposé avec les autres classificateurs tels que le SVM, le MLP et le CNN.Dans ces comparaisons, le modèle proposé a obtenu une meilleure précision de classification par rapport aux autres travaux existants.Translated Description (Spanish)
En el mundo real actual, una parte importante de la investigación en el procesamiento de imágenes es la detección y el reconocimiento de texto de escena. El texto de escena puede estar en diferentes idiomas, fuentes, tamaños, colores, orientaciones y estructuras. Además, las relaciones de aspecto y los diseños de un texto de escena pueden diferir significativamente. Todas estas variaciones parecen desafíos significativos para los algoritmos de detección y reconocimiento que se consideran para el texto en escenas naturales. En este documento, un nuevo método inteligente de detección y reconocimiento de texto para se ha propuesto la detección del texto de escenas naturales y el reconocimiento del texto mediante la aplicación de las reglas borrosas basadas en campos aleatorios condicionales recientemente propuestas incorporadas a la red neuronal convolucional (CR-CNN). Además, hemos recomendado un nuevo método de detección de texto para detectar el texto exacto de las imágenes de escena natural de entrada. Para mejorar la presentación del proceso de detección de bordes, se han aplicado actividades de preprocesamiento de imágenes como la detección de bordes y el modelado de color en este trabajo. Además, hemos generado nuevas reglas borrosas para tomar decisiones efectivas sobre los procesos de detección y reconocimiento de texto. Los experimentos se han dirigido utilizando los conjuntos de datos de referencia estándar, como el ICDAR 2003, el ICDAR 2011, el ICDAR 2005 y el SVT y han logrado una mejor precisión de detección, detección y reconocimiento de textos. Al utilizar estos tres conjuntos de datos, se han realizado cinco experimentos diferentes para evaluar el modelo propuesto. Y también, hemos comparado el sistema propuesto con los otros clasificadores como el SVM, el MLP y el CNN. En estas comparaciones, el modelo propuesto ha logrado una mejor precisión de clasificación en comparación con los otros trabajos existentes.Files
TSP_CSSE_23308.pdf.pdf
Files
(674.9 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:046dd0a71748edcc97eb264b99d8919f
|
674.9 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- سي إن إن وقواعد غامضة للكشف عن النص والتعرف عليه من المشاهد الطبيعية
- Translated title (French)
- Détection et reconnaissance de texte basées sur CNN et les règles floues à partir de scènes naturelles
- Translated title (Spanish)
- Detección y reconocimiento de texto basado en reglas difusas y CNN a partir de escenas naturales
Identifiers
- Other
- https://openalex.org/W4210897173
- DOI
- 10.32604/csse.2022.023308
References
- https://openalex.org/W1988461287
- https://openalex.org/W2082211707
- https://openalex.org/W2135231474
- https://openalex.org/W2158188757
- https://openalex.org/W2340583188
- https://openalex.org/W2574887079
- https://openalex.org/W2582730511
- https://openalex.org/W2604380918
- https://openalex.org/W2946005927
- https://openalex.org/W2984474881
- https://openalex.org/W2986036729
- https://openalex.org/W3016853014
- https://openalex.org/W3018494351
- https://openalex.org/W3022135700
- https://openalex.org/W3034105996
- https://openalex.org/W3043531819
- https://openalex.org/W3089298195
- https://openalex.org/W3155930636
- https://openalex.org/W3172146820
- https://openalex.org/W4252556556