Texture feature column scheme for single‐ and multi‐script writer identification

doi:10.60692/7dva8-56e65

Published February 14, 2021 | Version v1

Publication Open

Texture feature column scheme for single‐ and multi‐script writer identification

1. University of Bouira
2. Université Larbi Tébessi
3. Laboratoire d'Informatique, du Traitement de l'Information et des Systèmes
4. Université de Rouen Normandie
5. Bahria University
6. Higher Colleges of Technology

IET BiometricsVolume 10, Issue 2 p. 179-193 ORIGINAL RESEARCH PAPEROpen Access Texture feature column scheme for single- and multi-script writer identification Faycel Abbas, Corresponding Author Faycel Abbas faycel.abbas@univ-tebessa.dz LIMPAF Laboratory, Akli Mohand Oulhadj University, Bouira, Algeria Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria Correspondence Faycel Abbas, LIMPAF Laboratory, Akli Mohand Oulhadj University, Bouira, Algeria. Email: faycel.abbas@univ-tebessa.dzSearch for more papers by this authorAbdeljalil Gattal, Abdeljalil Gattal Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, AlgeriaSearch for more papers by this authorChawki Djeddi, Chawki Djeddi Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria LITIS Laboratory, University of Rouen, Rouen, FranceSearch for more papers by this authorImran Siddiqi, Imran Siddiqi Vision & Learning Lab, Bahria University, Islamabad, PakistanSearch for more papers by this authorAmeur Bensefia, Ameur Bensefia Higher Colleges of Technology, CIS Division, Abu Dhabi, UAESearch for more papers by this authorKamel Saoudi, Kamel Saoudi Department of Electrical Engineering, Akli Mohand Oulhadj University, Bouira, AlgeriaSearch for more papers by this author Faycel Abbas, Corresponding Author Faycel Abbas faycel.abbas@univ-tebessa.dz LIMPAF Laboratory, Akli Mohand Oulhadj University, Bouira, Algeria Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria Correspondence Faycel Abbas, LIMPAF Laboratory, Akli Mohand Oulhadj University, Bouira, Algeria. Email: faycel.abbas@univ-tebessa.dzSearch for more papers by this authorAbdeljalil Gattal, Abdeljalil Gattal Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, AlgeriaSearch for more papers by this authorChawki Djeddi, Chawki Djeddi Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria LITIS Laboratory, University of Rouen, Rouen, FranceSearch for more papers by this authorImran Siddiqi, Imran Siddiqi Vision & Learning Lab, Bahria University, Islamabad, PakistanSearch for more papers by this authorAmeur Bensefia, Ameur Bensefia Higher Colleges of Technology, CIS Division, Abu Dhabi, UAESearch for more papers by this authorKamel Saoudi, Kamel Saoudi Department of Electrical Engineering, Akli Mohand Oulhadj University, Bouira, AlgeriaSearch for more papers by this author First published: 14 February 2021 https://doi.org/10.1049/bme2.12010Citations: 1AboutSectionsPDF ToolsRequest permissionExport citationAdd to favoritesTrack citation ShareShare Give accessShare full text accessShare full-text accessPlease review our Terms and Conditions of Use and check box below to share full-text version of article.I have read and accept the Wiley Online Library Terms and Conditions of UseShareable LinkUse the link below to share a full-text version of this article with your friends and colleagues. Learn more.Copy URL Share a linkShare onFacebookTwitterLinked InRedditWechat Abstract Identification of writers from images of handwriting is an interesting research problem in the handwriting recognition community. Application of image analysis and machine learning techniques to this problem allows development of computerised solutions which can facilitate forensic experts in reducing the search space against a questioned document. This article investigates the effectiveness of textural measures in characterising the writer of a handwritten document. A novel descriptor by crossing the local binary patterns (LBP) with different configurations that allows capturing the local textural information in handwriting using a column histogram is introduced. The representation is enriched with the oriented Basic Image Features (oBIFs) column histogram. Support vector machine (SVM) is employed as the classifier, and the experimental study is carried out on five different datasets in single as well as multi-script evaluation scenarios. Multi-script evaluations allow evaluating the hypothesis that writers share common characteristics across multiple scripts and the reported results validate the effectiveness of textural measures in capturing this script-independent, writer-specific information. 1 INTRODUCTION Study of handwriting and hand-drawn shapes has always remained an attractive subject for historians, document examiners, psychologists and forensic experts. In addition to the semantic content, handwriting is known to carry rich information on the individual producing it [1, 2]. The most notable of these is the unique set of writing preferences depicted in the writing style. These writer-specific characteristics allow identifying and authenticating the authorship of a handwriting sample; more commonly known as writer identification and writer verification respectively. Formally, the problem of writer identification involves a set of writing samples with known writers and finding the writer of a handwriting in question, matching it with those in the reference set. The closely related problem of writer verification includes concluding whether a given set of two writing samples come from the same or different writers. Writer identification and verification form an important component of behavioural biometrics [3, 4] and although the performance of handwriting as a biometric modality is less impressive as opposed to physiological biometrics (iris, finger prints, DNA etc.), acquisition of handwriting is non-invasive and does not require any specialised hardware. With the advancements in image analysis and pattern classification, efforts have been made to develop computerised solutions to analyse digitised images of handwriting. Such systems aim to map the domain knowledge of forensic experts into computational features and these features are employed to characterise the writer of a handwritten document [1, 5, 6]. From the view point of practical applications, such systems can be employed to facilitate the domain experts by retrieving a hit-list of probable candidates from a large reference set, given a questioned document. This reduces the search space and allows the forensic experts to focus on a limited and manageable set of writing samples for manual analysis and decisive conclusions. Writer identification can be carried out from online handwriting or offline images in text-dependent or text-independent mode [7, 8]. From the perspective of offline, text-independent writer identification, computerised solutions exploit the visual differences in handwriting to characterise the writer. These difference include allographic variations, inter-word and intra-word spacings, slope of lines, slant of characters, legibility and cursiveness. Few of such visual differences between the writing samples of two writers can be observed in Figure 1. FIGURE 1Open in figure viewerPowerPoint Samples of two different writers—Images in each row represent samples by the same writer This article presents an offline writer identification technique leveraging the rich textural information in handwriting and considering the handwriting of an individual as a unique texture. In other words the technique relies on 'how' the text is written rather than 'what' is written to characterise the writer. Textural measures based on column histograms of local binary patterns (LBP) and oriented basic image features (oBIFs), computed from images of handwriting, are employed to identify the writer using Support Vector Machine (SVM) as classifier. The proposed technique is evaluated in a single as well as a multi-script mode and high identification rates are realised in a number of experimental scenarios. The hypothesis that individuals share common characteristics across multiple scripts is inspired by the handwriting generation process. The individuality in handwriting is contributed by many factors which, in addition to the learned copy-book style, include structure of hand, pen grip, muscular strength and properties of the central nervous system [9]. Handwriting is produced by a combination of writing strokes—the fundamental units of movement of hand (writing instrument). While the alphabets and words in one script are morphologically very different from those in another script, when produced by the same writer, the same writer-specific combination of writing strokes is employed to generate the final product. Hence, this idea can be employed to carry out writer identification in a script-independent scenario. The existence of common patterns across handwriting samples (of an individual writer) in multiple scripts has also been validated by a number of previous studies [10-12] and makes the subject of our current study as well. The key highlights of this study are listed in the following: Investigation of textural measures in characterising an individual from handwriting. Crossing multiple configurations of LBP and oBIFs to produce column histograms hence enriching the feature representation. Experimental study on five different datasets in a single as well as multi-script scenario. Validation of the hypothesis that individuals share common characteristics across multiple scripts. Realisation of high identification rates outperforming the current state-of-the-art on this problem. The article is organised as follows. In the next section, we discuss the recent advancements in offline writer identification. Section 3 introduces the textural features employed to characterise the writer along with the classification details. Experimental study, quantitative performance and a detailed analysis of the reported results is presented in Section 4. Section 5 concludes the article with a discussion on key findings and insights into open research problems on this subject. 2 RELATED WORKS Automatic writer identification has matured significantly over the years; thanks to the research endeavours of the pattern classification and handwriting recognition community. While the preliminary attempts targeted isolated characters and text-dependent identification, robust text-independent writer identification techniques have been developed reporting close to 100% identification rates on a hitlist of 10, with reference base of the order of 103 matching the target performance for most forensic applications [9]. Most of the research on writer identification focused on writing samples in a single-script [1, 13-15]. A relatively recent trend, however, has been to investigate this problem in a multi-script scenario where same individuals provide writing samples in more than one script [16, 17]. Investigating common, writer-specific writing characteristics across multiple scripts indeed represents an interesting research problem. Among various computational features, texture has been a popular choice of researchers for writer characterisation. Bertolini et al. [13], for instance, exploit Local phase quantisation (LPQ) and LBP features extracted from normalised blocks of handwriting to identify the writer and report high identification rates on the IAM dataset and the Brazilian Forensic Letter (BFL) dataset. In another similar work, Hannad et al. [18] rather than extracting textural measures from blocks, consider small fragments (windows) of writing. In addition to LBP and LPQ, the representation is enriched by a third textural descriptor, the Local Ternary Patterns (LTP). The features are evaluated in English (IAM) as well as Arabic (IFN/ENIT) writing samples and a comparative performance analysis reveals that LPQ outperforms other descriptors on both the datasets. Among other textural measures, oBIFs [19] computed using a bank of multiple Derivative-of-Gaussian filters, have also shown effective writer identification performance. Another notable category of writer identification techniques is the codebook-based methods. These methods extract frequent writing patterns to characterise the writer [14]. A codebook of fragmented connected-component contours (FCO3) extracted from character fragments ('fraglets'), for example is studied in Ref. [20]. The codebook is produced by grouping the fragments using Self Organising Maps (SOMs) and the probability distribution of producing the codebook patterns is used to identify the writer. A similar idea is presented by Siddiqi et al. [21] but rather than considering contour fragments, the codebook is generated using small fragments of writing. In another study [22], a synthetic codebook is employed along with a feature selection scheme to reduce its size. He et al. [23] identify the junction points in handwriting and produce a codebook of 'junclets'. The idea of codebooks was extended to an ensemble of codebooks (of graphemes) followed by dimensionality reduction in Ref. [24]. In another related work, Khan et al. [25] exploit the bagged discrete cosine transform (BDCT) descriptors to produce multiple codebooks. The final decision on the identity of the writer is reached through majority voting. In a recent investigation [26], key points in the handwriting are identified and patches around the key points are grouped into a codebook to characterise the writer. In a number of recent studies, automatic feature learning using deep neural networks has also been investigated for writer identification. Authors in Ref. [27], for example exploit convolutional neural networks to learn robust feature representations from writing samples and identify the writer in an end-to-end trainable system. A number of other similar studies [28-31] also demonstrate the effectiveness feature learning for writer characterisation and demonstrate the robustness of learned features over traditional methods. It is, however, important to recall that for a problem like writer identification, while the overall dataset sizes could be of the order of 103, the number of samples per (writer) class is fairly limited. Especially, from the view point of real-world forensic applications, a very limited amount of text (in some cases few lines or words only) is likely to be available. With such limited amount of training data per class, training CNNs to learn features could be challenging. Furthermore, from the perspective of applications for forensic experts, an 'explainable' solution is needed for the acceptance of computerised applications in their daily practices. Hand-crafted features are relatively more 'explainable' to domain experts as opposed to machine-learned features and the experts can also correlate these hand-engineered features with what they employ in handwriting analysis. In other words, the mapping of domain knowledge to computations features is much more evident. This serves to reduce to hesitancy of these experts in accepting automated solutions to facilitate their analysis. In the context of multi-script writer identification, Djeddi et al. [32] exploit run-length features with KNN and SVM classifier to identify writers in multi-script experimental settings. Evaluations on a collection of English and Greek writing samples from 126 different writers report promising identification rates. In another work considering the multi-script scenario, Graian et al. [10] employ two-dimensional (2D) auto-regression coefficients to characterise the writer from writing samples in French and Bengali. Likewise, Bertolini et al. [11] study the effectiveness of textural features (LBP and LPQ) in identifying writers in a multi-script experimental protocol with Arabic and English samples of 475 writers from the QUWI database. In another similar work [12], edge-hinge and run-length features are combined to identify writers through samples in Arabic, German, English and French. International competitions on multi-script writer identification have also been organised, the most notable of these include the ICDAR 2015 [16] and the ICFHR 2018 [17] competition. A summary of well-known contributions to writer identification reported in the literature is presented in Table 1. It is observed that identification of writers from writing samples in a single-script has been thoroughly investigated in the literature and high identification rates have been reported. Writer identification in multi-script settings, on the other, remains relatively less explored. The reported identification rates are also relatively low in many cases. Among popular datasets, IAM and CVL have been widely employed for English while IFN/ENIT and KHATT for Arabic writing samples. It is, however, important to mention that not all of these datasets were collected targeting the writer identification problem. IAM and IFN/ENIT, for instance, were primarily developed for tasks like segmentation and recognition of handwriting. However, since writer information was also stored during data collection, many researchers employed these datasets for evaluation of the writer identification systems. Datasets specifically developed for the writer identification task include the CEDAR letter [1], the BFL dataset [33], ICDAR 2015 writer identification dataset [16] and ICFHR 2018 writer identification dataset [17]. While CEDAR [1] and BFL [33] are collections of single-script samples, many of the recent datasets target writer identification in a multi-script scenario [16,17] and the same is being addressed in our current study. TABLE 1. An overview of well-known writer identification systems Features Study Database Language Number of writers Classification rates (%) Textural features Bertolini et al. (2013) IAM English 650 96.70 BFL Portuguese 315 99.20 Hannad et al. (2016) IFN/ENIT Arabic 411 94.89 IAM English 657 89.54 CVL English 310 96.20 Codebook-based Siddiqi and Vincent (2010) IAM English 650 91.00 He et al. (2015) IAM English 650 91.10 Firemaker Dutch 250 89.80 CERUG-MIXED Chinese and English 105 96.20 Abdi and Khemakhem (2015) IFN/ENIT Arabic 411 90.00 Khalifa et al. (2015) IAM English 650 92.00 Khan et al. (2017) IAM English 650 97.20 CVL English 310 99.60 IFN/ENIT Arabic 411 76.00 Bennour et al. (2019) BFL Portuguese 300 98.33 CVL English 300 94.00 KHAT Arabic 1000 62.81 Local descriptors Christlein et al. (2017) IAM English 650 88.00 CVL English 310 99.20 KHATT Arabic 1000 98.80 CNN Nguyen et al. (2019) JEITA-HP Japanese 400 93.82 Firemaker English 250 92.38 IAM English 650 90.12 Multi-script studies AR coefficients Graian et al. (2009) RIMES + ISI French/Bengali 422 62.10 Edge-hinge and run-length Djeddi et al. (2012) GRDS German/English/French 26 99.50 IFN/ENIT+GRDS German/English/French/Arabic 301 93.30 Run-length features Djeddi et al. (2013) Latin & Greek Docs. English/Greek 126 73.41/76.59 Textural features Bertolini et al. (2016) QUWI Arabic/English 475 77.90/98.70 English/Arabic 475 70.90/94.50 Zernike Moments ICDAR 2015 Winner QUWI Arabic/English 300 55.00 English/Arabic 300 29.00 3 METHODS Like all pattern classification systems, our writer identification technique relies on two key components, feature extraction and classification. Since we target multi-script writer identification, globally computed features that capture the overall writing style are not likely to be effective as the overall visual appearance of writing samples in different scripts would be totally different (even if they come from the same writer). Local features, on the other hand, allow capturing low-level stroke information in handwriting and this information is independent of script as an individual employs the same set of writing gestures to produce characters and words irrespective of the script. We, therefore, locally compute textural descriptors to characterise the writer. We introduce a novel representation of the local binary patterns (LBP column histogram) and combine it with the oBIFs column histogram to enrich the representation. Classification is carried out using the SVM classifier. Each of these components is presented in detail in the following. 3.1 Column scheme for textural features Extracting robust feature representations is the core component of any classification system. Given a collection of data samples (handwritten documents in our case) and the corresponding class labels (writer IDs), the idea is to seek effective representation in a feature space where samples of the same class (writer) tend to cluster together while those from other classes are far apart. In our study, we investigate two textural features, LBP and oBIFs. LBP captures the local spatial patterns in the handwriting. Likewise, oBIFs capture the local symmetry information. Furthermore, in order to capture the same information and different scales of observations, we compute these features for different parameter settings and then compute the column histogram, hence further enriching the representation. 3.2 LBP column histogram In continuation of the efforts [34] to seek robust textural representations, LBP descriptor was first proposed in Refs. [35, 36]. It encodes each pixel in an image with a decimal number as a function of the neighbouring pixel values. The encoding works by subtracting the reference pixel from each of its (8) neighbours. If the result is a negative value, the respective neighbour is assigned 1 and 0 otherwise. The resulting binary sequence is then considered as a number and represents the LBP code of the central pixel. The originally proposed LBP descriptor is considered a local neighbourhood of 3 × 3 and could not capture the structural information at distant scales of observations. The descriptor was therefore extended to multiple resolutions [37] by using neighbourhoods of different sizes. The neighbourhood is generalised by considering a circle centred at the pixel to be labelled and is defined by two parameters, the radius R of the circle and the number of (equally spaced) sampling points P in the neighbourhood (Figure 2). Points which do not represent true pixels are interpolated and the neighbourhood is typically represented by the pair (P, R). FIGURE 2Open in figure viewerPowerPoint Circular neighbourhood for two combinations of (P, R) pairs The coordinates of P neighbours (xp, yp) on the boundary of the circle with radius R are computed with respect to the central pixel (xc, yc) as follows. x p = x c + R c o s ( 2 π p P ) (1) y p = y c + R s i n ( 2 π p P ) (2) If the intensity value of the centre pixel is gc and the intensity values of its neighbours are gp with p = 0, 1, 2, …, P − 1, then the texture T considers the signs of the differences in the local neighbourhood of pixel (xc, yc) and is defined as: T ≈ ( s ( g 0 − g c ) , s ( g 1 − g c ) , … , s ( g P − 1 , g c ) ) (3)where, s(gp − gc) = 1 if (gp − gc) ≥ 0 and 0 otherwise. The local textural information is hence represented as a joint distribution of the value of the centre pixel and the differences. The extended LBP operator [37] is computed by assigning a binomial weight 2p to each s(gp − gc) as follows. L B P P , R ( x c , y c ) = ∑ p = 0 P − 1 s ( g p − g c ) . 2 p (4)where, P is the number of neighbouring pixels and R is the radius of the circle around (xc, yc). The histogram of these binary numbers is then used to describe the texture of the image. LBP is further characterised into uniform and non-uniform patterns. A pattern is termed as uniform if it has at most two bitwise transitions from 0 to 1 (or vice versa) when the pattern is considered a circular string. This results in P × (P − 1) + 3 unique values for P bits. For instance, uniform mapping of 8 sampling points produce 59 unique values while with 16 sampling points, 243 different values are produced. From the view point of representing a handwriting sample using LBP descriptors, LBP images for different combinations of sampling points P and radius R are computed. These LBP images are then stacked representing each pixel as a column vector. The image is then encoded using a (normalised) histogram of these columns. Figure 3 illustrates the process of computing the LBP column histogram from LBP images corresponding to two sets of (P, R) values. The column histogram enriches the LBP descriptor by taking into account multiple resolutions (scales of observations) corresponding to different values of P and R. While the original LBP method considers the local neighbourhood a pixel for a given pair of (P, R) values, we propose to enhance the basic LBP feature by computing two different LBP images for two pairs of (P, R) values, stacking them together and then computing the LBP column histogram that captures much richer local textural and symmetry information in the (handwriting) image. Different combinations of (P, R) values in computing the column histograms represent different scales at which the handwriting is analysed; combined in a single and enhanced feature vector. FIGURE 3Open in figure viewerPowerPoint Different steps of the LBP column scheme: (a) Original image; (b) Both LBPs images at different parameters (LBP image (p = 4, R = 16), LBP image (p = 8, R = 2)) are crossed to form columns at each location; (c) Histogram is computed with columns 3.2.1 oBIF column histogram Another set of textural measures investigated in our study comprises the oBIF. These features have been successfully applied to problems like texture classification [38], digit recognition [39] and identification of writers [19]. In our previous studies, we employed oBIFs for classification of gender from handwriting [40] and identification of writers from historical manuscripts [41]. In the present study, the objective of employing these features is to complement the LBP column histograms and enrich the textural representation of handwriting. The oBIFs represent an extension to the Basic Image Features (BIFs) [42, 43]. The key idea is to label each location in the image with one of the seven local symmetry classes. The features are computed by applying a bank of derivative of Gaussian filters controlled by a scale parameter σ. An additional parameter ϵ is employed to classify a location as 'flat'. Three of these symmetry types are accompanied by n possible orientations, the slope class has 2n possible orientations while three of the classes do not have any orientation. This gives an oBIF vector of 5n + 3. More details on computational aspects of oBIFs can be found in our previous work [40]. In the present work, we quantise the orientation into n = 4 directions, hence producing 23 entries (5 × 4 + 3) in the oBIFs dictionary. Similar to the LBP descriptor, oBIFs at two different scales are stacked (by ignoring the symmetry type flat) and the column histogram is computed. The histogram has a total of (5n + 2)2 = 484 bins. The scale parameter is chosen from the set σ ∈{1, 2, 4, 8, 16}, while ϵ is picked from a set of three small values {0.1, 0.01, 0.02}. The histogram is finally normalised for subsequent processing. The LBP and oBIFs column histograms are computed for writing samples of all individuals. By varying the parameters in computation of features, different configurations of LBP and oBIFs are produced and more details on these configurations are presented in Section 4. 3.3 Classification For the identification task, we employ SVM as the classifier [44, 45]. The LBP and oBIFs column histograms extracted from the writing sample(s) of an individual are used to train the learning algorithm. SVM is trained with the radial basis kernel function (RBF), the kernel parameter is selected in the range 0, 100], while the soft margin parameter C is fixed to 10. For each feature x fed to the trained SVM classifier, n decision scores fnj(x) for j = 1, 2, …, n are produced. n is the total number of writers and the decision on the identity of the writer is taken as follows. f m a x ( x ) = m a x ( f n j ( x ) ; j = 1 , 2 , … , n ) (5)fmax(x) is the maximum value selected from n responses produced by the classifier and fn(x) is the mapping of original SVM output values to the interval [0, 1] as follows. f n ( x ) = 1 1 + e − f ( x ) (6) In addition to making the identification decisions on each of the LBP and OBIFs column histograms, we also report identification performance based on picking the maximum value from the normalised decision scores on each of the two features. There are different ways to combine decisions of classifiers in an attempt to enhance the overall classification rates. Commonly employed methods include majority voting, Borda count, the sum, product and max rules and so on. Since we combine the decisions based on two distinct types of features, combinations using majority voting or Borda count would not be very meaningful (as there are only two scores). For each type of feature (LBP and oBIF columns), the SVM classifier outputs n similarity scores corresponding to n writers in the reference base. As mentioned earlier, these scores are mapped to the interval [0, 1]; higher the score, more confident the classifier is in predicting the respective class label (writer). The max rule predicts the output class by choosing the class corresponding to the maximum confidence value among all the participating classifiers. In other words, for the problem under study, the system reports two scores SLBP and SoBIFs. Selecting the maximum [max(SLBP, SoBIFs)] score ensures that we pick the decision corresponding to the classifier which is more confident. This serves to compensate the errors and improves the overall classification performance. The usefulness of combining decisions of a

Translated Descriptions

This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

IET Biometrics المجلد 10، العدد 2 ص. 179-193 البحث الأصلي مخطط عمود PAPEROpen Access Texture لتحديد هوية الكاتب أحادي ومتعدد النصوص Faycel Abbas، المؤلف المراسل Faycel Abbas faycel.abbas@univ-tebessa.dz مختبر LIMPAF، جامعة أكلي مهند أولحاج، بويرا، قسم الرياضيات وعلوم الكمبيوتر في الجزائر، جامعة العربي التبسي، تبسة، مراسلات الجزائر Faycel Abbas، مختبر LIMPAF، جامعة أكلي مهند أولحاج، بويرا، الجزائر. البريد الإلكتروني: faycel.abbas@univ-tebessa.dzالبحث عن المزيد من الأوراق من قبل هذا المؤلف عبد الجليل جطال، قسم عبد الجليل جطال للرياضيات وعلوم الكمبيوتر، جامعة العربي تبسي، تبسة، الجزائرالبحث عن المزيد من الأوراق من قبل هذا المؤلفشوقي جدي، قسم شوقي جدي للرياضيات وعلوم الكمبيوتر، جامعة العربي تبسي، تبسي، مختبر الجزائر ليتيس، جامعة روان، روان، فرنساالبحث عن المزيد من الأوراق من قبل هذا المؤلفعمران صديقي، مختبر عمران صديقي للرؤية والتعلم، جامعة البحرين، إسلام أباد، باكستانالبحث عن المزيد من الأوراق من قبل هذا المؤلفأمير بنسيفيا، كليات أمير بنسيفيا العليا للتكنولوجيا، قسم رابطة الدول المستقلة، أبو ظبي، الإمارات العربية المتحدةالبحث عن المزيد من الأوراق من قبل هذا المؤلفكاميل سعودي، قسم كامل السعودي للهندسة الكهربائية، المهندلي عولجاد، بويرا، الجزائرالبحث عن المزيد من قبل هذا المؤلف، عباس، مراسل فاسيفايفاي. Fabay.fcel.untebessa- LIMPA، مختبر أكاديمي، قسم الحاسب الآلي، جامعة المهندسين، جامعة الجزائر تيبسي، تيبسي، جامعة الجزائر، أبو ظبي، مراسل الجزائر، أبو ظبي. البريد الإلكتروني: faycel.abbas@univ-tebessa.dzالبحث عن المزيد من الأبحاث لهذا المؤلف عبد الجليل جطال، قسم عبد الجليل جطال للرياضيات وعلوم الكمبيوتر، جامعة العربي تبسي، تبسة، الجزائرالبحث عن المزيد من الأبحاث لهذا المؤلفشوقي دجيدي، قسم شوقي دجيدي للرياضيات وعلوم الكمبيوتر، جامعة العربي تبسي، تبسي، مختبر الجزائر LITIS، جامعة روان، روان، فرنساالبحث عن المزيد من الأبحاث لهذا المؤلفعمران صديقي، مختبر عمران صديقي للرؤية والتعلم، جامعة البحرين، إسلام أباد، باكستانالبحث عن المزيد من الأبحاث لهذا المؤلفأمير بنسيفيا، كليات أمير بنسيفيا العليا للتكنولوجيا، قسم رابطة الدول المستقلة، أبو ظبي، الإمارات العربية المتحدةابحث عن المزيد من الأوراق البحثية لهذا المؤلفKamel Saoudi, Kamel Saoudi Department of Electrical Engineering, Akli Mohand Oulhadj University, Bouira, Algeriaابحث عن المزيد من الأوراق البحثية لهذا المؤلف المنشورة لأول مرة: 14 فبراير 2021 https://doi.org/10.1049/bme2.12010 الاقتباسات: 1AboutSectionsPDF ToolsRequest permissionExport citation Add to favouritesTrack citation ShareShare Give accessShare full text accessShare full - text accessPlease review our Terms and Conditions of Use and check box below to share full - text version of article.I have read and accept the Wiley Online Library Terms and Conditions of UseShareable LinkUse the link below to share a full - text version of this article مع أصدقائك وزملائك. Learn more.Copy URL Share a linkShare onFacebookTwitterLinked InRedditWechat Abstract Identification of writers from images of handwriting is an interesting research problem in the handwriting recognition community. يسمح تطبيق تقنيات تحليل الصور والتعلم الآلي على هذه المشكلة بتطوير حلول محوسبة يمكن أن تسهل على خبراء الطب الشرعي تقليل مساحة البحث مقابل مستند مشكوك فيه. تبحث هذه المقالة في فعالية التدابير النسيجية في توصيف كاتب وثيقة مكتوبة بخط اليد. يتم تقديم وصف جديد عن طريق تقاطع الأنماط الثنائية المحلية (LBP) مع تكوينات مختلفة تسمح بالتقاط المعلومات النسيجية المحلية في الكتابة اليدوية باستخدام مخطط تكراري للعمود. يتم إثراء التمثيل بالمخطط التكراري لعمود ميزات الصورة الأساسية (oBIFs) الموجه. يتم استخدام آلة ناقلات الدعم (SVM) كمصنف، ويتم إجراء الدراسة التجريبية على خمس مجموعات بيانات مختلفة في سيناريوهات تقييم مفردة ومتعددة النصوص. تسمح التقييمات متعددة النصوص بتقييم الفرضية القائلة بأن الكتاب يشتركون في خصائص مشتركة عبر نصوص متعددة وأن النتائج المبلغ عنها تتحقق من فعالية التدابير النسيجية في التقاط هذه المعلومات المستقلة عن النص والخاصة بالكاتب. 1 المقدمة لطالما ظلت دراسة الكتابة اليدوية والأشكال المرسومة باليد موضوعًا جذابًا للمؤرخين وفاحصي الوثائق وعلماء النفس وخبراء الطب الشرعي. بالإضافة إلى المحتوى الدلالي، من المعروف أن الكتابة اليدوية تحمل معلومات غنية عن الفرد الذي ينتجها [1، 2]. وأبرزها المجموعة الفريدة من تفضيلات الكتابة المصورة في أسلوب الكتابة. تسمح هذه الخصائص الخاصة بالكاتب بتحديد وتوثيق تأليف عينة الكتابة اليدوية ؛ والمعروفة أكثر باسم تحديد الكاتب والتحقق من الكاتب على التوالي. من الناحية الرسمية، تنطوي مشكلة تحديد الكاتب على مجموعة من عينات الكتابة مع كتاب معروفين والعثور على كاتب خط اليد المعني، ومطابقته مع تلك الموجودة في المجموعة المرجعية. تتضمن مشكلة التحقق من الكاتب ذات الصلة الوثيقة استنتاج ما إذا كانت مجموعة معينة من عينتين للكتابة تأتي من نفس الكتاب أو من كتاب مختلفين. يشكل تحديد هوية الكاتب والتحقق منه مكونًا مهمًا للقياسات الحيوية السلوكية [3، 4] وعلى الرغم من أن أداء الكتابة اليدوية كطريقة بيومترية أقل إثارة للإعجاب مقارنة بالقياسات الحيوية الفسيولوجية (القزحية وبصمات الأصابع والحمض النووي وما إلى ذلك)، فإن اكتساب الكتابة اليدوية غير جراحي ولا يتطلب أي أجهزة متخصصة. مع التقدم في تحليل الصور وتصنيف الأنماط، بُذلت جهود لتطوير حلول محوسبة لتحليل الصور الرقمية للكتابة اليدوية. تهدف هذه الأنظمة إلى تعيين معرفة مجال خبراء الطب الشرعي في الميزات الحسابية وتستخدم هذه الميزات لتمييز كاتب وثيقة مكتوبة بخط اليد [1، 5، 6]. من وجهة نظر التطبيقات العملية، يمكن استخدام هذه الأنظمة لتسهيل خبراء المجال من خلال استرداد قائمة نجاحات المرشحين المحتملين من مجموعة مرجعية كبيرة، بالنظر إلى وثيقة مشكوك فيها. وهذا يقلل من مساحة البحث ويسمح لخبراء الطب الشرعي بالتركيز على مجموعة محدودة ويمكن التحكم فيها من عينات الكتابة للتحليل اليدوي والاستنتاجات الحاسمة. يمكن تحديد هوية الكاتب من خلال الكتابة اليدوية عبر الإنترنت أو الصور غير المتصلة بالإنترنت في وضع يعتمد على النص أو يعتمد على النص [7، 8]. من منظور تعريف الكاتب غير المتصل بالإنترنت والمستقل عن النص، تستغل الحلول المحوسبة الاختلافات المرئية في الكتابة اليدوية لتوصيف الكاتب. وتشمل هذه الاختلافات الاختلافات التمايزية، والمسافات بين الكلمات وداخل الكلمات، وانحدار الخطوط، وميل الأحرف، والوضوح، والسلسلة. يمكن ملاحظة القليل من هذه الاختلافات المرئية بين عينات الكتابة لاثنين من الكتاب في الشكل 1. الشكل 1 يعرض هذا المقال تقنية التعرف على الكاتب في وضع عدم الاتصال للاستفادة من المعلومات النسيجية الغنية في الكتابة اليدوية واعتبار الكتابة اليدوية للفرد نسيجًا فريدًا. وبعبارة أخرى، تعتمد التقنية على "كيفية" كتابة النص بدلاً من "ما" المكتوب لوصف الكاتب. يتم استخدام المقاييس النسيجية القائمة على الرسوم البيانية للأعمدة للأنماط الثنائية المحلية (LBP) وميزات الصورة الأساسية الموجهة (oBIFs)، المحسوبة من صور الكتابة اليدوية، لتحديد الكاتب باستخدام آلة دعم المتجهات (SVM) كمصنف. يتم تقييم التقنية المقترحة في وضع واحد بالإضافة إلى وضع متعدد النصوص ويتم تحقيق معدلات تحديد عالية في عدد من السيناريوهات التجريبية. إن الفرضية القائلة بأن الأفراد يشتركون في خصائص مشتركة عبر نصوص متعددة مستوحاة من عملية توليد الكتابة اليدوية. تساهم العديد من العوامل في الفردية في الكتابة اليدوية والتي تشمل، بالإضافة إلى أسلوب كتاب النسخ المتعلم، بنية اليد وقبضة القلم والقوة العضلية وخصائص الجهاز العصبي المركزي [9]. يتم إنتاج الكتابة اليدوية من خلال مزيج من ضربات الكتابة - الوحدات الأساسية لحركة اليد (أداة الكتابة). في حين أن الحروف الهجائية والكلمات في نص واحد تختلف اختلافًا كبيرًا من الناحية الشكلية عن تلك الموجودة في نص آخر، عندما ينتجها نفس الكاتب، يتم استخدام نفس المزيج الخاص بالكاتب من ضربات الكتابة لتوليد المنتج النهائي. وبالتالي، يمكن استخدام هذه الفكرة لتحديد هوية الكاتب في سيناريو مستقل عن السيناريو. كما تم التحقق من وجود أنماط مشتركة عبر عينات الكتابة اليدوية (لكاتب فردي) في نصوص متعددة من خلال عدد من الدراسات السابقة [10-12] ويجعل موضوع دراستنا الحالية أيضًا. يتم سرد النقاط الرئيسية لهذه الدراسة في ما يلي: التحقيق في التدابير النسيجية في توصيف الفرد من الكتابة اليدوية. عبور تكوينات متعددة من LBP و oBIFs لإنتاج الرسوم البيانية للعمود وبالتالي إثراء تمثيل الميزة. دراسة تجريبية على خمس مجموعات بيانات مختلفة في سيناريو واحد ومتعدد النصوص. التحقق من صحة الفرضية القائلة بأن الأفراد يشتركون في خصائص مشتركة عبر نصوص متعددة. تحقيق معدلات تحديد هوية عالية تتفوق على أحدث ما توصلت إليه هذه المشكلة. تم تنظيم المقالة على النحو التالي. في القسم التالي، نناقش التطورات الأخيرة في تحديد هوية الكاتب غير المتصل بالإنترنت. يقدم القسم 3 السمات التركيبية المستخدمة لتوصيف الكاتب جنبًا إلى جنب مع تفاصيل التصنيف. يتم عرض الدراسة التجريبية والأداء الكمي والتحليل التفصيلي للنتائج المبلغ عنها في القسم 4. ويختتم القسم 5 المقال بمناقشة النتائج الرئيسية والرؤى حول مشاكل البحث المفتوحة حول هذا الموضوع. 2 أعمال ذات صلة نضج التعرف التلقائي على الكاتب بشكل كبير على مر السنين ؛ بفضل المساعي البحثية لمجتمع تصنيف الأنماط والتعرف على الكتابة اليدوية. في حين أن المحاولات الأولية استهدفت الشخصيات المعزولة وتحديد الهوية المعتمد على النص، فقد تم تطوير تقنيات قوية لتحديد هوية الكاتب المستقل عن النص تبلغ عن معدلات تحديد هوية قريبة من 100 ٪ في قائمة من 10، مع قاعدة مرجعية لترتيب 103 مطابقة للأداء المستهدف لمعظم تطبيقات الطب الشرعي [9]. ركزت معظم الأبحاث حول تحديد هوية الكاتب على كتابة العينات في نص واحد [1، 13-15]. ومع ذلك، كان الاتجاه الحديث نسبيًا هو التحقيق في هذه المشكلة في سيناريو متعدد النصوص حيث يقدم نفس الأفراد عينات الكتابة بأكثر من نص واحد [16، 17]. إن التحقيق في خصائص الكتابة الشائعة الخاصة بالكاتب عبر نصوص متعددة يمثل بالفعل مشكلة بحثية مثيرة للاهتمام. من بين الميزات الحسابية المختلفة، كان النسيج خيارًا شائعًا للباحثين لتوصيف الكاتب. بيرتوليني وآخرون. [13]، على سبيل المثال، يستغلون تكميم الطور المحلي (LPQ) وميزات LBP المستخرجة من كتل طبيعية من الكتابة اليدوية لتحديد الكاتب والإبلاغ عن معدلات تحديد عالية على مجموعة بيانات IAM ومجموعة بيانات خطاب الطب الشرعي البرازيلي (BFL). في عمل مماثل آخر، Hannad et al. [18] بدلاً من استخراج التدابير النسيجية من الكتل، ضع في اعتبارك الأجزاء الصغيرة (النوافذ) من الكتابة. بالإضافة إلى LBP و LPQ، يتم إثراء التمثيل بواصف نصي ثالث، الأنماط الثلاثية المحلية (LTP). يتم تقييم الميزات باللغة الإنجليزية (IAM) وكذلك العربية (IFN/ENIT) عينات الكتابة ويكشف تحليل الأداء المقارن أن LPQ يتفوق على الأوصاف الأخرى في كلتا مجموعتي البيانات. من بين المقاييس النسيجية الأخرى، أظهرت oBIFs [19] المحسوبة باستخدام بنك من مرشحات المشتقات الغوسية المتعددة، أيضًا أداءً فعالًا في تحديد هوية الكاتب. هناك فئة أخرى بارزة من تقنيات تحديد هوية الكاتب وهي الأساليب القائمة على الكود. تستخرج هذه الأساليب أنماط الكتابة المتكررة لتوصيف الكاتب [14]. تمت دراسة كتاب رموز لخطوط المكونات المتصلة المجزأة (FCO3) المستخرجة من شظايا الأحرف (" الشظايا ")، على سبيل المثال في المرجع. [20]. يتم إنتاج دفتر الشفرة عن طريق تجميع الشظايا باستخدام خرائط التنظيم الذاتي (SOMs) ويتم استخدام توزيع احتمالية إنتاج أنماط دفتر الشفرة لتحديد الكاتب. يتم تقديم فكرة مماثلة من قبل صديقي وآخرون. [21] ولكن بدلاً من النظر في الأجزاء الكنتورية، يتم إنشاء كتاب الشفرة باستخدام أجزاء صغيرة من الكتابة. في دراسة أخرى [22]، يتم استخدام دفتر رموز اصطناعي جنبًا إلى جنب مع مخطط اختيار الميزات لتقليل حجمه. هو وآخرون. [23] تحديد نقاط التقاطع في الكتابة اليدوية وإنتاج كتاب شفرة من "junclets". تم توسيع فكرة دفاتر الرموز لتشمل مجموعة من دفاتر الرموز (من الحروف) متبوعة بتقليل الأبعاد في المرجع. [24]. في عمل آخر ذي صلة، يستغل خان وآخرون [25] واصفات تحويل جيب التمام المنفصلة المعبأة (BDCT) لإنتاج دفاتر رموز متعددة. يتم التوصل إلى القرار النهائي بشأن هوية الكاتب من خلال تصويت الأغلبية. في تحقيق حديث [26]، يتم تحديد النقاط الرئيسية في الكتابة اليدوية ويتم تجميع البقع حول النقاط الرئيسية في دفتر رموز لتمييز الكاتب. في عدد من الدراسات الحديثة، تم أيضًا التحقيق في تعلم الميزات التلقائي باستخدام الشبكات العصبية العميقة لتحديد هوية الكاتب. يستغل المؤلفون في المرجع. [27]، على سبيل المثال، الشبكات العصبية الالتفافية لتعلم تمثيلات الميزات القوية من كتابة العينات وتحديد الكاتب في نظام قابل للتدريب من البداية إلى النهاية. يوضح عدد من الدراسات المماثلة الأخرى [28-31] أيضًا تعلم ميزة الفعالية لتوصيف الكاتب وإظهار قوة الميزات المستفادة على الطرق التقليدية. ومع ذلك، من المهم أن نتذكر أنه بالنسبة لمشكلة مثل تحديد الكاتب، في حين أن أحجام مجموعة البيانات الإجمالية يمكن أن تكون في حدود 103، فإن عدد العينات لكل فصل (كاتب) محدود إلى حد ما. على وجه الخصوص، من وجهة نظر تطبيقات الطب الشرعي في العالم الحقيقي، من المرجح أن تكون كمية محدودة للغاية من النص (في بعض الحالات بضعة أسطر أو كلمات فقط) متاحة. مع هذا الكم المحدود من بيانات التدريب لكل فصل، قد يكون تدريب CNNs على تعلم الميزات أمرًا صعبًا. علاوة على ذلك، من منظور طلبات خبراء الطب الشرعي، هناك حاجة إلى حل "قابل للتفسير" لقبول التطبيقات المحوسبة في ممارساتهم اليومية. تعتبر الميزات المصنوعة يدويًا "قابلة للشرح" نسبيًا لخبراء المجال بدلاً من الميزات التي يتم تعلمها آليًا ويمكن للخبراء أيضًا ربط هذه الميزات المصممة يدويًا بما يستخدمونه في تحليل الكتابة اليدوية. وبعبارة أخرى، فإن ربط معرفة المجال بميزات الحسابات أكثر وضوحًا. وهذا يقلل من تردد هؤلاء الخبراء في قبول الحلول الآلية لتسهيل تحليلهم. في سياق تحديد الكاتب متعدد النصوص، يستغل Djeddi et al. [32] ميزات طول التشغيل مع مصنف KNN و SVM لتحديد الكتاب في إعدادات تجريبية متعددة النصوص. تشير التقييمات على مجموعة من عينات الكتابة الإنجليزية واليونانية من 126 كاتبًا مختلفًا إلى معدلات تحديد واعدة. في عمل آخر يأخذ في الاعتبار السيناريو متعدد النصوص، يستخدم Graian et al. [10] معاملات الانحدار التلقائي ثنائية الأبعاد (2D) لتمييز الكاتب عن كتابة العينات بالفرنسية والبنغالية. وبالمثل، يدرس Bertolini et al. [11] فعالية السمات النسيجية (LBP و LPQ) في تحديد الكتاب في بروتوكول تجريبي متعدد النصوص مع عينات عربية وإنجليزية من 475 كاتبًا من قاعدة بيانات QUWI. في عمل مماثل آخر [12]، يتم الجمع بين ميزات حافة المفصل وطول التشغيل لتحديد الكتاب من خلال عينات باللغات العربية والألمانية والإنجليزية والفرنسية. كما تم تنظيم مسابقات دولية حول تحديد هوية الكاتب متعدد النصوص، وأبرزها ICDAR 2015 [16] ومسابقة ICFHR 2018 [17]. ويرد في الجدول 1 ملخص للمساهمات المعروفة في تحديد هوية الكاتب المبلغ عنها في الأدبيات. لوحظ أن تحديد هوية الكتاب من كتابة العينات في نص واحد قد تم التحقيق فيه بدقة في الأدبيات وتم الإبلاغ عن معدلات تحديد عالية. من ناحية أخرى، لا يزال تحديد هوية الكاتب في إعدادات النصوص المتعددة أقل استكشافًا نسبيًا. كما أن معدلات تحديد الهوية المبلغ عنها منخفضة نسبيًا في كثير من الحالات. من بين مجموعات البيانات الشائعة، تم استخدام IAM و CVL على نطاق واسع للغة الإنجليزية بينما IFN/ENIT و KHATT لعينات الكتابة العربية. ومع ذلك، من المهم الإشارة إلى أنه لم يتم جمع كل مجموعات البيانات هذه التي تستهدف مشكلة تحديد هوية الكاتب. تم تطوير IAM و IFN/ENIT، على سبيل المثال، في المقام الأول لمهام مثل التجزئة والتعرف على الكتابة اليدوية. ومع ذلك، نظرًا لأنه تم تخزين معلومات الكاتب أيضًا أثناء جمع البيانات، فقد استخدم العديد من الباحثين مجموعات البيانات هذه لتقييم أنظمة تحديد هوية الكاتب. تشمل مجموعات البيانات التي تم تطويرها خصيصًا لمهمة تحديد هوية الكاتب حرف الأرز [1]، ومجموعة بيانات BFL [33]، ومجموعة بيانات تحديد هوية الكاتب ICDAR 2015 [16] ومجموعة بيانات تحديد هوية الكاتب ICFHR 2018 [17]. في حين أن الأرز [1] و BFL [33] عبارة عن مجموعات من عينات أحادية النص، فإن العديد من مجموعات البيانات الحديثة تستهدف تحديد الكاتب في سيناريو متعدد النصوص [16،17] ويتم تناول الشيء نفسه في دراستنا الحالية. الجدول 1. نظرة عامة على أنظمة تحديد هوية الكاتب المعروفة ميزات قاعدة بيانات الدراسة اللغة عدد الكتاب معدلات التصنيف (٪) الميزات النصية بيرتوليني وآخرون. (2013) IAM English 650 96.70 BFL Portuguese 315 99.20 Hannad et al. (2016) IFN/ENIT Arabic 411 94.89 IAM English 657 89.54 CVL English 310 96.20 Codebook - based Siddiqi and Vincent (2010) IAM English 650 91.00 He et al. (2015) IAM English 650 91.10 Firemaker Dutch 250 89.80 CERUG - MIXED Chinese and English 105 96.20 Abdi and Khemakhem (2015) IFN/ENIT Arabic 411 90.00 Khalifa et al. (2015) IAM English 650 92.00 Khan et al. (2017) IAM English 650 97.20 CVL English 310 99.60 IFN/ENIT Arabic 411 76.00 Bennour et al. (2019) BFL Portuguese 300 98.33 CVL English 300 94.00 KHAT Arabic 1000 62.81 الأوصاف المحلية Christlein et al. (2017) IAM English 650 88.00 CVL English 310 99.20 KHATT Arabic 1000 98.80 CNN Nguyen et al. (2019) JEITA - HP Japanese 400 93.82 Firemaker English 250 92.38 IAM English 650 90.12 دراسات متعددة النصوص معاملات AR Graian et al. (2009) RIMES + ISI French/Bengali 422 62.10 Edge - hinge and run - length Djeddi et al. (2012) GRDS German/English/French 26 99.50 IFN/ENIT+ GRDS German/English/French/Arabic 301 93.30 Run - length features Djeddi et al. (2013) المستندات اللاتينية واليونانية. الإنجليزية/اليونانية 126 73.41/76.59 السمات النسيجية Bertolini et al. (2016) QUWI العربية/الإنجليزية 475 77.90/98.70 الإنجليزية/العربية 475 70.90/94.50 Zernike Moments ICDAR 2015 الفائز QUWI العربية/الإنجليزية 300 55.00 الإنجليزية/العربية 300 29.00 3 طرق مثل جميع أنظمة تصنيف الأنماط، تعتمد تقنية تحديد الكاتب الخاصة بنا على مكونين رئيسيين، استخراج الميزات وتصنيفها. نظرًا لأننا نستهدف تحديد هوية الكاتب متعدد النصوص، فمن غير المرجح أن تكون الميزات المحسوبة عالميًا التي تلتقط أسلوب الكتابة العام فعالة لأن المظهر المرئي العام لكتابة العينات في نصوص مختلفة سيكون مختلفًا تمامًا (حتى لو كانت تأتي من نفس الكاتب). من ناحية أخرى، تسمح الميزات المحلية بالتقاط معلومات السكتة الدماغية منخفضة المستوى في الكتابة اليدوية وهذه المعلومات مستقلة عن السيناريو حيث يستخدم الفرد نفس مجموعة إيماءات الكتابة لإنتاج الشخصيات والكلمات بغض النظر عن السيناريو. لذلك، نحسب محليًا الأوصاف النصية لتوصيف الكاتب. نقدم تمثيلًا جديدًا للأنماط الثنائية المحلية (الرسم البياني لعمود LBP) وندمجها مع الرسم البياني لعمود oBIFs لإثراء التمثيل. يتم التصنيف باستخدام مصنف SVM. يتم عرض كل من هذه المكونات بالتفصيل في ما يلي. 3.1 مخطط العمود للسمات النسيجية استخراج تمثيلات السمات القوية هو المكون الأساسي لأي نظام تصنيف. بالنظر إلى مجموعة من عينات البيانات (المستندات المكتوبة بخط اليد في حالتنا) وتسميات الفئات المقابلة (معرّفات الكاتب)، فإن الفكرة هي البحث عن تمثيل فعال في مساحة ميزة حيث تميل عينات من نفس الفئة (الكاتب) إلى التجمع معًا بينما تكون عينات من فئات أخرى متباعدة. في دراستنا، نقوم بالتحقيق في ميزتين نسيجيتين، LBP و oBIFs. يلتقط LBP الأنماط المكانية المحلية في الكتابة اليدوية. وبالمثل، تلتقط oBIFs معلومات التماثل المحلية. علاوة على ذلك، من أجل التقاط نفس المعلومات ومقاييس الملاحظات المختلفة، نحسب هذه الميزات لإعدادات المعلمات المختلفة ثم نحسب الرسم البياني للعمود، وبالتالي نزيد من إثراء التمثيل. 3.2 المخطط التكراري لعمود LBP استمرارًا للجهود [34] للبحث عن تمثيلات نسيجية قوية، تم اقتراح واصف LBP لأول مرة في المراجع. [35، 36]. يقوم بتشفير كل بكسل في صورة ذات رقم عشري كدالة لقيم البكسل المجاورة. يعمل الترميز عن طريق طرح البكسل المرجعي من كل من جيرانه (8). إذا كانت النتيجة قيمة سالبة، يتم تعيين الجار المعني 1 و 0 بخلاف ذلك. ثم يتم اعتبار التسلسل الثنائي الناتج كرقم ويمثل رمز LBP للبكسل المركزي. يعتبر واصف LBP المقترح في الأصل حيًا محليًا من 3 × 3 ولا يمكنه التقاط المعلومات الهيكلية على مقاييس بعيدة من الملاحظات. لذلك تم توسيع الوصف ليشمل دقة متعددة [37] باستخدام أحياء ذات أحجام مختلفة. يتم تعميم الحي من خلال النظر في دائرة تتمحور حول البكسل المراد تسميتها ويتم تحديدها بواسطة معلمتين، نصف قطر R للدائرة وعدد نقاط أخذ العينات (متباعدة بالتساوي) P في الحي (الشكل 2). يتم استكمال النقاط التي لا تمثل وحدات البكسل الحقيقية ويتم تمثيل الحي عادة بالزوج (P، R). الشكل 2 فتح في عارض الشكل حي PowerPoint الدائري لمجموعتين من أزواج (P، R) يتم حساب إحداثيات P المجاورة (xp، yp) على حدود الدائرة مع نصف القطر R فيما يتعلق بالبكسل المركزي (xc، yc) على النحو التالي. x p = x c + R c o s ( 2 π p P ) (1) y p = y c + R s i n ( 2 π p P ) (2) إذا كانت قيمة شدة البكسل المركزي هي gc وقيم شدة جيرانها هي gp مع p = 0، 1، 2،...، P − 1، فإن الملمس T يأخذ في الاعتبار علامات الاختلافات في الحي المحلي للبكسل (xc، yc) ويتم تعريفه على النحو التالي: T ≈ (g 0 − g c)، s (g 1 − g c ) ، …، s ( g P − 1، c ) (3)، حيث s (g − c) = 1 (g − c) إذا كان g − p) ≥ 0 و 0. وبالتالي يتم تمثيل المعلومات التركيبية المحلية كتوزيع مشترك لقيمة البكسل المركزي والاختلافات. يتم حساب مشغل LBP الممتد [37] عن طريق تعيين وزن ذي حدين 2p لكل ثانية(gp - gc) على النحو التالي. L B P P ، R ( x c ، y c ) = ա p = 0 P − 1 s ( g p − g c ) . 2 p (4)حيث، P هو عدد البكسلات المجاورة و R هو نصف قطر الدائرة المحيطة (xc، yc). ثم يتم استخدام الرسم البياني لهذه الأرقام الثنائية لوصف نسيج الصورة. يتميز LBP أيضًا بأنماط موحدة وغير موحدة. يُطلق على النمط اسم موحد إذا كان يحتوي على اثنين على الأكثر من التحولات الثنائية من 0 إلى 1 (أو العكس) عندما يعتبر النمط سلسلة دائرية. ينتج عن ذلك P × (P − 1) + 3 قيم فريدة لبتات P. على سبيل المثال، ينتج عن التخطيط الموحد لـ 8 نقاط أخذ عينات 59 قيمة فريدة بينما يتم إنتاج 243 قيمة مختلفة مع 16 نقطة أخذ عينات. من وجهة نظر تمثيل عينة خط اليد باستخدام واصفات LBP، يتم حساب صور LBP لمجموعات مختلفة من نقاط أخذ العينات P ونصف القطر R. ثم يتم تكديس صور LBP هذه التي تمثل كل بكسل كمتجه عمود. ثم يتم ترميز الصورة باستخدام مخطط تكراري (طبيعي) لهذه الأعمدة. يوضح الشكل 3 عملية حساب الرسم البياني لعمود LBP من صور LBP المقابلة لمجموعتين من قيم (P، R). يثري المخطط التكراري للعمود واصف LBP من خلال مراعاة الدقة المتعددة (مقاييس الملاحظات) المقابلة للقيم المختلفة لـ P و R. بينما تعتبر طريقة LBP الأصلية الحي المحلي بكسلًا لزوج معين من قيم (P، R)، نقترح تحسين ميزة LBP الأساسية من خلال حساب صورتين مختلفتين لـ LBP لزوجين من قيم (P، R)، وتكديسهما معًا ثم حساب المخطط التكراري لعمود LBP الذي يلتقط معلومات نسيجية وتناظرية محلية أكثر ثراءً في صورة (الكتابة اليدوية). تمثل مجموعات مختلفة من قيم (P، R) في حساب الرسوم البيانية للعمود مقاييس مختلفة يتم عندها تحليل الكتابة اليدوية ؛ مجتمعة في متجه ميزة واحد ومعزز. الشكل 3 الخطوات المختلفة لمخطط عمود LBP: (أ) الصورة الأصلية ؛ (ب) يتم تقاطع كل من صور LBPs عند معلمات مختلفة (صورة LBP (p = 4، R = 16)، صورة LBP (p = 8، R = 2)) لتشكيل أعمدة في كل موقع ؛ (ج) يتم حساب الرسم البياني باستخدام الأعمدة 3.2.1 oBIF الرسم البياني للعمود تشتمل مجموعة أخرى من المقاييس النسيجية التي تم التحقيق فيها في دراستنا على oBIF. تم تطبيق هذه الميزات بنجاح على مشاكل مثل تصنيف الملمس [38]، والتعرف على الأرقام [39] وتحديد الكتاب [19]. في دراساتنا السابقة، استخدمنا oBIFs لتصنيف الجنس من الكتابة اليدوية [40] وتحديد الكتاب من المخطوطات التاريخية [41]. في هذه الدراسة، الهدف من استخدام هذه الميزات هو استكمال المخططات التكرارية لعمود LBP وإثراء التمثيل النصي للكتابة اليدوية. تمثل oBIFs امتدادًا لميزات الصورة الأساسية (BIFs) [42، 43]. الفكرة الرئيسية هي تسمية كل موقع في الصورة بواحدة من فئات التماثل المحلية السبعة. يتم حساب الميزات من خلال تطبيق بنك مشتق من المرشحات الغاوسية التي يتم التحكم فيها بواسطة معلمة مقياس σ. يتم استخدام معلمة إضافية لتصنيف الموقع على أنه "مسطح". ثلاثة من أنواع التماثل هذه مصحوبة بـ n اتجاهات محتملة، فئة المنحدر لها 2n اتجاهات محتملة في حين أن ثلاثة من الفئات ليس لها أي اتجاه. هذا يعطي متجه oBIF من 5n + 3. يمكن العثور على مزيد من التفاصيل حول الجوانب الحسابية لـ oBIFs في عملنا السابق [40]. في العمل الحالي، نحدد الاتجاه إلى n = 4 اتجاهات، وبالتالي ننتج 23 إدخالًا (5 × 4 + 3) في قاموس oBIFs. على غرار واصف LBP، يتم تكديس oBIFs على مقياسين مختلفين (من خلال تجاهل نوع التماثل المسطح) ويتم حساب المخطط التكراري للعمود. يحتوي المدرج التكراري على ما مجموعه (5n + 2)2 = 484 حاوية. يتم اختيار معلمة المقياس من المجموعة α {1، 2، 4، 8، 16}، بينما يتم اختيار σ من مجموعة من ثلاث قيم صغيرة {0.1، 0.01، 0.02}. يتم تطبيع المخطط التكراري أخيرًا للمعالجة اللاحقة. يتم حساب المدرج التكراري لعمود LBP و oBIFs لكتابة عينات من جميع الأفراد. من خلال تغيير المعلمات في حساب الميزات، يتم إنتاج تكوينات مختلفة من LBP و oBIFs ويتم تقديم المزيد من التفاصيل حول هذه التكوينات في القسم 4. 3.3 التصنيف لمهمة التحديد، نستخدم SVM كمصنف [44، 45]. يتم استخدام المدرجات التكرارية لعمود LBP و oBIFs المستخرجة من عينة(عينات) الكتابة للفرد لتدريب خوارزمية التعلم. يتم تدريب SVM على وظيفة نواة الأساس الشعاعي (RBF)، ويتم تحديد معلمة النواة في النطاق 0، 100]، بينما يتم تثبيت معلمة الهامش الناعم C على 10. لكل ميزة x يتم تغذيتها إلى مصنف SVM المدرب، يتم إنتاج n من درجات القرار fnj (x) لـ j = 1، 2،...، n. n هو العدد الإجمالي للكتاب ويتم اتخاذ القرار بشأن هوية الكاتب على النحو التالي. f m a x ( x ) = m a x ( f n j ( x); j = 1 ، 2 ،... ، n )( 5) fmax (x) هي القيمة القصوى المحددة من n الردود التي ينتجها المصنف و fn(x) هي تعيين قيم إخراج SVM الأصلية إلى الفاصل الزمني [0، 1] على النحو التالي. f n ( x ) = 1 1 + e - f ( x )( 6) بالإضافة إلى اتخاذ قرارات تحديد الهوية على كل من المخطط البياني لعمود LBP و OBIFs، نبلغ أيضًا عن أداء تحديد الهوية بناءً على اختيار القيمة القصوى من درجات القرار الطبيعية على كل من الميزتين. هناك طرق مختلفة للجمع بين قرارات المصنفين في محاولة لتعزيز معدلات التصنيف الإجمالية. تشمل الطرق الشائعة الاستخدام تصويت الأغلبية وعدد البوردا والمبلغ والمنتج والقواعد القصوى وما إلى ذلك. نظرًا لأننا نجمع بين القرارات بناءً على نوعين متميزين من الميزات، فإن المجموعات التي تستخدم تصويت الأغلبية أو عد بوردا لن تكون ذات مغزى كبير (نظرًا لوجود نتيجتين فقط). لكل نوع من الميزات (أعمدة LBP و oBIF)، يخرج مصنف SVM n درجات التشابه المقابلة لـ n كتاب في القاعدة المرجعية. كما ذكرنا سابقًا، يتم تعيين هذه الدرجات إلى الفاصل الزمني [0، 1] ؛ أعلى درجة، أكثر ثقة في أن المصنف هو في التنبؤ بتسمية الفصل المعني (الكاتب). تتنبأ قاعدة الحد الأقصى بفئة الإخراج عن طريق اختيار الفئة المقابلة لقيمة الثقة القصوى بين جميع المصنفات المشاركة. وبعبارة أخرى، بالنسبة للمشكلة قيد الدراسة، يبلغ النظام عن نتيجتين SLBP و SoBIFs. يضمن اختيار الحد الأقصى لدرجة [max(SLBP, SoBIFs)] اختيار القرار المقابل للمصنف الأكثر ثقة. يعمل هذا على تعويض الأخطاء وتحسين أداء التصنيف العام. فائدة الجمع بين قرارات

Translated Description (French)

IET BiometricsVolume 10, Issue 2 p. 179-193 RECHERCHE ORIGINALE PAPEROpen Access Texture feature column scheme for single- and multi-script writer identification Faycel Abbas, Correspondant Author Faycel Abbas faycel.abbas@univ-tebessa.dz LIMPAF Laboratory, Akli Mohand Oulhadj University, Bouira, Algeria Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria Correspondance Faycel Abbas, LIMPAF Laboratory, Akli Mohand Oulhadj University, Bouira, Algeria. Email : faycel.abbas@univ-tebessa.dzRecherche pour plus d'articles de cet auteurAbdeljalil Gattal, Abdeljalil Gattal Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, AlgeriaRecherche pour plus d'articles de cet auteurChawki Djeddi, Chawki Djeddi Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria LITIS Laboratory, University of Rouen, Rouen, FranceRecherche pour plus d'articles de cet auteurImran Siddiqi, Imran Siddiqi Vision & Learning Lab, Bahria University, Islamabad, PakistanRecherche pour plus d'articles de cet auteurAmeur Bensefia, Ameur Bensefia Higher Colleges of Technology, CIS Division, Abu Dhabi, UAESRecherche pour plus d'articles de cet auteurKamel Saoudi, Kamel Saoudi Department of Electrical Engineering, Akli Mohand Oulhadj University, Bouira, AlgeriaRecherche pour plus d'articles de cet auteur Faycel Abbas, Correspondant Author Faycel Abbas faycel.abbas@un-tebessa.dz LIMF Laboratory, Mohli Ouljhad, University, Bouira, Algeria Department of Mathematics, Tebsi, Tebessa University, AlgeriaRecherche pour plus d'articles de cet auteur Faycel Fay Fay Faycel.abbas@univessa.dzdimf Laboratory, Algeria. Courriel : faycel.abbas@univ-tebessa.dzRechercher d'autres articles de cet auteurAbdeljalil Gattal, Abdeljalil Gattal Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, AlgeriaRechercher d'autres articles de cet auteurChawki Djeddi, Chawki Djeddi Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria LITIS Laboratory, University of Rouen, Rouen, FranceRechercher d'autres articles de cet auteurImran Siddiqi, Imran Siddiqi Vision & Learning Lab, Bahria University, Islamabad, PakistanRechercherchercher d'autres articles de cet auteurAmeur Bensefia, Ameur Bensefia Higher Colleges of Technology, CIS Division, Abu Dhabi, UARechercher d'autres articles de cet auteurKamel Saoudi, Kamel Saoudi Department of Electrical Engineering, Akli Mohand Oulhadj University, Bouira, AlgeriaRechercher d'autres articles de cet auteur Première publication : 14 février 2021 https://doi.org/10.1049/bme2.12010Citations : 1AboutSectionsPDF ToolsRequest permissionExport citationAdd to favoritesTrack citation ShareShare Give accessShare full text accessShare full-text accessPlease review our Terms and Use and check box below to share full-text version of article.I have read and accept the Wiley Online Library Terms and Conditions of UseShareable LinkUse the link below to share a full-text version of this article avec vos amis et collègues. En savoir plus.Copy URL Share a linkShare onFacebookTwitterLinked InRedditWechat Abstract Identification of writers from images of handwriting is an interesting research problem in the handwriting recognition community. L'application des techniques d'analyse d'images et d'apprentissage automatique à ce problème permet de développer des solutions informatisées qui peuvent aider les experts légistes à réduire l'espace de recherche par rapport à un document remis en question. Cet article étudie l'efficacité des mesures texturales pour caractériser l'auteur d'un document manuscrit. Un nouveau descripteur par croisement des motifs binaires locaux (LBP) avec différentes configurations qui permet de capturer les informations texturales locales en écriture manuscrite à l'aide d'un histogramme de colonne est introduit. La représentation est enrichie de l'histogramme de colonne oBIFs (Basic Image Features) orienté. La machine à vecteurs de support (SVM) est utilisée comme classificateur, et l'étude expérimentale est réalisée sur cinq ensembles de données différents dans des scénarios d'évaluation uniques et multi-scripts. Les évaluations multi-scripts permettent d'évaluer l'hypothèse selon laquelle les rédacteurs partagent des caractéristiques communes à plusieurs scripts et les résultats rapportés valident l'efficacité des mesures texturales pour capturer ces informations spécifiques aux rédacteurs et indépendantes des scripts. 1 INTRODUCTION L'étude de l'écriture manuscrite et des formes dessinées à la main est toujours restée un sujet attrayant pour les historiens, les examinateurs de documents, les psychologues et les experts légistes. En plus du contenu sémantique, l'écriture manuscrite est connue pour transporter des informations riches sur l'individu qui la produit [1, 2]. Le plus remarquable d'entre eux est l'ensemble unique de préférences d'écriture représentées dans le style d'écriture. Ces caractéristiques spécifiques au rédacteur permettent d'identifier et d'authentifier la paternité d'un échantillon d'écriture manuscrite ; plus communément appelées identification du rédacteur et vérification du rédacteur respectivement. Formellement, le problème de l'identification de l'auteur implique un ensemble d'échantillons d'écriture avec des auteurs connus et la recherche de l'auteur d'une écriture en question, en le faisant correspondre avec ceux de l'ensemble de référence. Le problème étroitement lié à la vérification du rédacteur consiste à déterminer si un ensemble donné de deux échantillons d'écriture provient du même rédacteur ou de rédacteurs différents. L'identification et la vérification de l'écrivain constituent une composante importante de la biométrie comportementale [3, 4] et bien que la performance de l'écriture manuscrite en tant que modalité biométrique soit moins impressionnante que la biométrie physiologique (iris, empreintes digitales, ADN, etc.), l'acquisition de l'écriture manuscrite est non invasive et ne nécessite aucun matériel spécialisé. Avec les progrès de l'analyse d'image et de la classification des motifs, des efforts ont été faits pour développer des solutions informatisées pour analyser les images numérisées de l'écriture manuscrite. De tels systèmes visent à mapper les connaissances du domaine des experts médico-légaux en caractéristiques informatiques et ces caractéristiques sont utilisées pour caractériser l'auteur d'un document manuscrit [1, 5, 6]. Du point de vue des applications pratiques, de tels systèmes peuvent être utilisés pour faciliter les experts du domaine en récupérant une liste de candidats probables à partir d'un grand ensemble de référence, étant donné un document remis en question. Cela réduit l'espace de recherche et permet aux experts légistes de se concentrer sur un ensemble limité et gérable d'échantillons d'écriture pour une analyse manuelle et des conclusions décisives. L'identification de l'auteur peut être effectuée à partir d'une écriture manuscrite en ligne ou d'images hors ligne en mode dépendant du texte ou indépendant du texte [7, 8]. Du point de vue de l'identification de l'écrivain hors ligne, indépendante du texte, les solutions informatiques exploitent les différences visuelles de l'écriture manuscrite pour caractériser l'écrivain. Ces différences comprennent les variations allographiques, les espacements entre et à l'intérieur des mots, la pente des lignes, l'inclinaison des caractères, la lisibilité et la courbure. Peu de telles différences visuelles entre les échantillons d'écriture de deux écrivains peuvent être observées dans la figure 1. FIGURE 1Ouvrir dans la visionneuse de figuresÉchantillons PowerPoint de deux écrivains différents - Les images de chaque ligne représentent des échantillons du même écrivain Cet article présente une technique d'identification d'écrivain hors ligne tirant parti des riches informations texturales de l'écriture manuscrite et considérant l'écriture d'un individu comme une texture unique. En d'autres termes, la technique repose sur « comment » le texte est écrit plutôt que sur « ce qui » est écrit pour caractériser l'auteur. Des mesures de texture basées sur des histogrammes de colonnes de motifs binaires locaux (LBP) et de caractéristiques d'image de base orientées (oBIF), calculées à partir d'images d'écriture manuscrite, sont utilisées pour identifier l'auteur en utilisant la machine vectorielle de support (SVM) comme classificateur. La technique proposée est évaluée en mode simple ainsi qu'en mode multi-scripts et des taux d'identification élevés sont réalisés dans un certain nombre de scénarios expérimentaux. L'hypothèse selon laquelle les individus partagent des caractéristiques communes à travers plusieurs scripts est inspirée par le processus de génération d'écriture manuscrite. L'individualité de l'écriture manuscrite est due à de nombreux facteurs qui, en plus du style de livre de copie appris, comprennent la structure de la main, la prise du stylo, la force musculaire et les propriétés du système nerveux central [9]. L'écriture manuscrite est produite par une combinaison de coups d'écriture - les unités fondamentales du mouvement de la main (instrument d'écriture). Alors que les alphabets et les mots d'un script sont morphologiquement très différents de ceux d'un autre script, lorsqu'ils sont produits par le même écrivain, la même combinaison de traits d'écriture spécifique à l'écrivain est utilisée pour générer le produit final. Par conséquent, cette idée peut être utilisée pour effectuer l'identification de l'auteur dans un scénario indépendant du script. L'existence de schémas communs entre les échantillons d'écriture manuscrite (d'un écrivain individuel) dans plusieurs scripts a également été validée par un certain nombre d'études antérieures [10-12] et fait également l'objet de notre étude actuelle. Les principaux points saillants de cette étude sont énumérés dans ce qui suit : Enquête sur les mesures texturales dans la caractérisation d'un individu à partir de l'écriture manuscrite. Croiser plusieurs configurations de LBP et d'oBIF pour produire des histogrammes de colonne enrichissant ainsi la représentation des caractéristiques. Étude expérimentale sur cinq ensembles de données différents dans un scénario unique et multi-scripts. Validation de l'hypothèse selon laquelle les individus partagent des caractéristiques communes à travers plusieurs scripts. Réalisation de taux d'identification élevés surpassant l'état de l'art actuel sur ce problème. L'article est organisé comme suit. Dans la section suivante, nous discutons des progrès récents en matière d'identification des rédacteurs hors ligne. La section 3 présente les caractéristiques texturales utilisées pour caractériser l'auteur ainsi que les détails de la classification. L'étude expérimentale, la performance quantitative et une analyse détaillée des résultats rapportés sont présentées dans la section 4. La section 5 conclut l'article par une discussion sur les principales conclusions et idées sur les problèmes de recherche ouverte sur ce sujet. 2 TRAVAUX CONNEXES L'identification automatique des rédacteurs a considérablement évolué au fil des ans ; grâce aux efforts de recherche de la communauté de la classification des modèles et de la reconnaissance de l'écriture manuscrite. Alors que les tentatives préliminaires ciblaient les caractères isolés et l'identification dépendante du texte, des techniques robustes d'identification indépendante du texte ont été développées, rapportant des taux d'identification proches de 100% sur une liste de 10, avec une base de référence de l'ordre de 103 correspondant à la performance cible pour la plupart des applications médico-légales [9]. La plupart des recherches sur l'identification de l'auteur se sont concentrées sur l'écriture d'échantillons en un seul script [1, 13-15]. Une tendance relativement récente, cependant, a été d'enquêter sur ce problème dans un scénario multi-script où les mêmes personnes fournissent des échantillons d'écriture dans plus d'un script [16, 17]. Étudier les caractéristiques d'écriture communes et spécifiques à l'écrivain dans plusieurs scripts représente en effet un problème de recherche intéressant. Parmi les diverses fonctionnalités de calcul, la texture a été un choix populaire des chercheurs pour la caractérisation de l'écrivain. Bertolini et al. [13], par exemple, exploitent les fonctionnalités de quantification de phase locale (LPQ) et de LBP extraites de blocs d'écriture normalisés pour identifier l'auteur et signaler des taux d'identification élevés sur l'ensemble de données IAM et l'ensemble de données BFL (Brazilian Forensic Letter). Dans un autre travail similaire, Hannad et al. [18] plutôt que d'extraire des mesures texturales de blocs, considérez de petits fragments (fenêtres) d'écriture. En plus du LBP et du LPQ, la représentation est enrichie par un troisième descripteur de texture, le Local Ternary Patterns (LTP). Les caractéristiques sont évaluées en anglais (IAM) ainsi qu'en arabe (IFN/ENIT) et une analyse comparative des performances révèle que LPQ surpasse les autres descripteurs sur les deux ensembles de données. Entre autres mesures de texture, les oBIF [19] calculés à l'aide d'une banque de plusieurs filtres dérivés de Gauss ont également montré des performances efficaces d'identification de l'auteur. Une autre catégorie notable de techniques d'identification des rédacteurs est celle des méthodes basées sur les livres de codes. Ces méthodes extraient des motifs d'écriture fréquents pour caractériser l'écrivain [14]. Un livre de codes de contours de composants connectés fragmentés (FCO3) extraits de fragments de caractères (« fraglets »), par exemple, est étudié dans la Réf. [20]. Le livre de codes est produit en regroupant les fragments à l'aide de cartes auto-organisées (SOM) et la distribution de probabilité de production des modèles de livre de codes est utilisée pour identifier l'auteur. Une idée similaire est présentée par Siddiqi et al. [21] mais plutôt que de considérer des fragments de contour, le livre de code est généré en utilisant de petits fragments d'écriture. Dans une autre étude [22], un livre de codes synthétique est utilisé avec un schéma de sélection de caractéristiques pour réduire sa taille. He et al. [23] identifient les points de jonction dans l'écriture manuscrite et produisent un livre de codes de « junclets ». L'idée de codebooks a été étendue à un ensemble de codebooks (de graphèmes) suivi d'une réduction de dimensionnalité dans Ref. [24]. Dans un autre travail connexe, Khan et al. [25] exploitent les descripteurs de transformée en cosinus discrète en sac (BDCT) pour produire plusieurs livres de codes. La décision finale sur l'identité de l'auteur est prise par vote à la majorité. Dans une enquête récente [26], des points clés de l'écriture sont identifiés et des correctifs autour des points clés sont regroupés dans un livre de code pour caractériser l'auteur. Dans un certain nombre d'études récentes, l'apprentissage automatique des fonctionnalités à l'aide de réseaux neuronaux profonds a également été étudié pour l'identification de l'auteur. Les auteurs de la réf. [27], par exemple, exploitent les réseaux neuronaux convolutionnels pour apprendre des représentations de caractéristiques robustes à partir d'échantillons d'écriture et identifier l'auteur dans un système formable de bout en bout. Un certain nombre d'autres études similaires [28-31] démontrent également l'efficacité de l'apprentissage des caractéristiques pour la caractérisation de l'auteur et démontrent la robustesse des caractéristiques apprises par rapport aux méthodes traditionnelles. Il est cependant important de rappeler que pour un problème comme l'identification de l'auteur, alors que la taille globale de l'ensemble de données pourrait être de l'ordre de 103, le nombre d'échantillons par classe (d'auteur) est assez limité. En particulier, du point de vue des applications médico-légales du monde réel, une quantité très limitée de texte (dans certains cas, quelques lignes ou quelques mots seulement) est susceptible d'être disponible. Avec une quantité aussi limitée de données de formation par classe, former les CNN à apprendre des fonctionnalités pourrait être difficile. En outre, du point de vue des demandes d'expertise médico-légale, une solution « explicable » est nécessaire pour l'acceptation des applications informatisées dans leurs pratiques quotidiennes. Les fonctionnalités artisanales sont relativement plus « explicables » pour les experts du domaine que les fonctionnalités apprises à la machine et les experts peuvent également corréler ces fonctionnalités conçues à la main avec ce qu'ils utilisent dans l'analyse de l'écriture manuscrite. En d'autres termes, le mappage de la connaissance du domaine aux fonctionnalités de calcul est beaucoup plus évident. Cela sert à réduire à l'hésitation de ces experts à accepter des solutions automatisées pour faciliter leur analyse. Dans le contexte de l'identification des scripteurs multi-scripts, Djeddi et al. [32] exploitent les fonctionnalités de longueur d'exécution avec le classificateur KNN et SVM pour identifier les scripteurs dans des contextes expérimentaux multi-scripts. Les évaluations sur une collection d'échantillons d'écriture anglaise et grecque provenant de 126 auteurs différents rapportent des taux d'identification prometteurs. Dans un autre travail considérant le scénario multi-scripts, Graian et al. [10] utilisent des coefficients d'autorégression bidimensionnels (2D) pour caractériser l'écrivain à partir d'échantillons d'écriture en français et en bengali. De même, Bertolini et al. [11] étudient l'efficacité des caractéristiques texturales (LBP et LPQ) dans l'identification des écrivains dans un protocole expérimental multi-script avec des échantillons arabes et anglais de 475 écrivains de la base de données QUWI. Dans un autre travail similaire [12], les caractéristiques de charnière de bord et de longueur de course sont combinées pour identifier les écrivains à travers des échantillons en arabe, allemand, anglais et français. Des concours internationaux sur l'identification des auteurs de scripts multiples ont également été organisés, les plus notables étant le concours ICDAR 2015 [16] et le concours ICFHR 2018 [17]. Un résumé des contributions bien connues à l'identification des auteurs rapportées dans la littérature est présenté dans le tableau 1. Il est observé que l'identification des écrivains à partir d'échantillons d'écriture dans un seul script a été minutieusement étudiée dans la littérature et que des taux d'identification élevés ont été signalés. L'identification de l'écrivain dans des contextes multi-scripts, d'autre part, reste relativement moins explorée. Les taux d'identification signalés sont également relativement faibles dans de nombreux cas. Parmi les ensembles de données populaires, IAM et CVL ont été largement utilisés pour l'anglais tandis que IFN/ENIT et KHATT pour les échantillons d'écriture arabe. Il est cependant important de mentionner que tous ces ensembles de données n'ont pas été collectés en ciblant le problème d'identification de l'auteur. IAM et IFN/ENIT, par exemple, ont été principalement développés pour des tâches telles que la segmentation et la reconnaissance de l'écriture manuscrite. Cependant, comme les informations sur l'auteur étaient également stockées pendant la collecte de données, de nombreux chercheurs ont utilisé ces ensembles de données pour évaluer les systèmes d'identification de l'auteur. Les ensembles de données spécifiquement développés pour la tâche d'identification du rédacteur comprennent la lettre CEDAR [1], l'ensemble de données BFL [33], l'ensemble de données d'identification du rédacteur ICDAR 2015 [16] et l'ensemble de données d'identification du rédacteur ICFHR 2018 [17]. Alors que CEDAR [1] et BFL [33] sont des collections d'échantillons à script unique, de nombreux ensembles de données récents ciblent l'identification de l'auteur dans un scénario multi-scripts [16,17] et la même chose est abordée dans notre étude actuelle. TABLEAU 1. Aperçu des systèmes d'identification des écrivains bien connus Caractéristiques Base de données de l'étude Langue Nombre d'écrivains Taux de classification (%) Caractéristiques texturales Bertolini et al. (2013) IAM Anglais 650 96,70 BFL Portugais 315 99,20 Hannad et al. (2016) IFN/ENIT Arabic 411 94.89 IAM English 657 89.54 CVL English 310 96.20 Codebook-based Siddiqi and Vincent (2010) IAM English 650 91.00 He et al. (2015) IAM English 650 91.10 Firemaker Dutch 250 89.80 CERUG-MIXED Chinese and English 105 96.20 Abdi and Khemakhem (2015) IFN/ENIT Arabic 411 90.00 Khalifa et al. (2015) IAM English 650 92,00 Khan et al. (2017) IAM Anglais 650 97,20 CVL Anglais 310 99,60 IFN/ENIT Arabe 411 76,00 Bennour et al. (2019) BFL Portugais 300 98,33 CVL Anglais 300 94,00 KHAT Arabe 1000 62,81 Descripteurs locaux Christlein et al. (2017) IAM Anglais 650 88,00 CVL Anglais 310 99,20 KHATT Arabe 1000 98,80 CNN Nguyen et al. (2019) JEITA-HP Japanese 400 93.82 Firemaker English 250 92.38 IAM English 650 90.12 Multi-script studies AR coefficients Graian et al. (2009) RIMES + ISI French/Bengali 422 62.10 Edge-hinge et run-length Djeddi et al. (2012) GRDS Allemand/Anglais/Français 26 99,50 IFN/ENIT+GRDS Allemand/Anglais/Français/Arabe 301 93,30 Caractéristiques de longueur de course Djeddi et al. (2013) Latin & Greek Docs. Anglais/Grec 126 73,41/76,59 Caractéristiques texturales Bertolini et al. (2016) QUWI Arabic/English 475 77.90/98.70 English/Arabic 475 70.90/94.50 Zernike Moments ICDAR 2015 Winner QUWI Arabic/English 300 55.00 English/Arabic 300 29.00 3 METHODS Like all pattern classification systems, our writer identification technique relies on two key components, feature extraction and classification. Étant donné que nous ciblons l'identification de l'auteur de plusieurs scripts, les fonctionnalités calculées à l'échelle mondiale qui capturent le style d'écriture global ne sont pas susceptibles d'être efficaces car l'apparence visuelle globale des échantillons d'écriture dans différents scripts serait totalement différente (même s'ils proviennent du même auteur). Les fonctionnalités locales, d'autre part, permettent de capturer des informations d'AVC de bas niveau dans l'écriture manuscrite et ces informations sont indépendantes du script car un individu utilise le même ensemble de gestes d'écriture pour produire des caractères et des mots quel que soit le script. Nous calculons donc localement des descripteurs texturaux pour caractériser l'auteur. Nous introduisons une nouvelle représentation des motifs binaires locaux (histogramme de colonne LBP) et la combinons avec l'histogramme de colonne oBIFs pour enrichir la représentation. La classification est effectuée à l'aide du classificateur SVM. Chacun de ces composants est présenté en détail dans ce qui suit. 3.1 Schéma de colonnes pour les caractéristiques texturales L'extraction de représentations de caractéristiques robustes est l'élément central de tout système de classification. Compte tenu d'une collection d'échantillons de données (documents manuscrits dans notre cas) et des étiquettes de classe correspondantes (ID de rédacteur), l'idée est de rechercher une représentation efficace dans un espace de caractéristiques où les échantillons de la même classe (rédacteur) ont tendance à se regrouper alors que ceux des autres classes sont éloignés. Dans notre étude, nous étudions deux caractéristiques texturales, LBP et oBIFs. LBP capture les modèles spatiaux locaux dans l'écriture manuscrite. De même, les oBIF capturent les informations de symétrie locale. En outre, afin de capturer les mêmes informations et différentes échelles d'observations, nous calculons ces caractéristiques pour différents paramètres, puis calculons l'histogramme des colonnes, enrichissant ainsi davantage la représentation. 3.2 Histogramme de la colonne LBP Dans la continuité des efforts [34] pour rechercher des représentations texturales robustes, le descripteur LBP a été proposé pour la première fois dans Refs. [35, 36]. Il code chaque pixel dans une image avec un nombre décimal en fonction des valeurs de pixel voisines. L'encodage fonctionne en soustrayant le pixel de référence de chacun de ses (8) voisins. Si le résultat est une valeur négative, le voisin respectif se voit attribuer 1 et 0 sinon. La séquence binaire résultante est alors considérée comme un nombre et représente le code LBP du pixel central. Le descripteur de LBP proposé à l'origine est considéré comme un voisinage local de 3 × 3 et n'a pas pu capturer les informations structurelles à des échelles d'observations éloignées. Le descripteur a donc été étendu à de multiples résolutions [37] en utilisant des quartiers de tailles différentes. Le voisinage est généralisé en considérant un cercle centré au pixel à étiqueter et est défini par deux paramètres, le rayon R du cercle et le nombre de points d'échantillonnage P (équidistants) dans le voisinage (Figure 2). Les points qui ne représentent pas de vrais pixels sont interpolés et le voisinage est typiquement représenté par la paire (P, R). FIGURE 2Open in figure viewerPowerPoint Quartier circulaire pour deux combinaisons de paires (P, R) Les coordonnées de P voisins (xp, yp) sur la frontière du cercle de rayon R sont calculées par rapport au pixel central (xc, yc) comme suit. x p = x c + R c o s ( 2 π p P ) (1) y p = y c + R s i n ( 2 π p P ) (2) Si la valeur d'intensité du pixel central est gc et les valeurs d'intensité de ses voisins sont gp avec p = 0, 1, 2, …, P − 1, alors la texture T considère les signes des différences dans le voisinage local du pixel (xc, yc) et est définie comme : T ≈ ( s ( g 0 − g c ) , s ( g 1 − g c ) , … , s ( g P − 1 , g c ) ) (3)où, s(gp − gc) = 1 si (gp − gc) ≥ 0 et 0 sinon. L'information texturale locale est donc représentée comme une distribution conjointe de la valeur du pixel central et des différences. L'opérateur LBP étendu [37] est calculé en attribuant un poids binomial 2p à chaque s(gp − gc) comme suit. L B P P , R ( x c , y c ) = ∑ p = 0 P − 1 s ( g p − g c ) . 2 p (4)où, P est le nombre de pixels voisins et R est le rayon du cercle autour de (xc, yc). L'histogramme de ces nombres binaires est ensuite utilisé pour décrire la texture de l'image. La lombalgie est en outre caractérisée par des motifs uniformes et non uniformes. Un motif est qualifié d'uniforme s'il a au plus deux transitions binaires de 0 à 1 (ou vice versa) lorsque le motif est considéré comme une chaîne circulaire. Il en résulte P × (P − 1) + 3 valeurs uniques pour P bits. Par exemple, une cartographie uniforme de 8 points d'échantillonnage produit 59 valeurs uniques tandis qu'avec 16 points d'échantillonnage, 243 valeurs différentes sont produites. Du point de vue de la représentation d'un échantillon d'écriture manuscrite à l'aide de descripteurs LBP, des images LBP pour différentes combinaisons de points d'échantillonnage P et de rayon R sont calculées. Ces images LBP sont ensuite empilées représentant chaque pixel comme un vecteur colonne. L'image est ensuite codée à l'aide d'un histogramme (normalisé) de ces colonnes. La figure 3 illustre le processus de calcul de l'histogramme de colonne LBP à partir d'images LBP correspondant à deux ensembles de valeurs (P, R). L'histogramme de colonne enrichit le descripteur LBP en prenant en compte plusieurs résolutions (échelles d'observations) correspondant à différentes valeurs de P et R. Alors que la méthode LBP originale considère le voisinage local comme un pixel pour une paire donnée de valeurs (P, R), nous proposons d'améliorer la fonction LBP de base en calculant deux images LBP différentes pour deux paires de valeurs (P, R), en les empilant ensemble, puis en calculant l'histogramme de colonne LBP qui capture des informations de texture et de symétrie locales beaucoup plus riches dans l'image (écriture manuscrite). Différentes combinaisons de valeurs (P, R) dans le calcul des histogrammes de colonne représentent différentes échelles auxquelles l'écriture est analysée ; combinées dans un vecteur de caractéristiques unique et amélioré. FIGURE 3Ouvrir dans la visionneuse de figuresPowerPoint Différentes étapes du schéma de colonnes LBP : (a) Image originale ; (b) Les deux images LBP à différents paramètres (image LBP (p = 4, R = 16), image LBP (p = 8, R = 2)) sont croisées pour former des colonnes à chaque emplacement ; (c) L'histogramme est calculé avec les colonnes 3.2.1 Histogramme de colonne oBIF Un autre ensemble de mesures texturales étudiées dans notre étude comprend l'oBIF. Ces caractéristiques ont été appliquées avec succès à des problèmes tels que la classification des textures [38], la reconnaissance des chiffres [39] et l'identification des écrivains [19]. Dans nos études précédentes, nous avons utilisé des oBIF pour la classification du genre à partir de l'écriture manuscrite [40] et l'identification des écrivains à partir de manuscrits historiques [41]. Dans la présente étude, l'objectif de l'utilisation de ces caractéristiques est de compléter les histogrammes des colonnes LBP et d'enrichir la représentation texturale de l'écriture manuscrite. Les oBIF représentent une extension des fonctionnalités d'image de base (BIF) [42, 43]. L'idée clé est d'étiqueter chaque emplacement de l'image avec l'une des sept classes de symétrie locale. Les caractéristiques sont calculées en appliquant une banque de dérivées de filtres gaussiens contrôlés par un paramètre d'échelle σ. Un paramètre supplémentaire est utilisé pour classer un emplacement comme « plat ». Trois de ces types de symétrie sont accompagnés de n orientations possibles, la classe de pente a 2n orientations possibles tandis que trois des classes n'ont aucune orientation. Cela donne un vecteur oBIF de 5n + 3. Plus de détails sur les aspects informatiques des oBIF peuvent être trouvés dans nos travaux précédents [40]. Dans le présent travail, nous quantifions l'orientation en n = 4 directions, produisant ainsi 23 entrées (5 × 4 + 3) dans le dictionnaire oBIFs. Semblable au descripteur LBP, les oBIF à deux échelles différentes sont empilés (en ignorant le type de symétrie à plat) et l'histogramme de colonne est calculé. L'histogramme a un total de (5n + 2)2 = 484 cases. Le paramètre d'échelle est choisi dans l'ensemble σ ∈{1, 2, 4, 8, 16}, tandis que ≃ est choisi dans un ensemble de trois petites valeurs {0,1, 0,01, 0,02}. L'histogramme est finalement normalisé pour un traitement ultérieur. Les histogrammes des colonnes LBP et oBIFs sont calculés pour l'écriture d'échantillons de tous les individus. En faisant varier les paramètres dans le calcul des caractéristiques, différentes configurations de LBP et d'oBIF sont produites et plus de détails sur ces configurations sont présentés dans la section 4. 3.3 Classification Pour la tâche d'identification, nous utilisons SVM comme classificateur [44, 45]. Les histogrammes des colonnes LBP et oBIFs extraits du ou des échantillonsd'écriture d'un individu sont utilisés pour former l'algorithme d'apprentissage. SVM est entraîné avec la fonction de noyau de base radiale (RBF), le paramètre de noyau est sélectionné dans la plage 0, 100], tandis que le paramètre de marge souple C est fixé à 10. Pour chaque caractéristique x fournie au classificateur SVM formé, n scores de décision fnj (x) pour j = 1, 2, …, n sont produits. n est le nombre total d'écrivains et la décision sur l'identité de l'écrivain est prise comme suit. f m a x ( x ) = m a x ( f n j ( x ) ; j = 1 , 2, … , n ) (5) fmax(x) est la valeur maximale sélectionnée parmi n réponses produites par le classificateur et fn(x) est le mappage des valeurs de sortie SVM originales à l'intervalle [0, 1] comme suit. f n ( x ) = 1 1 + e − f ( x ) (6) En plus de prendre les décisions d'identification sur chacun des histogrammes de colonne LBP et OBIF, nous rapportons également les performances d'identification en fonction du choix de la valeur maximale des scores de décision normalisés sur chacune des deux caractéristiques. Il existe différentes façons de combiner les décisions des classificateurs dans le but d'améliorer les taux de classification globaux. Les méthodes couramment utilisées comprennent le vote à la majorité, le comptage de Borda, la somme, le produit et les règles maximales, etc. Étant donné que nous combinons les décisions basées sur deux types de caractéristiques distincts, les combinaisons utilisant le vote à la majorité ou le comptage de Borda ne seraient pas très significatives (car il n'y a que deux scores). Pour chaque type de caractéristique (colonnes LBP et oBIF), le classificateur SVM produit n scores de similarité correspondant à n écrivains dans la base de référence. Comme mentionné précédemment, ces scores sont mappés à l'intervalle [0, 1] ; plus le score est élevé, plus le classificateur est confiant dans la prédiction de l'étiquette de classe respective (écrivain). La règle max prédit la classe de sortie en choisissant la classe correspondant à la valeur de confiance maximale parmi tous les classificateurs participants. En d'autres termes, pour le problème à l'étude, le système rapporte deux scores SLBP et SoBIF. La sélection du score maximum [max(SLBP, SoBIFs)] garantit que nous choisissons la décision correspondant au classificateur qui est plus confiante. Cela permet de compenser les erreurs et d'améliorer la performance globale de la classification. L'utilité de combiner les décisions d'un

Translated Description (Spanish)

IET BiometricsVolumen 10, Número 2 pág. 179-193 INVESTIGACIÓN ORIGINAL PAPEROpen Access Texture feature column scheme for single- and multi-script writer identification Faycel Abbas, Corresponding Author Faycel Abbas faycel.abbas@univ-tebessa.dz LIMPAF Laboratory, Akli Mohand Oulhadj University, Bouira, Algeria Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria Correspondence Faycel Abbas, LIMPAF Laboratory, Akli Mohand Oulhadj University, Bouira, Algeria. Correo electrónico: faycel.abbas@univ-tebessa.dzBuscar más artículos de este autorAbdeljalil Gattal, Abdeljalil Gattal Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, AlgeriaBuscar más artículos de este autorChawki Djeddi, Chawki Djeddi Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria LITIS Laboratory, University of Rouen, Rouen, FranceBuscar más artículos de este autorImran Siddiqi, Imran Siddiqi Vision & Learning Lab, Bahria University, Islamabad, PakistanBuscar más artículos de este autorAmeur Bensefia, Ameur Bensefia Higher Colleges of Technology, CIS Division, Abu Dhabi, UAESearch más artículos de este autorKamel Saoudi, Kamel Saoudi Department of Electrical Engineering, Akli Mohand Oulhadj University, Bouira, AlgeriaBuscar más artículos de este autorFay Abbas, Corresponding Author Faycel faycel.abbas@univ-tebessa.dz LIMPAF Laboratory, Akli Mohandulhadj, Bouja University, Algeria Department of Mathematics, Larbi University, Corbessa, Algeria Ludi, Algeria Lapadjad, Algeria. Correo electrónico: faycel.abbas@univ-tebessa.dzBuscar más artículos de este autorAbdeljalil Gattal, Abdeljalil Gattal Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, AlgeriaBuscar más artículos de este autorChawki Djeddi, Chawki Djeddi Department of Mathematics and Computer Science, Larbi Tebessi University, Tebessa, Algeria LITIS Laboratory, University of Rouen, Rouen, FranceBuscar más artículos de este autorImran Siddiqi, Imran Siddiqi Vision & Learning Lab, Bahria University, Islamabad, PakistanBuscar más artículos de este autorAmeur Bensefia, Ameur Bensefia Higher Colleges of Technology, CIS Division, Abu Dhabi, UAESearch for more papers by this authorKamel Saoudi, Kamel Saoudi Department of Electrical Engineering, Akli Mohand Oulhadj University, Bouira, AlgeriaSearch for more papers by this author First published: 14 February 2021 https://doi.org/10.1049/bme2.12010Citations: 1AboutSectionsPDF ToolsRequest permissionExport citationAdd to favoritesTrack citation ShareShare Give accessShare full text accessShare full-text accessPlease review our Terms and Conditions of Use and check box below to share full-text version of article.I have read and accept the Wiley Online Library Terms and Conditions of UseShareable LinkUse the link below to share a full-text version of this article con tus amigos y colegas. Más información.Copiar URL Compartir un enlaceCompartir enFacebookTwitterLinked InRedditWechat Abstract La identificación de escritores a partir de imágenes de escritura a mano es un problema de investigación interesante en la comunidad de reconocimiento de escritura a mano. La aplicación de técnicas de análisis de imágenes y aprendizaje automático a este problema permite el desarrollo de soluciones computarizadas que pueden facilitar a los expertos forenses la reducción del espacio de búsqueda frente a un documento cuestionado. Este artículo investiga la efectividad de las medidas de textura para caracterizar al escritor de un documento escrito a mano. Se introduce un novedoso descriptor cruzando los patrones binarios locales (LBP) con diferentes configuraciones que permite capturar la información textural local de forma manuscrita mediante un histograma de columnas. La representación se enriquece con el histograma de columna Basic Image Features (oBIFs) orientado. La máquina de vectores de soporte (SVM) se emplea como clasificador, y el estudio experimental se lleva a cabo en cinco conjuntos de datos diferentes en escenarios de evaluación individuales y multiscript. Las evaluaciones de múltiples guiones permiten evaluar la hipótesis de que los escritores comparten características comunes en múltiples guiones y los resultados informados validan la efectividad de las medidas de textura para capturar esta información independiente del guion y específica del escritor. 1 INTRODUCCIÓN El estudio de la escritura a mano y las formas dibujadas a mano siempre ha sido un tema atractivo para historiadores, examinadores de documentos, psicólogos y expertos forenses. Además del contenido semántico, se sabe que la escritura a mano contiene información rica sobre el individuo que la produce [1, 2]. El más notable de ellos es el conjunto único de preferencias de escritura representadas en el estilo de escritura. Estas características específicas del escritor permiten identificar y autenticar la autoría de una muestra de escritura a mano; más comúnmente conocido como identificación del escritor y verificación del escritor, respectivamente. Formalmente, el problema de la identificación del escritor implica un conjunto de muestras de escritura con escritores conocidos y encontrar al escritor de una escritura en cuestión, emparejándola con las del conjunto de referencia. El problema estrechamente relacionado de la verificación de escritores incluye concluir si un conjunto dado de dos muestras de escritura proviene de los mismos o diferentes escritores. La identificación y verificación del escritor forman un componente importante de la biometría del comportamiento [3, 4] y, aunque el rendimiento de la escritura a mano como modalidad biométrica es menos impresionante que la biometría fisiológica (iris, huellas dactilares, ADN, etc.), la adquisición de la escritura a mano no es invasiva y no requiere ningún hardware especializado. Con los avances en el análisis de imágenes y la clasificación de patrones, se han realizado esfuerzos para desarrollar soluciones computarizadas para analizar imágenes digitalizadas de escritura a mano. Dichos sistemas tienen como objetivo mapear el conocimiento del dominio de los expertos forenses en características computacionales y estas características se emplean para caracterizar al escritor de un documento escrito a mano [1, 5, 6]. Desde el punto de vista de las aplicaciones prácticas, tales sistemas se pueden emplear para facilitar a los expertos en el dominio mediante la recuperación de una lista de posibles candidatos de un gran conjunto de referencia, dado un documento cuestionado. Esto reduce el espacio de búsqueda y permite a los expertos forenses centrarse en un conjunto limitado y manejable de muestras de escritura para el análisis manual y las conclusiones decisivas. La identificación del escritor se puede llevar a cabo a partir de escritura a mano en línea o imágenes fuera de línea en modo dependiente de texto o independiente de texto [7, 8]. Desde la perspectiva de la identificación del escritor fuera de línea e independiente del texto, las soluciones computarizadas explotan las diferencias visuales en la escritura para caracterizar al escritor. Estas diferencias incluyen variaciones alográficas, espaciados entre palabras e intrapalabras, pendiente de las líneas, inclinación de los caracteres, legibilidad y cursividad. Pocas de estas diferencias visuales entre las muestras de escritura de dos escritores se pueden observar en la Figura 1. FIGURA 1Abrir en el visor de figurasPowerPoint Muestras de dos escritores diferentes: las imágenes de cada fila representan muestras del mismo escritor Este artículo presenta una técnica de identificación de escritores sin conexión que aprovecha la rica información de textura en la escritura a mano y considera la escritura a mano de un individuo como una textura única. En otras palabras, la técnica se basa en "cómo" se escribe el texto en lugar de "qué" se escribe para caracterizar al escritor. Las medidas de textura basadas en histogramas de columna de patrones binarios locales (LBP) y características de imagen básicas orientadas (oBIF), calculadas a partir de imágenes de escritura a mano, se emplean para identificar al escritor utilizando Support Vector Machine (SVM) como clasificador. La técnica propuesta se evalúa en un solo modo, así como en un modo multi-script y se realizan altas tasas de identificación en una serie de escenarios experimentales. La hipótesis de que las personas comparten características comunes en múltiples guiones se inspira en el proceso de generación de escritura a mano. La individualidad en la escritura a mano es aportada por muchos factores que, además del estilo de libro de copia aprendido, incluyen la estructura de la mano, el agarre de la pluma, la fuerza muscular y las propiedades del sistema nervioso central [9]. La escritura a mano se produce mediante una combinación de trazos de escritura, las unidades fundamentales de movimiento de la mano (instrumento de escritura). Mientras que los alfabetos y las palabras en un guión son morfológicamente muy diferentes de los de otro guión, cuando son producidos por el mismo escritor, se emplea la misma combinación específica de trazos de escritura para generar el producto final. Por lo tanto, esta idea se puede emplear para llevar a cabo la identificación del escritor en un escenario independiente del guión. La existencia de patrones comunes en las muestras de escritura a mano (de un escritor individual) en múltiples guiones también ha sido validada por una serie de estudios previos [10-12] y también es el tema de nuestro estudio actual. Los aspectos más destacados de este estudio se enumeran a continuación: Investigación de las medidas de textura en la caracterización de un individuo a partir de la escritura a mano. Cruzar múltiples configuraciones de LBP y oBIF para producir histogramas de columna, enriqueciendo así la representación de características. Estudio experimental sobre cinco conjuntos de datos diferentes en un escenario único y multiscript. Validación de la hipótesis de que los individuos comparten características comunes en múltiples guiones. La realización de altas tasas de identificación supera el estado actual de la técnica en este problema. El artículo está organizado de la siguiente manera. En la siguiente sección, discutimos los avances recientes en la identificación de escritores sin conexión. La sección 3 presenta las características texturales empleadas para caracterizar al escritor junto con los detalles de la clasificación. El estudio experimental, el rendimiento cuantitativo y un análisis detallado de los resultados informados se presentan en la Sección 4. La sección 5 concluye el artículo con una discusión sobre los hallazgos clave y las ideas sobre los problemas de investigación abiertos sobre este tema. 2 OBRAS RELACIONADAS La identificación automática de escritores ha madurado significativamente a lo largo de los años; gracias a los esfuerzos de investigación de la comunidad de clasificación de patrones y reconocimiento de escritura a mano. Si bien los intentos preliminares se dirigieron a caracteres aislados e identificación dependiente del texto, se han desarrollado técnicas sólidas de identificación de escritores independientes del texto que informan tasas de identificación cercanas al 100% en una lista de 10, con una base de referencia del orden de 103 que coincide con el rendimiento objetivo para la mayoría de las aplicaciones forenses [9]. La mayor parte de la investigación sobre la identificación del escritor se centró en escribir muestras en un solo guión [1, 13-15]. Una tendencia relativamente reciente, sin embargo, ha sido investigar este problema en un escenario multi-script donde los mismos individuos proporcionan muestras de escritura en más de un script [16, 17]. De hecho, investigar las características de escritura comunes y específicas del escritor en múltiples guiones representa un problema de investigación interesante. Entre varias características computacionales, la textura ha sido una opción popular de los investigadores para la caracterización del escritor. Bertolini et al. [13], por ejemplo, explotan las características de cuantificación de fase local (LPQ) y LBP extraídas de bloques normalizados de escritura a mano para identificar al escritor e informar altas tasas de identificación en el conjunto de datos de IAM y el conjunto de datos de la Carta Forense Brasileña (BFL). En otro trabajo similar, Hannad et al. [18] en lugar de extraer medidas de textura de bloques, considere pequeños fragmentos (ventanas) de escritura. Además de LBP y LPQ, la representación se enriquece con un tercer descriptor de textura, los patrones ternarios locales (LTP). Las características se evalúan en muestras de escritura en inglés (IAM) y en árabe (IFN/ENIT) y un análisis de rendimiento comparativo revela que LPQ supera a otros descriptores en ambos conjuntos de datos. Entre otras medidas de textura, los oBIF [19] calculados utilizando un banco de múltiples filtros derivados de Gauss, también han demostrado un rendimiento efectivo de identificación del escritor. Otra categoría notable de técnicas de identificación de escritores son los métodos basados en libros de códigos. Estos métodos extraen patrones de escritura frecuentes para caracterizar al escritor [14]. Un libro de códigos de contornos de componentes conectados fragmentados (FCO3) extraídos de fragmentos de caracteres ('fraglets'), por ejemplo, se estudia en la Ref. [20]. El libro de códigos se produce agrupando los fragmentos utilizando mapas autoorganizados (SOM) y la distribución de probabilidad de producir los patrones del libro de códigos se utiliza para identificar al escritor. Siddiqi et al. [21] presentan una idea similar, pero en lugar de considerar fragmentos de contorno, el libro de códigos se genera utilizando pequeños fragmentos de escritura. En otro estudio [22], se emplea un libro de códigos sintético junto con un esquema de selección de características para reducir su tamaño. He et al. [23] identifican los puntos de unión en la escritura a mano y producen un libro de códigos de 'junclets'. La idea de los libros de códigos se extendió a un conjunto de libros de códigos (de grafemas) seguido de la reducción de la dimensionalidad en la Ref. [24]. En otro trabajo relacionado, Khan et al. [25] explotan los descriptores de transformada discreta de coseno embolsada (BDCT) para producir múltiples libros de códigos. La decisión final sobre la identidad del escritor se alcanza a través de la votación por mayoría. En una investigación reciente [26], se identifican los puntos clave de la escritura a mano y los parches alrededor de los puntos clave se agrupan en un libro de códigos para caracterizar al escritor. En varios estudios recientes, también se ha investigado el aprendizaje automático de funciones mediante redes neuronales profundas para la identificación de escritores. Los autores en Ref. [27], por ejemplo, explotan las redes neuronales convolucionales para aprender representaciones de características sólidas a partir de muestras de escritura e identificar al escritor en un sistema entrenable de extremo a extremo. Varios otros estudios similares [28-31] también demuestran la eficacia del aprendizaje de características para la caracterización del escritor y demuestran la solidez de las características aprendidas sobre los métodos tradicionales. Sin embargo, es importante recordar que para un problema como la identificación del escritor, mientras que los tamaños generales del conjunto de datos podrían ser del orden de 103, el número de muestras por clase (escritora) es bastante limitado. Especialmente, desde el punto de vista de las aplicaciones forenses del mundo real, es probable que esté disponible una cantidad muy limitada de texto (en algunos casos solo unas pocas líneas o palabras). Con una cantidad tan limitada de datos de capacitación por clase, capacitar a las CNN para aprender las funciones podría ser un desafío. Además, desde la perspectiva de las aplicaciones para expertos forenses, se necesita una solución "explicable" para la aceptación de aplicaciones computarizadas en sus prácticas diarias. Las características hechas a mano son relativamente más "explicables" para los expertos en el dominio en lugar de las características aprendidas a máquina y los expertos también pueden correlacionar estas características diseñadas a mano con lo que emplean en el análisis de escritura a mano. En otras palabras, el mapeo del conocimiento del dominio a las características de los cálculos es mucho más evidente. Esto sirve para reducir la vacilación de estos expertos en aceptar soluciones automatizadas para facilitar su análisis. En el contexto de la identificación de escritores multi-script, Djeddi et al. [32] explotan las características de longitud de ejecución con el clasificador KNN y SVM para identificar escritores en entornos experimentales multi-script. Las evaluaciones de una colección de muestras de escritura en inglés y griego de 126 escritores diferentes informan tasas de identificación prometedoras. En otro trabajo que considera el escenario de múltiples guiones, Graian et al. [10] emplean coeficientes de autorregresión bidimensionales (2D) para caracterizar al escritor a partir de muestras de escritura en francés y bengalí. Del mismo modo, Bertolini et al. [11] estudian la efectividad de las características texturales (LBP y LPQ) en la identificación de escritores en un protocolo experimental de múltiples guiones con muestras en árabe e inglés de 475 escritores de la base de datos QUWI. En otro trabajo similar [12], las características de bisagra de borde y longitud de carrera se combinan para identificar a los escritores a través de muestras en árabe, alemán, inglés y francés. También se han organizado concursos internacionales sobre identificación de escritores de múltiples guiones, los más notables de los cuales incluyen el ICDAR 2015 [16] y el ICFHR 2018 [17]. En la Tabla 1 se presenta un resumen de las contribuciones conocidas a la identificación del escritor informadas en la literatura. Se observa que la identificación de escritores a partir de muestras de escritura en un solo guión se ha investigado a fondo en la literatura y se han reportado altas tasas de identificación. La identificación del escritor en entornos de múltiples guiones, por otro lado, sigue siendo relativamente menos explorada. Las tasas de identificación informadas también son relativamente bajas en muchos casos. Entre los conjuntos de datos populares, IAM y CVL se han empleado ampliamente para el inglés, mientras que IFN/ENIT y KHATT para las muestras de escritura árabe. Sin embargo, es importante mencionar que no todos estos conjuntos de datos se recopilaron para abordar el problema de identificación del escritor. IAM e IFN/ENIT, por ejemplo, se desarrollaron principalmente para tareas como la segmentación y el reconocimiento de la escritura a mano. Sin embargo, dado que la información del escritor también se almacenó durante la recopilación de datos, muchos investigadores emplearon estos conjuntos de datos para la evaluación de los sistemas de identificación del escritor. Los conjuntos de datos desarrollados específicamente para la tarea de identificación de escritores incluyen la letra CEDRO [1], el conjunto de datos BFL [33], el conjunto de datos de identificación de escritores ICDAR 2015 [16] y el conjunto de datos de identificación de escritores ICFHR 2018 [17]. Si bien CEDAR [1] y BFL [33] son colecciones de muestras de un solo guión, muchos de los conjuntos de datos recientes se dirigen a la identificación del escritor en un escenario de múltiples guiones [16,17] y lo mismo se está abordando en nuestro estudio actual. TABLA 1. Una descripción general de los sistemas de identificación de escritores conocidos Características Base de datos del estudio Idioma Número de escritores Tasas de clasificación (%) Características texturales Bertolini et al. (2013) IAM English 650 96.70 BFL Portugués 315 99.20 Hannad et al. (2016) IFN/ENIT Arabic 411 94.89 IAM English 657 89.54 CVL English 310 96.20 Codebook-based Siddiqi and Vincent (2010) IAM English 650 91.00 He et al. (2015) IAM English 650 91.10 Firemaker Dutch 250 89.80 CERUG-MIXED Chinese and English 105 96.20 Abdi and Khemakhem (2015) IFN/ENIT Arabic 411 90.00 Khalifa et al. (2015) IAM English 650 92.00 Khan et al. (2017) IAM English 650 97.20 CVL English 310 99.60 IFN/ENIT Arabic 411 76.00 Bennour et al. (2019) BFL Portugués 300 98.33 CVL Inglés 300 94.00 KHAT Árabe 1000 62.81 Descriptores locales Christlein et al. (2017) IAM English 650 88.00 CVL English 310 99.20 KHATT Arabic 1000 98.80 CNN Nguyen et al. (2019) JEITA-HP Japonés 400 93.82 Inglés Firemaker 250 92.38 IAM Inglés 650 90.12 Estudios multi-script Coeficientes AR Graian et al. (2009) RIMES + ISI French/Bengali 422 62.10 Edge-binge and run-length Djeddi et al. (2012) GRDS German/English/French 26 99.50 IFN/ENIT+GRDS German/English/French/Arabic 301 93.30 Run-length features Djeddi et al. (2013) Latin & Greek Docs. Inglés/Griego 126 73.41/76.59 Características texturales Bertolini et al. (2016) QUWI Arabic/English 475 77.90/98.70 English/Arabic 475 70.90/94.50 Zernike Moments ICDAR 2015 Ganador QUWI Arabic/English 300 55.00 English/Arabic 300 29.00 3 MÉTODOS Como todos los sistemas de clasificación de patrones, nuestra técnica de identificación de escritores se basa en dos componentes clave, extracción y clasificación de características. Dado que nos enfocamos en la identificación de escritores de múltiples guiones, es poco probable que las características calculadas globalmente que capturan el estilo de escritura general sean efectivas, ya que la apariencia visual general de las muestras de escritura en diferentes guiones sería totalmente diferente (incluso si provienen del mismo escritor). Las características locales, por otro lado, permiten capturar información de trazos de bajo nivel en la escritura a mano y esta información es independiente del guión, ya que un individuo emplea el mismo conjunto de gestos de escritura para producir caracteres y palabras independientemente del guión. Por lo tanto, calculamos localmente descriptores de textura para caracterizar al escritor. Introducimos una nueva representación de los patrones binarios locales (histograma de la columna LBP) y la combinamos con el histograma de la columna oBIFs para enriquecer la representación. La clasificación se realiza utilizando el clasificador SVM. Cada uno de estos componentes se presenta en detalle a continuación. 3.1 Esquema de columnas para características de textura La extracción de representaciones de características robustas es el componente central de cualquier sistema de clasificación. Dada una colección de muestras de datos (documentos escritos a mano en nuestro caso) y las etiquetas de clase correspondientes (ID de escritor), la idea es buscar una representación efectiva en un espacio de características donde las muestras de la misma clase (escritor) tienden a agruparse mientras que las de otras clases están muy separadas. En nuestro estudio, investigamos dos características texturales, LBP y oBIF. LBP captura los patrones espaciales locales en la escritura a mano. Asimismo, los oBIF capturan la información de simetría local. Además, para capturar la misma información y diferentes escalas de observaciones, calculamos estas características para diferentes configuraciones de parámetros y luego calculamos el histograma de la columna, lo que enriquece aún más la representación. 3.2 Histograma de la columna LBP En continuación de los esfuerzos [34] para buscar representaciones texturales sólidas, el descriptor LBP se propuso por primera vez en las Refs. [35, 36]. Codifica cada píxel en una imagen con un número decimal en función de los valores de píxeles vecinos. La codificación funciona restando el píxel de referencia de cada uno de sus (8) vecinos. Si el resultado es un valor negativo, al vecino respectivo se le asigna 1 y 0 en caso contrario. La secuencia binaria resultante se considera entonces como un número y representa el código LBP del píxel central. El descriptor de LBP propuesto originalmente se considera un vecindario local de 3 × 3 y no pudo capturar la información estructural a escalas distantes. Por lo tanto, el descriptor se extendió a múltiples resoluciones [37] mediante el uso de vecindarios de diferentes tamaños. El vecindario se generaliza considerando un círculo centrado en el píxel a etiquetar y se define por dos parámetros, el radio R del círculo y el número de puntos de muestreo P (equidistantes) en el vecindario (Figura 2). Los puntos que no representan píxeles verdaderos se interpolan y el vecindario generalmente está representado por el par (P, R). FIGURA 2Abrir en el visor de figurasPowerPoint Vecindario circular para dos combinaciones de pares (P, R) Las coordenadas de P vecinos (xp, yp) en el límite del círculo con radio R se calculan con respecto al píxel central (xc, yc) de la siguiente manera. x p = x c + R c o s ( 2 π p P ) (1) y p = y c + R s i n ( 2 π p P ) (2) Si el valor de intensidad del píxel central es gc y los valores de intensidad de sus vecinos son gp con p = 0, 1, 2, …, P − 1, entonces la textura T considera los signos de las diferencias en el vecindario local del píxel (xc, yc) y se define como: T ≈ ( s ( g 0 − g c ) , s ( g 1 − g c ) , … , s ( g P − 1 , g c ) ) (3)donde, s(gp − gc) = 1 si (gp − gc) ≥ 0 y 0 de lo contrario. Por lo tanto, la información de textura local se representa como una distribución conjunta del valor del píxel central y las diferencias. El operador LBP extendido [37] se calcula asignando un peso binomial 2p a cada s(gp - gc) de la siguiente manera. L B P P , R ( x c , y c ) = ∑ p = 0 P − 1 s ( g p − g c ) . 2 p (4)donde, P es el número de píxeles vecinos y R es el radio del círculo alrededor de (xc, yc). El histograma de estos números binarios se utiliza para describir la textura de la imagen. El dolor lumbar se caracteriza además por patrones uniformes y no uniformes. Un patrón se denomina uniforme si tiene como máximo dos transiciones bit a bit de 0 a 1 (o viceversa) cuando el patrón se considera una cadena circular. Esto da como resultado P × (P − 1) + 3 valores únicos para P bits. Por ejemplo, el mapeo uniforme de 8 puntos de muestreo produce 59 valores únicos, mientras que con 16 puntos de muestreo, se producen 243 valores diferentes. Desde el punto de vista de representar una muestra de escritura a mano utilizando descriptores LBP, se calculan imágenes LBP para diferentes combinaciones de puntos de muestreo P y radio R. Estas imágenes LBP se apilan y representan cada píxel como un vector de columna. La imagen se codifica utilizando un histograma (normalizado) de estas columnas. La Figura 3 ilustra el proceso de cálculo del histograma de columna LBP a partir de imágenes LBP correspondientes a dos conjuntos de valores (P, R). El histograma de columna enriquece el descriptor de LBP teniendo en cuenta múltiples resoluciones (escalas de observaciones) correspondientes a diferentes valores de P y R. Mientras que el método original de LBP considera que el vecindario local es un píxel para un par dado de valores (P, R), proponemos mejorar la característica básica de LBP calculando dos imágenes de LBP diferentes para dos pares de valores (P, R), apilándolas y luego calculando el histograma de columna de LBP que captura información de textura y simetría local mucho más rica en la imagen (escritura a mano). Diferentes combinaciones de valores (P, R) en el cálculo de los histogramas de columna representan diferentes escalas en las que se analiza la escritura a mano; combinados en un vector de características único y mejorado. FIGURA 3Abrir en el visor de figurasPowerPoint Diferentes pasos del esquema de columnas LBP: (a) Imagen original; (b) Ambas imágenes LBP en diferentes parámetros (imagen LBP (p = 4, R = 16), imagen LBP (p = 8, R = 2)) se cruzan para formar columnas en cada ubicación; (c) El histograma se calcula con las columnas 3.2.1 histograma de columna oBIF Otro conjunto de medidas de textura investigado en nuestro estudio comprende el oBIF. Estas características se han aplicado con éxito a problemas como la clasificación de texturas [38], el reconocimiento de dígitos [39] y la identificación de escritores [19]. En nuestros estudios anteriores, empleamos oBIF para la clasificación del género a partir de la escritura a mano [40] y la identificación de escritores a partir de manuscritos históricos [41]. En el presente estudio, el objetivo de emplear estas características es complementar los histogramas de la columna LBP y enriquecer la representación textural de la escritura a mano. Los oBIF representan una extensión de las Características Básicas de la Imagen (BIF) [42, 43]. La idea clave es etiquetar cada ubicación de la imagen con una de las siete clases de simetría local. Las características se calculan aplicando un banco de derivados de filtros gaussianos controlados por un parámetro de escala σ. Se emplea un parámetro adicional para clasificar una ubicación como "plana". Tres de estos tipos de simetría van acompañados de n orientaciones posibles, la clase de pendiente tiene 2n orientaciones posibles mientras que tres de las clases no tienen ninguna orientación. Esto da un vector oBIF de 5n + 3. Se pueden encontrar más detalles sobre los aspectos computacionales de los oBIF en nuestro trabajo anterior [40]. En el presente trabajo, cuantificamos la orientación en n = 4 direcciones, produciendo así 23 entradas (5 × 4 + 3) en el diccionario oBIFs. Al igual que el descriptor LBP, los oBIF en dos escalas diferentes se apilan (ignorando el plano de tipo simetría) y se calcula el histograma de la columna. El histograma tiene un total de (5n + 2)2 = 484 bins. El parámetro de escala se elige del conjunto σ ∈{1, 2, 4, 8, 16}, mientras que el parámetro de escala se elige de un conjunto de tres valores pequeños {0.1, 0.01, 0.02}. Finalmente se normaliza el histograma para su posterior tratamiento. Los histogramas de las columnas LBP y oBIF se calculan para escribir muestras de todos los individuos. Al variar los parámetros en el cálculo de las características, se producen diferentes configuraciones de LBP y oBIF y se presentan más detalles sobre estas configuraciones en la Sección 4. 3.3 Clasificación Para la tarea de identificación, empleamos SVM como clasificador [44, 45]. Los histogramas de columna LBP y oBIF extraídos de la (s) muestra(s) de escritura de un individuo se utilizan para entrenar el algoritmo de aprendizaje. SVM se entrena con la función de núcleo de base radial (RBF), el parámetro del núcleo se selecciona en el rango 0, 100], mientras que el parámetro de margen suave C se fija en 10. Para cada característica x alimentada al clasificador SVM entrenado, se producen n puntajes de decisión fnj (x) para j = 1, 2,..., n. n es el número total de escritores y la decisión sobre la identidad del escritor se toma de la siguiente manera. f m a x ( x ) = m a x ( f n j ( x ) ; j = 1 , 2,... , n ) (5) fmax(x) es el valor máximo seleccionado de n respuestas producidas por el clasificador y fn(x) es el mapeo de los valores de salida SVM originales al intervalo [0, 1] de la siguiente manera. f n ( x ) = 1 1 + e - f ( x ) (6) Además de tomar las decisiones de identificación en cada uno de los histogramas de las columnas LBP y OBIF, también informamos el rendimiento de identificación en función de la selección del valor máximo de los puntajes de decisión normalizados en cada una de las dos características. Hay diferentes formas de combinar las decisiones de los clasificadores en un intento de mejorar las tasas de clasificación general. Los métodos comúnmente empleados incluyen la votación por mayoría, el conteo de borda, las reglas de suma, producto y máximo, etc. Dado que combinamos las decisiones en función de dos tipos distintos de características, las combinaciones que utilizan la votación por mayoría o el recuento de Borda no serían muy significativas (ya que solo hay dos puntuaciones). Para cada tipo de característica (columnas LBP y oBIF), el clasificador SVM produce n puntajes de similitud correspondientes a n escritores en la base de referencia. Como se mencionó anteriormente, estas puntuaciones se asignan al intervalo [0, 1]; más alta la puntuación, más confianza tiene el clasificador en la predicción de la etiqueta de clase respectiva (escritor). La regla Max predice la clase de salida eligiendo la clase correspondiente al valor de confianza máximo entre todos los clasificadores participantes. Es decir, para el problema en estudio, el sistema reporta dos puntuaciones SLBP y SoBIFs. Seleccionar la puntuación máxima [max(SLBP, SoBIFs)] garantiza que elijamos la decisión correspondiente al clasificador que tenga más confianza. Esto sirve para compensar los errores y mejorar el rendimiento general de la clasificación. La utilidad de combinar decisiones de un

Files

bme2.12010.pdf

Files (15.9 kB)

Please wait a few minutes before your translated files are ready Note: Some files might be protected thus translations might not work.

Name	Size	Download all
bme2.12010.pdf md5:d33b647887d588b84cca00b4498aeeb7	15.9 kB	Preview Download

Additional details

Translated title (Arabic): مخطط عمود ميزة الملمس لتحديد الكاتب أحادي النص ومتعدد النصوص
Translated title (French): Schéma de colonnes de caractéristiques de texture pour l'identification descripts simples et multiples
Translated title (Spanish): Esquema de columnas de características de textura para la identificación de escritores deguiones únicos y múltiples

Other: https://openalex.org/W3130570596
DOI: 10.1049/bme2.12010

Is Global South Knowledge: Yes
Country: Pakistan

https://openalex.org/W1606323814
https://openalex.org/W1966917421
https://openalex.org/W1993312227
https://openalex.org/W1993487275
https://openalex.org/W1995060894
https://openalex.org/W2013361743
https://openalex.org/W2034125743
https://openalex.org/W2039051707
https://openalex.org/W2039903200
https://openalex.org/W2063858877
https://openalex.org/W2064012597
https://openalex.org/W2076107430
https://openalex.org/W2076407655
https://openalex.org/W2088120514
https://openalex.org/W2090985198
https://openalex.org/W2094056275
https://openalex.org/W2097313661
https://openalex.org/W2119818729
https://openalex.org/W2124090627
https://openalex.org/W2130478883
https://openalex.org/W2133885091
https://openalex.org/W2138378783
https://openalex.org/W2143684158
https://openalex.org/W2145077686
https://openalex.org/W2151274142
https://openalex.org/W2163352848
https://openalex.org/W2170737087
https://openalex.org/W2171360111
https://openalex.org/W2172000360
https://openalex.org/W2206728794
https://openalex.org/W2295185764
https://openalex.org/W2442123158
https://openalex.org/W2488229905
https://openalex.org/W2527189503
https://openalex.org/W2550742354
https://openalex.org/W2563552331
https://openalex.org/W2595950516
https://openalex.org/W2610087018
https://openalex.org/W2743659363
https://openalex.org/W2790253618
https://openalex.org/W2883949996
https://openalex.org/W2890688138
https://openalex.org/W2905718025
https://openalex.org/W2905924516
https://openalex.org/W2910631070
https://openalex.org/W2913593540
https://openalex.org/W2924223126
https://openalex.org/W2945155822
https://openalex.org/W2962708362
https://openalex.org/W2964292554
https://openalex.org/W3041181110
https://openalex.org/W4230674625
https://openalex.org/W601793257

	All versions	This version
Views	3	3
Downloads	1	1
Data volume	15.9 kB	15.9 kB

Texture feature column scheme for single‐ and multi‐script writer identification

Translated Descriptions

Translated Description (Arabic)

Translated Description (French)

Translated Description (Spanish)

Files

bme2.12010.pdf

Files (15.9 kB)

Additional details

Additional titles

Identifiers

Related works

GreSIS Basics Section

References

Texture feature column scheme for single‐ and multi‐script writer identification

Creators

Description

Translated Descriptions

Translated Description (Arabic)

Translated Description (French)

Translated Description (Spanish)

Files

bme2.12010.pdf

Files (15.9 kB)

Additional details

Additional titles

Identifiers

Related works

GreSIS Basics Section

References