RGB and VIS/NIR Hyperspectral Imaging Data for 90 Rice Seed Varieties
Creators
- 1. Hanoi University of Science and Technology
- 2. University of Strathclyde
Description
The dataset contains 90 rice seed species and 96 kernels per species resulting in 8,640 rice seed kernels in total. The dataset was collected in 2017 using the following two imaging systems: Visible - Near Infrared (VIS/NIR) Hyperspectral Imaging Device System (~385nm - ~1000nm) consisting of a Specim V10E Imaging Spectrograph and Hamamatsu ORCA-05G CCD camera. RGB - Fujifilm X-M1 with a 35mm/F2.0, ISO 400. For each species, 96 kernels have been captured in two imaging bundles with 48 kernels in each bundle. For each imaging bundle, the 48 kernels were carefully positioned on a sheet of white paper and arranged in an 8x6
matrix. This rice seed matrix was then positioned on a translational stage and imaged using the HSI and RGB cameras described above. The following three files result from a single acquisition: .hdr
: The HSI ENVI header file (More information on the ENVI format can be found at the Harris Geospatial Solutions documentation. .raw
: The HSI datacube data. .jpg
: The RGB image. The filename convention used is the (short) species name followed by a dash, followed by the bundle number (i.e. 1 or 2), followed by the filename suffix. For instance, the data for the BC15
rice seed variety are contained in the following 6 files: BC15-01.hdr
BC15-01.raw
BC15-01.jpg
BC15-02.hdr
BC15-02.raw
BC15-02.jpg
The data were captured in 9 batches across multiple days. All the data from the same batch are contained in a dedicated folder. For instance the folder Data-VIS-20170111-2-room-light-off
indicates that the data are in the VIS/NIR range, captured on the 11th of January 2017 and this was the second batch for that day with the room lights off. Two halogen bulbs were used for illumination and these were accurately positioned to provide balanced lighting across the scene. To ensure stability, the halogen bulbs were switched on and allowed to reach constant operating temperature before the data were acquired in a dark room to minimise any other sources of illumination variance. For the purposes of calibration each HSI image contains in the scene a 100% reflective spectralon tile which is a highly reflective Lambertian scatter. For the dark reference, each folder contains an HSI image with the lens-cap covering the camera. The dark reference can be founds in each folder under the filename black.hdr
/black.raw
. A full index of the data for each species is provided in the index.csv
file. The file contains the following columns: Species Full Name: The full species name (as used in filenames). Species Short Name: A shorthand of the species name. Bundle Number: Imaging Bundle Number (each bundle contains 48 kernels) every species has 2 bundles. Folder: The name of the folder containing the data (as described above where each folder contains a batch of images captured in a single imaging session). File Name: The stem of the filename. Note: that there are 3 suffixes for each stem (.hdr
, .raw
, .jpg
) The HSI system was used to capture 256 wavelengths in this experiment and the exact wavelengths corresponding to the data provided are included in the file wavelengths.csv
. Both camera systems were fixed on a rigid frame for the duration of the experiments. To permit possible registration between the two cameras, a chessboard pattern has been imaged and the acquired files are also contained in the folder chessboard
. Note: The bundle 01
for the species NDC1
was originally acquired during the batch Data-VIS-20170111-2-room-light-off
. However, the file was corrupted and hence, the acquisition was repeated during the batch Data-VIS-20170203-1-room-light-off
. As a result, the NDC1-01
files are in the Data-VIS-20170203-1-room-light-off
folder.
Translated Descriptions
Translated Description (Arabic)
تحتوي مجموعة البيانات على 90 نوعًا من بذور الأرز و 96 حبة لكل نوع مما ينتج عنه 8640 حبة من بذور الأرز في المجموع. تم جمع مجموعة البيانات في عام 2017 باستخدام نظامي التصوير التاليين: نظام جهاز التصوير فوق الطيفي المرئي - القريب من الأشعة تحت الحمراء (VIS/NIR) (~385 نانومتر - ~1000 نانومتر) الذي يتكون من مطياف تصوير العينة V10E وكاميرا Hamamatsu ORCA -05G CCD. RGB - Fujifilm X - M1 مع 35 مم/F2.0، ISO 400. لكل نوع، تم التقاط 96 حبة في حزمتين تصوير مع 48 حبة في كل حزمة. لكل حزمة تصوير، تم وضع 48 حبة بعناية على ورقة بيضاء وترتيبها في مصفوفة8 × 6
. ثم تم وضع مصفوفة بذور الأرز هذه على مرحلة انتقالية وتم تصويرها باستخدام كاميرات HSI و RGB الموضحة أعلاه. الملفات الثلاثة التالية ناتجة عن اكتساب واحد: .hdr
: ملف رأس HSI ENVI (يمكن العثور على مزيد من المعلومات حول تنسيق ENVI في وثائق Harris Geospatial Solutions. .raw
: بيانات HSI datacube. .jpg
: صورة RGB. اصطلاح اسم الملف المستخدم هو اسم النوع (القصير) متبوعًا بشرطة، متبوعًا برقم الحزمة (أي 1 أو 2)، متبوعًا بلاحقة اسم الملف. على سبيل المثال، ترد البيانات
الخاصة بصنف بذور الأرز BC15 في الملفات الستة التالية: BC15-01.hdr BC15-01.raw
BC15-01.jpg
BC15-02.hdr
BC15-02.raw
BC15-02.jpg
تم التقاط البيانات في 9 دفعات على مدار عدة أيام. يتم تضمين جميع البيانات من نفس الدفعة في مجلد مخصص. على سبيل المثال، يشير
المجلد Data - VIS -20170111-2 - room - light - off إلى أن البيانات تقع في نطاق VIS/NIR، الذي تم التقاطه في 11 يناير 2017 وكانت هذه هي الدفعة الثانية لذلك اليوم مع إطفاء أضواء الغرفة. تم استخدام اثنين من مصابيح الهالوجين للإضاءة وتم وضعهما بدقة لتوفير إضاءة متوازنة في جميع أنحاء المشهد. لضمان الاستقرار، تم تشغيل مصابيح الهالوجين والسماح لها بالوصول إلى درجة حرارة تشغيل ثابتة قبل الحصول على البيانات في غرفة مظلمة لتقليل أي مصادر أخرى لتباين الإضاءة. لأغراض المعايرة، تحتوي كل صورة HSI في المشهد على بلاط طيفي عاكس بنسبة 100 ٪ وهو مبعثر لامبرتي عاكس للغاية. بالنسبة للمرجع الداكن، يحتوي كل مجلد على صورة HSI مع غطاء العدسة الذي يغطي الكاميرا. يمكن العثور على المرجع الداكن في كل مجلد تحت اسم الملف black.hdr
/black.raw
. يتم توفير فهرس كامل للبيانات لكل نوع في ملف index.csv
. يحتوي الملف على الأعمدة التالية: الاسم الكامل للأنواع: اسم النوع الكامل (كما هو مستخدم في أسماء الملفات). الاسم المختصر للأنواع: اختصار لاسم النوع. رقم الحزمة: رقم حزمة التصوير (تحتوي كل حزمة على 48 حبة) يحتوي كل نوع على حزمتين. المجلد: اسم المجلد الذي يحتوي على البيانات (كما هو موضح أعلاه حيث يحتوي كل مجلد على مجموعة من الصور الملتقطة في جلسة تصوير واحدة). اسم الملف: جذع اسم الملف. ملاحظة: هناك 3 لاحقات لكل ساق (.hdr
، .raw
، .jpg
) تم استخدام نظام HSI لالتقاط 256 طولًا موجيًا في هذه التجربة ويتم تضمين الأطوال الموجية الدقيقة المقابلة للبيانات المقدمة في الملف wavelengths.csv
. تم تثبيت كلا نظامي الكاميرا على إطار صلب طوال مدة التجارب. للسماح بالتسجيل المحتمل بين الكاميرتين، تم تصوير نمط رقعة الشطرنج وترد الملفات المكتسبة أيضًا في رقعة الشطرنج
في المجلد. ملاحظة: تم الحصول على الحزمة 01
للأنواع NDC1 في الأصل
خلال دفعة Data - VIS -20170111-2 - room - light - off
. ومع ذلك، كان الملف تالفًا، وبالتالي، تم تكرار الاستحواذ خلال دفعة Data - VIS -20170203-1 - room - light - off
. ونتيجة لذلك، توجد ملفات NDC1 -01 في مجلد
Data - VIS -20170203-1 - room - light
- off.
Translated Description (French)
L'ensemble de données contient 90 espèces de graines de riz et 96 grains par espèce, ce qui donne 8 640 grains de graines de riz au total. L'ensemble de données a été collecté en 2017 à l'aide des deux systèmes d'imagerie suivants : Visible - Near Infrared (vis/NIR) Hyperspectral Imaging Device System (~385nm - ~1000nm) composé d'un spectrographe d'imagerie Specim V10E et d'une caméra CCD Hamamatsu ORCA-05G. RVB - Fujifilm X-M1 avec un 35mm/F2.0, ISO 400. Pour chaque espèce, 96 grains ont été capturés dans deux faisceaux d'imagerie avec 48 grains dans chaque faisceau. Pour chaque faisceau d'imagerie, les 48 grains ont été soigneusement positionnés sur une feuille de papier blanc et disposés dans une matrice8x6
. Cette matrice de semences de riz a ensuite été positionnée sur une scène de translation et imagée à l'aide des caméras HSI et RVB décrites ci-dessus. Les trois fichiers suivants résultent d'une seule acquisition : .hdr
: Le fichier d'en-tête HSI ENVI (Plus d'informations sur le format ENVI peuvent être trouvées dans la documentation Harris Geospatial Solutions. .raw
: Les données du datacube HSI. .jpg
: L'image RVB. La convention de nom de fichier utilisée est le nom d'espèce (court) suivi d'un tiret, suivi du numéro de paquet (c'est-à-dire 1 ou 2), suivi du suffixe de nom de fichier. Par exemple, les données pour la variété de semences de riz BC15
sont contenues dans les 6 fichiers suivants : BC15-01.hdr
BC15-01.raw
BC15-01.jpg
BC15-02.hdr
BC15-02.raw
BC15-02.jpg
Les données ont été capturées en 9 lots sur plusieurs jours. Toutes les données d'un même lot sont contenues dans un dossier dédié. Par exemple, le dossier
Data-VIS-20170111-2-room-light-off indique que les données sont dans la plage vis/NIR, capturées le 11 janvier 2017 et qu'il s'agissait du deuxième lot de la journée avec les lumières de la pièce éteintes. Deux ampoules halogènes ont été utilisées pour l'éclairage et celles-ci ont été positionnées avec précision pour fournir un éclairage équilibré sur toute la scène. Pour assurer la stabilité, les ampoules halogènes ont été allumées et autorisées à atteindre une température de fonctionnement constante avant que les données ne soient acquises dans une pièce sombre afin de minimiser toute autre source de variance d'éclairage. Aux fins de l'étalonnage, chaque image HSI contient dans la scène une tuile spectrale 100 % réfléchissante qui est une dispersion lambertienne hautement réfléchissante. Pour la référence sombre, chaque dossier contient une image HSI avec le capuchon d'objectif couvrant l'appareil photo. La référence sombre se trouve dans chaque dossier sous le nom de fichier black.hdr
/black.raw
. Un index complet des données pour chaque espèce est fourni dans le fichier
index.csv. Le fichier contient les colonnes suivantes : Nom complet de l'espèce : Le nom complet de l'espèce (tel qu'utilisé dans les noms de fichiers). Nom abrégé de l'espèce : abréviation du nom de l'espèce. Numéro de paquet : Numéro de paquet d'imagerie (chaque paquet contient 48 noyaux) chaque espèce a 2 paquets. Dossier : le nom du dossier contenant les données (comme décrit ci-dessus où chaque dossier contient un lot d'images capturées dans une seule session d'imagerie). Nom du fichier : la racine du nom de fichier. Remarque : il y a 3 suffixes pour chaque tige (.hdr
, .raw
, .jpg
) Le système HSI a été utilisé pour capturer 256 longueurs d'onde dans cette expérience et les longueurs d'onde exactes correspondant aux données fournies sont incluses dans le fichier wavelengths.csv
. Les deux systèmes de caméras ont été fixés sur un cadre rigide pendant toute la durée des expériences. Pour permettre un enregistrement possible entre les deux caméras, un motif d'échiquier a été imagé et les fichiers acquis sont également contenus dans le dossier échiquier
. Remarque : Le lot 01
pour l'espèce NDC1 a
été initialement acquis lors du lot Data-VIS-20170111-2-room-light-off
. Cependant, le fichier a été corrompu et donc, l'acquisition a été répétée lors du batch Data-VIS-20170203-1-room-light-off
. En conséquence, les fichiers NDC1-01
se trouvent dans le dossier
Data-VIS-20170203-1-room-light-off.
Translated Description (Spanish)
El conjunto de datos contiene 90 especies de semillas de arroz y 96 granos por especie, lo que da como resultado 8.640 granos de semillas de arroz en total. El conjunto de datos se recopiló en 2017 utilizando los siguientes dos sistemas de imágenes: sistema de dispositivo de imágenes hiperespectrales visible - infrarrojo cercano (VIS/NIR) (~385 nm - ~1000 nm) que consiste en un espectrógrafo de imágenes Specim V10E y una cámara CCD Hamamatsu ORCA-05G. RGB - Fujifilm X-M1 con 35 mm/F2.0, ISO 400. Para cada especie, se han capturado 96 granos en dos paquetes de imágenes con 48 granos en cada paquete. Para cada paquete de imágenes, los 48 granos se colocaron cuidadosamente en una hoja de papel blanco y se dispusieron en una matriz de8x6
. Esta matriz de semillas de arroz se colocó luego en una plataforma de traslación y se obtuvieron imágenes utilizando las cámaras HSI y RGB descritas anteriormente. Los siguientes tres archivos son el resultado de una sola adquisición: .hdr
: El archivo de encabezado HSI ENVI (Puede encontrar más información sobre el formato ENVI en la documentación de Harris Geospatial Solutions. .raw
: Los datos del cubo de datos HSI. .jpg
: La imagen RGB. La convención de nombre de archivo utilizada es el nombre de especie (corto) seguido de un guión, seguido del número de paquete (es decir, 1 o 2), seguido del sufijo de nombre de archivo. Por ejemplo, los datos para la variedad de semilla de arroz BC15
están contenidos en los siguientes 6 archivos: BC15-01.hdr BC15-01.raw
BC15-01.jpg
BC15-02.hdr
BC15-02.raw
BC15-02.jpg
Los
datos se capturaron en 9 lotes a lo largo de varios días. Todos los datos del mismo lote están contenidos en una carpeta dedicada. Por ejemplo, la carpeta
Data-VIS-20170111-2room-light-off indica que los datos están en el rango VIS/NIR, capturados el 11 de enero de 2017 y este fue el segundo lote de ese día con las luces de la habitación apagadas. Se utilizaron dos bombillas halógenas para la iluminación y se colocaron con precisión para proporcionar una iluminación equilibrada en toda la escena. Para garantizar la estabilidad, las bombillas halógenas se encendieron y se les permitió alcanzar una temperatura de funcionamiento constante antes de que se adquirieran los datos en una habitación oscura para minimizar cualquier otra fuente de variación de iluminación. A los efectos de la calibración, cada imagen HSI contiene en la escena una baldosa espectralon 100% reflectante que es una dispersión lambertiana altamente reflectante. Para la referencia oscura, cada carpeta contiene una imagen HSI con la tapa de la lente cubriendo la cámara. La referencia oscura se puede encontrar en cada carpeta bajo el nombre de archivo black.hdr
/black.raw
. Se proporciona un índice completo de los datos de cada especie en el archivo
index.csv. El archivo contiene las siguientes columnas: Nombre completo de la especie: El nombre completo de la especie (como se usa en los nombres de archivo). Nombre corto de la especie: una abreviatura del nombre de la especie. Número de paquete: Número de paquete de imágenes (cada paquete contiene 48 núcleos) cada especie tiene 2 paquetes. Carpeta: el nombre de la carpeta que contiene los datos (como se describió anteriormente, donde cada carpeta contiene un lote de imágenes capturadas en una sola sesión de imágenes). Nombre del archivo: La raíz del nombre del archivo. Nota: que hay 3 sufijos para cada tallo (.hdr
, .raw
, .jpg
) El sistema HSI se utilizó para capturar 256 longitudes de onda en este experimento y las longitudes de onda exactas correspondientes a los datos proporcionados se incluyen en el archivo wavelengths.csv
. Ambos sistemas de cámara se fijaron en un marco rígido durante la duración de los experimentos. Para permitir un posible registro entre las dos cámaras, se ha fotografiado un patrón de tablero de ajedrez y los archivos adquiridos también están contenidos en el tablero de ajedrez
de la carpeta. Nota: El paquete 01
para la especie NDC1
se adquirió originalmente durante el lote Data-VIS-20170111-2-room-light-off
. Sin embargo, el archivo estaba dañado y, por lo tanto, la adquisición se repitió durante el lote Data-VIS-20170203-1-room-light-off
. Como resultado, los archivos NDC1-01
se encuentran en la carpeta
Data-VIS-20170203-1-room-light-off.
Additional details
Additional titles
- Translated title (Arabic)
- بيانات التصوير فوق الطيفي RGB و VIS/NIR لـ 90 نوعًا من بذور الأرز
- Translated title (French)
- Données d'imagerie hyperspectrale RVB et vis/NIR pour 90 variétés de graines de riz
- Translated title (Spanish)
- Datos de imágenes hiperespectrales RGB y VIS/NIR para 90 variedades de semillas de arroz
Identifiers
- Other
- https://openalex.org/W4394037452
- DOI
- 10.5281/zenodo.3241922