Published August 29, 2018 | Version v1
Publication Open

Comparing Seven Methodogies for Rigid Alignment of Point Clouds with Focus on Frame-to-Frame Registration in Depth Sequences

  • 1. Universidade Federal de Juiz de Fora
  • 2. Laboratório Nacional de Computação Científica
  • 3. Hospital Ana Nery
  • 4. Universidade Federal da Bahia

Description

Pairwise rigid registration aims to find the rigid transformation that best registers two surfaces represented by point clouds. This work presents a comparison between seven algorithms, with different strategies to tackle rigid registration tasks. We focus on the frame-to-frame problem, in which the point clouds are extracted from a video sequence with depth information generating partial overlapping 3D data. We use both point clouds and RGB-D video streams in the experimental results. The former is considered under different viewpoints with the addition of a case-study simulating missing data. Since the ground truth rotation is provided, we discuss four different metrics to measure the rotation error in this case. Among the seven considered techniques, the Sparse ICP and Sparse ICP-CTSF outperform the other five ones in the point cloud registration experiments without considering incomplete data. However, the evaluation facing missing data indicates sensitivity for these methods against this problem and favors ICP-CTSF in such situations. In the tests with video sequences, the depth information is segmented in the first step, to get the target region. Next, the registration algorithms are applied and the average root mean squared error, rotation and translation errors are computed. Besides, we analyze the robustness of the algorithms against spatial and temporal sampling rates. We conclude from the experiments using a depth video sequences that ICP-CTSF is the best technique for frame-to-frame registration.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يهدف التسجيل الثابت المزدوج إلى العثور على التحول الصلب الذي يسجل أفضل سطحين تمثلهما السحب النقطية. يقدم هذا العمل مقارنة بين سبع خوارزميات، مع استراتيجيات مختلفة لمعالجة مهام التسجيل الصارمة. نحن نركز على مشكلة الإطار إلى الإطار، حيث يتم استخراج السحب النقطية من تسلسل فيديو مع معلومات العمق التي تولد بيانات ثلاثية الأبعاد متداخلة جزئيًا. نستخدم كلا من السحب النقطية وتدفق الفيديو RGB - D في النتائج التجريبية. يُنظر إلى الأول في ظل وجهات نظر مختلفة مع إضافة دراسة حالة تحاكي البيانات المفقودة. نظرًا لتوفير دوران الحقيقة الأرضية، نناقش أربعة مقاييس مختلفة لقياس خطأ الدوران في هذه الحالة. من بين التقنيات السبعة المدروسة، يتفوق برنامج المقارنات الدولية المتناثر و ICP - CTSF المتناثر على التقنيات الخمس الأخرى في تجارب تسجيل السحابة النقطية دون النظر في البيانات غير المكتملة. ومع ذلك، فإن التقييم الذي يواجه البيانات المفقودة يشير إلى الحساسية لهذه الأساليب ضد هذه المشكلة ويفضل إطار التعاون التقني لبرنامج المقارنات الدولية في مثل هذه الحالات. في الاختبارات مع تسلسلات الفيديو، يتم تقسيم معلومات العمق في الخطوة الأولى، للحصول على المنطقة المستهدفة. بعد ذلك، يتم تطبيق خوارزميات التسجيل ويتم حساب متوسط متوسط الجذر التربيعي للأخطاء والدوران والترجمة. إلى جانب ذلك، نقوم بتحليل قوة الخوارزميات مقابل معدلات أخذ العينات المكانية والزمانية. نستنتج من التجارب باستخدام تسلسلات فيديو عميقة أن ICP - CTSF هي أفضل تقنية للتسجيل من إطار إلى إطار.

Translated Description (French)

Le repérage rigide par paire vise à trouver la transformation rigide qui enregistre le mieux deux surfaces représentées par des nuages de points. Ce travail présente une comparaison entre sept algorithmes, avec différentes stratégies pour aborder des tâches d'enregistrement rigides. Nous nous concentrons sur le problème image à image, dans lequel les nuages de points sont extraits d'une séquence vidéo avec des informations de profondeur générant des données 3D se chevauchant partiellement. Nous utilisons à la fois des nuages de points et des flux vidéo RGB-D dans les résultats expérimentaux. Le premier est considéré sous différents points de vue avec l'ajout d'une étude de cas simulant des données manquantes. Étant donné que la rotation de la vérité du sol est fournie, nous discutons de quatre mesures différentes pour mesurer l'erreur de rotation dans ce cas. Parmi les sept techniques considérées, le Sparse ICP et le Sparse ICP-CTSF surpassent les cinq autres dans les expériences d'enregistrement de nuages de points sans tenir compte des données incomplètes. Cependant, l'évaluation face aux données manquantes indique une sensibilité de ces méthodes face à ce problème et favorise l'ICP-CTSF dans de telles situations. Dans les tests avec des séquences vidéo, les informations de profondeur sont segmentées dans la première étape, pour obtenir la région cible. Ensuite, les algorithmes d'enregistrement sont appliqués et l'erreur quadratique moyenne, la rotation et les erreurs de traduction sont calculées. Par ailleurs, nous analysons la robustesse des algorithmes par rapport aux taux d'échantillonnage spatial et temporel. Nous concluons des expériences utilisant des séquences vidéo de profondeur que l'ICP-CTSF est la meilleure technique pour l'enregistrement d'image à image.

Translated Description (Spanish)

El registro rígido por pares tiene como objetivo encontrar la transformación rígida que mejor registre dos superficies representadas por nubes de puntos. Este trabajo presenta una comparación entre siete algoritmos, con diferentes estrategias para abordar tareas de registro rígidas. Nos centramos en el problema de fotograma a fotograma, en el que las nubes de puntos se extraen de una secuencia de vídeo con información de profundidad que genera datos 3D parcialmente superpuestos. Utilizamos nubes de puntos y secuencias de vídeo RGB-D en los resultados experimentales. El primero se considera bajo diferentes puntos de vista con la adición de un estudio de caso que simula los datos faltantes. Dado que se proporciona la rotación de la verdad del terreno, discutimos cuatro métricas diferentes para medir el error de rotación en este caso. Entre las siete técnicas consideradas, el ICP disperso y el ICP-CTSF disperso superan a los otros cinco en los experimentos de registro de nubes de puntos sin considerar datos incompletos. Sin embargo, la evaluación que enfrenta datos faltantes indica sensibilidad para estos métodos frente a este problema y favorece a ICP-CTSF en tales situaciones. En las pruebas con secuencias de vídeo, la información de profundidad se segmenta en el primer paso, para obtener la región objetivo. A continuación, se aplican los algoritmos de registro y se calcula la media del error cuadrático medio, los errores de rotación y de traslación. Además, analizamos la robustez de los algoritmos frente a las tasas de muestreo espaciales y temporales. A partir de los experimentos que utilizan secuencias de vídeo de profundidad, concluimos que ICP-CTSF es la mejor técnica para el registro de fotograma a fotograma.

Files

698.pdf

Files (9.0 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:108ffdb084470b0845c54a585ef8e019
9.0 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
مقارنة سبع طرق للمحاذاة الصلبة للسحب النقطية مع التركيز على تسجيل الإطار إلى الإطار في تسلسلات العمق
Translated title (French)
Comparaison de sept méthodes pour l'alignement rigide des nuages de points avec l'accent mis sur l'enregistrement trame à trame dans les séquences de profondeur
Translated title (Spanish)
Comparación de siete metodologías para la alineación rígida de nubes de puntos con enfoque en el registro de fotograma a fotograma en secuencias de profundidad

Identifiers

Other
https://openalex.org/W2891317676
DOI
10.5753/jis.2018.703

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Brazil