Density-based clustering for bivariate-flow data
Creators
- 1. Institute of Geographic Sciences and Natural Resources Research
- 2. Chinese Academy of Sciences
- 3. University of Chinese Academy of Sciences
- 4. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application
Description
Geographical flows reflect the movements, spatial interactions or connections among locations and are generally abstracted as origin-destination (OD) flows. In this context, clustering is a spatial pattern describing a group of flows with adjacent O and D points. For data composed of two types of flows (bivariate-flow data), a bivariate-flow cluster is a cluster comprising two types of flows, at least one of which exhibits a clustering pattern. In a bivariate-flow cluster, varying flow density combinations imply different meanings. For instance, a cluster with high-density travel flows on both weekdays (type A) and weekends (type B) may be associated with entertainment, whereas high-density flows on weekdays and sparse flows on weekends may reveal work-related travel. However, identifying bivariate-flow clusters with different flow density combinations is still an unsolved problem. To this end, we extend a bivariate-point clustering method and propose a density-based clustering method for bivariate flows. The simulation experiments verify model robustness. In a case study, we apply this method to extract clusters of bivariate-flow data comprising Beijing taxi OD flows of different periods, and identify clusters of work-related, entertainment, tourism, or egress and return travels. These results demonstrate the capability of our method in detecting bivariate-flow clusters.
Translated Descriptions
Translated Description (Arabic)
تعكس التدفقات الجغرافية الحركات أو التفاعلات المكانية أو الروابط بين المواقع ويتم تجريدها بشكل عام كتدفقات المنشأ والوجهة (OD). في هذا السياق، التجميع العنقودي هو نمط مكاني يصف مجموعة من التدفقات بنقطتي O و D المتجاورتين. بالنسبة للبيانات المكونة من نوعين من التدفقات (بيانات التدفق ثنائي المتغير)، فإن مجموعة التدفق ثنائي المتغير هي مجموعة تتألف من نوعين من التدفقات، يظهر أحدهما على الأقل نمط التجميع. في مجموعة التدفق ثنائي المتغير، تنطوي مجموعات كثافة التدفق المختلفة على معانٍ مختلفة. على سبيل المثال، قد ترتبط مجموعة ذات تدفقات سفر عالية الكثافة في كل من أيام الأسبوع (النوع أ) وعطلات نهاية الأسبوع (النوع ب) بالترفيه، في حين أن التدفقات عالية الكثافة في أيام الأسبوع والتدفقات المتناثرة في عطلات نهاية الأسبوع قد تكشف عن السفر المتعلق بالعمل. ومع ذلك، لا يزال تحديد مجموعات التدفق ثنائي المتغير ذات مجموعات كثافة التدفق المختلفة مشكلة لم يتم حلها. تحقيقا لهذه الغاية، نوسع طريقة التجميع ثنائي المتغير ونقترح طريقة التجميع على أساس الكثافة للتدفقات ثنائية المتغير. تتحقق تجارب المحاكاة من متانة النموذج. في دراسة حالة، نطبق هذه الطريقة لاستخراج مجموعات من بيانات التدفق ثنائي المتغير التي تضم تدفقات التطوير التنظيمي لسيارات الأجرة في بكين لفترات مختلفة، وتحديد مجموعات من الرحلات المتعلقة بالعمل أو الترفيه أو السياحة أو الخروج والعودة. توضح هذه النتائج قدرة طريقتنا في الكشف عن مجموعات التدفق ثنائي المتغير.Translated Description (French)
Les flux géographiques reflètent les mouvements, les interactions spatiales ou les connexions entre les lieux et sont généralement abstraits en tant que flux origine-destination (DO). Dans ce contexte, le clustering est un modèle spatial décrivant un groupe de flux avec des points O et D adjacents. Pour les données composées de deux types de flux (données à flux bivarié), un cluster à flux bivarié est un cluster comprenant deux types de flux, dont au moins un présente un schéma de clustering. Dans un groupe à flux bivarié, différentes combinaisons de densité d'écoulement impliquent différentes significations. Par exemple, un groupe avec des flux de déplacements à haute densité en semaine (type A) et les week-ends (type B) peut être associé à des divertissements, tandis que les flux à haute densité en semaine et les flux clairsemés les week-ends peuvent révéler des déplacements liés au travail. Cependant, l'identification d'amas bivariés avec différentes combinaisons de densité d'écoulement reste un problème non résolu. À cette fin, nous étendons une méthode de regroupement de points bivariés et proposons une méthode de regroupement basée sur la densité pour les flux bivariés. Les expériences de simulation vérifient la robustesse du modèle. Dans une étude de cas, nous appliquons cette méthode pour extraire des grappes de données de flux bivariés comprenant des flux de DO de taxi de Pékin de différentes périodes, et identifier des grappes de voyages liés au travail, au divertissement, au tourisme ou aux voyages de sortie et de retour. Ces résultats démontrent la capacité de notre méthode à détecter les agrégats de flux bivariés.Translated Description (Spanish)
Los flujos geográficos reflejan los movimientos, interacciones espaciales o conexiones entre ubicaciones y generalmente se abstraen como flujos origen-destino (OD). En este contexto, la agrupación es un patrón espacial que describe un grupo de flujos con puntos O y D adyacentes. Para los datos compuestos por dos tipos de flujos (datos de flujo bivariado), un clúster de flujo bivariado es un clúster que comprende dos tipos de flujos, al menos uno de los cuales exhibe un patrón de agrupamiento. En un grupo de flujo bivariado, las combinaciones variables de densidad de flujo implican diferentes significados. Por ejemplo, un grupo con flujos de viajes de alta densidad tanto en días laborables (tipo A) como en fines de semana (tipo B) puede estar asociado con el entretenimiento, mientras que los flujos de alta densidad en días laborables y los flujos escasos en fines de semana pueden revelar viajes relacionados con el trabajo. Sin embargo, la identificación de grupos de flujo bivariados con diferentes combinaciones de densidad de flujo sigue siendo un problema sin resolver. Con este fin, ampliamos un método de agrupamiento de puntos bivariados y proponemos un método de agrupamiento basado en la densidad para flujos bivariados. Los experimentos de simulación verifican la robustez del modelo. En un estudio de caso, aplicamos este método para extraer grupos de datos de flujos bivariados que comprenden flujos de OD de taxis de Beijing de diferentes períodos, e identificamos grupos de viajes relacionados con el trabajo, el entretenimiento, el turismo o de ida y vuelta. Estos resultados demuestran la capacidad de nuestro método para detectar grupos de flujo bivariado.Files
35154953.pdf.pdf
Files
(1.8 MB)
Name | Size | Download all |
---|---|---|
md5:b9ed474328fa996ab9940094a765e6b2
|
1.8 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- التجميع العنقودي القائم على الكثافة لبيانات التدفق ثنائي المتغير
- Translated title (French)
- Regroupement basé sur la densité pour les données à flux bivarié
- Translated title (Spanish)
- Agrupación basada en la densidad para datos de flujo bivariable
Identifiers
- Other
- https://openalex.org/W4280563173
- DOI
- 10.1080/13658816.2022.2073595
References
- https://openalex.org/W1559632079
- https://openalex.org/W1986774893
- https://openalex.org/W1987111416
- https://openalex.org/W2001750397
- https://openalex.org/W2002151188
- https://openalex.org/W2010183919
- https://openalex.org/W2032101051
- https://openalex.org/W2043894190
- https://openalex.org/W2050676491
- https://openalex.org/W2051529712
- https://openalex.org/W2060564327
- https://openalex.org/W2076937757
- https://openalex.org/W2118898434
- https://openalex.org/W2161921787
- https://openalex.org/W2346552988
- https://openalex.org/W2496675188
- https://openalex.org/W2710575985
- https://openalex.org/W2755080545
- https://openalex.org/W2774327422
- https://openalex.org/W2793250185
- https://openalex.org/W2891533561
- https://openalex.org/W2941089237
- https://openalex.org/W2962954233
- https://openalex.org/W2997423535
- https://openalex.org/W3009376433
- https://openalex.org/W3017286331
- https://openalex.org/W3038283877
- https://openalex.org/W3095196938
- https://openalex.org/W3118276629
- https://openalex.org/W3136363661
- https://openalex.org/W3164408063