User-station attention inference using smart card data: a knowledge graph assisted matrix decomposition model
- 1. KTH Royal Institute of Technology
- 2. Henan Academy of Sciences
- 3. Institute of Physics
- 4. Beihang University
- 5. Wuhan University of Technology
Description
Abstract Understanding human mobility in urban areas is important for transportation, from planning to operations and online control. This paper proposes the concept of user-station attention, which describes the user's (or user group's) interest in or dependency on specific stations. The concept contributes to a better understanding of human mobility (e.g., travel purposes) and facilitates downstream applications, such as individual mobility prediction and location recommendation. However, intrinsic unsupervised learning characteristics and untrustworthy observation data make it challenging to estimate the real user-station attention. We introduce the user-station attention inference problem using station visit counts data in public transport and develop a matrix decomposition method capturing simultaneously user similarity and station-station relationships using knowledge graphs. Specifically, it captures the user similarity information from the user-station visit counts matrix. It extracts the stations' latent representation and hidden relations (activities) between stations to construct the mobility knowledge graph (MKG) from smart card data. We develop a neural network (NN)-based nonlinear decomposition approach to extract the MKG relations capturing the latent spatiotemporal travel dependencies. The case study uses both synthetic and real-world data to validate the proposed approach by comparing it with benchmark models. The results illustrate the significant value of the knowledge graph in contributing to the user-station attention inference. The model with MKG improves the estimation accuracy by 35% in MAE and 16% in RMSE. Also, the model is not sensitive to sparse data provided only positive observations are used.
Translated Descriptions
Translated Description (Arabic)
ملخص يعد فهم التنقل البشري في المناطق الحضرية أمرًا مهمًا للنقل، من التخطيط إلى العمليات والتحكم عبر الإنترنت. تقترح هذه الورقة مفهوم انتباه محطة المستخدم، والذي يصف اهتمام المستخدم (أو مجموعة المستخدمين) بمحطات محددة أو اعتماده عليها. يساهم المفهوم في فهم أفضل للتنقل البشري (على سبيل المثال، أغراض السفر) ويسهل التطبيقات النهائية، مثل التنبؤ بالتنقل الفردي والتوصية بالموقع. ومع ذلك، فإن خصائص التعلم الجوهرية غير الخاضعة للإشراف وبيانات الملاحظة غير الجديرة بالثقة تجعل من الصعب تقدير الانتباه الحقيقي لمحطة المستخدم. نقدم مشكلة استدلال انتباه محطة المستخدم باستخدام بيانات تعداد زيارات المحطة في وسائل النقل العام ونطور طريقة تحليل المصفوفة التي تلتقط تشابه المستخدم وعلاقات محطة المحطة في وقت واحد باستخدام الرسوم البيانية المعرفية. على وجه التحديد، فإنه يلتقط معلومات تشابه المستخدم من مصفوفة عدد زيارات محطة المستخدم. يستخرج التمثيل الكامن للمحطات والعلاقات (الأنشطة) الخفية بين المحطات لإنشاء الرسم البياني لمعارف التنقل (MKG) من بيانات البطاقة الذكية. نقوم بتطوير نهج تحلل غير خطي قائم على الشبكة العصبية (NN) لاستخراج علاقات MKG التي تلتقط تبعيات السفر المكاني والزماني الكامنة. تستخدم دراسة الحالة كل من البيانات الاصطناعية والواقعية للتحقق من صحة النهج المقترح من خلال مقارنته بالنماذج المعيارية. توضح النتائج القيمة الكبيرة للرسم البياني المعرفي في المساهمة في استنتاج انتباه محطة المستخدم. يحسن النموذج مع MKG دقة التقدير بنسبة 35 ٪ في MAE و 16 ٪ في RMSE. كما أن النموذج ليس حساسًا للبيانات المتناثرة بشرط استخدام الملاحظات الإيجابية فقط.Translated Description (French)
Résumé Comprendre la mobilité humaine dans les zones urbaines est important pour le transport, de la planification aux opérations et au contrôle en ligne. Cet article propose le concept d'attention aux stations d'utilisateurs, qui décrit l'intérêt ou la dépendance de l'utilisateur (ou du groupe d'utilisateurs) à l'égard de stations spécifiques. Le concept contribue à une meilleure compréhension de la mobilité humaine (par exemple, à des fins de voyage) et facilite les applications en aval, telles que la prédiction de la mobilité individuelle et la recommandation de localisation. Cependant, les caractéristiques intrinsèques de l'apprentissage non supervisé et les données d'observation non fiables rendent difficile l'estimation de l'attention réelle de la station utilisateur. Nous introduisons le problème d'inférence de l'attention de la station utilisateur à l'aide des données de comptage des visites de station dans les transports publics et développons une méthode de décomposition matricielle capturant simultanément la similarité des utilisateurs et les relations station-station à l'aide de graphiques de connaissances. Plus précisément, il capture les informations de similarité de l'utilisateur à partir de la matrice des comptes de visites de la station utilisateur. Il extrait la représentation latente des stations et les relations cachées (activités) entre les stations pour construire le graphe de connaissances sur la mobilité (MKG) à partir des données de la carte à puce. Nous développons une approche de décomposition non linéaire basée sur les réseaux neuronaux (NN) pour extraire les relations MKG capturant les dépendances spatio-temporelles latentes du voyage. L'étude de cas utilise à la fois des données synthétiques et réelles pour valider l'approche proposée en la comparant à des modèles de référence. Les résultats illustrent la valeur significative du graphique des connaissances pour contribuer à l'inférence de l'attention de la station utilisateur. Le modèle avec MKG améliore la précision de l'estimation de 35% dans MAE et de 16% dans RMSE. En outre, le modèle n'est pas sensible aux données éparses à condition que seules des observations positives soient utilisées.Translated Description (Spanish)
Resumen La comprensión de la movilidad humana en las zonas urbanas es importante para el transporte, desde la planificación hasta las operaciones y el control en línea. Este documento propone el concepto de atención usuario-estación, que describe el interés o la dependencia del usuario (o grupo de usuarios) en estaciones específicas. El concepto contribuye a una mejor comprensión de la movilidad humana (por ejemplo, fines de viaje) y facilita aplicaciones posteriores, como la predicción de la movilidad individual y la recomendación de ubicación. Sin embargo, las características intrínsecas de aprendizaje no supervisado y los datos de observación poco confiables hacen que sea difícil estimar la atención real de la estación del usuario. Presentamos el problema de inferencia de atención usuario-estación utilizando datos de recuentos de visitas a la estación en el transporte público y desarrollamos un método de descomposición matricial que captura simultáneamente la similitud del usuario y las relaciones estación-estación utilizando gráficos de conocimiento. Específicamente, captura la información de similitud del usuario de la matriz de recuentos de visitas usuario-estación. Extrae la representación latente de las estaciones y las relaciones ocultas (actividades) entre las estaciones para construir el gráfico de conocimiento de movilidad (MKG) a partir de los datos de la tarjeta inteligente. Desarrollamos un enfoque de descomposición no lineal basado en redes neuronales (NN) para extraer las relaciones MKG que capturan las dependencias de viaje espaciotemporales latentes. El estudio de caso utiliza datos sintéticos y del mundo real para validar el enfoque propuesto comparándolo con modelos de referencia. Los resultados ilustran el valor significativo del gráfico de conocimiento para contribuir a la inferencia de atención usuario-estación. El modelo con MKG mejora la precisión de la estimación en un 35% en MAE y un 16% en RMSE. Además, el modelo no es sensible a datos escasos siempre que solo se utilicen observaciones positivas.Files
s10489-023-04678-2.pdf.pdf
Files
(1.9 MB)
Name | Size | Download all |
---|---|---|
md5:0566837f4c72afef8e13bc027fbf24a7
|
1.9 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- استدلال انتباه محطة المستخدم باستخدام بيانات البطاقة الذكية: نموذج تحليل مصفوفة بمساعدة رسم بياني للمعرفة
- Translated title (French)
- Inférence de l'attention de la station utilisateur à l'aide des données de la carte à puce : un modèle de décomposition matricielle assistée par graphique de connaissances
- Translated title (Spanish)
- Inferencia de atención usuario-estación utilizando datos de tarjeta inteligente: un modelo de descomposición de matriz asistida por gráfico de conocimiento
Identifiers
- Other
- https://openalex.org/W4381243900
- DOI
- 10.1007/s10489-023-04678-2
References
- https://openalex.org/W2591549476
- https://openalex.org/W2606363764
- https://openalex.org/W2741267865
- https://openalex.org/W2790843555
- https://openalex.org/W2901387348
- https://openalex.org/W2946250653
- https://openalex.org/W2966501701
- https://openalex.org/W3000659041
- https://openalex.org/W3003265726
- https://openalex.org/W3004611733
- https://openalex.org/W3006452877
- https://openalex.org/W3025226748
- https://openalex.org/W3036397942
- https://openalex.org/W3038003025
- https://openalex.org/W3044498809
- https://openalex.org/W3081189998
- https://openalex.org/W3086182925
- https://openalex.org/W3091470251
- https://openalex.org/W3093150592
- https://openalex.org/W3139431089
- https://openalex.org/W3143371164
- https://openalex.org/W3155097488
- https://openalex.org/W3158529139
- https://openalex.org/W3191721961
- https://openalex.org/W3207365242
- https://openalex.org/W3217005823
- https://openalex.org/W4205176928
- https://openalex.org/W4205340501
- https://openalex.org/W4205413516
- https://openalex.org/W4205459297
- https://openalex.org/W4210395897
- https://openalex.org/W4220975012
- https://openalex.org/W4293169147
- https://openalex.org/W4308738233
- https://openalex.org/W4312856860
- https://openalex.org/W4313885855
- https://openalex.org/W4323022392