A Specialized Probability Density Function for the Input of Mixture of Gaussian Processes
Description
Mixture of Gaussian Processes (MGP) is a generative model being powerful and widely used in the fields of machine learning and data mining. However, when we learn this generative model on a given dataset, we should set the probability density function (pdf) of the input in advance. In general, it can be set as a Gaussian distribution. But, for some actual data like time series, this setting or assumption is not reasonable and effective. In this paper, we propose a specialized pdf for the input of MGP model which is a piecewise-defined continuous function with three parts such that the middle part takes the form of a uniform distribution, while the two side parts take the form of Gaussian distribution. This specialized pdf is more consistent with the uniform distribution of the input than the Gaussian pdf. The two tails of the pdf with the form of a Gaussian distribution ensure the effectiveness of the iteration of the hard-cut EM algorithm for MGPs. It demonstrated by the experiments on the simulation and stock datasets that the MGP model with these specialized pdfs can lead to a better result on time series prediction in comparison with the general MGP models as well as the other classical regression methods.
Translated Descriptions
Translated Description (Arabic)
مزيج من العمليات الغاوسية (MGP) هو نموذج توليدي قوي ويستخدم على نطاق واسع في مجالات التعلم الآلي واستخراج البيانات. ومع ذلك، عندما نتعلم هذا النموذج التوليدي على مجموعة بيانات معينة، يجب علينا تعيين دالة الكثافة الاحتمالية (PDF) للمدخلات مسبقًا. بشكل عام، يمكن تعيينه كتوزيع غاوسي. ولكن بالنسبة لبعض البيانات الفعلية مثل السلاسل الزمنية، فإن هذا الإعداد أو الافتراض غير معقول وفعال. في هذه الورقة، نقترح ملف PDF متخصص لمدخلات نموذج MGP وهي وظيفة مستمرة محددة بالقطعة مع ثلاثة أجزاء بحيث يأخذ الجزء الأوسط شكل توزيع موحد، في حين أن الجزأين الجانبيين يأخذان شكل التوزيع الغاوسي. هذا ملف pdf المتخصص أكثر اتساقًا مع التوزيع الموحد للمدخلات من ملف pdf الغاوسي. يضمن ذيلان ملف PDF مع شكل توزيع غاوسي فعالية تكرار خوارزمية EM المقطوعة بشدة لـ MGPs. وقد أثبتت التجارب على مجموعات بيانات المحاكاة والمخزون أن نموذج MGP مع ملفات pdf المتخصصة هذه يمكن أن يؤدي إلى نتيجة أفضل في التنبؤ بالسلاسل الزمنية مقارنة بنماذج MGP العامة بالإضافة إلى طرق الانحدار الكلاسيكية الأخرى.Translated Description (French)
Le mélange de processus gaussiens (MGP) est un modèle génératif puissant et largement utilisé dans les domaines de l'apprentissage automatique et de l'exploration de données. Cependant, lorsque nous apprenons ce modèle génératif sur un ensemble de données donné, nous devons définir à l'avance la fonction de densité de probabilité (pdf) de l'entrée. En général, il peut être défini comme une distribution gaussienne. Mais, pour certaines données réelles comme les séries chronologiques, ce paramètre ou cette hypothèse n'est pas raisonnable et efficace. Dans cet article, nous proposons un pdf spécialisé pour l'entrée du modèle MGP qui est une fonction continue définie par morceaux avec trois parties telles que la partie médiane prend la forme d'une distribution uniforme, tandis que les deux parties latérales prennent la forme d'une distribution gaussienne. Ce pdf spécialisé est plus cohérent avec la distribution uniforme de l'entrée que le pdf gaussien. Les deux queues du pdf sous la forme d'une distribution gaussienne assurent l'efficacité de l'itération de l'algorithme EM durci pour les MGP. Il a été démontré par les expériences sur les jeux de données de simulation et de stock que le modèle MGP avec ces pdfs spécialisés peut conduire à un meilleur résultat sur la prédiction des séries temporelles par rapport aux modèles MGP généraux ainsi qu'aux autres méthodes de régression classiques.Translated Description (Spanish)
La Mezcla de Procesos Gaussianos (MGP) es un modelo generativo potente y ampliamente utilizado en los campos del aprendizaje automático y la minería de datos. Sin embargo, cuando aprendemos este modelo generativo en un conjunto de datos dado, debemos establecer la función de densidad de probabilidad (pdf) de la entrada de antemano. En general, se puede establecer como una distribución gaussiana. Pero, para algunos datos reales, como las series temporales, este ajuste o suposición no es razonable ni eficaz. En este documento, proponemos un pdf especializado para la entrada del modelo MGP, que es una función continua definida por tramos con tres partes, de modo que la parte media toma la forma de una distribución uniforme, mientras que las dos partes laterales toman la forma de una distribución gaussiana. Este pdf especializado es más consistente con la distribución uniforme de la entrada que el pdf gaussiano. Las dos colas del pdf con la forma de una distribución gaussiana garantizan la efectividad de la iteración del algoritmo EM de corte rígido para las MGP. Los experimentos en los conjuntos de datos de simulación y stock demostraron que el modelo MGP con estos pdfs especializados puede conducir a un mejor resultado en la predicción de series de tiempo en comparación con los modelos MGP generales, así como con los otros métodos de regresión clásicos.Files
document.pdf
Files
(532.0 kB)
Name | Size | Download all |
---|---|---|
md5:1db6135f355c9493adfb7e6d0c03e423
|
532.0 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- دالة كثافة احتمالية متخصصة لإدخال خليط من العمليات الغاوسية
- Translated title (French)
- Une fonction de densité de probabilité spécialisée pour l'entrée de mélange de processus gaussiens
- Translated title (Spanish)
- Una función de densidad de probabilidad especializada para la entrada de mezcla de procesos gaussianos
Identifiers
- Other
- https://openalex.org/W2895528396
- DOI
- 10.1007/978-3-030-01313-4_8
References
- https://openalex.org/W1499730991
- https://openalex.org/W1595039761
- https://openalex.org/W1947913127
- https://openalex.org/W1987052429
- https://openalex.org/W2007236156
- https://openalex.org/W2114355534
- https://openalex.org/W2115038749
- https://openalex.org/W2117063635
- https://openalex.org/W2160299137
- https://openalex.org/W2292090008
- https://openalex.org/W2295295550
- https://openalex.org/W2488546812
- https://openalex.org/W2504160096
- https://openalex.org/W2603908693
- https://openalex.org/W2781929852
- https://openalex.org/W4211049957
- https://openalex.org/W97653666