Analysing Influential Factors in Student Academic Achievement: Prediction Modelling and Insight
Creators
- 1. Taylor's University
Description
The fascination with understanding student academic performance has drawn widespread attention from various stakeholders, including parents, policymakers, and businesses. The 'Students Performance in Exams' dataset, available on platforms like Kaggle, stands as a treasure trove. It extends beyond test scores, encompassing diverse student attributes like ethnicity, gender, parental education, test preparation, and even lunch type. In our tech-driven age, predicting academic success has become a compelling pursuit. This study aims to delve deep into this dataset, utilizing data mining methods and robust classification algorithms like Logistic Regression and Random Forest in a Jupyter Notebook environment. Rigorous model training, testing, and fine-tuning strive for the utmost predictive accuracy. Data cleaning and preprocessing play a crucial role in establishing a reliable dataset for accurate predictions. Beyond numbers, the project emphasizes data visualization's impact, transforming raw data into comprehensible insights for effective communication. The Logistic Regression Model exhibits an impressive 87.6% accuracy, highlighting its potential in predicting academic performance. Moreover, the Random Forest Model excels with a remarkable 100% accuracy in forecasting student grades, showcasing its effectiveness in this domain.
Translated Descriptions
Translated Description (Arabic)
جذب الافتتان بفهم الأداء الأكاديمي للطلاب اهتمامًا واسع النطاق من مختلف أصحاب المصلحة، بما في ذلك أولياء الأمور وواضعي السياسات والشركات. تمثل مجموعة بيانات "أداء الطلاب في الامتحانات"، المتاحة على منصات مثل Kaggle، كنزًا دفينًا. ويمتد إلى ما هو أبعد من درجات الاختبار، ليشمل سمات الطلاب المتنوعة مثل العرق والجنس وتثقيف الوالدين والتحضير للاختبار وحتى نوع الغداء. في عصرنا القائم على التكنولوجيا، أصبح التنبؤ بالنجاح الأكاديمي سعيًا مقنعًا. تهدف هذه الدراسة إلى التعمق في مجموعة البيانات هذه، باستخدام طرق استخراج البيانات وخوارزميات التصنيف القوية مثل الانحدار اللوجستي والغابة العشوائية في بيئة دفتر ملاحظات جوبيتر. يسعى التدريب والاختبار والضبط الدقيق للنماذج الصارمة إلى تحقيق أقصى قدر من الدقة التنبؤية. يلعب تنظيف البيانات ومعالجتها مسبقًا دورًا حاسمًا في إنشاء مجموعة بيانات موثوقة للتنبؤات الدقيقة. بالإضافة إلى الأرقام، يؤكد المشروع على تأثير تصور البيانات، وتحويل البيانات الخام إلى رؤى مفهومة للتواصل الفعال. يُظهر نموذج الانحدار اللوجستي دقة مثيرة للإعجاب بنسبة 87.6 ٪، مما يسلط الضوء على إمكاناته في التنبؤ بالأداء الأكاديمي. علاوة على ذلك، يتفوق نموذج الغابة العشوائية بدقة ملحوظة بنسبة 100 ٪ في التنبؤ بدرجات الطلاب، مما يعرض فعاليته في هذا المجال.Translated Description (French)
La fascination pour la compréhension des performances académiques des étudiants a attiré l'attention de diverses parties prenantes, notamment les parents, les décideurs et les entreprises. L'ensemble de données « Performances des étudiants dans les examens », disponible sur des plateformes comme Kaggle, constitue un trésor. Il s'étend au-delà des résultats des tests, englobant diverses caractéristiques des élèves telles que l'origine ethnique, le sexe, l'éducation parentale, la préparation aux tests et même le type de déjeuner. À notre époque axée sur la technologie, la prédiction de la réussite scolaire est devenue une quête incontournable. Cette étude vise à approfondir cet ensemble de données, en utilisant des méthodes d'exploration de données et des algorithmes de classification robustes tels que la régression logistique et la forêt aléatoire dans un environnement Jupyter Notebook. La formation, les tests et les réglages rigoureux des modèles visent la plus grande précision prédictive. Le nettoyage et le prétraitement des données jouent un rôle crucial dans l'établissement d'un ensemble de données fiables pour des prévisions précises. Au-delà des chiffres, le projet met l'accent sur l'impact de la visualisation des données, transformant les données brutes en informations compréhensibles pour une communication efficace. Le modèle de régression logistique présente une précision impressionnante de 87,6 %, mettant en évidence son potentiel pour prédire les performances académiques. De plus, le modèle de forêt aléatoire excelle avec une précision remarquable de 100 % dans la prévision des notes des étudiants, démontrant son efficacité dans ce domaine.Translated Description (Spanish)
La fascinación por comprender el rendimiento académico de los estudiantes ha llamado la atención de varias partes interesadas, incluidos los padres, los responsables de la formulación de políticas y las empresas. El conjunto de datos "Rendimiento de los estudiantes en los exámenes", disponible en plataformas como Kaggle, es un tesoro. Se extiende más allá de los puntajes de las pruebas, abarcando diversos atributos de los estudiantes como el origen étnico, el género, la educación de los padres, la preparación de las pruebas e incluso el tipo de almuerzo. En nuestra era impulsada por la tecnología, predecir el éxito académico se ha convertido en una búsqueda convincente. Este estudio tiene como objetivo profundizar en este conjunto de datos, utilizando métodos de minería de datos y algoritmos de clasificación sólidos como la regresión logística y el bosque aleatorio en un entorno Jupyter Notebook. La capacitación, las pruebas y el ajuste rigurosos de los modelos se esfuerzan por lograr la máxima precisión predictiva. La limpieza y el preprocesamiento de datos desempeñan un papel crucial en el establecimiento de un conjunto de datos confiable para predicciones precisas. Más allá de los números, el proyecto enfatiza el impacto de la visualización de datos, transformando los datos sin procesar en información comprensible para una comunicación efectiva. El modelo de regresión logística muestra una impresionante precisión del 87,6%, lo que destaca su potencial para predecir el rendimiento académico. Además, el modelo de bosque aleatorio sobresale con una notable precisión del 100% en la previsión de las calificaciones de los estudiantes, lo que demuestra su eficacia en este ámbito.Files
114.pdf
Files
(1.9 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:3be996146f618eca0317354fdc3c8ed8
|
1.9 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- تحليل العوامل المؤثرة في التحصيل الأكاديمي للطلاب: نمذجة التنبؤ والبصيرة
- Translated title (French)
- Analyser les facteurs influents dans la réussite scolaire des étudiants : modélisation des prédictions et informations
- Translated title (Spanish)
- Análisis de factores influyentes en el rendimiento académico de los estudiantes: modelado de predicción y comprensión
Identifiers
- Other
- https://openalex.org/W4389004818
- DOI
- 10.54938/ijemdcsai.2023.02.1.254