Published January 1, 2020 | Version v1
Publication Open

IGSQL: Database Schema Interaction Graph Based Neural Model for Context-Dependent Text-to-SQL Generation

  • 1. Peking University

Description

Context-dependent text-to-SQL task has drawn much attention in recent years.Previous models on context-dependent text-to-SQL task only concentrate on utilizing historical user inputs.In this work, in addition to using encoders to capture historical information of user inputs, we propose a database schema interaction graph encoder to utilize historicalal information of database schema items.In decoding phase, we introduce a gate mechanism to weigh the importance of different vocabularies and then make the prediction of SQL tokens.We evaluate our model on the benchmark SParC and CoSQL datasets, which are two large complex context-dependent cross-domain text-to-SQL datasets.Our model outperforms previous state-of-the-art model by a large margin and achieves new state-of-the-art results on the two datasets.The comparison and ablation results demonstrate the efficacy of our model and the usefulness of the database schema interaction graph encoder.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

لقد جذبت مهمة تحويل النص إلى قاعدة بيانات المعتمدة على السياق الكثير من الاهتمام في السنوات الأخيرة. تركز النماذج السابقة لمهمة تحويل النص إلى قاعدة بيانات المعتمدة على السياق فقط على استخدام مدخلات المستخدم التاريخية. في هذا العمل، بالإضافة إلى استخدام أدوات التشفير لالتقاط المعلومات التاريخية لمدخلات المستخدم، نقترح أداة تشفير الرسم البياني لتفاعل مخطط قاعدة البيانات لاستخدام المعلومات التاريخية لعناصر مخطط قاعدة البيانات. في مرحلة فك التشفير، نقدم آلية بوابة لموازنة أهمية المفردات المختلفة ثم التنبؤ برموز SQL. نقيم نموذجنا على مجموعات بيانات SParC و CoSQL المعيارية، وهما مجموعتا بيانات كبيرتان معقدتان تعتمدان على السياق من النص عبر المجال إلى مجموعات بيانات SQL. يتفوق نموذجنا على النموذج المتطور السابق بهامش كبير ويحقق نتائج حديثة جديدة على مجموعتي البيانات. توضح نتائج المقارنة والاستئصال فعالية نموذجنا وفائدة مخطط تفاعل مخطط قاعدة البيانات.

Translated Description (French)

La tâche text-to-SQL dépendante du contexte a attiré beaucoup d'attention ces dernières années. Les modèles précédents sur la tâche text-to-SQL dépendante du contexte se concentrent uniquement sur l'utilisation des entrées utilisateur historiques. Dans ce travail, en plus d'utiliser des codeurs pour capturer les informations historiques des entrées utilisateur, nous proposons un encodeur de graphique d'interaction de schéma de base de données pour utiliser les informations historiques des éléments de schéma de base de données. Dans la phase de décodage, nous introduisons un mécanisme de porte pour peser l'importance des différents vocabulaires et ensuite faire la prédiction des jetons SQL. Nous évaluons notre modèle sur les ensembles de données SParC et CoSQL de référence, qui sont deux grands ensembles de données text-to-SQL complexes dépendant du contexte. Notre modèle surpasse de loin le modèle de pointe précédent et obtient de nouveaux résultats de pointe sur les deux ensembles de données. Les résultats de comparaison et d'ablation démontrent l'efficacité de notre modèle et l'utilité de l'encodeur de graphique d'interaction de schéma de base de données.

Translated Description (Spanish)

La tarea de texto a SQL dependiente del contexto ha llamado mucho la atención en los últimos años. Los modelos anteriores sobre la tarea de texto a SQL dependiente del contexto solo se concentran en utilizar entradas de usuario históricas. En este trabajo, además de usar codificadores para capturar información histórica de entradas de usuario, proponemos un codificador de gráfico de interacción de esquema de base de datos para utilizar información histórica de elementos de esquema de base de datos. En la fase de decodificación, introducimos un mecanismo de puerta para sopesar la importancia de diferentes vocabularios y luego hacemos la predicción de tokens SQL. Evaluamos nuestro modelo en los conjuntos de datos SParC y CoSQL de referencia, que son dos grandes conjuntos de datos complejos de texto a SQL de dominio cruzado dependientes del contexto. Nuestro modelo supera al modelo anterior de vanguardia por un amplio margen y logra nuevos resultados de vanguardia en los dos conjuntos de datos. Los resultados de comparación y ablación demuestran la eficacia de nuestro modelo y la utilidad del codificador de gráfico de interacción de esquema de base de datos.

Files

2020.emnlp-main.560.pdf.pdf

Files (226 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:5360980bad11bf9723da89687501effc
226 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
IGSQL: النموذج العصبي القائم على الرسم البياني لتفاعل مخطط قاعدة البيانات لتوليد النص إلى SQL المعتمد على السياق
Translated title (French)
IGSQL : Database Schema Interaction Graph Based Neural Model for Context-Dependent Text-to-SQL Generation
Translated title (Spanish)
IGSQL: modelo neuronal basado en gráficos de interacción de esquema de base de datos para la generación de texto a SQL dependiente del contexto

Identifiers

Other
https://openalex.org/W3103291908
DOI
10.18653/v1/2020.emnlp-main.560

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W2952032096
  • https://openalex.org/W2970172141