Using Large Pretrained Language Models for Answering User Queries from Product Specifications
Creators
- 1. Indian Institute of Technology Kharagpur
Description
While buying a product from the e-commerce websites, customers generally have a plethora of questions.From the perspective of both the e-commerce service provider as well as the customers, there must be an effective question answering system to provide immediate answers to the user queries.While certain questions can only be answered after using the product, there are many questions which can be answered from the product specification itself.Our work takes a first step in this direction by finding out the relevant product specifications, that can help answering the user questions.We propose an approach to automatically create a training dataset for this problem.We utilize recently proposed XLNet and BERT architectures for this problem and find that they provide much better performance than the Siamese model, previously applied for this problem (Lai et al., 2018).Our model gives a good performance even when trained on one vertical and tested across different verticals.* Work done while author was at IIT Kharagpur. 1 Flipkart Pvt Ltd. is an e-commerce company based in Bangalore, India.2 We randomly sampled 1500 questions from all these verticals except Mobile and manually annotated them as to whether these can be answered through product specifications.
Translated Descriptions
Translated Description (Arabic)
أثناء شراء منتج من مواقع التجارة الإلكترونية، يكون لدى العملاء عمومًا عدد كبير من الأسئلة. من وجهة نظر كل من مزود خدمة التجارة الإلكترونية وكذلك العملاء، يجب أن يكون هناك نظام فعال للإجابة على الأسئلة لتقديم إجابات فورية على استفسارات المستخدم. بينما لا يمكن الإجابة على أسئلة معينة إلا بعد استخدام المنتج، هناك العديد من الأسئلة التي يمكن الإجابة عليها من مواصفات المنتج نفسها. يتخذ عملنا خطوة أولى في هذا الاتجاه من خلال معرفة مواصفات المنتج ذات الصلة، والتي يمكن أن تساعد في الإجابة على أسئلة المستخدم. نقترح نهجًا لإنشاء مجموعة بيانات تدريبية تلقائيًا لهذه المشكلة. نستخدم معماريات XLNet و BERT المقترحة مؤخرًا لهذه المشكلة ونجد أنها توفر أداءً أفضل بكثير من نموذج Siamese، الذي تم تطبيقه مسبقًا لهذه المشكلة (لاي وآخرون.، 2018). يقدم نموذجنا أداءً جيدًا حتى عند التدريب على عمود واحد واختباره عبر قطاعات مختلفة.* العمل المنجز أثناء وجود المؤلف في IIT Kharagpur. 1 Flipkart Pvt Ltd. هي شركة تجارة إلكترونية مقرها في بنغالور، الهند. 2 قمنا بأخذ عينات عشوائية من 1500 سؤال من جميع هذه القطاعات باستثناء الهاتف المحمول وقمنا بتعليقها يدويًا حول ما إذا كان يمكن الإجابة عليها من خلال مواصفات المنتج.Translated Description (French)
Lors de l'achat d'un produit sur les sites Web de commerce électronique, les clients ont généralement une pléthore de questions. Du point de vue du fournisseur de services de commerce électronique ainsi que des clients, il doit y avoir un système de réponse aux questions efficace pour fournir des réponses immédiates aux questions des utilisateurs. Bien que certaines questions ne puissent être répondues qu'après avoir utilisé le produit, il existe de nombreuses questions auxquelles il est possible de répondre à partir de la spécification du produit elle-même. Notre travail fait un premier pas dans cette direction en découvrant les spécifications pertinentes du produit, qui peuvent aider à répondre aux questions des utilisateurs. Nous proposons une approche pour créer automatiquement un ensemble de données de formation pour ce problème. Nous utilisons les architectures XLNet et BERT récemment proposées pour ce problème et constatons qu'elles offrent de bien meilleures performances que le modèle siamois, précédemment appliqué à ce problème (Lai et al., 2018). Notre modèle offre de bonnes performances même lorsqu'il est formé sur une verticale et testé sur différentes verticales.* Travail effectué alors que l'auteur était à l'IIT Kharagpur. 1 Flipkart Pvt Ltd. est une société de commerce électronique basée à Bangalore, en Inde.2 Nous avons échantillonné au hasard 1 500 questions de tous ces secteurs verticaux, à l'exception de Mobile, et nous les avons annotées manuellement pour savoir s'il était possible d'y répondre par le biais des spécifications du produit.Translated Description (Spanish)
Al comprar un producto en los sitios web de comercio electrónico, los clientes generalmente tienen una gran cantidad de preguntas. Desde la perspectiva tanto del proveedor de servicios de comercio electrónico como de los clientes, debe haber un sistema efectivo de respuesta de preguntas para proporcionar respuestas inmediatas a las consultas de los usuarios. Si bien ciertas preguntas solo se pueden responder después de usar el producto, hay muchas preguntas que se pueden responder desde la propia especificación del producto. Nuestro trabajo da un primer paso en esta dirección al descubrir las especificaciones relevantes del producto, que pueden ayudar a responder las preguntas de los usuarios. Proponemos un enfoque para crear automáticamente un conjunto de datos de capacitación para este problema. Utilizamos las arquitecturas XLNet y BERT recientemente propuestas para este problema y encontramos que proporcionan un rendimiento mucho mejor que el modelo siamés, previamente aplicado para este problema (Lai et al., 2018).Nuestro modelo ofrece un buen rendimiento incluso cuando se entrena en una vertical y se prueba en diferentes verticales.* Trabajo realizado mientras el autor estaba en IIT Kharagpur. 1 Flipkart Pvt Ltd. es una empresa de comercio electrónico con sede en Bangalore, India.2 Tomamos muestras aleatorias de 1500 preguntas de todas estas verticales, excepto Mobile, y las anotamos manualmente para saber si se pueden responder a través de las especificaciones del producto.Files
2020.ecnlp-1.5.pdf.pdf
Files
(226 Bytes)
| Name | Size | Download all |
|---|---|---|
|
md5:5360980bad11bf9723da89687501effc
|
226 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- استخدام نماذج لغوية كبيرة مدربة مسبقًا للإجابة على استفسارات المستخدم من مواصفات المنتج
- Translated title (French)
- Utilisation de grands modèles de langage préformé pour répondre aux requêtes des utilisateurs à partir des spécifications du produit
- Translated title (Spanish)
- Uso de grandes modelos de lenguaje preentrenados para responder a las consultas de los usuarios a partir de las especificaciones del producto
Identifiers
- Other
- https://openalex.org/W3045632615
- DOI
- 10.18653/v1/2020.ecnlp-1.5
References
- https://openalex.org/W2243869100
- https://openalex.org/W2904258646
- https://openalex.org/W2908018635
- https://openalex.org/W2950808302
- https://openalex.org/W2953519289
- https://openalex.org/W2954153770
- https://openalex.org/W2963341956