Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/13687
Files in This Item:
File Description SizeFormat 
joraogomesjunior.pdf2.73 MBAdobe PDFThumbnail
View/Open
Type: Dissertação
Title: A hereditary attentive template-based approach for complex knowledge base question answering systems
Author: Gomes Junior, Jorão
First Advisor: Souza, Jairo Francisco de
Co-Advisor: Menezes, Victor Ströele de Andrade
Referee Member: Bernardino, Heder Soares
Referee Member: Ferreira, Anderson Almeida
Resumo: Os sistemas de perguntas e respostas (QA) recuperam a resposta mais relevante para uma pergunta de linguagem natural. Os sistemas de perguntas e respostas sobre Bases de Conhecimento (KBQA) exploram entidades e relações das Bases de Conhecimento (KB) para gerar respostas. Os sistemas KBQA precisam lidar com perguntas que podem ser divididas em dois grupos: perguntas simples e complexas. Perguntas simples são aquelas que contêm respostas diretas que precisam ser detectadas para responder a um pergunta. As perguntas complexas precisam de mais informações do que as explícitas que podem ser extraídas de perguntas simples. É necessário utilizar operações de consulta avançada para coletar a resposta das KB, como exploração de relações indiretas entre entidades, multirelações, restrições qualitativas e quantitativas, entre outras. Atualmente, os sistemas KBQA alcançam melhores resultados ao responder a perguntas simples, e os sistemas de perguntas e respostas complexas sobre Bases de Conhecimento (C-KBQA) tornaram-se o objetivo para a pesquisa recente. No entanto, faltam estudos que abordem questões complexas na área de KBQA. Este trabalho visa preencher essa lacuna, apresentando um estudo sobre sistemas C-KBQA. A contribuição desta dissertação de mestrado é dividida em dois grupos: um mapeamento sistemático da literatura C-KBQA e uma nova abordagem de correspondência de modelos para sistemas C-KBQA. Primeiro, o mapeamento sistemático mostrou que os sistemas C-KBQA precisam lidar com dois tipos de perguntas: múltiplos saltos e perguntas com restrições. Além disso, foi possível identificar três etapas principais para a construção de um sistema C-KBQA e a utilização de duas abordagens principais neste processo. Em segundo lugar, a abordagem de CKBQA proposta realiza um casamento entre modelos usando a combinação de análises semânticas e técnicas de redes neurais para prever o modelo de resposta apropriado para uma questão de linguagem natural. A chamada Atenção Hereditária foi criada para auxiliar a Tree-LSTM, e demonstramos a eficácia de nossa solução comparando-a com o estado da arte do conjunto de dados LC-QuAD. Os resultados mostram que nossa abordagem supera os sistemas de última geração.
Abstract: Question Answering (QA) systems retrieve the most relevant answer to a natural language question. Knowledge Base Question Answering (KBQA) systems explore entities and relations from Knowledge Bases (KB) to generate answers. KBQA systems need to deal with questions that can be divided into two groups: simple and complex questions. Simple questions are those that contain direct answers that need to be detected to answer a question. Complex questions need more information than the explicit features that can be extracted from simple questions. It is necessary to use advanced query operations to collect the answer from the KB, such as exploiting indirect relations among entities, multi-relations, qualitative and quantitative constraints, and others. Currently, KBQA systems achieve better results when answering simple questions, and Complex Knowledge Base Question Answering (C-KBQA) systems turned the goal to the recent research. However, there is a lack of studies that address complex questions in the KBQA field. This work aims to fill this gap by presenting a study on C-KBQA systems. The contribution of this master thesis is twofold: a systematic mapping of the C-KBQA literature and a novel template matching approach for C-KBQA systems. First, the systematic mapping showed that C-KBQA systems need to handle with two question types: multi-hop and constraint questions. Also, it was possible to identify three main steps to construct a C-KBQA system and the use of two main approaches in this process. Secondly, our proposed C-KBQA approach performs a template matching using the combination of Semantic Parsing and Neural Networks techniques to predict the appropriate answer template to a natural language question. The so-called Hereditary Attention was created to assist the Tree-LSTM, and we demonstrate the effectiveness of our solution by comparing it to the state-of-the-art in the LC-QuAD dataset. The results show that our approach outperforms the state-of-the-art systems.
Keywords: Perguntas e respostas
Pergunta complexa
Bases de conhecimento
Análise semântica
Redes neurais
Question answering
Complex question
Knowledge base
Semantic parsing
Neural networks
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Juiz de Fora (UFJF)
Institution Initials: UFJF
Department: ICE – Instituto de Ciências Exatas
Program: Programa de Pós-graduação em Ciência da Computação
Access Type: Acesso Aberto
Attribution-ShareAlike 3.0 Brazil
Creative Commons License: http://creativecommons.org/licenses/by-sa/3.0/br/
DOI: https://doi.org/10.34019/ufjf/di/2021/00325
URI: https://repositorio.ufjf.br/jspui/handle/ufjf/13687
Issue Date: 18-Oct-2021
Appears in Collections:Mestrado em Ciência da Computação (Dissertações)



This item is licensed under a Creative Commons License Creative Commons