https://repositorio.ufjf.br/jspui/handle/ufjf/14672
File | Description | Size | Format | |
---|---|---|---|---|
vaniagomesdealmeida.pdf | 5.71 MB | Adobe PDF | View/Open |
Type: | Tese |
Title: | Modelagem e identificação automática de construções de estrutura argumental: uma proposta para o constructicon da Framenet Brasil |
Author: | Almeida, Vânia Gomes de |
First Advisor: | Torrent, Tiago Timponi |
Referee Member: | Amaral, Luana Lopes |
Referee Member: | Rigo, Sandro José |
Referee Member: | Almeida, Sandra Aparecida Faria de |
Referee Member: | Matos, Ely Edison da Silva |
Resumo: | Este trabalho tem por objetivo, em primeiro lugar, fornecer a modelagem linguístico computacional, no Constructicon da FrameNet Brasil, de 24 construções de estrutura argumental do Português Brasileiro, a saber: Sujeito-Predicado, Transitiva Direta Ativa, Transitiva Indireta, Transitiva Oblíqua, Bitransitiva, Intransitiva, Ergativa, Resultativa, Objeto Interdito, Argumento Cindido Artefato, Argumento Cindido Parte do Corpo, Argumento Cindido Posse Alienável, Argumento Cindido Entidade Atributo, Predicativa Nominal Atributiva, Predicativa Nominal Estativa, Predicativa Locativa, Verbo Nominal Objetiva, Mudança de Estado, Sem Sujeito Intransitiva, Existencial Apresentacional e Tempo Decorrido. Em segundo lugar, apresenta e discute os resultados de uma tarefa de identificação automática de construções cujo objetivo é o de identificar instâncias das construções acima. Nesse sentido, a proposta se enquadra nas discussões teórico-metodológicas da FrameNet Brasil (FN-Br) (SALOMÃO, 2009a), a qual desenvolve dois grandes recursos computacionais: um Lexicon e um Constructicon. O Lexicon tem por objetivos: criar uma representação computacional de frames, definidos por seus participantes e instrumentos e conectados entre si via relações entre frames; definir Unidades Lexicais, pareamentos entre um lema e um significado definido em termos de um frame; anotar sentenças que exemplifiquem os padrões de valência sintáticos e semânticos em que as ULs ocorrem. Já o Constructicon consiste em um recurso computacional no qual as informações estruturais sobre construções de uma língua são modeladas e é construído através de um modelo semântico baseado em frames, ligado às suas manifestações linguísticas (SALOMÃO, 2009a). Ambos os recursos se encontram interligados, na medida em que tanto o Lexicon como o Constructicon foram desenhados para lidar com todos os traços linguísticos relevantes para a identificação de um frame e de uma construção. Diante da interligação entre as duas frentes da FN-Br, apresentaremos uma proposta que pretende ampliar o escopo de pesquisa anterior (ALMEIDA, 2016), para auxiliar em tarefas de Compreensão de Língua Natural. Através da interação entre a Linguística e a Computação, este trabalho engloba as três fases apresentadas por Dias da Silva (2006) como necessárias para o desenvolvimento de um sistema em Linguística Computacional: a fase linguística, a fase linguístico computacional e a fase computacional. Para tanto, apresenta a especificação das construções na fase linguística, a representação dessas construções no Constructicon, na fase linguístico computacional, e propõe um sistema computacional para que essas construções possam ser reconhecidas na fase computacional. Tal sistema visa a testar a hipótese de que a modelagem de construções composta por informações relativas à sua forma e ao seu sentido, auxilia na tarefa de reconhecimento de construtos por elas licenciados. Para tanto, instâncias das construções foram anotadas em corpus e submetidas a distintos modelos de Inteligência Artificial para serem classificadas conforme as construções existentes no Constructicon. Os resultados indicaram que, para construções muito frequentes no corpus de treinamento, a adição de informações advindas da modelagem afeta negativamente o desempenho do modelo. Por outro lado, para padrões construcionais menos frequentes, tal modelagem afeta positivamente o desempenho do modelo. |
Abstract: | This work aims, firstly, to provide the linguistic-computational modeling, in the Constructicon of FrameNet Brazil, of 24 Brazilian Portuguese argument structure constructions, namely: Subject Predicate, Active Direct Transitive, Indirect Transitive, Oblique Transitive, Ditransitive, Intransitive, Ergative , Resultative, Object Interrupted, Split Object Artifact, Split Object Body Part, Split Object Alienable Possession, Split Object Entity Attribute, Attributive Nominal Predicative, Stative Nominal Predicative, Locative Predicative, Objective Nominal Verb, State Change, Without Subject Intransitive, Existential Presentation and Elapsed Time. Second, it presents and discusses the results of an automatic construction identification task whose objective is to identify instances of the above constructions. In this sense, the proposal fits into the theoretical-methodological discussions of FrameNet Brazil (FNBr) (SALOMÃO, 2009a), which develops two major computational resources: a Lexicon and a Constructicon. Lexicon aims to: create a computational representation of frames, defined by its participants and instruments, and connected to each other via relationships between frames; define Lexical Units, pairings between a lemma and a meaning defined in terms of a frame; note sentences that exemplify the syntactic and semantic valence patterns in which ULs occur. Constructicon, on the other hand, consists of a computational resource in which structural information about constructions of a language is modeled and it is built through a semantic model based on frames, linked to its linguistic manifestations (SALOMÃO, 2009a). Both resources are interconnected, as both Lexicon and Constructicon were designed to deal with all the linguistic features relevant to the identification of a frame and a construction. In view of the interconnection between the two fronts of the FN-Br, we will present a proposal that intends to expand the scope of previous research (ALMEIDA, 2016), to assist in Natural Language Comprehension tasks. Through the interaction between Linguistics and Computing, this work encompasses the three phases presented by Dias da Silva (2006) as necessary for the development of a system in Computational Linguistics: the linguistic phase, the linguisticcomputational phase and the computational phase. Therefore, it presents the specification of constructions in the linguistic phase, the representation of these constructions in the Constructicon, in the linguistic-computational phase, and proposes a computational system so that these constructions can be recognized in the computational phase. This system aims to test the hypothesis that the modeling of constructions, composed of information related to their form and meaning, helps in the task of recognizing constructs licensed by them. For that, instances of the constructions were annotated in corpus and submitted to different models of Artificial Intelligence to be classified according to the existing constructions in Constructicon. The results indicated that, for very frequent constructions in the training corpus, the addition of information from the modeling negatively affects the performance of the model. On the other hand, for less frequent constructional patterns, such modeling positively affects the performance of the model |
Keywords: | Modelagem de construções Reconhecimento de construções Estrutura argumental Gramática de construções Constructicon Construction modeling Construction recognition Argument structure Construction grammar |
CNPq: | CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Juiz de Fora (UFJF) |
Institution Initials: | UFJF |
Department: | Faculdade de Letras |
Program: | Programa de Pós-graduação em Letras: Linguística |
Access Type: | Acesso Aberto Attribution-NoDerivs 3.0 Brazil |
Creative Commons License: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
DOI: | https://doi.org/10.34019/ufjf/te/2022/00080 |
URI: | https://repositorio.ufjf.br/jspui/handle/ufjf/14672 |
Issue Date: | 29-Jul-2022 |
Appears in Collections: | Doutorado em Linguística (Teses) |
This item is licensed under a Creative Commons License