Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/12524
Files in This Item:
File Description SizeFormat 
thallysdasilvanogueira.pdf6.26 MBAdobe PDFThumbnail
View/Open
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Goliat, Priscila Vanessa Zabala Capriles-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3074561832181610pt_BR
dc.contributor.referee1Siqueira, Kennya Beatriz-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/2961347602093303pt_BR
dc.contributor.referee2Campos, Luciana Conceição Dias-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/6986138014246480pt_BR
dc.creatorNogueira, Thallys da Silva-
dc.creator.Latteshttp://lattes.cnpq.br/3169797309794510pt_BR
dc.date.accessioned2021-04-06T21:59:31Z-
dc.date.available2021-04-06-
dc.date.available2021-04-06T21:59:31Z-
dc.date.issued2021-03-18-
dc.identifier.doihttps://doi.org/10.34019/ufjf/di/2021/00021pt_BR
dc.identifier.urihttps://repositorio.ufjf.br/jspui/handle/ufjf/12524-
dc.description.abstractThe development of alternatives to traditional market research has been a majorchallenge in corporate environments. Such research has a scientific basis, is well validatedand brings good results, however, factors such as geographic limitations, long time ofapplication and analysis, high cost, in addition to having forms that can be extensive andoften with low adherence can make their use unfeasible. With so many people using themost diverse social networks, companies are increasingly attentive to what is commentedon in these virtual environments. With so many messages, posts, comments and audios, alarge volume of data is generated and, therefore, the term Big Data in this environmentis very present referring to the large volume, variety and speed with which the dataare generated. Knowing the consumer profile and consumption trends can help a lot inmaking strategic decisions in the most diverse sectors and commercial segments. Thatsaid, the present work refers to the development of a computational system capable ofcollecting, storing, processing and extracting information in data from the social networkTwitter, with the objective of evaluating consumption trends through the identification ofconsumption characteristics and habits of artisanal cheese in Brazil. For this, initially a setof keywords was developed referring to the names of the artisanal cheeses of interest andan algorithm capable of collecting this data on Twitter. Then, it was necessary to build adatabase model capable of efficiently storing the newly collected data and the results ofother analyzes. To identify the polarity of the feelings present in the tweets, a model wasdeveloped using the Voting Classifier Ensemble to perform the classification of publicationsin the negative, neutral and positive classes. It was necessary to create a specific trainingdata set for artisanal cheeses, since no literature that met these specifications was foundin the literature. Natural Language Processing techniques were used to treat textualdata and extract information from them. A set of keywords was developed based onthe opinion of researchers at EMBRAPA Dairy Cattle, representatives of the AssistanceTechnical and Territorial Extension Company (EMATER) and the analysis of the mostfrequent words in tweets about artisanal cheese, capable of identifying the characteristicsand consumption habits of the artisanal cheese. With the analysis of the opinion expressedby the consumer on Twitter’s social network about artisanal cheeses in Brazil, it wasfound that defining a general trend for all artisanal cheeses was a practical task due toissues such as regionalism, characteristics and consumption habits vary for each type ofcheese, a fact that could be observed by analyzing the consumption profile of Coalhocheese. However, taking into account the results obtained, the computer system developedproved to be capable of combining several techniques and methodologies in one place, making decision-making more efficient based on the analysis of real data, thus innovatingthe way of doing traditional market research.pt_BR
dc.description.resumoO desenvolvimento de alternativas à pesquisa de mercado tradicional tem sido um grande desafio em ambientes corporativos. Tais pesquisas, têm embasamento científico, são bem validadas e trazem bons resultados, porém, fatores como limitações geográficas, longo tempo de aplicação e análise, alto custo, além de possuírem formulários que podem ser extensos e muitas vezes com baixa adesão podem inviabilizar seu uso. Com tantas pessoas utilizando as mais diversas redes sociais, as empresas estão cada vez mais atentas ao que se comenta nesses ambientes virtuais. Com tantas mensagens,posts, comentários e áudios,um grande volume de dados é gerado e, por isso, o termo Big Data neste ambiente está muito presente se referindo ao grande volume, variedade e velocidade com que os dados são gerados. Conhecer o perfil do consumidor e as tendências de consumo pode ajudar muito na tomada de decisões estratégicas nos mais diversos setores e segmentos comerciais.Dito isso, o presente trabalho refere-se ao desenvolvimento de um sistema computacional capaz de coletar, armazenar, processar e extrair informações em dados da rede social Twitter, com o objetivo de avaliar tendências de consumo por meio da identificação de características e hábitos de consumo do queijo artesanal no Brasil. Para isso, inicialmente foi desenvolvido um conjunto de palavras-chave referentes aos nomes dos queijos artesanais de interesse e um algoritmo capaz de coletar esses dados no Twitter. Em seguida, foi necessário construir um modelo de banco de dados capaz de armazenar com eficiência os dados recém-coletados e os resultados de outras análises. Para identificar a polaridade dos sentimentos presentes nos tweets desenvolveu-se um modelo utilizando o Ensemble Voting Classifier para a realização da classificação das publicações nas classes negativo,neutro e positivo. Foi necessária a criação de um conjunto de dados de treinamento específico para queijos artesanais, uma vez que não foi encontrado na literatura nenhum que atendesse a essas especificações. Utilizou-se técnicas de Processamento de Linguagem Natural para tratamento dos dados textuais e extração de informação dos mesmos. Foi desenvolvido um conjunto de palavras-chave baseada na opinião de pesquisadores da EMBRAPA Gado de Leite, representantes da Empresa de Assistência Técnica e Extensão Territorial (EMATER) e análise das palavras mais frequentes nos tweets sobre queijo artesanal, capazes de identificar as características e os hábitos de consumo do queijo artesanal. Com a análise da opinião expressa pelo consumidor na rede social do Twitter sobre os queijos artesanais no Brasil, verificou-se que definir uma tendência geral para todos os queijos artesanais foi uma tarefa impraticável devido a questões como o regionalismo,características e hábitos de consumo que variam para cada tipo de queijo, fato este que pôde ser observado pela análise do perfil de consumo do queijo Coalho. Entretanto, levando em consideração os resultados obtidos, o sistema computacional desenvolvido mostrou-se ser capaz de combinar várias técnicas e metodologias em um só lugar, tornando a tomada de decisão mais eficiente pautada pela análise de dados reais, inovando assim a forma de se fazer pesquisas de mercado tradicionais.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Juiz de Fora (UFJF)pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentFaculdade de Engenhariapt_BR
dc.publisher.programPrograma de Pós-graduação em Modelagem Computacionalpt_BR
dc.publisher.initialsUFJFpt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectMineração de dadospt_BR
dc.subjectAprendizagem de máquinapt_BR
dc.subjectAnálise de sentimentospt_BR
dc.subjectRedes sociaispt_BR
dc.subjectQueijo artesanalpt_BR
dc.subjectData miningpt_BR
dc.subjectMachine learningpt_BR
dc.subjectSentiment analysispt_BR
dc.subjectSocial networkspt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRApt_BR
dc.titleMineração de dados em rede social para avaliação de tendências de consumo do queijo artesanal no Brasilpt_BR
dc.typeDissertaçãopt_BR
Appears in Collections:Mestrado em Modelagem Computacional (Dissertações)



This item is licensed under a Creative Commons License Creative Commons