https://repositorio.ufjf.br/jspui/handle/ufjf/12524
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
thallysdasilvanogueira.pdf | 6.26 MB | Adobe PDF | Visualizar/Abrir |
Tipo: | Dissertação |
Título: | Mineração de dados em rede social para avaliação de tendências de consumo do queijo artesanal no Brasil |
Autor(es): | Nogueira, Thallys da Silva |
Primeiro Orientador: | Goliat, Priscila Vanessa Zabala Capriles |
Membro da banca: | Siqueira, Kennya Beatriz |
Membro da banca: | Campos, Luciana Conceição Dias |
Resumo: | O desenvolvimento de alternativas à pesquisa de mercado tradicional tem sido um grande desafio em ambientes corporativos. Tais pesquisas, têm embasamento científico, são bem validadas e trazem bons resultados, porém, fatores como limitações geográficas, longo tempo de aplicação e análise, alto custo, além de possuírem formulários que podem ser extensos e muitas vezes com baixa adesão podem inviabilizar seu uso. Com tantas pessoas utilizando as mais diversas redes sociais, as empresas estão cada vez mais atentas ao que se comenta nesses ambientes virtuais. Com tantas mensagens,posts, comentários e áudios,um grande volume de dados é gerado e, por isso, o termo Big Data neste ambiente está muito presente se referindo ao grande volume, variedade e velocidade com que os dados são gerados. Conhecer o perfil do consumidor e as tendências de consumo pode ajudar muito na tomada de decisões estratégicas nos mais diversos setores e segmentos comerciais.Dito isso, o presente trabalho refere-se ao desenvolvimento de um sistema computacional capaz de coletar, armazenar, processar e extrair informações em dados da rede social Twitter, com o objetivo de avaliar tendências de consumo por meio da identificação de características e hábitos de consumo do queijo artesanal no Brasil. Para isso, inicialmente foi desenvolvido um conjunto de palavras-chave referentes aos nomes dos queijos artesanais de interesse e um algoritmo capaz de coletar esses dados no Twitter. Em seguida, foi necessário construir um modelo de banco de dados capaz de armazenar com eficiência os dados recém-coletados e os resultados de outras análises. Para identificar a polaridade dos sentimentos presentes nos tweets desenvolveu-se um modelo utilizando o Ensemble Voting Classifier para a realização da classificação das publicações nas classes negativo,neutro e positivo. Foi necessária a criação de um conjunto de dados de treinamento específico para queijos artesanais, uma vez que não foi encontrado na literatura nenhum que atendesse a essas especificações. Utilizou-se técnicas de Processamento de Linguagem Natural para tratamento dos dados textuais e extração de informação dos mesmos. Foi desenvolvido um conjunto de palavras-chave baseada na opinião de pesquisadores da EMBRAPA Gado de Leite, representantes da Empresa de Assistência Técnica e Extensão Territorial (EMATER) e análise das palavras mais frequentes nos tweets sobre queijo artesanal, capazes de identificar as características e os hábitos de consumo do queijo artesanal. Com a análise da opinião expressa pelo consumidor na rede social do Twitter sobre os queijos artesanais no Brasil, verificou-se que definir uma tendência geral para todos os queijos artesanais foi uma tarefa impraticável devido a questões como o regionalismo,características e hábitos de consumo que variam para cada tipo de queijo, fato este que pôde ser observado pela análise do perfil de consumo do queijo Coalho. Entretanto, levando em consideração os resultados obtidos, o sistema computacional desenvolvido mostrou-se ser capaz de combinar várias técnicas e metodologias em um só lugar, tornando a tomada de decisão mais eficiente pautada pela análise de dados reais, inovando assim a forma de se fazer pesquisas de mercado tradicionais. |
Abstract: | The development of alternatives to traditional market research has been a majorchallenge in corporate environments. Such research has a scientific basis, is well validatedand brings good results, however, factors such as geographic limitations, long time ofapplication and analysis, high cost, in addition to having forms that can be extensive andoften with low adherence can make their use unfeasible. With so many people using themost diverse social networks, companies are increasingly attentive to what is commentedon in these virtual environments. With so many messages, posts, comments and audios, alarge volume of data is generated and, therefore, the term Big Data in this environmentis very present referring to the large volume, variety and speed with which the dataare generated. Knowing the consumer profile and consumption trends can help a lot inmaking strategic decisions in the most diverse sectors and commercial segments. Thatsaid, the present work refers to the development of a computational system capable ofcollecting, storing, processing and extracting information in data from the social networkTwitter, with the objective of evaluating consumption trends through the identification ofconsumption characteristics and habits of artisanal cheese in Brazil. For this, initially a setof keywords was developed referring to the names of the artisanal cheeses of interest andan algorithm capable of collecting this data on Twitter. Then, it was necessary to build adatabase model capable of efficiently storing the newly collected data and the results ofother analyzes. To identify the polarity of the feelings present in the tweets, a model wasdeveloped using the Voting Classifier Ensemble to perform the classification of publicationsin the negative, neutral and positive classes. It was necessary to create a specific trainingdata set for artisanal cheeses, since no literature that met these specifications was foundin the literature. Natural Language Processing techniques were used to treat textualdata and extract information from them. A set of keywords was developed based onthe opinion of researchers at EMBRAPA Dairy Cattle, representatives of the AssistanceTechnical and Territorial Extension Company (EMATER) and the analysis of the mostfrequent words in tweets about artisanal cheese, capable of identifying the characteristicsand consumption habits of the artisanal cheese. With the analysis of the opinion expressedby the consumer on Twitter’s social network about artisanal cheeses in Brazil, it wasfound that defining a general trend for all artisanal cheeses was a practical task due toissues such as regionalism, characteristics and consumption habits vary for each type ofcheese, a fact that could be observed by analyzing the consumption profile of Coalhocheese. However, taking into account the results obtained, the computer system developedproved to be capable of combining several techniques and methodologies in one place, making decision-making more efficient based on the analysis of real data, thus innovatingthe way of doing traditional market research. |
Palavras-chave: | Mineração de dados Aprendizagem de máquina Análise de sentimentos Redes sociais Queijo artesanal Data mining Machine learning Sentiment analysis Social networks |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Juiz de Fora (UFJF) |
Sigla da Instituição: | UFJF |
Departamento: | Faculdade de Engenharia |
Programa: | Programa de Pós-graduação em Modelagem Computacional |
Tipo de Acesso: | Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 Brazil |
Licenças Creative Commons: | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
DOI: | https://doi.org/10.34019/ufjf/di/2021/00021 |
URI: | https://repositorio.ufjf.br/jspui/handle/ufjf/12524 |
Data do documento: | 18-Mar-2021 |
Aparece nas coleções: | Mestrado em Modelagem Computacional (Dissertações) |
Este item está licenciado sob uma Licença Creative Commons