https://repositorio.ufjf.br/jspui/handle/ufjf/19401
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
gabrielrezendedasilva.pdf | PDF/A | 10.95 MB | Adobe PDF | Visualizar/Abrir |
Clase: | Dissertação |
Título : | Cattle face generation using an adversarial network with bounding boxes of facial subregions |
Autor(es): | Silva, Gabriel Rezende da |
Orientador: | Vieira, Marcelo Bernardes |
Co-orientador: | Maciel, Luiz Maurílio da Silva |
Miembros Examinadores: | Souza, Jairo Francisco de |
Miembros Examinadores: | Giraldi, Gilson Antonio |
Resumo: | A coleta de dados no âmbito da pecuária de precisão é um sério desao. A escassez de conjuntos de dados de imagens anotadas para problemas relacionados à pecuária de precisão limita o potencial de algoritmos de aprendizado profundo. As informações aprendidas pelas Redes Adversárias Generativas (GANs) podem ser empregadas para melhorar o desempenho de tarefas de aprendizado de máquina, como classicação. Subregiões especícas da região facial de bovinos, como focinho, orelhas e olhos, são indicadores signicativos de dor, desconforto e estresse nos animais, além de serem utilizadas para a identicação individual. Nesse contexto, o presente trabalho propõe uma nova arquitetura que reforça a localização espacial de sub-regiões faciais de interesse. O método proposto integra módulos de caixa delimitadora com uma GAN conhecida na literatura, denominada BigGAN. A hipótese é que a incorporação de informações de localização espacial, fornecidas por caixas delimitadoras de sub-regiões de interesse, como focinho, orelhas e olhos, pode aprimorar a geração de imagens sintéticas de faces de bovinos. Assim, propõe-se uma nova conguração desses módulos, baseada no provimento de múltiplos objetos em uma cena. Os módulos são acoplados em diferentes profundidades no gerador, formando uma pirâmide de resolução, e em um nível especíco no discriminador. Também propõe-se a utilização de caixas multi-escalas para representar as sub-regiões de interesse. A premissa é suavizar as áreas de transição entre os objetos e o plano de fundo, ao mesmo tempo em que reforça as características dos objetos. Para treinar o modelo, ltrou-se um conjunto de dados pré-anotados para a tarefa de detecção, adaptando-o à tarefa de geração. O novo conjunto de dados inclui 9▷495 faces de bovinos e um subconjunto de anotações de caixas delimitadoras. Para avaliar a viabilidade da proposta, realizou-se uma análise extensiva, tanto quantitativa quanto qualitativa. Os resultados experimentais mostraram ganhos proporcionados pela inserção de informações adicionais de sub-regiões de interesse via módulos de caixa delimitadora. A capacidade de inserir arbitrariamente a posição das sub-regiões permite possíveis aplicações como a geração facial personalizada pelo usuário. |
Resumen : | Data collection in precision livestock farming is a serious challenge. The scarcity of annotated image datasets for precision livestock problems limits the potential of deep learning algorithms. The information learned by the Generative Adversarial Networks (GANs) can be employed to improve the performance of machine learning tasks, such as classication. Specic subregions of the facial cattle region, such as the muzzle, ears, and eyes, are signicant indicators of pain, discomfort, and stress in animals, as well as being used for individual identication. In this context, in the present work we develop a new architecture that enhances the spatial localization of facial interest subregions. The proposed method combines bounding box modules with a GAN known in the literature, named BigGAN. The hypothesis is that the incorporation of spatial location information, provided by interest subregions bounding boxes, such as the muzzle, ears, and eyes, can improve the generation of synthetic cattle faces images. Thus, we proposed a new conguration of these modules, based on providing multiple objects in a scene. The modules are attached at dierent depths in the generator, forming a resolution pyramid, and at a specic level in the discriminator. We also propose to use a multiscale boxes to represent the interest subregions. The premise is to smooth out the transitions between the objects and the background, while reinforcing the objects’ features. To train the model, we ltered a pre-annotated dataset for the detection task and adapted it for the generation task. The new dataset includes 9, 495 cattle faces and a subset of bounding box annotations. To assess the feasibility of the proposal, we conducted extensive analysis, both quantitative and qualitative. The experimental results showed improvements provided by the inclusion of additional information for the interest subregions via bounding box modules. The capacity to arbitrarily insert the subregions’ position allows for possible applications such as facial generation designed by user. |
Palabras clave : | Geração facial de bovinos Aprendizado profundo Redes adversárias generativas Módulos de caixa delimitadora Cattle facial generation Deep learning Generative adversarial networks Bounding box modules |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA |
Idioma: | eng |
País: | Brasil |
Editorial : | Universidade Federal de Juiz de Fora (UFJF) |
Sigla de la Instituición: | UFJF |
Departamento: | ICE – Instituto de Ciências Exatas |
Programa: | Programa de Pós-graduação em Ciência da Computação |
Clase de Acesso: | Acesso Aberto Attribution-NonCommercial-ShareAlike 3.0 Brazil |
Licenças Creative Commons: | http://creativecommons.org/licenses/by-nc-sa/3.0/br/ |
URI : | https://repositorio.ufjf.br/jspui/handle/ufjf/19401 |
Fecha de publicación : | 27-sep-2024 |
Aparece en las colecciones: | Mestrado em Ciência da Computação (Dissertações) |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons