Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufjf.br/jspui/handle/ufjf/19385
Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
leonardoazalimdeoliveira.pdfPDF/A5.22 MBAdobe PDFVisualizar/Abrir
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisor1Silva, Edelberto Franco-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3987091765361506pt_BR
dc.contributor.advisor-co1Chaves, Luciano Jerez-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/7521861928465039pt_BR
dc.contributor.referee1Vieira, Alex Borges-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/9037224811267705pt_BR
dc.contributor.referee2Lima, Michele Nogueira-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/7862253799240671pt_BR
dc.contributor.referee3Mattos, Diogo Menezes Ferrazani-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/6177045546956476pt_BR
dc.creatorOliveira, Leonardo Azalim de-
dc.creator.Latteshttp://lattes.cnpq.br/7749238753232176pt_BR
dc.date.accessioned2025-09-12T10:55:02Z-
dc.date.available2025-09-09-
dc.date.available2025-09-12T10:55:02Z-
dc.date.issued2025-06-11-
dc.identifier.urihttps://repositorio.ufjf.br/jspui/handle/ufjf/19385-
dc.description.abstractThe fifth generation of cellular network (5G), specified by the 3 rd Generation Partnership Program (3GPP), distinguishes itself from previous mobile network generations primarily through the adoption of a Service Based Architecture (SBA). By leveraging the flexibility of this new architectural paradigm, this work investigates the feasibility of implementing a Network Data Analytics Function (NWDAF) mechanism for classifying 5G devices. Following the 3GPP specifications, the International Telecommunication Union (ITU) defines three 5G service axes: Enhanced Mobile Broadband (eMBB), Ultra Reliable and Low Latency Communications (URLLC), and Massive Machine-Type Communications (mMTC). These axes focus on applications that require high throughput, low latency with high availability, and low-energy transmissions with thousands of connected Internet of Things (IoT) devices, respectively. Therefore, the classification of different device types is crucial, as each 5G axis is associated with distinct constraints, which influence resource allocation in the 5G Core (5GC). Defined by the 3GPP in Release 15 as responsible for data analysis in 5G networks, the NWDAF remains considerably underexplored in existing literature. To address this gap, this work employs a simulated 5G environment utilizing Free/Libre and Open Source Software (FLOSS). This environment incorporates UERANSIM, a Radio Access Network (RAN) and User Equipment (UE) simulator; free5GC, a 5GC implementation; and a custom network traffic generator. Two real-world 5G datasets were used to train eleven different Machine Learning (ML) models — Linear Regression (LR), Histogram-based Gradient Boosting (HGB), Light Gradient Boosting Machine (LGBM), Multilayer Perceptron (MLP), Random Forest (RF), Linear Support Vector Classification (SVC), eXtreme Gradient Boosting (XGB), Decision Tree (DT), Adaboost, Stacking, and Voting — to classify UEs in the axes based on their observed network traffic. In the implemented ML pipeline the model inference performance results achieved up to 99.91% F1-score for the eMBB class using RF, LGBM, and XGB. For the URLLC class the best results were 99.99% F1-score with SVC. In contrast, due to the sparse data points of the mMTC class, while Adaboost achieved a 99.99% F1-score in the burst scenario, the performance was limited to 2.74% in the probabilistic scenario. Despite using techniques that include balancing the training dataset, the models suffered from overfitting. Inspired by the open science movement, both the software used and the dataset created for inference are publicly accessible. This approach ensures reproducibility and establishes a foundation for future investigations into data analysis as specified by 3GPP.pt_BR
dc.description.resumoA quinta geração de redes celulares (5G), que é especificada pelo 3 rd Generation Partnership Program (3GPP), se distingue das gerações anteriores de redes móveis principalmente pela adoção de uma arquitetura baseada em serviços (do inglês, Service Based Architecture (SBA)). Ao aproveitar da flexibilidade desse novo paradigma arquitetural, este trabalho investiga a viabilidade da implementação de um mecanismo de Network Data Analytics Function (NWDAF) para a classificação de dispositivos 5G. Consoante com a normatização do 3GPP, o International Telecommunication Union (ITU) define três eixos de serviço 5G: Enhanced Mobile Broadband (eMBB), Ultra Reliable and Low Latency Communications (URLLC) e Massive Machine-Type Communications (mMTC). Esses eixos concentram principalmente aplicações que necessitam de altas taxas de vazão, baixa latência com alta disponibilidade e transmissões de baixo gasto energético com milhares de dispositivos de Internet of Things (IoT) conectados, respectivamente. Então, a classificação de diferentes tipos de dispositivos é crucial, uma vez que cada eixo do 5G está associado a restrições distintas, que influenciam a alocação de recursos no Núcleo 5G (do inglês, 5G Core (5GC)). Definido pelo 3GPP na Release 15 como responsável pela análise de dados em redes 5G, o NWDAF permanece subexplorado na literatura. Então, para explorar essa lacuna, este trabalho utiliza um ambiente 5G simulado que emprega Software Livre (SL). Este ambiente engloba o UERANSIM, que é um simulador de Radio Access Network (RAN) e User Equipment (UE); o free5GC, que é uma implementação de 5GC; e um gerador de tráfego de rede customizável. Dois conjuntos de dados 5G reais, foram utilizados para treinar onze diferentes modelos de Machine Learning (ML) — Linear Regression (LR), Histogram-based Gradient Boosting (HGB), Light Gradient Boosting Machine (LGBM), Multilayer Perceptron (MLP), Random Forest (RF), Linear Support Vector Classification (SVC), eXtreme Gradient Boosting (XGB), Decision Tree (DT), AdaBoost, Stacking, e Voting — com o objetivo de classificar os UEs nos eixos a partir do tráfego de rede observado. No pipeline de ML implementado, os modelos alcançaram até 99.91% de F1-score para a classe eMBB ao utilizar RF, LGBM e XGB. Para a classe URLLC, os melhores resultados foram de 99.99% de F1-score com o SVC. Em contraste, devido à natureza esparsa dos dados da classe mMTC, enquanto o AdaBoost alcançou 99.99% de F1-score no cenário de burst, a performance ficou limitada em 2.74% no cenário probabilístico. Mesmo após empregar técnicas que incluíram o balanceamento dos dados de treinamento, os modelos sofreram de overfitting. Inspirado pelo movimento de ciência aberta, tanto o software utilizado quanto o conjunto de dados criado para a inferência estão acessíveis publicamente. Essa abordagem garante a reprodutibilidade e estabelece bases para investigações futuras sobre análise de dados conforme especificado pelo 3GPP.pt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Juiz de Fora (UFJF)pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentICE – Instituto de Ciências Exataspt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.publisher.initialsUFJFpt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/*
dc.subject5Gpt_BR
dc.subjectTráfego de redept_BR
dc.subjectClassificaçãopt_BR
dc.subjectNetwork trafficpt_BR
dc.subjectClassificationpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRApt_BR
dc.titleUser equipment traffic classification in the 5G corept_BR
dc.typeDissertaçãopt_BR
Aparece en las colecciones: Mestrado em Ciência da Computação (Dissertações)



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons