Logo do repositório
 
Publicação

Exploração de indicadores para identificar víeis em diferentes conjuntos de dados

datacite.subject.fosEngenharia e Tecnologia
dc.contributor.advisorSena, Inês
dc.contributor.advisorPereira, Ana I.
dc.contributor.authorPereira, Rozeana Celeste Tavares
dc.date.accessioned2026-01-09T14:35:58Z
dc.date.available2026-01-09T14:35:58Z
dc.date.issued2025
dc.date.submitted2025
dc.description.abstractOs conjuntos de dados frequentemente contêm vieses que prejudicam determinados grupos. Geralmente, é muito difícil eliminar totalmente esses vieses. No entanto, deve-se sempre tentar minimizá-los. O presente estudo tem como principal objetivo identificar a presença de viés em diferentes conjuntos de dados. Para validar a abordagem, foram realizados testes práticos em Python, com diferentes conjuntos de teste. Foram utilizados dois conjuntos de dados de contextos distintos. Aplicaram-se os testes estatísticos Qui-Quadrado ( 2) e ANOVA para identificar possíveis vieses, interpretando os resultados em função do nível de significância de 1% e dos testes de hipóteses. Além disso, aplicou-se a técnica de balanceamento de dados Random Oversampling, uma vez que os resultados continham vieses. A combinação dos testes estatísticos e da técnica de balanceamento permitiu analisar os resultados dos testes estatísticos antes e depois do balanceamento, demonstrando a eficácia das abordagens na deteção e mitigação de vieses, contribuindo para sistemas mais justos.por
dc.description.abstractDatasets often contain biases that disadvantage certain groups. It is generally very difficult to eliminate these biases. However, one should always try to minimize them. The main objective of this study is to identify the presence of bias in different datasets. To validate the approach, practical tests were performed in Python with different test sets. Two datasets from distinct contexts were used. Chi-square ( 2) and ANOVA statistical tests were applied to identify possible biases, interpreting the results based on a significance level of 1% and hypothesis testing. In addition, the Random Oversampling data balancing technique was applied, as the results contained biases. The combination of statistical tests and the balancing technique allowed for the analysis of the statistical test results before and after balancing, demonstrating the effectiveness of the approaches in detecting and mitigating biases, contributing to fairer systems.por
dc.identifier.tid204123151
dc.identifier.urihttp://hdl.handle.net/10198/35430
dc.language.isopor
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectANOVA
dc.subjectBalanceamento de dados
dc.subjectInteligência artificial
dc.subjectQui-Quadrado
dc.subjectViés algorítmico
dc.titleExploração de indicadores para identificar víeis em diferentes conjuntos de dados
dc.typemaster thesis
dspace.entity.typePublication
thesis.degree.nameDissertação de mestrado Engenharia Eletrotécnica e de Computadores

Ficheiros

Principais
A mostrar 1 - 1 de 1
A carregar...
Miniatura
Nome:
Rozeana Pereira.pdf
Tamanho:
2.45 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
1.75 KB
Formato:
Item-specific license agreed upon to submission
Descrição: