Repository logo
 
Publication

Binary classification of cardiac pathologies using deep learning: a PTB-XL dataset approach

datacite.subject.fosCiências Médicas
datacite.subject.sdg03:Saúde de Qualidade
dc.contributor.advisorTeixeira, João Paulo
dc.contributor.advisorSlim , Mohamed Aymen
dc.contributor.authorChaabani, Mohamed Khalil
dc.date.accessioned2025-11-11T16:27:35Z
dc.date.available2025-11-11T16:27:35Z
dc.date.issued2025
dc.date.submitted2025
dc.descriptionMestrado de dupla diplomação com Tunisia Private University (ULT Tunisie)
dc.description.abstractCardiovascular diseases, including myocardial infarction, remain among the leading causes of mortality worldwide. Timely and accurate diagnosis is critical for effective treatment but often requires labour-intensive manual analysis of clinical-grade electrocardiograms (ECGs). This dissertation proposes a novel deep learning-based approach for binary classification of cardiac pathologies, using the PTB-XL dataset. The final model architecture integrates EfficientNetB3 for spatial feature extraction and a Linformer block to capture long-range dependencies between ECG leads, the results prove its adaptability for ECG image classification tasks. Extensive experimentation and iterative model development were conducted to reach the final design. Early trials involved exploring different hyperparameter tuning like Optuna and Adam optimizer and a wide range of hyperparameter configurations, including different learning rates, dropout rates, batch sizes, and numbers of Linformer layers. These experiments were critical in finding the optimal combination of parameters that balanced computational efficiency and model accuracy. Comprehensive details of these trials and evaluations are provided in the report. The preprocessing pipeline involves selecting the ECGs and converting them to 11 images (aVR was excluded) each representing a lead, converting RGBA ECG images to RGB format and applying normalization to ensure compatibility with model input requirements. This preprocessing step addresses the unique format of the dataset and prepares it for high-performance neural network training. Initial results from the finalized model architecture have demonstrated promising performance, achieving an AUC (Area Under the Curve) of 85.02% and a F1-score of 78.94%. The achieved results are comparable to recent state-of-the-art models reported on the PTB-XL dataset, which typically range between 85% and 95% AUC for similar binary classification tasks. These results indicate that the model's AUC of 85.02% is promising but on the edge of the current state-of-the-art. These findings indicate strong potential for the system to support clinical decision-making by automating the classification of ECG data. Ongoing research aims to extend the current binary classification framework to multi-class scenarios, further enhancing its clinical applicability. Additionally, efforts are being made to improve the model for faster inference times, enabling real-time ECG analysis and improving its feasibility for deployment in healthcare settings.por
dc.description.abstractAs doenças cardiovasculares, incluindo o enfarte do miocárdio, continuam a ser uma das principais causas de mortalidade em todo o mundo. O diagnóstico atempado e preciso é fundamental para um tratamento eficaz, mas muitas vezes requer uma análise manual intensiva de electrocardiogramas (ECGs) de grau clínico. Esta dissertação propõe uma nova abordagem baseada em aprendizagem profunda para a classificação binária de patologias cardíacas, utilizando o conjunto de dados PTB-XL. A arquitetura final do modelo integra o EfficientNetB3 para extração de caraterísticas espaciais e um bloco Linformer para capturar dependências de longo alcance entre as leads do ECG, os resultados provam a sua adaptabilidade para tarefas de classificação de imagens de ECG. Foi efetuada uma experimentação extensiva e um desenvolvimento iterativo do modelo para chegar à conceção final. Os primeiros ensaios envolveram a exploração de diferentes afinações de hiperparâmetros, como o Optuna e o optimizador Adam, e uma vasta gama de configurações de hiperparâmetros, incluindo diferentes taxas de aprendizagem, taxas de abandono, tamanhos de lotes e números de camadas Linformer. Estas experiências foram fundamentais para encontrar a combinação ideal de parâmetros que equilibrasse a eficiência computacional e a precisão do modelo. O relatório apresenta pormenores abrangentes sobre estas experiências e avaliações. O processo de pré-processamento envolve a seleção dos ECGs e a sua conversão em 11 imagens (aVR foi excluída), cada uma representando uma Lead, a conversão das imagens de ECG RGBA para o formato RGB e a aplicação da normalização para garantir a compatibilidade com os requisitos de entrada do modelo. Essa etapa de pré-processamento aborda o formato exclusivo do conjunto de dados e o prepara para o treinamento de redes neurais de alto desempenho. Os resultados iniciais da arquitetura do modelo finalizado demonstraram um desempenho promissor, alcançando uma AUC (Área sob a curva) de 85,02% e uma pontuação F1 de 78,94%. Os resultados alcançados são comparáveis aos modelos recentes do estado da arte reportados no conjunto de dados PTB-XL, que tipicamente variam entre 85% e 95% de AUC para tarefas de classificação binária semelhantes. Estes resultados indicam que a AUC do modelo de 85,02% é promissora, mas no limite do estado da arte atual. Estes resultados indicam um forte potencial para o sistema apoiar a tomada de decisões clínicas, automatizando a classificação dos dados de ECG. A investigação em curso visa alargar a atual estrutura de classificação binária a cenários multi-classe, melhorando ainda mais a sua aplicabilidade clínica. Além disso, estão a ser estão a ser feitos esforços no sentido de melhorar o modelo para obter tempos de inferência mais rápidos, permitindo a análise de ECG em tempo real e melhorando a sua viabilidade de implementação em ambientes de cuidados de saúde.por
dc.identifier.tid204045401
dc.identifier.urihttp://hdl.handle.net/10198/35045
dc.language.isoeng
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectECG classification
dc.subjectEfficientNet
dc.subjectLinformer
dc.subjectManual and dynamic hyperparameter tuning techniques
dc.subjectAdam optimizer
dc.subjectOptuna
dc.subjectAUC
dc.subjectMyocardial Infarction
dc.titleBinary classification of cardiac pathologies using deep learning: a PTB-XL dataset approach
dc.typemaster thesis
dspace.entity.typePublication
thesis.degree.nameDissertação de mestrado em Engenharia Eletrotécnica e de Computadores

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Mohamed Chaabani.pdf
Size:
1.56 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.75 KB
Format:
Item-specific license agreed upon to submission
Description: