| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 1.56 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
Cardiovascular diseases, including myocardial infarction, remain among the leading causes of mortality worldwide. Timely and accurate diagnosis is critical for effective treatment but often requires labour-intensive manual analysis of clinical-grade electrocardiograms (ECGs). This dissertation proposes a novel deep learning-based approach for binary classification of cardiac pathologies, using the PTB-XL dataset. The final model architecture integrates EfficientNetB3 for spatial feature extraction and a Linformer block to capture long-range dependencies between ECG leads, the results prove its adaptability for ECG image classification tasks.
Extensive experimentation and iterative model development were conducted to reach the final design. Early trials involved exploring different hyperparameter tuning like Optuna and Adam optimizer and a wide range of hyperparameter configurations, including different learning rates, dropout rates, batch sizes, and numbers of Linformer layers. These experiments were critical in finding the optimal combination of parameters that balanced computational efficiency and model accuracy. Comprehensive details of these trials and evaluations are provided in the report.
The preprocessing pipeline involves selecting the ECGs and converting them to 11 images (aVR was excluded) each representing a lead, converting RGBA ECG images to RGB format and applying normalization to ensure compatibility with model input requirements. This preprocessing step addresses the unique format of the dataset and prepares it for high-performance neural network training.
Initial results from the finalized model architecture have demonstrated promising performance, achieving an AUC (Area Under the Curve) of 85.02% and a F1-score of 78.94%. The achieved results are comparable to recent state-of-the-art models reported on the PTB-XL dataset, which typically range between 85% and 95% AUC for similar binary classification tasks. These results indicate that the model's AUC of 85.02% is promising but on the edge of the current state-of-the-art. These findings indicate strong potential for the system to support clinical decision-making by automating the classification of ECG data. Ongoing research aims to extend the current binary classification framework to multi-class scenarios, further enhancing its clinical applicability. Additionally, efforts are being made to improve the model for faster inference times, enabling real-time ECG analysis and improving its feasibility for deployment in healthcare settings.
As doenças cardiovasculares, incluindo o enfarte do miocárdio, continuam a ser uma das principais causas de mortalidade em todo o mundo. O diagnóstico atempado e preciso é fundamental para um tratamento eficaz, mas muitas vezes requer uma análise manual intensiva de electrocardiogramas (ECGs) de grau clínico. Esta dissertação propõe uma nova abordagem baseada em aprendizagem profunda para a classificação binária de patologias cardíacas, utilizando o conjunto de dados PTB-XL. A arquitetura final do modelo integra o EfficientNetB3 para extração de caraterísticas espaciais e um bloco Linformer para capturar dependências de longo alcance entre as leads do ECG, os resultados provam a sua adaptabilidade para tarefas de classificação de imagens de ECG. Foi efetuada uma experimentação extensiva e um desenvolvimento iterativo do modelo para chegar à conceção final. Os primeiros ensaios envolveram a exploração de diferentes afinações de hiperparâmetros, como o Optuna e o optimizador Adam, e uma vasta gama de configurações de hiperparâmetros, incluindo diferentes taxas de aprendizagem, taxas de abandono, tamanhos de lotes e números de camadas Linformer. Estas experiências foram fundamentais para encontrar a combinação ideal de parâmetros que equilibrasse a eficiência computacional e a precisão do modelo. O relatório apresenta pormenores abrangentes sobre estas experiências e avaliações. O processo de pré-processamento envolve a seleção dos ECGs e a sua conversão em 11 imagens (aVR foi excluída), cada uma representando uma Lead, a conversão das imagens de ECG RGBA para o formato RGB e a aplicação da normalização para garantir a compatibilidade com os requisitos de entrada do modelo. Essa etapa de pré-processamento aborda o formato exclusivo do conjunto de dados e o prepara para o treinamento de redes neurais de alto desempenho. Os resultados iniciais da arquitetura do modelo finalizado demonstraram um desempenho promissor, alcançando uma AUC (Área sob a curva) de 85,02% e uma pontuação F1 de 78,94%. Os resultados alcançados são comparáveis aos modelos recentes do estado da arte reportados no conjunto de dados PTB-XL, que tipicamente variam entre 85% e 95% de AUC para tarefas de classificação binária semelhantes. Estes resultados indicam que a AUC do modelo de 85,02% é promissora, mas no limite do estado da arte atual. Estes resultados indicam um forte potencial para o sistema apoiar a tomada de decisões clínicas, automatizando a classificação dos dados de ECG. A investigação em curso visa alargar a atual estrutura de classificação binária a cenários multi-classe, melhorando ainda mais a sua aplicabilidade clínica. Além disso, estão a ser estão a ser feitos esforços no sentido de melhorar o modelo para obter tempos de inferência mais rápidos, permitindo a análise de ECG em tempo real e melhorando a sua viabilidade de implementação em ambientes de cuidados de saúde.
As doenças cardiovasculares, incluindo o enfarte do miocárdio, continuam a ser uma das principais causas de mortalidade em todo o mundo. O diagnóstico atempado e preciso é fundamental para um tratamento eficaz, mas muitas vezes requer uma análise manual intensiva de electrocardiogramas (ECGs) de grau clínico. Esta dissertação propõe uma nova abordagem baseada em aprendizagem profunda para a classificação binária de patologias cardíacas, utilizando o conjunto de dados PTB-XL. A arquitetura final do modelo integra o EfficientNetB3 para extração de caraterísticas espaciais e um bloco Linformer para capturar dependências de longo alcance entre as leads do ECG, os resultados provam a sua adaptabilidade para tarefas de classificação de imagens de ECG. Foi efetuada uma experimentação extensiva e um desenvolvimento iterativo do modelo para chegar à conceção final. Os primeiros ensaios envolveram a exploração de diferentes afinações de hiperparâmetros, como o Optuna e o optimizador Adam, e uma vasta gama de configurações de hiperparâmetros, incluindo diferentes taxas de aprendizagem, taxas de abandono, tamanhos de lotes e números de camadas Linformer. Estas experiências foram fundamentais para encontrar a combinação ideal de parâmetros que equilibrasse a eficiência computacional e a precisão do modelo. O relatório apresenta pormenores abrangentes sobre estas experiências e avaliações. O processo de pré-processamento envolve a seleção dos ECGs e a sua conversão em 11 imagens (aVR foi excluída), cada uma representando uma Lead, a conversão das imagens de ECG RGBA para o formato RGB e a aplicação da normalização para garantir a compatibilidade com os requisitos de entrada do modelo. Essa etapa de pré-processamento aborda o formato exclusivo do conjunto de dados e o prepara para o treinamento de redes neurais de alto desempenho. Os resultados iniciais da arquitetura do modelo finalizado demonstraram um desempenho promissor, alcançando uma AUC (Área sob a curva) de 85,02% e uma pontuação F1 de 78,94%. Os resultados alcançados são comparáveis aos modelos recentes do estado da arte reportados no conjunto de dados PTB-XL, que tipicamente variam entre 85% e 95% de AUC para tarefas de classificação binária semelhantes. Estes resultados indicam que a AUC do modelo de 85,02% é promissora, mas no limite do estado da arte atual. Estes resultados indicam um forte potencial para o sistema apoiar a tomada de decisões clínicas, automatizando a classificação dos dados de ECG. A investigação em curso visa alargar a atual estrutura de classificação binária a cenários multi-classe, melhorando ainda mais a sua aplicabilidade clínica. Além disso, estão a ser estão a ser feitos esforços no sentido de melhorar o modelo para obter tempos de inferência mais rápidos, permitindo a análise de ECG em tempo real e melhorando a sua viabilidade de implementação em ambientes de cuidados de saúde.
Description
Mestrado de dupla diplomação com Tunisia Private University (ULT Tunisie)
Keywords
ECG classification EfficientNet Linformer Manual and dynamic hyperparameter tuning techniques Adam optimizer Optuna AUC Myocardial Infarction
