Repository logo
 
Publication

Deep learning aplicado a classificação de patologias da voz

datacite.subject.fosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformÔticapt_PT
dc.contributor.advisorTeixeira, João Paulo
dc.contributor.advisorCĆ¢ndido Junior, Arnaldo
dc.contributor.authorGuedes, Victor
dc.date.accessioned2020-01-31T12:21:13Z
dc.date.available2020-01-31T12:21:13Z
dc.date.issued2019
dc.date.submitted2018
dc.descriptionDupla diplomaçaão com a UTFPR - Universidade Tecnológica Federal do ParanÔpt_PT
dc.description.abstractA classificação de patologias relacionadas a voz utilizando conceitos de Deep Learning vem crescendo consideravelmente nos Ćŗltimos anos. Bons resultados jĆ” foram obtidos para a classificação em fala sustentada com vogais, mas ainda existem poucos trabalhos relacionadas a classificação deste problema utilizando fala contĆ­nua. Por isso, Ć© foco desta dissertação realizar a implementação dos principais modelos de Deep Learning para a classificação de patologias da voz em fala contĆ­nua, utilizando a frase alemĆ£ ā€œGuten Morgen, wie geht es Ihnen?ā€ da base de dados Saarbruecken Voice Database. SĆ£o utilizados as patologias de disfonia, laringite e paralisia das cordas vocais, alĆ©m da classe dos saudĆ”veis, para anĆ”lises multi classe e binĆ”ria. AlĆ©m disso, tambĆ©m Ć© realizado um estudo prĆ©vio para a classificação com vogais nas mesmas patologias. O melhor resultado para as vogais Ć© de 99% de exatidĆ£o para a implementação de um modelo LSTM com parĆ¢metros Jitter, Shimmer e Autocorrelação, na classificação binĆ”ria entre laringite e saudĆ”vel. Para as frases, Ć© realizado um estudo comparativo entre modelos de redes neuronais, convolucionais e recorrentes para os parĆ¢metros MFCCs e Espectrogramas na escala Mel obtendo resultados de 76% de medida-F para disfonia x saudĆ”vel, 68% de medida-F para laringite x saudĆ”vel, 80% de medida-F para paralisia x saudĆ”vel. Para classificação multi classe Ć© obtido 59% e 40% de medida-F para 3 classes e 4 classes, respectivamente.pt_PT
dc.description.abstractThe classification of voice related pathologies using Deep Learning concepts has been increasing considerably in recent years. Good results have already been obtained for classification in sustained speech with vowels, but there are still few studies related to the classification of this problem using continuous speech. Therefore, the focus of this dissertation is to implement the main models of Deep Learning for the classification of voice pathologies in continuous speech, using the German phrase "Guten Morgen, wie geht es Ihnen?"From the Saarbruecken Voice Database. The pathologies of dysphonia, laryngitis and paralysis of the vocal cords, as well as the healthy class, are used for multi-class and binary analyzes. In addition, a previous study for the classification with vowels in the same pathologies is also carried out. The best result for the vowels is 99 % accuracy for the implementation of an LSTM model with parameters Jitter, Shimmer and Autocorrelation, in the binary classification between laryngitis and healthy. For the phrases, a comparative study between neural networks, convolutional and recurrent models with the parameter MFCCs and Spectrograms in the Mel scale, obtaining results of 76% F-measure for dysphonia x healthy, 68% F-measure for laryngitis x healthy, 80% F-measure for healthy x paralysis of the vocal cords. For multi-class classification is obtained 59% and 40% of F-measure for 3 classes and 4 classes, respectively.pt_PT
dc.identifier.tid202388328pt_PT
dc.identifier.urihttp://hdl.handle.net/10198/20502
dc.language.isoporpt_PT
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/pt_PT
dc.subjectLong short-term memorypt_PT
dc.subjectRede neuronais convolucionalpt_PT
dc.subjectRedes neuronais artificiaspt_PT
dc.subjectTransfer learningpt_PT
dc.titleDeep learning aplicado a classificação de patologias da vozpt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameSistemas de Informaçãopt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Guedes_Victor.pdf
Size:
5.66 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.75 KB
Format:
Item-specific license agreed upon to submission
Description: