Repository logo
 
Publication

DOTS - detection of covid-19 contagion symptoms and self-diagnosis in social networks

datacite.subject.fosCiências Naturais::Ciências da Computação e da Informaçãopt_PT
dc.contributor.advisorLopes, Rui Pedro
dc.contributor.advisorJunior, Arnaldo Candido
dc.contributor.authorSilva, Clístenes Fernandes da
dc.date.accessioned2021-07-27T11:18:03Z
dc.date.available2021-07-27T11:18:03Z
dc.date.issued2021
dc.descriptionMestrado de dupla diplomação com a UTFPR - Universidade Tecnológica Federal do Paranápt_PT
dc.description.abstractSocial media present ways for people to share emotions, feelings, ideas, and even symptoms of disease, and is a great source of data for a variety of analyses. At the end of 2019, an alert was raised for a global pandemic of a virus that has a very high contamination rate and can cause respiratory complications in the contaminated people. To help identify those who may have the symptoms of this disease or to control who are already infected, this paper analyzed the performance of KNN, Naive Bayes, Decision Tree, Random Forest, SVM, simple Multilayer Perceptron, Convolutional Neural Networks and BERT algorithms to classify tweets that contained reports of Covid-19 symptoms or selfreports of infection. The dataset was labeled using a set of disease symptom keywords taken from a list provided by the World Health Organization. The tests on these models showed that the Random Forest algorithm performed best when classifying the tweets in a small dataset. This work demonstrated a superior performance of the Random Forest algorithm over other more robust algorithms for this type of classification and dataset.pt_PT
dc.description.abstractAs redes sociais apresentam meios para as pessoas compartilharem emoções, sentimentos, ideias e até sintomas de doenças, e são uma ótima fonte de dados para as mais diversas análises. No final do ano de 2019, um alerta foi levantado para uma pandemia global de um vírus que tem uma taxa de contaminação muito elevada e que pode causar complicações respiratórias nas pessoas contaminadas. Para o auxilio na identificação de pessoas que possam ter os sintomas desssa doença ou o controle das que já estão infectadas, neste trabalho foram analisados os desempenhos dos algoritmos KNN, Naive Bayes, Decision Tree, Random Forest, SVM, Multilayer Perceptron simples, Redes neurais Convolucionais e BERT para classificação de tweets que continham relatos de sintomas do Covid-19 ou auto-declaração de contaminação. O conjunto de dados foi rotulado utilizando um conjunto de palavras chaves dos sintomas da doença retirada de uma lista disponibilizada pela Organização Mundial da Saúde. Os testes nesses modelos mostraram que o algoritmo Random Forest foi o que obteve melhor resultado ao classificar os tweets em uma base de dados pequena. Este trabalho demonstrou o desempenho superior do algoritmo RandomForest sobre outros mais robustos para este tipo de classificação e conjunto de dados.pt_PT
dc.identifier.tid202747379pt_PT
dc.identifier.urihttp://hdl.handle.net/10198/23769
dc.language.isoengpt_PT
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/pt_PT
dc.subjectMachine learningpt_PT
dc.subjectDeep learningpt_PT
dc.subjectCovid-19pt_PT
dc.subjectComparação de algoritmospt_PT
dc.titleDOTS - detection of covid-19 contagion symptoms and self-diagnosis in social networkspt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameInformáticapt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Silva_Clístenes.pdf
Size:
2.06 MB
Format:
Adobe Portable Document Format