| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 3.38 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
This work presents the implementation of a system for daily activity classification using 3D Convolutional Neural Networks (3D CNN) and the Toyota Smarthome
Dataset. The system aims to generalize and correctly classify activities, even in the face of data limitations such as high class imbalance, ambient occlusions, and similarities between classes. To overcome these challenges, preprocessing techniques and data augmentation were applied, including spatio-temporal resizing and image enhancement, with the objective of optimizing learning and generalization capabilities of the model. The proposed approach proved to be effective compared to
other models on the same dataset, achieving 85.7% accuracy, 0.8568 precision, and 0.8570 recall.
Este trabalho apresenta a implementação de um sistema para classificação de atividades diárias utilizando redes neurais convolucionais 3D (3D CNN) e o Toyota Smarthome Dataset. O sistema visa generalizar e classificar corretamente as atividades, mesmo diante de limitações nos dados, como alto desbalanceamento de classes, oclusões ambientais e similaridades entre as classes. Para superar esses desafios, foram aplicadas técnicas de pré-processamento e melhoria de dados (data augmentation), incluindo redimensionamento espaço-temporal e aprimoramento de imagens, com o objetivo de otimizar o aprendizado e a capacidade de generalização do modelo. A abordagem proposta mostrou-se eficaz em comparação com outros modelos no mesmo conjunto de dados, alcançando 85,7% de acurácia, 0,8568 de precisão e 0,8570 de sensibilidade.
Este trabalho apresenta a implementação de um sistema para classificação de atividades diárias utilizando redes neurais convolucionais 3D (3D CNN) e o Toyota Smarthome Dataset. O sistema visa generalizar e classificar corretamente as atividades, mesmo diante de limitações nos dados, como alto desbalanceamento de classes, oclusões ambientais e similaridades entre as classes. Para superar esses desafios, foram aplicadas técnicas de pré-processamento e melhoria de dados (data augmentation), incluindo redimensionamento espaço-temporal e aprimoramento de imagens, com o objetivo de otimizar o aprendizado e a capacidade de generalização do modelo. A abordagem proposta mostrou-se eficaz em comparação com outros modelos no mesmo conjunto de dados, alcançando 85,7% de acurácia, 0,8568 de precisão e 0,8570 de sensibilidade.
Description
Mestrado de dupla diplomação com a Tbilisi State University (Geórgia)
Keywords
Activities of daily living Convolutional neural networks Video classification Toyota smarthome dataset Data augmentation
