Use este identificador para citar ou linkar para este item: https://repository.ufrpe.br/handle/123456789/4126
Título: Comparação de algoritmos de reconhecimento de gestos aplicados à sinais estáticos de Libras
Autor: Cruz, Lisandra Sousa da
Endereco Lattes do autor: http://lattes.cnpq.br/2111589326272463
Orientador: Cordeiro, Filipe Rolim
Endereco Lattes do orientador : http://lattes.cnpq.br/4807739914511076
Co-orientador : Macario Filho, Valmir
Endereço Lattes do Co-orientador : http://lattes.cnpq.br/4346898674852080
Palavras-chave: Lingua brasileira de sinais;Inteligência artificial;Visão computacional
Data do documento: 12-Jul-2019
Citação: CRUZ, Lisandra Sousa da. Comparação de algoritmos de reconhecimento de gestos aplicados à sinais estáticos de Libras. 2019. 53 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2019.
Abstract: Brazilian Sign Language (BSL) has been created in order to cope with a necessity of a non-verbal communication for the deafs, which during a long time were indoctrinated to learn the Brazilian Portuguese as their first language. Nowadays, the BSL is the Brazil’s second official language and first deaf’s language, as well as the Portuguese for the listener. Nevertheless, even with large recognition, the Brazil’s second official language is not known by the majority of the Brazilian population. The inclusion process aims to allow equality for the impaired, such that the deficiency does not become an impediment factor for living together in society. With the technology arrival and the Artificial Inteligence (AI) advances, it was created technologic artifices to allow inclusion. In the AI, the pattern recognition is one of more approached subthemes in the present, and it is widely applied for the gesture classification of many sign languages in literature. This research has, as key task, the identification of the hands that form a certain BSL gesture and, thus, the recognition of the class it belongs to. Based on American Sign Language (ASL) classification, the Feature Fusion-based Convolutional Neural Network (FFCNN), an extended network from Convolutional Neural Network (CNN), obtained the best accuracy in comparison to other networks, such as Visual Geometry Group (VGG). Therefore, based on this scenario, this work applies the FFCNN to BSL static gestures to verify whether the FFCNN obtain the best accuracy as well as obtained in ASL or not. In order to achieve the goal, this work compares three classifiers: the Visual Geometry Group (VGG), a CNN with variation of 13 and 16 layers, the FFCNN, and a Multi Layer Perceptron network used in recognition of BSL static gestures in literature. The algorithms were applied in a BSL dataset with 9,600 images of 40 signals. The results demonstrate that VGG with 16 layers obtained the best accuracy regarding the described models in this work, corresponding to 99,45%.
Resumo: A Língua Brasileira de Sinais (Libras) foi criada a fim de suprir uma necessidade de comunicação não-verbal para os surdos, que durante muito tempo foram doutrinados à ter o português como sua primeira língua. Atualmente, a Libras é a segunda língua oficial do Brasil e primeira língua dos surdos, assim como o português é para o ouvinte. Entretanto, mesmo com tamanho reconhecimento, a segunda língua oficial do Brasil não é conhecida pela maior parte da população brasileira. O processo de inclusão visa proporcionar igualdade aos deficientes, de forma que a deficiência não seja um fator impeditivo à convivência em sociedade. Com o advento da tecnologia e avanços da Inteligência Artificial (IA), foram criados artifícios tecnológicos visando propiciar inclusão. Na IA, o reconhecimento de padrões é um dos subtemas mais abordados na atualidade, sendo bastante aplicada para a classificação de gestos de diversas línguas de sinais na literatura. Essa pesquisa tem como principal tarefa identificar as mãos que formam um determinado sinal de Libras e em seguida reconhecer a que classe pertence, classificando-o. Baseado na classificação da Língua de Sinais Americana, a Feature Fusion-based Convolutional Neural Network (FFCNN), uma rede estendida da Convolutional Neural Network (CNN), obteve a melhor acurácia em comparação a outras redes, dentre elas a Visual Geometry Group (VGG). Diante desse cenário, esse trabalho aplica a FFCNN à gestos estáticos de Libras a fim de verificar se a FFCNN obtém a melhor acurácia assim como obteve na Língua de Sinais Americana. Para alcançar esse objetivo são comparados três classificadores: VGG com uma variação da CNN com 13 e 16 camadas; FFCNN e uma rede Multi Layer Perceptron (MLP) usada no reconhecimento de gestos estáticos de Libras na literatura. Os algoritmos foram aplicados em um dataset de Libras que contém 9.600 imagens de 40 sinais. Os resultados demonstram que a rede VGG com 16 camadas obteve a maior acurácia dentre modelos descritos neste trabalho, com valor de 99,45%.
URI: https://repository.ufrpe.br/handle/123456789/4126
Aparece nas coleções:TCC - Bacharelado em Sistemas da Informação (Sede)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
tcc_lisandrasousadacruz.pdf1,64 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.