Use este identificador para citar ou linkar para este item: https://repository.ufrpe.br/handle/123456789/2150
Título: Estudo comparativo de algoritmos de classificação supervisionada para classificação de polaridade em análise de sentimentos
Autor: Albuquerque, Rotsen Diego Rodrigues de
Endereco Lattes do autor: http://lattes.cnpq.br/6441716676783585
Orientador: Albuquerque Júnior, Gabriel Alves de
Endereco Lattes do orientador : http://lattes.cnpq.br/1399502815770584
Palavras-chave: Aprendizado do computador;Mineração de dados (Computação);Textos;Emoções
Data do documento: 2019
Citação: ALBUQUERQUE, Rotsen Diego Rodrigues de. comparativo de algoritmos de classificação supervisionada para classificação de polaridade em análise de sentimentos. 2019. 44 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2019.
Abstract: The huge increase of data on the Internet, it is a rich source for public opinion assessment of a specific subject. Consequently, the number of opinions available makes decision-making impossible if it is necessary to read and analyze all opinions. Since the use of Machine Learning has been widely used, I will present a comparative study of two algorithms for classifying movie comments using techniques of natural language processing and Sentiment Analysis. The data obtained were obtained manually where through the competition site called Kaggle where we have about 50,000 comments on various films. The purpose of this study is also to use the concepts of data science and Machine Learning, natural language processing and sentiment analysis to add more information about the entertainment and film industry. That is why these algorithms were created so that it is possible to show the results for this domain in the of movies comments registered in one big site/platform of movie industry, the famous IMDB. After training and testing, the machine had an accuracy of 86 % on predicting sentiments on commented text from movies.
Resumo: Com o grande aumento de dados na internet, mostra-se uma rica fonte para a avaliação da opinião pública sobre uma entidade específica. Consequentemente, o número de opiniões disponíveis torna impossível uma tomada de decisão se for necessário ler e analisar todas as opiniões. Como o uso de Machine Learning tem sindo bastante usado, irei apresentar um estudo comparativo de dois algoritmos para classificar oscomentários usando técnicas de processamento de linguagem natural e Análise de Sentimentos. O dados obtidos foram obtidos manualmente onde através do site de competições chamado Kaggle temos cerca de 50.000 comentários sobre diversos filmes. Este estudo tem por finalidade usar também os conceitos da ciência de dados e Machine Learning, processamento de linguagem natural e analises de sentimentos para agregar mais informação sobre a industria de entretenimento e cinema. Por isso esses algoritmos foram criados para que seja possível mostrar os resultados para esse domínio nos reviews de filmes registrados no site da grande industria cinematográfica o famoso IMDB. Após a aplicação dos treinos e testes, a máquina teve uma Acuráciade 86% sobre a predição de textos comentados de filmes.
URI: https://repository.ufrpe.br/handle/123456789/2150
Aparece nas coleções:TCC - Bacharelado em Sistemas da Informação (Sede)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
tcc_rotsendiegorodriguesdealbuquerque.pdf1,72 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.