Use este identificador para citar ou linkar para este item: https://repository.ufrpe.br/handle/123456789/2133
Título: Aspect term extraction in aspect-based sentiment analysis
Autor: Francisco, Alesson Delmiro
Orientador: Lima, Rinaldo José de
Endereco Lattes do orientador : http://lattes.cnpq.br/7645118086647340
Palavras-chave: Mineração de dados (Computação);Aprendizado do computador;Algoritmos computacionais;Emoções
Data do documento: 2019
Citação: FRANCISCO, Alesson Delmiro. Aspect term extraction in aspect-based sentiment analysis. 2019. 59 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2019.
Abstract: The increasing use of the Internet in many directions has created a necessity to analyze alarge quantity of data. A large amount of data is presented as Natural Language Text,which is unstructured, with many ways to express the same information. It is an importanttask to extract information and meaning from those unstructured content, such as opinionson products or services. The need to extract and analyze the large amount of data createdevery day on the Internet surpassed the capabilities of human ability, as a result, manytext mining applications that extract and analyze textual data produced by humans areavailable today, one of such kind of applications is Sentiment Analysis, viewed as a vitaltask both to the academic and commercial fields, so that companies and service providerscan use that knowledge extracted from textual documents to better understand how theircustomers think about them or to know how their products and services are appreciated ornot by their customers. However, the task of analysing unstructured text is a difficult one,that is why it is necessary to provide coherent information and concise summaries to thoserevisions. Sentiment Analysis is the process of computationally identifying and categorizingopinions expressed in a piece of text, especially in order to determine the writer’s attitudetowards a particular topic or product. Aspect-Based Sentiment Analysis is a sub-field ofSentiment Analysis that aims to extract more refined and exact opinions, by breakingdown text into aspects. Most of the current work in the literature does not take profitof either semantic-based resources or NLP-based analysis in the preprocessing stage. Tocountermeasure these limitations, a study on these resources is done aiming to extract thefeatures needed to execute the task, and to make the best combination for ATE. This workhas the main goal of implementing and analysing a method of Aspect Term Extraction(ATE) of users reviews (restaurants and laptops). The proposed method is based on asupervised approach called Conditional Random Fields (CRF) which is able to optimizethe use of features for classification, this choice was justified by previous related work thatdemonstrate the effectiveness of CRF for ATE. Also, we are investigating the existingmethods and features for ABSA, as well as proposing new features and experimentingwith feature combinations in order to find the best features combinations, that are not yetcovered in the state of art. The detailed study is done by experimenting with word features,n-grams and custom made features using an CRF supervised algorithm to accomplish thetask of Aspect Term Extraction with results in terms of Precision, Recall and F-measure,the standard evaluation metrics adopted in the field. Finally, a comparative assessmentbetween the proposal method for ATE against other related work presented in the literaturehas shown that the method presented by this work is competitive.
Resumo: O uso crescente da Internet criou a necessidade de analisar uma vasta quantidade dedados. Uma grande quantia de dados é apresentada como Texto em Linguagem Naturalnão estruturado, com várias maneiras de expressar a mesma informação. É uma tarefaimportante extrair informação e significado destes conteúdos não estruturados, comoopiniões em produtos ou serviços. A necessidade de extrair e analisar a vasta quantidadede dados criados todos os dias na Internet ultrapassou as capacidades humanas, comoresultado, várias aplicações de mineração de texto que extraem e analisam dados textuaisproduzidos por humanos estão disponíveis atualmente, uma destas aplicações é a Análise deSentimentos usada para que empresas e provedores de serviços possam usar o conhecimentoextraído de documentos textuais para melhor entender como seus clientes pensam sobreeles. No entanto, a tarefa de analisar texto não estruturado é difícil, por isso é necessárioprover informação coerente e resumos concisos para as revisões. Análise de Sentimentoé o processo de identificar e categorizar computacionalmente opiniões expressadas numtexto, especialmente para determinar a atitude do autor sobre um tópico ou produto emparticular. Análise de Sentimentos Baseada em Aspectos (ABSA) é um sub-campo daAnálise de Sentimentos que tem como objetivo extrair opiniões mais refinadas e exatas,quebrando o texto em aspectos. A maior parte dos trabalhos atuais na literatura não lucramde recursos baseados em semântica ou análises baseadas em Processamento de LinguagemNatural na fase de pré-processamento. Para tratar essas limitações, um estudo nestesrecursos é feito com o objetivo de extrair as características necessárias para a execuçãoda tarefa, e para fazer a melhor combinação para Extração de Termo de Aspecto. Estetrabalho tem como o principal objetivo implementar e analisar um método de Extraçãode Termo de Aspecto (ATE) de críticas de usuários (restaurantes e laptops). O métodoproposto é baseado em uma abordagem supervisionada chamada Campos CondicionaisAleatórios (CRF) que otimiza o uso de características para classificação, esta escolha éjustificada pelos trabalhos relacionados anteriores que demonstram a eficácia do CRFpara ATE. Um estudo também é feito em métodos para propor novas características eexperimantar com combinações de características para obter as melhores combinações.O estudo detalhado é feito a partir da experimentação com características de palavra,n-gramas e características customizadas utilizando um algoritmo supervisionado CRF pararealizar a tarefa de Extração de Termo de Aspecto com resultados em termo de Precisão,Cobertura e F-Measure, as métricas padrões de avaliação adotadas na área. Por fim, umaavaliação comparativa entre o método proposto para ATE contra outros trabalhos daliteratura mostra que o método apresentado neste trabalho é competitivo.
URI: https://repository.ufrpe.br/handle/123456789/2133
Aparece nas coleções:TCC - Bacharelado em Sistemas da Informação (Sede)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
tcc_alessondelmirofrancisco.pdf1,65 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.