Use este identificador para citar ou linkar para este item:
https://repository.ufrpe.br/handle/123456789/2134
Título: | Predição de popularidade de podcasts através de características textuais |
Autor: | Santana Júnior, Bernardo de Moraes |
Endereco Lattes do autor: | http://lattes.cnpq.br/9948081717430490 |
Orientador: | Cabral, Giordano Ribeiro Eulalio |
Endereco Lattes do orientador : | http://lattes.cnpq.br/6045470959652684 |
Palavras-chave: | Processamento de linguagem natural (Computação);Aprendizado do computador;Podcast |
Data do documento: | 2019 |
Citação: | SANTANA JÚNIOR, Bernardo de Moraes. Predição de popularidade de podcasts através de características textuais. 2019. 42 f.Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação)- Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2019. |
Abstract: | With the tremendous growth of Podcasts and the professionalization of its creators,to the point that news networks call this as Podcast’s ”golden age”, new tools have emerged to assist its content producers in building and maintaining of their channels.In this context, finding features inside episodes that provide broader reach to the target audience is of great value to both creators and listeners, allowing channels to stay active longer and offer better content quality.Thus, this paper proposes a study of popularity analysis of brazilian’s podcasts using a podcast audience analysis tool in one of the most used channel and episode aggregators in the world, iTunes. By using Web Scraping tools to collect available and necessary information, also tools for transcriptions of the audios’s episodes in orderto obtain what has been said, and calculating metrics to measure the accuracy of the generated model, therefore making an analysis of which information is relevant or not o predicting a channel’s popularity.Results displayed were favorable in the correlation between the categories analyzed individually and the its text, whereas in an analysis in which categories are not discriminated there is a low relationship between text and popularity, demonstrating that the category of a given channel plays an important role in analyzing its popularity. |
Resumo: | Com o tremendo crescimento dos Podcast se profissionalização de seus criadores,ao ponto de redes de notícias chamarem esse momento como ”era de ouro”para os Podcasts, novas ferramentas surgiram para auxiliar esses produtores na construção emanutenção de seus canais. Nesse contexto encontrar características nos episódios produzidos que proporcionem um alcance maior ao público alvo é de grande valor tantopara os criadores quanto para os ouvintes, permitindo que canais permaneçam ativospor mais tempo e ofereçam uma melhor qualidade de conteúdo.Assim, este trabalho propõe um estudo de análise de popularidade dosPodcastsna-cionais, utilizando uma ferramenta de análise da audiência dos Podcasts em um dos agregadores de canais e episódios mais utilizados do mundo, oiTunes. Através de ferramentas deWeb Scraping para a coleta das informações disponíveis e necessárias,de ferramentas para transcrições dos áudios dos episódios para a obtenção do que foidito e o calculo de métricas para medir precisão do modelo gerado, assim fazer uma análise de quais informações são relevantes para a predição de popularidade de um canal.Resultados obtidos foram favoráveis na correlação entre as categorias analisadas de forma individual e texto dos episódios nelas contidos, enquanto em uma análise em que categorias não são descriminadas há uma baixa relação entre texto e popularidade, demonstrando que a categoria de determinado canal tem um papel importante na análise de sua popularidade. |
URI: | https://repository.ufrpe.br/handle/123456789/2134 |
Aparece nas coleções: | TCC - Bacharelado em Sistemas da Informação (Sede) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
tcc_bernardodemoraessantanajunior.pdf | 489,53 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.