Use este identificador para citar ou linkar para este item:
https://repository.ufrpe.br/handle/123456789/3443
Título: | Análise do comportamento através dos dados coletados na internet |
Autor: | Lima, Priscilla Amarante de |
Endereco Lattes do autor: | http://lattes.cnpq.br/7284770857817456 |
Orientador: | Diniz, Juliana Regueira Basto |
Endereco Lattes do orientador : | http://lattes.cnpq.br/0175193064988810 |
Palavras-chave: | Aprendizado do computador;Indústria de tecnologia de ponta;Facebook (Rede social on-line);Big data |
Data do documento: | 7-Abr-2021 |
Citação: | LIMA, Priscilla Amarante de. Análise do comportamento através dos dados coletados na internet. 2021. 46 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Unidade Acadêmica de Educação a Distância, Universidade Federal Rural de Pernambuco, Recife, 2021. |
Abstract: | This work presents an analysis of human behavior through data collected on the internet. They will be confirmed as Big Techs and the Cambridge Analytica case study. We show that digital records of behavior easily obtained, through likes, through Facebook can be used to automatically and accurately predict a range of highly confidential personal attributes, including: sexual orientation, ethnicity, religious and political views, personality traits, intelligence, happiness, use of addictive substances, separation from parents, age and sex. The based analysis is based on a data set of more than 58,000 volunteers who provided Facebook likes, detailed demographic profiles and the results of various psychometric tests. The proposed model uses dimensionality reduction to pre-process the tanned data, which is then inserted in linear regression to predict individual psych demographic profiles of tanned. The model correctly discriminates between homosexual and heterosexual men in 88% of cases, African-Americans and Caucasian Americans in 95% of cases, and between Democrats and Republicans in 85% of cases. For the personality trait "Aperture", prediction accuracy is close to the test-retest accuracy of a personality test pattern. We give examples of associations between attributes and likes and discuss it as a conclusion for online personalization and privacy. |
Resumo: | Este trabalho apresenta uma análise sobre o comportamento humano através dos dados coletados na internet. Serão apresentadas as Big Techs e o estudo de caso da Cambridge Analytica. Os registros digitais de comportamento podem ser acessados, através das curtidas no Facebook e serem usadas para prever de forma automática e precisa um intervalo de atributos pessoais altamente confidenciais, incluindo: orientação sexual, etnia, pontos de vista religiosos e políticos, traços de personalidade, inteligência, felicidade, uso de substâncias viciantes, separação dos pais, idade e sexo. A análise apresentada é baseada em um conjunto de dados de mais de 58.000 voluntários que forneceram curtidas no Facebook, perfis demográficos detalhados e os resultados de vários testes psicométricos. O modelo proposto usa redução de dimensionalidade para processar os dados de curtidas, que são então inseridos em regressão linear para prever perfis psicodemográficos individuais de curtidas. O modelo classifica corretamente entre homens homossexuais e heterossexuais em 88% dos casos, afro-americanos e Americanos caucasianos em 95% dos casos, e entre democratas e Republicanos em 85% dos casos. Para o traço de personalidade "Abertura", a precisão da previsão está próxima da precisão teste-reteste de um padrão teste de personalidade. São apresentados exemplos de associações entre atributos e curtidas e discutidas as implicações para a personalização online e privacidade. |
URI: | https://repository.ufrpe.br/handle/123456789/3443 |
Aparece nas coleções: | TCC - Bacharelado em Sistemas da Informação (UAEADTec) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
tcc_priscillaamarantedelima.pdf | 741,49 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.