Utilize este identificador para referenciar este registo: http://hdl.handle.net/10071/23052
Autoria: Marreiros, Carolina Ferraz
Orientação: Ferreira, João Carlos Amaro
Ribeiro, Ricardo Daniel Santos Faro Marques
Data: 30-Jul-2021
Título próprio: Social media insights about COVID-19 in Portugal: A text mining approach
Referência bibliográfica: Marreiros, C. F. (2021). Social media insights about COVID-19 in Portugal: A text mining approach [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório do Iscte. http://hdl.handle.net/10071/23052
Palavras-chave: Media sociais -- Social media
COVID-19
Natural language processing
Sentiment analysis
Topic modeling
Public opinion
Processamento da língua natural
Análise de sentimentos
Modelagem de tópicos
Opinião pública
Resumo: The rapid spread of COVID-19 around the world had a significant impact on daily life. As in other countries, measures were taken in Portugal to combat the exponential increase of cases, such as curfews and the use of masks. Thus, in parallel with the direct consequences on health and the healthcare sector, the pandemic also caused changes in human behavior from a sociological viewpoint. The objective of this dissertation is to attain a perception of the reality concerning COVID-19. For this purpose, real-time data was extracted from three sources, two of them being social media platforms - Twitter and Reddit - and the other one being Público, a Portuguese online newspaper. The adopted approach, based on topic modeling and sentiment analysis, was validated within the Portugal context, concerning data over a period of one year, but it can equally be employed in similar situations and other countries and provide decision-making support. After the data extracting, it was prepared for application of natural language processing (NLP) tools specific to the Portuguese language, which can represent a challenge due to the lexical richness. With the gathered information, a dashboard was built, with the purpose of gaining insights on the COVID-19 pandemic in Portugal. It was concluded that the topics discussed on social media reflect the events related to the pandemic. In a final stage, these dashboards were evaluated by public health experts, who highlighted the potential of the results obtained. The data and dashboards will be made available to the scientific community upon request.
A rápida propagação da COVID-19 em todo o mundo teve um impacto significativo na vida quotidiana. Tal como noutros países, foram tomadas medidas em Portugal para combater o aumento exponencial de casos, tais como o recolher obrigatório e o uso de máscaras. Assim, em paralelo com as consequências diretas na saúde e no seu sector, a pandemia causou também mudanças no comportamento humano a nível sociológico. O objetivo da presente dissertação é obter uma perceção da realidade relativa à COVID-19. Nesse sentido, foram extraídos dados de três fontes, sendo duas delas redes sociais - Twitter e Reddit - e a outra o Público, um site de notícias português. A abordagem desenvolvida, baseada em identificação de tópicos e análise de sentimentos, foi validada no contexto português com um período de dados superior a um ano, mas pode ser aplicada em situações semelhantes e noutros países de modo a contribuir para o apoio à tomada de decisão. Após a extração dos dados, estes foram preparados para aplicação de ferramentas de processamento de linguagem natural (PNL) específicas da língua portuguesa, o que representa um desafio devido ao vasto vocabulário. Com a informação obtida, foi construído um conjunto de visualizações, para posteriormente extrair conhecimento sobre o contexto pandémico em Portugal. Concluiu-se que os tópicos discutidos nas redes sociais refetem os eventos relacionados com a pandemia. Numa fase final, estas visualizações foram avaliadas por peritos na área, que destacaram o potencial dos resultados. Os dados e visualizações serão disponibilizados à comunidade científica, mediante pedido prévio.
Designação do grau: Mestrado em Sistemas Integrados de Apoio à Decisão
Arbitragem científica: yes
Acesso: Acesso Restrito
Aparece nas coleções:T&D-DM - Dissertações de mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
master_carolina_ferraz_marreiros.pdf
  Restricted Access
5,78 MBAdobe PDFVer/Abrir Request a copy


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.