Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/83542

TítuloDeep Learning-based algorithm for violence detection in audio data
Outro(s) título(s)Algoritmo baseado em deep learning para deteção de violência em dados de áudio
Autor(es)Gomes, Eduardo Dias
Orientador(es)Shah, Vaibhav
Pereira, José Luís
Palavras-chaveAudio event classification
Audio features
CRISP-DM
Deep learning
Violence detection
Classificação de eventos de audio
Deteção de violência
Data2022
Resumo(s)Currently, the mobility services industry lacks a component that guarantees the safety of both its drivers and customers, which is not in line with the constant evolution of the technological sector and the exponential increase of IoT devices capable of capturing data from both the external and internal environment of the vehicle. In this context, Bosch Car Multimedia introduced the RideCare project, which aims to monitor various data in real time from the vehicles of a mobility service provider's fleet, being the root where this dissertation is inserted. The present work aims to study and develop a Deep Learning-based algorithm capable of detecting violent scenarios only using audio data as its input. In the experimental phase of this project, the CRoss Industry Standard Process for Data Mining (CRISP-DM) methodology was implemented in order to ensure that all project requirements were met in the most efficient way. Special attention was given to the data preparation phase as well as the modeling phase to ensure greater accuracy in terms of classification capability. Subsequently, the models were trained in several test scenarios, composed of several different audio representations, allowing to carry out a comparative analysis in order to extract the most competent model, which is comprised by the MobileNet architecture using the Mel-frequency cepstral coefficients audio feature as input, being able to achieve an accuracy of 81%.
Atualmente, a indústria de serviços de mobilidade carece de uma componente que garanta a segurança tanto dos seus condutores como dos seus clientes, o que é algo que não se alinha com a constante evolução do setor tecnológico e com o exponencial aumento de dispositivos IoT capazes de capturar dados tanto do meio externo como interno do veículo. Desta forma, a Bosch Car Multimedia introduziu o projeto RideCare que tem vista a monitorização de vários dados em tempo real dos veículos de uma frota dum prestador de serviços de mobilidade, sendo a raíz onde esta dissertação se enquadra. O presente trabalho tem como objetivo estudar e desenvolver um algoritmo baseado em Deep Learning capaz de detetar cenários violentos apenas usando dados de áudio como input. Na fase experimental deste projeto a metodologia CRoss Industry Standard Process for Data Mining (CRISP-DM) foi implementada no sentido de garantir que todos os requisitos do projeto fossem cumpridos da forma mais eficiente. Foi dada uma especial atenção à fase de preparação dos dados bem como a fase de modelação para certificar uma maior precisão a nível de capacidade de classificação. Posteriormente, os modelos foram treinados em vários cenários de teste, compostos por várias representações de áudio diferentes, permitindo fazer uma análise comparativa de modo a retirar o modelo mais competente, sendo este constituído pela arquitetura MobileNet utilizando como input o audio feature Mel-frequency cepstral coefficients, atingindo uma acuidade de 81%. Palavras chave: Classificação de eventos de audio; Deteção de violência
TipoDissertação de mestrado
DescriçãoDissertação de mestrado integrado em Engineering and Management of Information Systems
URIhttps://hdl.handle.net/1822/83542
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Dissertação.pdf3,33 MBAdobe PDFVer/Abrir

Este trabalho está licenciado sob uma Licença Creative Commons Creative Commons

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID