Supervised person annotation in video sequences
Tipus de documentTreball Final de Grau
Data2020-01
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
Nowadays, Artificial Intelligence in computation vision is widely used, and there are constant improvements in object detection and recognition systems. So, the aim of this project is to implement a new solution that can recognize people using their face and annotate information in a database for latter consumption. In this study we have selected an environment based on a TV talk show, where the persons we will try to find are journalists and politicians. Although this could be a multimodal recognition system, we have focused this project on the visual information, that is, face recognition. The proposed system consists of three main parts, those being, detection, tracking and recognition, that allow us to fine tune some of the parameters in order to generalize the system for other environments. As an output of the system we would know how many of the persons of interest appear inside a video, when and for how long. En la actualidad, el uso de la inteligencia artificial en el campo de la vision por computación esta muy extendido. En este campo hay mejoras constantes en cuanto a detección y reconocimiento de objetos. El objetivo de este proyecto es el de implementar una solución basada en estas técnicas que pueda reconocer personas por su rostro y anotar esa información en una base de datos que podría ser usada a posteriori. En este proyecto se ha seleccionado un entorno, basado en un programa de televisión, donde las personas que se quieren reconocer son periodistas y políticos. Esto, podría plantearse como un problema de reconocimiento multi-modal, pero nos centraremos en el reconocimiento facial para así no perder de vista el objetivo del proyecto. El sistema propuesto consiste en 3 partes principales, que son: detección, seguimiento y reconocimiento. Esto nos permite modificar ciertos parámetros para tal de mejorar el sistema. Al final obtendremos información referente a las personas que aparecen en el video, cuando y por cuanto tiempo aparecen. Actualment, l'ús de la intel·ligència artificial en el camp de la visió per computació està molt estesa. En aquest camp hi ha millores constants en sistemes de detecció I reconeixement d'objectes. L'objectiu d'aquest projecte és el d'implementar una solució basada en tècniques de detecció i reconeixement per visió per computació reconegui persones per la seva fisonomia facial, emmagatzemant aquesta informació en una base de dades per ser usada posteriorment. En aquest projecte es disposa d'un entorn, basat en un programa de televisió, on les persones que es vol reconèixer són periodistes i polítics. Això podria ser un sistema de reconeixement multi modal, però ens centrarem en el reconeixement facial per tal de proposar una solució especifica. El sistema proposat està format per tres parts principals, que són: detecció, seguiment i reconeixement. Això ens permetrà ajustar paràmetres de cada una d'aquestes etapes per tal d'obtenir uns bons resultats. El sistema proporcionarà informació referent a les persones que apareixen en el vídeo i en quins moments concrets hi apareixen.
MatèriesAutomation, Artificial intelligence, Robot vision, Computer vision, Automatització, Intel·ligència artificial, Visió artificial (Robòtica), Visió per ordinador
TitulacióGRAU EN ENGINYERIA DE TECNOLOGIES I SERVEIS DE TELECOMUNICACIÓ (Pla 2015)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Degree_thesis_jan.pdf | 983,6Kb | Visualitza/Obre | ||
Degree_thesis_jan2.pdf | 980,3Kb | Visualitza/Obre |