Utilize este identificador para referenciar este registo: http://hdl.handle.net/10400.6/11132
Título: Desenvolvimento de Modelos Analíticos de Apoio à Gestão em Instituições do Ensino Superior, com Recurso a Data Mining
Autor: Martins, Maria Prudência Gonçalves
Orientador: Silva, Vera Lúcia Miguéis Oliveira e
Fonseca, Davide Sérgio Baptista da
Palavras-chave: Aprendizagem automática
Descoberta de conhecimento em bases de dados
Data mining
Educational data mining
Previsão de sucesso/abandono académico
Random forest
Redes neuronais artificiais
Máquinas de vetores de suporte
Data de Defesa: 3-Fev-2020
Resumo: As instituições de ensino superior deparam‐se atualmente com grandes desafios, derivados da concorrência na captação de novos alunos, da globalização da educação e das diretrizes das recentes políticas educativas, quer nacionais quer da união europeia, que exigem intervenções acrescidas em prol do sucesso educativo e da prevenção do abandono académico. Com o objetivo de contribuir para que essas instituições de ensino se transformem em organizações mais pró‐ativas, capazes de enfrentar os atuais desafios, propõem‐se, nesta tese, novos modelos analíticos de previsão, desenvolvidos com recurso a técnicas de data mining, que permitem estimar, com a devida antecedência, quer o nível de sucesso esperado no final do curso, quer a propensão do aluno para o abandono. Esses modelos vão permitir identificar quer os grupos de estudantes de maior risco, que venham a necessitar de uma maior atenção, quer os fatores que mais contribuam para o seu (in)sucesso, conhecimentos de importância primordial para que os agentes de gestão possam adotar as medidas e decisões estratégicas de promoção de sucesso académico mais adequadas. Para prever o sucesso académico global do aluno é proposto um modelo de regressão baseado no algoritmo random forest. Para estimar a sua propensão para o abandono é desenvolvido um modelo de classificação que combina três das mais importantes técnicas de data mining, como são os casos dos algoritmos random forest, máquinas de vetores de suporte e redes neuronais artificiais. Com o objetivo de avaliar e garantir que as metodologias desenvolvidas e os modelos propostos possam ser utilizados em contextos reais, usam‐se, como caso de estudo, os alunos de licenciatura duma instituição pública do ensino superior politécnico. Para além da elevada capacidade de previsão evidenciada pelos modelos desenvolvidos e da própria dimensão e diversidade dos dados analisados, destacam‐se, como contribuições diferenciadoras desta tese, os processos de seleção dos fatores explicativos do sucesso e do abandono académico. A tese também demonstra o potencial das técnicas de data mining quando aplicadas a bases de dados de grande dimensão provenientes de ambientes educacionais, podendo a abordagem metodológica seguida servir de guia a outras instituições de ensino, ajudando‐as a perceber de que forma o data mining as poderá auxiliar na extração de conhecimento útil que suporte melhores decisões.
Higher education institutions are currently facing deep challenges stemming from the competition for attracting new students, the globalisation of education, and the directives from recent educational policies adopted both nationally and by the European Union, which require more interventions aiming the attainment of educational success and the prevention of students dropout. With the aim to contribute to the transformation of such institutions into more proactive organisations, capable of facing up to the current challenges, this thesis puts forward new analytical predictive models, developed by means of data mining techniques, which enable the early estimation of a student’s expected level of success at the end of the degree course as well as their propensity to drop out. These models will enable the identification of major risk groups of students, who will need closer attention, and also the identification of the factors mostly contributing to their success or failure. The importance of such information is vital to enable decision‐makers to take the most adequate measures and decisions in order to promote academic success. In order to predict students’ global academic success, we propose a regression model based on random forest algorithm. For the estimation of students’ propensity to drop out, we developed a classification model which combines three of the most popular data mining techniques, namely random forest, support vector machines and artificial neural networks. Aiming to assess and ensure that the methodologies developed and the models proposed can be used in real contexts, the undergraduates of a public polytechnic higher education institution were used as a case study. Besides the high predictive capacity demonstrated by the models developed and the dimension and diversity of the data analysed, other noteworthy differentiating contributions of this thesis are the innovative process of selection of the explanatory factors for academic success and students dropout. The thesis also shows the potential of data mining techniques when applied to large scale datasets deriving from educational environments, and the approach followed in this study may be used as a guideline to other educational institutions on how data mining can support the extraction of useful knowledge with a view to support better decisions.
URI: http://hdl.handle.net/10400.6/11132
Designação: Doutoramento em Engenharia e Gestão Industrial
Aparece nas colecções:FE - DEM | Dissertações de Mestrado e Teses de Doutoramento

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
tesefinal_entregue_definitiva2.pdf9,45 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.