Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10400.6/11132
Título: | Desenvolvimento de Modelos Analíticos de Apoio à Gestão em Instituições do Ensino Superior, com Recurso a Data Mining |
Autor: | Martins, Maria Prudência Gonçalves |
Orientador: | Silva, Vera Lúcia Miguéis Oliveira e Fonseca, Davide Sérgio Baptista da |
Palavras-chave: | Aprendizagem automática Descoberta de conhecimento em bases de dados Data mining Educational data mining Previsão de sucesso/abandono académico Random forest Redes neuronais artificiais Máquinas de vetores de suporte |
Data de Defesa: | 3-Fev-2020 |
Resumo: | As instituições de ensino superior deparam‐se atualmente com grandes desafios, derivados da
concorrência na captação de novos alunos, da globalização da educação e das diretrizes das
recentes políticas educativas, quer nacionais quer da união europeia, que exigem intervenções
acrescidas em prol do sucesso educativo e da prevenção do abandono académico. Com o objetivo
de contribuir para que essas instituições de ensino se transformem em organizações mais
pró‐ativas, capazes de enfrentar os atuais desafios, propõem‐se, nesta tese, novos modelos
analíticos de previsão, desenvolvidos com recurso a técnicas de data mining, que permitem estimar,
com a devida antecedência, quer o nível de sucesso esperado no final do curso, quer a
propensão do aluno para o abandono. Esses modelos vão permitir identificar quer os grupos de
estudantes de maior risco, que venham a necessitar de uma maior atenção, quer os fatores que
mais contribuam para o seu (in)sucesso, conhecimentos de importância primordial para que os
agentes de gestão possam adotar as medidas e decisões estratégicas de promoção de sucesso
académico mais adequadas.
Para prever o sucesso académico global do aluno é proposto um modelo de regressão baseado
no algoritmo random forest. Para estimar a sua propensão para o abandono é desenvolvido um
modelo de classificação que combina três das mais importantes técnicas de data mining, como
são os casos dos algoritmos random forest, máquinas de vetores de suporte e redes neuronais
artificiais. Com o objetivo de avaliar e garantir que as metodologias desenvolvidas e os modelos
propostos possam ser utilizados em contextos reais, usam‐se, como caso de estudo, os alunos
de licenciatura duma instituição pública do ensino superior politécnico.
Para além da elevada capacidade de previsão evidenciada pelos modelos desenvolvidos e da
própria dimensão e diversidade dos dados analisados, destacam‐se, como contribuições diferenciadoras
desta tese, os processos de seleção dos fatores explicativos do sucesso e do abandono
académico. A tese também demonstra o potencial das técnicas de data mining quando aplicadas
a bases de dados de grande dimensão provenientes de ambientes educacionais, podendo a
abordagem metodológica seguida servir de guia a outras instituições de ensino, ajudando‐as a
perceber de que forma o data mining as poderá auxiliar na extração de conhecimento útil que
suporte melhores decisões. Higher education institutions are currently facing deep challenges stemming from the competition for attracting new students, the globalisation of education, and the directives from recent educational policies adopted both nationally and by the European Union, which require more interventions aiming the attainment of educational success and the prevention of students dropout. With the aim to contribute to the transformation of such institutions into more proactive organisations, capable of facing up to the current challenges, this thesis puts forward new analytical predictive models, developed by means of data mining techniques, which enable the early estimation of a student’s expected level of success at the end of the degree course as well as their propensity to drop out. These models will enable the identification of major risk groups of students, who will need closer attention, and also the identification of the factors mostly contributing to their success or failure. The importance of such information is vital to enable decision‐makers to take the most adequate measures and decisions in order to promote academic success. In order to predict students’ global academic success, we propose a regression model based on random forest algorithm. For the estimation of students’ propensity to drop out, we developed a classification model which combines three of the most popular data mining techniques, namely random forest, support vector machines and artificial neural networks. Aiming to assess and ensure that the methodologies developed and the models proposed can be used in real contexts, the undergraduates of a public polytechnic higher education institution were used as a case study. Besides the high predictive capacity demonstrated by the models developed and the dimension and diversity of the data analysed, other noteworthy differentiating contributions of this thesis are the innovative process of selection of the explanatory factors for academic success and students dropout. The thesis also shows the potential of data mining techniques when applied to large scale datasets deriving from educational environments, and the approach followed in this study may be used as a guideline to other educational institutions on how data mining can support the extraction of useful knowledge with a view to support better decisions. |
URI: | http://hdl.handle.net/10400.6/11132 |
Designação: | Doutoramento em Engenharia e Gestão Industrial |
Aparece nas colecções: | FE - DEM | Dissertações de Mestrado e Teses de Doutoramento |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
tesefinal_entregue_definitiva2.pdf | 9,45 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.