Využití principů dolování datových toků v doporučovacích systémech
Data stream mining approaches in recommendation systems
Typ dokumentu
diplomová prácemaster thesis
Autor
Tomáš Chládek
Vedoucí práce
Kuchař Jaroslav
Oponent práce
Špaček Petr
Studijní obor
Webové a softwarové inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra softwarového inženýrstvíPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Hlavním tématem diplomové práce je využití technik dolování dat z datových toků k doporučování novinových článků. V teoretické části jsou rozebrány principy doporučovacích systémů a jejich testování. Dále jsou popsány principy, které se v algoritmech na dolování dat z datových toků využívají. V rešerši jsou zkoumána existující řešení v doméně novinových článků a platforma, která je k experimentování použita. V části dolování dat je popsán proces získání informací a analyzována data, která jsou použita k experimentům. Proudový algoritmus implementuje různé parametrizovatelné techniky vytěžování datových toků. V experimentální části jsou zkoumány vlivy jednotlivých technik a heuristik na měřené metriky. Experimenty jsou rozděleny do kategorii dle následujích heuristik: náhodný výběr, populárnost, iterátor a nedávno navštívený článek. Testování je provedeno na platformě StreamingRec. V závěru práce je shrnutí vhodnosti technik k doporučování položek v doméně novinových článků. Main topic of this master thesis is usage of data stream mining techniques in news recommendation systems. In theoretical part are described principles of recommendation systems, data mining and data streams. In previous work are revised existing algorithms in this domain and platform, that can be used for evaluation of recommendation system. In the data mining part is described the process of gathering information from the data stream and analyzed data, that are used for experiments. Streaming algorithm implements various parameterized techniques for data stream mining. Experiments are divided by following heuristics: random selection, popularity, iterator and recently visited article. Evaluation of experiments is performed on StreamingRec platform. The conclusion summarizes the benefits of using data stream mining techniques in the news recommendation systems.
Kolekce
- Diplomové práce - 18102 [1036]