Archetypální analýza jako segmentační nástroj
Archetypal Analysis as a Segmentation Tool
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/75707Identifikátory
SIS: 114347
Kolekce
- Kvalifikační práce [10678]
Autor
Vedoucí práce
Oponent práce
Antoch, Jaromír
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná matematika
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
11. 9. 2015
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Dobře
Klíčová slova (česky)
Archetypální analýza, segmentace, konvexní lineární kombinace, metoda nejmenších čtvercůKlíčová slova (anglicky)
Archetypal analysis, segmentation, linear convex combination, least squares problemPráce se zabývá metodou nazvanou archetypální analýza, jež patří do odvětví mnohorozměrné statistické analýzy. Tato moderní metoda nachází uplatnění v mnoha dalších vědních oborech. Soustředí se na hledání "čistých typů" neboli archetypů, které jsou konvexními lineárními kombinacemi prvků analyzovaných dat, přičemž se zároveň snaží stejným způsobem původní data co nejlépe aproximovat. Celý postup zpracování dat je demonstrován na reálném datovém souboru, na němž jsou též předvedeny některé vybrané vlastnosti metody. Součástí práce je také navržení několika způsobů, kterými lze na základě algoritmu archetypů rozdělit data na vhodný počet segmentů. Tyto způsoby jsou porovnány a předvedeny. Datový soubor je přiložen k práci. Powered by TCPDF (www.tcpdf.org)
The thesis presents method called archetypal analysis, which belongs to the field of multivariate statistical data analysis. The method brings contribution to many different branches of science. It focuses in searching for the archetypes or so called "individuals of pure type" that are expressed as convex linear combinations of the original data. At the same time, the original data are represented as the convex linear combinations of the data minimizing the squared error in this representation. There is also a detailed example on processing of the real data. The thesis contains also a sugestion of ways how the original data can be divided into segments. The processed data set is attached. Powered by TCPDF (www.tcpdf.org)