Estudio del uso de memorias no volátiles para mejorar el rendimiento de bases de datos NoSQL
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/190277
Tipus de documentTreball Final de Grau
Data2019-11
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Els discs són els dispositius d'emmagatzematge amb el temps d'accés més alt. De diverses formes, l'estructura de la jerarquia de memòria d'un sistema informàtic sempre s'ha intentat optimitzar. No obstant, el disc és l'única memòria que manté persistent les dades, és a dir, després de l'apagada de sistema, es mantenen en memòria. Per tant, en la majoria de sistemes informàtics els discs són indispensables. Així doncs, l'accés a ells és inevitable, de manera que millorar un sistema amb la seva interacció amb aquests dispositius és fàcilment beneficiós. Intel ha proposat una nova tecnologia no volàtil amb un temps d'accés poc superior a les memòries DRAM. Es pretén que la persistència d'aquestes dades no resulti tan costosa com els discs tradicionals HDD o SSD. Per comprovar la seva efectivitat, es posarà a prova en diferents entorns. Un bon exemple de sistema informàtic amb moltes operacions a disc són les bases de dades. En aquest cas, la base de dades serà Cassandra. Quan una base de dades, com Cassandra, escriu les dades de les taules a disc, les escriu de fila en fila. Apache Arrow, una llibreria d'Apache, permet escriure les dades en columnes, aprofitant les característiques SIMD dels nous processadors. Així mateix, el format en què es guarden les dades es pretén que sigui el mateix per a totes les bases de dades. Aquest programari encara és nou i sembla tenir potencial, de manera que aquest treball també aspira a poder fer un anàlisi de la llibreria aplicada en Cassandra amb la memòria no volàtil. Disks are the storage with the highest access time. In various ways, the structure of the memory hierarchy of a computer has always been tried to optimize. However, the disk is the only memory that keeps data persistent, that is, after system shutdown, they are maintained. Therefore, in most computer systems the disks are indispensable. Thus, access to them is inevitable, so improving a system with its interaction with these devices is easily beneficial. Intel has proposed a new non-volatile technology with a slightly longer access time to DRAM memories. It is intended that the persistence of this data is not expensive as traditional HDD or SSD disks. To verify its effectiveness, it will be tested in different environments. A good example of a computer system with many disks operations are databases. In this case, the database will be Cassandra. When a database, such as Cassandra, writes the data in memory, it writes them from row to row. Apache Arrow, an Apache library, allows you to write the data in columns, taking advantage of the SIMD features of the new processors. Also, the format in which the data is stored is intended to be the same for all databases. This software is still new and seems to have potential, so this work also aims to make an analysis of the library applied in Cassandra with Intel's non-volatile memory.
TitulacióGRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
147807.pdf | 1,377Mb | Visualitza/Obre |