Especificación y ejecución de benchmarks sobre el gestor de datos distribuido y escalable Cassandra para aplicaciones de uso intenso de datos en la Industria 4.0
Benchmark specification and execution on Cassandra, a distributed and scalable data base, for intensive-data applications in the Industry 4.0
Ver/ Abrir
Identificadores
URI: http://hdl.handle.net/10902/16866Registro completo
Mostrar el registro completo DCAutoría
Dintén Herrero, RicardoFecha
2019-06-21Director/es
Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Benchmark
NoSQL
Big data
Industria 4.0
Industry 4.0
Resumen/Abstract
RESUMEN: En la actualidad, estamos inmersos en la llamada cuarta revolución industrial o también conocida industria 4.0. Esta tiene por objeto revolucionar la industria de la fabricación y producción gracias a la digitalización de los equipos del entorno industrial, la computación en la nube, la integración de los datos y los avances tecnológicos de los sistemas de producción y fabricación. Las plataformas de tercera generación, basadas en arquitecturas centradas en el dato y la computación en la nube, son propuestas para vertebrar este cambio tecnológico. El grupo de investigación ISTR de la Universidad de Cantabria está desarrollando una propuesta arquitectónica denominada P3forI4 basada en los frameworks del ecosistema Apache. En este trabajo, se estudia y evalúa el gestor de bases de datos distribuido y escalable Apache Cassandra para comprobar su idoneidad y su comportamiento para formar parte de la capa de persistencia de esta arquitectura. Para ello se diseñan y realizan un conjunto de pruebas (benchmark) con distintas configuraciones y cargas de trabajo para conocer las condiciones límite de operación y extraer conclusiones sobre consideraciones de diseño para su adecuación como sistema de persistencia para aplicaciones reactivas y entornos con consideraciones de tiempo real.
ABSTRACT: Nowadays we are immersed in the fourth industrial revolution, also known as Industry 4.0. This is aimed at revolutionizing the manufacturing and production industry thanks to the digitalization of the equipment of the industrial environment, the cloud computing, the integration of the data and the technological advances of the production and manufacturing systems.The thrid generation platforms based on data-centric architectures and cloud computing are proposed to vertebrate this technological change. ISTR, a research group of the University of Cantabria, is currently developing an architectural proposal named P3forI4 based on the Apache ecosystem frameworks. In this project, we study and evaluate Cassandra, a distributed and scalable data base, to check its suitability and its behavior to be considered as an element of the persistence layer of this architecture. Therefore, we design and perform a set of benchmarks with different configurations and workloads to know the limits of the system and draw conclusions about design guidelines to adapt it as a persistance system for reactive applications in real-time environments.