This thesis aims at developing a full-fledged system supporting pervasive information distribution and sharing. The key feature of this system is to allow to manage, integrate, analyze, and possibly reason on, a large and heterogeneous set of data. Part of this data set (e.g. user data, service data, network and vehicles static data) have to be stored in a traditional information system (e.g. based on a relational data structure) while another big part of them -- those data that come from sensors, system logs and every other run-time, dynamic data -- need to be treated as a data stream, which requires research beyond the current state-of-the-art. The system includes the use of context-aware techniques applied to data gathering, shared services, and information distribution; we also discuss how a context-aware approach applied to these tasks leads to the reduction of (noisy) information delivered to the users and to the personalized distribution of information. A privacy-safe approach to information distribution and advertising is adopted. Within the overall architecture, the most relevant concern of this thesis is understanding how to manage the flow of information contained in the streams and how to extract useful knowledge from it. Due to the intrinsic dynamicity of the system, a large part of this analysis task has to be executed in real-time, otherwise its results might become outdated, and reasoning on them could lead to wrong conclusions. On the other hand, also historical data analysis is important since it makes it possible to understand some aspects, like performance degradation in time, that real-time analysis is not able to evince. The research activity will focus on methods and techniques which allow to query this data stream in real-time, while at the same time preprocessing and loading data into a persistent data store for further off-line mining. Due to the large amount and to the simple structure of sensor-collected data, storage solutions like Cloud Databases and clusters of Parallel, Shared-Nothing, Distributed Database systems become very interesting. The project, grounded in many results on the use of context-awareness and sensor-network data management already published by the same research group, aims at building a real-life system based on them. Prototypes of (parts of) the system are produced, within the application domains of car-sharing services and support for citizens' mobility.

La tesi ha come scopo la progettazione e lo sviluppo di un sistema completo per il supporto della condivisione e distribuzione dei dati in sistemi pervasivi. Tale sistema deve consentire la gestione, l'integrazione, l'analisi ed eventualmente l'inferenza basata su tecniche complesse come il "reasoning" automatico, su grandi insiemi di dati eterogenei. Parte di questi dati (ad es. i dati degli utenti, dei servizi, delle reti, ) è più opportuno che vengano immagazzinati in sistemi informativi tradizionali (cioè su sistemi basati su basi di dati relazionali) mentre un'altra grande parte di questi dati, costituita dai dati che provengono dai sensori, dai log di sistema e da tutti i dati dinamici registrati durante l'esecuzione di un sistema, può invece essere trattata come flussi di dati ("data stream"). Ciò richiede un'attività di ricerca che parte da, e va oltre, lo stato dell'arte. Il sistema include anche l'uso di tecniche di contestualizzazione da applicare alla raccolta dei dati, ai servizi condivisi e alla distribuzione delle informazioni. Si discuterà anche di come l'uso di un approccio contestuale in queste operazioni consenta di ridurre il numero di informazioni da distribuire agli utenti, personalizzando il processo di distribuzione stesso. L'approccio proposto consentirà inoltre un maggiore rispetto della privacy dell'utente, anche nelle attività di distribuzione personalizzata di informazioni commerciali e non. Considerando l'architettura globale, questa tesi si focalizza su come i vari flussi di dati contenenti informazioni vadano gestiti in modo tale da consentire di estrarne informazioni utili. Data l'intrinseca ed elevata dinamicità del sistema, una grande parte di questi dati deve essere trattata in tempo reale, altrimenti le informazioni risulteranno troppo "vecchie e le analisi porteranno a conclusioni errate. D'altra parte, è necessaria anche un'analisi dei dati storici registrati dal sistema, per ottenere informazioni utili alla gestione del sistema stesso, quali ad esempio degli indicatori sul peggioramento delle prestazioni. L'attività di ricerca si focalizzerà su tecniche e metodi che consentano di gestire i flussi di dati in tempo reale, mentre allo stesso tempo questi dati verranno preprocessati e memorizzati in una struttura persistente per altre analisi future. Data la grande mole e la struttura semplice dei dati provenienti dai sensori, soluzioni di memorizzazione alternative come i "cloud database" o i cluster di database paralleli e distribuiti devono essere tenute in considerazione. La tesi, che ha le sue radici nei molti lavori e risultati pubblicati dello stesso gruppo di ricerca in merito a contestualizzazione e reti di sensori, ha come scopo quello di creare un sistema reale basato sulle tecniche che verranno descritte. Sono inoltre stati prodotti dei prototipi relativi ad alcune componenti del sistema, nel dominio applicativo dei servizi di car-sharing e del supporto alla mobilità dei cittadini.

SuNDroPS: semantic and dyNamic data in a pervasive system : context-ADDICT revisited

PANIGATI, EMANUELE

Abstract

This thesis aims at developing a full-fledged system supporting pervasive information distribution and sharing. The key feature of this system is to allow to manage, integrate, analyze, and possibly reason on, a large and heterogeneous set of data. Part of this data set (e.g. user data, service data, network and vehicles static data) have to be stored in a traditional information system (e.g. based on a relational data structure) while another big part of them -- those data that come from sensors, system logs and every other run-time, dynamic data -- need to be treated as a data stream, which requires research beyond the current state-of-the-art. The system includes the use of context-aware techniques applied to data gathering, shared services, and information distribution; we also discuss how a context-aware approach applied to these tasks leads to the reduction of (noisy) information delivered to the users and to the personalized distribution of information. A privacy-safe approach to information distribution and advertising is adopted. Within the overall architecture, the most relevant concern of this thesis is understanding how to manage the flow of information contained in the streams and how to extract useful knowledge from it. Due to the intrinsic dynamicity of the system, a large part of this analysis task has to be executed in real-time, otherwise its results might become outdated, and reasoning on them could lead to wrong conclusions. On the other hand, also historical data analysis is important since it makes it possible to understand some aspects, like performance degradation in time, that real-time analysis is not able to evince. The research activity will focus on methods and techniques which allow to query this data stream in real-time, while at the same time preprocessing and loading data into a persistent data store for further off-line mining. Due to the large amount and to the simple structure of sensor-collected data, storage solutions like Cloud Databases and clusters of Parallel, Shared-Nothing, Distributed Database systems become very interesting. The project, grounded in many results on the use of context-awareness and sensor-network data management already published by the same research group, aims at building a real-life system based on them. Prototypes of (parts of) the system are produced, within the application domains of car-sharing services and support for citizens' mobility.
FIORINI, CARLO ETTORE
BARESI, LUCIANO
CUGOLA, GIANPAOLO
SCHREIBER, FABIO ALBERTO
10-dic-2014
La tesi ha come scopo la progettazione e lo sviluppo di un sistema completo per il supporto della condivisione e distribuzione dei dati in sistemi pervasivi. Tale sistema deve consentire la gestione, l'integrazione, l'analisi ed eventualmente l'inferenza basata su tecniche complesse come il "reasoning" automatico, su grandi insiemi di dati eterogenei. Parte di questi dati (ad es. i dati degli utenti, dei servizi, delle reti, ) è più opportuno che vengano immagazzinati in sistemi informativi tradizionali (cioè su sistemi basati su basi di dati relazionali) mentre un'altra grande parte di questi dati, costituita dai dati che provengono dai sensori, dai log di sistema e da tutti i dati dinamici registrati durante l'esecuzione di un sistema, può invece essere trattata come flussi di dati ("data stream"). Ciò richiede un'attività di ricerca che parte da, e va oltre, lo stato dell'arte. Il sistema include anche l'uso di tecniche di contestualizzazione da applicare alla raccolta dei dati, ai servizi condivisi e alla distribuzione delle informazioni. Si discuterà anche di come l'uso di un approccio contestuale in queste operazioni consenta di ridurre il numero di informazioni da distribuire agli utenti, personalizzando il processo di distribuzione stesso. L'approccio proposto consentirà inoltre un maggiore rispetto della privacy dell'utente, anche nelle attività di distribuzione personalizzata di informazioni commerciali e non. Considerando l'architettura globale, questa tesi si focalizza su come i vari flussi di dati contenenti informazioni vadano gestiti in modo tale da consentire di estrarne informazioni utili. Data l'intrinseca ed elevata dinamicità del sistema, una grande parte di questi dati deve essere trattata in tempo reale, altrimenti le informazioni risulteranno troppo "vecchie e le analisi porteranno a conclusioni errate. D'altra parte, è necessaria anche un'analisi dei dati storici registrati dal sistema, per ottenere informazioni utili alla gestione del sistema stesso, quali ad esempio degli indicatori sul peggioramento delle prestazioni. L'attività di ricerca si focalizzerà su tecniche e metodi che consentano di gestire i flussi di dati in tempo reale, mentre allo stesso tempo questi dati verranno preprocessati e memorizzati in una struttura persistente per altre analisi future. Data la grande mole e la struttura semplice dei dati provenienti dai sensori, soluzioni di memorizzazione alternative come i "cloud database" o i cluster di database paralleli e distribuiti devono essere tenute in considerazione. La tesi, che ha le sue radici nei molti lavori e risultati pubblicati dello stesso gruppo di ricerca in merito a contestualizzazione e reti di sensori, ha come scopo quello di creare un sistema reale basato sulle tecniche che verranno descritte. Sono inoltre stati prodotti dei prototipi relativi ad alcune componenti del sistema, nel dominio applicativo dei servizi di car-sharing e del supporto alla mobilità dei cittadini.
Tesi di dottorato
File allegati
File Dimensione Formato  
2014_12_PhD_Panigati.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 6.45 MB
Formato Adobe PDF
6.45 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/98542