Boclusterização na análise de dados incertos

Fabrício Olivetti de França

Boclusterização na análise de dados incertos

Fabricio Olivetti de França

Material

TESE

Idioma

Português

Número de chamada

T/UNICAMP F844b

Título outro

[Biclustering on uncertais data analysis]

Publicação

Campinas, SP : [s.n.], 2010.

Descrição física

172 p. : il.

Nota geral

Orientador: Fernando Jose Von Zuben

Nota de dissertação ou tese

Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação

Resumo

Resumo: O processo de aquisição de dados está sujeito a muitas fontes de incerteza e inconsistência. Essas incertezas podem fazer com que os dados se tornem ruidosos ou impedir a aquisição dos mesmos, gerando o problema de dados faltantes. A maioria das ferramentas utilizadas para tratar tais...

Resumo: O processo de aquisição de dados está sujeito a muitas fontes de incerteza e inconsistência. Essas incertezas podem fazer com que os dados se tornem ruidosos ou impedir a aquisição dos mesmos, gerando o problema de dados faltantes. A maioria das ferramentas utilizadas para tratar tais problemas age de forma global em relação às informações da base de dados e ignora o efeito que o ruído pode ter na análise desses. Esta tese tem como objetivo explorar as propriedades do processo de biclusterização, que faz uma análise local dos dados, criando múltiplos modelos de imputação de dados que buscam minimizar o erro de predição dos valores faltantes na base de dados. Primeiramente, é proposto um novo algoritmo de biclusterização com um melhor desempenho que outras abordagens utilizadas atualmente, enfatizando a capacidade dos biclusters em gerar modelos com ruído reduzido. Em seguida, é proposta uma formulação de otimização quadrática para, utilizando os modelos locais gerados pelo bicluster, imputar os valores faltantes na base de dados. Os resultados obtidos indicam que a utilização da biclusterização ajuda a reduzir o erro de predição da imputação, além de fornecer condições favoráveis a uma análise a posteriori das informações contidas nos dados

Ver mais

Ver menos

Abstract: The data acquisition process is subject to many inconsistencies and uncertainties. These uncertainties may produce noisy data or even provoke the absence of some of them, thus leading to the missing data problem. Most procedures used to deal with such problem act in a global manner,...

Abstract: The data acquisition process is subject to many inconsistencies and uncertainties. These uncertainties may produce noisy data or even provoke the absence of some of them, thus leading to the missing data problem. Most procedures used to deal with such problem act in a global manner, relatively to the dataset, and ignore the noise e_ect on such analysis. The objective of this thesis is to explore the properties of the so called biclustering method, which performs a local data analysis, creating several imputation models for the dataset in order to minimize the prediction error estimating missing values of the dataset. First, it is proposed a new biclustering algorithm with a better performance than the one produced by other traditional approaches, with emphasis on the noise reduction capability of the models generated by the biclusters. Next, it is proposed the formulation of a quadratic optimization problem to impute the missing data by means of the local models engendered by a set of biclusters. The obtained results show that the use of biclustering helps to reduce the prediction error of data imputation, besides providing some interesting conditions for an a posteriori analysis of the dataset

Ver mais

Ver menos

Assuntos

Aprendizado de máquina

Dados faltantes (Estatística)

Cluster

Mineração de dados (Computação)

Algoritmos evolutivos

Autoria

França, Fabrício Olivetti de, 1980-

Von Zuben, Fernando José, 1968- Orientador

Coelho, André Luís Vasconcelos Avaliador

Buarque de Lima Neto, Fernando Avaliador

Lyra Filho, Christiano, 1951- Avaliador

Attux, Romis Ribeiro de Faissol, 1978- Avaliador

Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação. Programa de Pós-Graduação em Engenharia Elétrica

Sites

DOI: https://doi.org/10.47749/T/UNICAMP.2010.783091

Arquivos

Texto completo pdf

Boclusterização na análise de dados incertos

Fabricio Olivetti de França

Boclusterização na análise de dados incertos

Fabricio Olivetti de França

Exemplares

Nº de exemplares: 2
Não existem reservas para esta obra

Exemplar	Tombo	Edição	Ano	Volume	Suporte	Nº de chamada	Biblioteca	Localização	Situação	QR Code
Tombo: 1150090011 Ano: 2010 Suporte: Impresso Nº de chamada: T/UNICAMP F844b Biblioteca: BAE Situação: Retido (Aguardando baixa patrimonial) Visualizar QR Code	1150090011		2010		Impresso	T/UNICAMP F844b	BAE		Retido (Aguardando baixa patrimonial)
Tombo: 1150090002 Ano: 2010 Nº de chamada: T/UNICAMP F844b Biblioteca: BCCL Situação: Não circula Visualizar QR Code	1150090002		2010			T/UNICAMP F844b	BCCL		Não circula