Acções do Documento
LeanBigData (notícia)
Análise Integrada e Visual de Big Data Ultra-escalável e Ultra-eficiente
INESC TEC inicia projeto europeu na área de “Big Data”
O Laboratório de Software Confiável (HASLab) e o Centro de Sistemas de Informação e de Computação Gráfica (CSIG) do INESC TEC iniciaram em fevereiro de 2014 o projeto europeu LeanBigData (Ultra-Scalable and Ultra-Efficient Integrated and Visual Big Data Analytics), que tem como objetivo solucionar três grandes desafios do processamento analítico em “Big Data”: o custo associado ao escalonamento do processamento analítico de “Big Data” para análise de sequências dinâmicas e fontes estáticas; a falta de integração das tecnologias existentes para a manipulação de “Big Data” e os seus elevados tempos de resposta; e ainda o insuficiente suporte ao utilizador final que leva a ciclos de análise extremamente longos.
O projeto propõe-se a criar e desenvolver três sistemas eficientes para a manipulação de “Big Data”: uma nova base dados NoSQL transacional, um sistema de processamento de eventos complexos (CEP) distribuído e um motor de interrogações SQL distribuído. Na mesma linha de raciocínio, a equipa de investigação, onde se incluem os investigadores do HASLab Rui Oliveira, José Orlando Pereira, Francisco Moura, José Nuno de Oliveira e António Ribeiro e do CSIG Alexandre Carvalho, pretende criar uma plataforma integrada com as três principais tecnologias para “Big Data”, NoSQL, SQL e Streaming/CEP, que melhorarão o tempo de resposta do processamento analítico unificado sobre múltiplas fontes e grandes quantidades de dados, evitando as ineficiências das atuais abordagens extração-transformação-carregamento (ETL).
O projeto deverá também permitir a análise “Big Data” fim-a-fim, eliminando as quatro principais fontes de atraso no ciclo de análise de dados, utilizando para isso a descoberta automática de anomalias e “root cause analysis”, bem como a visualização incremental de interrogações longas, a composição de visualizações de forma declarativa e interação simplificada com “drag-and-drop”, e ainda a manipulação eficiente de visualizações através de gestos em vistas 3D/Holográficas.
Finalmente, o LeanBigData demonstrará estes resultados num “cluster” com mil núcleos de processamento em quatro casos de estudo industriais com dados reais, preparando a sua implantação no contexto de processos de negócio reais.
Do consórcio do projeto fazem parte, além do INESC TEC, a Portugal Telecom, a Universidad Politecnica de Madrid e as empresas Computer Asscociates e ATOS (Espanha), a Intel (de Israel), a Foundation for Research and Technology (Grécia), o Institute of Communication and Computer Systems (Reino Unido), e SyncLab SRL (Itália). O projeto tem duração de 36 meses e é financiado pelo 7º Programa Quadro da União Europeia.
Mais informação