LOD: Publicando dados na web de forma estruturada


Certamente você já deve ter ouvido falar do crescimento exponencial da web nos últimos anos. Não só as pessoas como indivíduos estãopublicando cada vez mais dados na web mas também empresas e governos o tem feito de maneira crescente e frequente.

No que diz respeito aos governos mundo a fora, essa iniciativa, baseada no Open-Government, foi batizada de e-Government. Já no Brasil essa prática, que de certa forma já vinha sendo adotada, deverá ganhar ainda mais força depois do discurso da Dilma sobre o projeto de governo aberto e dos EUA terem convidado o Brasil para ser co-dirigente do projeto.

O foco do “governo aberto” é a ampla divulgação de dados aos cidadãos e organizações, e na transparência das ações dos governos. Os benefícios são inúmeros e dentre eles está o combate à corrupção. Mas meu objetivo aqui não é tratar dessa parte. Vamos às questões tecnológicas que viabilizam tais iniciativas.

Do ponto de vista tecnológico, o que está por trás dessas iniciativas é o que a comunidade de computação chama de Linked Open Data ou simplesmente LOD. As questões principais que LOD trata são a da interoperabilidade e da integração de dados em larga escala. Na verdade essas duas questões não são novas, elas estão presentes em praticamente das áreas de TI dos governos e empresas. A diferença é que agora variáveis como distribuiçãoheterogeneidade acesso tem um peso muito maior. A final de contas, estamos falando de interoperabilidade eintegração na web, ao invés de um ambiente relativamente bem mais controlado como, por exemplo, a rede de uma empresa.

LOD propõe o uso de padrões abertos apoiados pelo W3C mais especificamente os que estão relacionados às tecnologias da Web Semântica. Tais tecnologias visam permitir que dados sejam publicados de maneira estruturada e na Web a fim de facilitar, de forma ampla e livre, a criação de ligações entre eles independente da sua origem. Daí o nome Linked Open Data ou “dados abertos ligados”.

A nuvem LOD em Setembro 2011 - Dados que já estão abertos, ligados e disponíveis para reuso
A nuvem LOD em Setembro 2011 – Dados que já estão abertos, ligados e disponíveis para reuso

Tradicionalmente já é uma prática comum na área de Desenvolvimento de Software modularizar ou componentizar trechos de código. Isso é feito por que quando reduzimos a granularidade estamos aumentando a coesão e reduzindo o acoplamento do código. A consequência disso é a maior flexibilidade e facilidade de reuso de código. O que isso tem a ver com LOD?

Em LOD o baixo nível de granularidade extrapola o código e é aplicados nos dados. Por exemplo, não representamos mais os dados como tabelas como fazemos no modelo relacional.  Ao invés do modelo relacional usa-se a teoria de grafos e a representação de dados em formato de triplas que contém SujeitoPredicado e Objeto. Sai de cena as tabelas e entre em cena o RDF – Resource Descrition Framework e seus formatos RDF/XMLN-TripleTurtle e N3. Saem de cena os bancos de dados relacionais e entram os bancos de triplas ou triple stores.

Nesse post, pretendi passar apenas uma visão geral de LOD e suas tecnologias. Em posts futuros falarei sobre meus trabalhos e pesquisas relacionadas a Web Semântica e Ontologias na Web em conjunto com o GRECO – Grupo de Gestão de Conhecimento do iNCE/UFRJ. Pretendo também comentar como essas tecnologias estão sendo aplicadas na indústria de mídia e como estamos aplicando os princípios e regras da Linked Data na Infoglobo para integrar nossos sistemas e construir novas ferramentas sobre o conteúdo que produzimos.

As 5 regras para projetos de dados ligados abertos
As 5 regras para projetos de dados ligados abertos

Continuem ligados!!!

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s