Por Thiago Ávila*
Os Dados Abertos são um tema do meu cotidiano profissional há quase 10 anos, sendo inclusive a temática da minha dissertação de mestrado, denominada “Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectados Governamentais”[1]. Pois é, mas até então, eu não tinha parado para escrever um artigo simples para responder a uma pergunta que me fazem com frequência: “Como publicar Dados Abertos?”
Inicialmente é importante ressaltar que, no setor público brasileiro, a publicação de dados em formato aberto é uma obrigação prevista na Lei de Acesso à informação (Lei Federal 12527/2011, Art. 8o, Parágrafo 3o, incisos ii e iii), onde esta Lei contempla todo o setor público, dos Poderes Executivo, Legislativo e Judiciário, nas Esferas Federal, Estadual e Municipal.
No mestrado, tive a oportunidade de estudar com profundidade, 15 processos de publicação de Dados Abertos (Conectados) e a partir deste estudo, propus um modelo de processo robusto, porém adaptável a diversas realidades, batizado de “Piece of Cake”. O “Piece of Cake” é um modelo evolutivo que tem como sua “espinha dorsal” as 10 “Melhores Práticas para Publicação de Dados Conectados” do W3C [6], onde tais melhores práticas, em sua grande maioria, são totalmente aplicadas para a publicação de Dados Abertos.
Desta dissertação desenvolvi uma revisão de literatura que identificou 70 recomendações para a publicação de Dados Abertos Conectados Governamentais, distribuído entre as 10 melhores práticas estabelecidas pelo W3C[6], que estão sendo exploradas numa sequência de artigos que publico regularmente no meu blog e no blog Áreas de Integração.
Tudo bem. E como publicar Dados Abertos?
Antes de discutirmos o como fazer, gostaria de discutir o quê fazer, ou seja, quais dados devem ser abertos, e quais não devem. É importante ressaltar que, seja no setor governamental, acadêmico ou privado, nem todos os dados de uma instituição são passíveis de abertura, por diversos motivos, especialmente por quê existem dados que precisam ser sigilosos, ora por conterem dados pessoais, dados relacionados a segurança de instituições, propriedade intelectual, por serem dados preliminares, não conclusivos.
Enfim, dados sigilosos e/ou privados sempre existiram e sempre vão existir, e por este motivo, é de extrema importância que, antes de se pensar sobre como publicar Dados Abertos, haja uma definição clara do que pode ser aberto e especialmente, o que não pode e nem deve ser aberto!!!
Figura 01 – Dados Abertos x Dados Fechados. Fonte: Elaboração Própria (2018).
Além disto, qual a diferença entre publicar Dados e publicar Dados Abertos? O conceito de Dados Abertos definido pela Open Knowledge Foundation (OKFn) [5] e as 3 Leis dos Dados Abertos [4] nos ajudam a entender estas diferenças.
Dados abertos, segundo a OKFn são dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa – sujeitos, no máximo, à exigência de atribuição da fonte e compartilhamento pelas mesmas regras. Complementarmente, as 3 Leis dos Dados Abertos estabelecem que:
- Se o dado não pode ser encontrado e indexado na Web, ele não existe;
- Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado; e
- Se algum dispositivo legal não permitir sua replicação, ele não é útil.
Logo, publicar Dados Abertos significa publicar dados que serão utilizados, reutilizados e redistribuídos de forma livre, sem pedir nenhuma autorização prévia a fonte, apenas creditando a fonte do dado. Além disso, o dado para ser aberto, precisa ser encontrado e indexado na Web, ser compreensível por máquina para ser reaproveitado e não haver nenhum instrumento jurídico que impeça o seu uso.
Ficou claro? Vamos dialogar em algumas perguntas e respostas a respeito dos Dados Abertos:
-
Meus dados estão disponibilizados numa API (interface de programação) que requer autenticação para uso. Isto é Dado Aberto?
R.: Não. Não é dado aberto, apesar de ter várias características que podem tornar estes dados abertos, a existência de autenticação requer autorização prévia para uso do dado. Eu costumo chamar estes dados de “dados semi-abertos”.
-
Publico regularmente relatórios da minha empresa em planilhas do Microsoft Excel no formato xls. Isto é Dado Aberto?
R.: Há controvérsias. Arquivos gerados no formato XLS, nativos do Excel, precisam, por padrão, da licença de uso do Microsoft Excel para abri-los. Todavia, por existirem outros softwares livres que abrem arquivos nestes formatos, parte da comunidade já considera sim um arquivo neste formato como dado aberto. Inclusive o grande pesquisador Tim Berners-Lee, o inventor da WWW, considera este tipo de dado com “dado aberto 2 estrelas”, conforme a sua clássica escala evolutiva das 5 estrelas dos Dados Abertos [2].
-
Meu sistema de informação tem uma API nativa, onde outros sistemas conseguem ler os dados do meu sistema estes dados naturalmente e de forma automatizada. Isto é dado aberto?
R.: SIM, SIM e SIM. Sem sombra de dúvida, afinal este tipo de dado atende a todos os requisitos do conceito de dados abertos e as três leis ?
Figura 02 – Esquema 5 estrelas dos Dados Abertos. Fonte: BERNERS-LEE (2006) [2].
Ótimo. Já sei o que são Dados Abertos e o que não são. Como faço para publicá-los afinal?
O Governo brasileiro, através do Kit de Dados Abertos, estabeleceu o fluxograma abaixo com atividades relevantes para um processo de publicação de Dados Abertos. Este material, denominado de “Processo sistêmico para abertura de dados”[1] foi muito utilizado para a concepção do modelo de processo “Piece of Cake”. Dentre suas principais atividades, eu destaco:
-
Prepare as partes interessadas com o seu projeto de abertura de dados.
- Apresente o que são dados abertos, quais os benefícios, quais as obrigações legais em publicá-los. A abertura de dados é um processo coletivo, que envolve várias pessoas. Você não conseguirá fazer nada sozinho. Logo, construa parcerias.
- Defina um líder do projeto, um ponto focal para coordenar o trabalho. Essa pessoa vai liderar a iniciativa, “fazer o projeto acontecer”, interagindo com os gestores e técnicos da instituição, bem como com outras instituições parceiras do projeto. É recomendável que este líder do projeto seja conhecedor dos sistemas e bases de dados mantidos pela instituição e tenha Familiaridade com o tema Acesso à Informação, formatos de arquivos de dados, e conceitos da Web.
-
Faça “chover”. Desenvolva um projeto ágil de abertura de dados
Para introduzir um tema novo, nada melhor do que um exemplo tangível e adaptado a realidade da sua instituição. Além disso, um projeto piloto vai proporcional que a equipe envolvida no projeto experimente, de forma muito rápida, todo o processo de publicação de dados abertos. Isso dá uma noção do escopo da publicação de dados abertos, ajudando na tomada de decisões durante as próximas atividades de abertura.
Figura 03 – Processo sistêmico para abertura de dados do Governo Brasileiro. Fonte: BRASIL (n.d) [3].
Conforme o Kit de Dados Abertos [3], um projeto ágil (mais informações aqui) deve contemplar as seguintes atividades técnicas:
- Extraia os dados que deseja abrir de suas fontes (arquivos, pastas, bancos de dados);
- Defina a qualidade mínima dos dados
- Desenvolver a solução ou o método de disponibilização destes dados (pode ser uma pasta no site institucional ou até um catálogo de dados);
- Divulgar, inicialmente de forma interna, os dados abertos
Beleza. Feito isto, fica bem mais fácil para você continuar “Preparando as Partes Interessadas”, pois elas são fundamentais para o sucesso do seu projeto de abertura de dados. Quem mais você deve envolver:
- Gestores e técnicos das áreas finalísticas da instituição
- Comprometa a área de Tecnologia da Informação o máximo que você puder. Sem estes caras, nada vai acontecer.
- A área de Ouvidoria, pois é a partir dela que você vai descobrir quais as maiores demandas de dados dos seus clientes;
- E obviamente, a galera que divulga, ou seja, a Assessoria de Comunicação Social,
Acredito que isto é suficiente para você conseguir o apoio necessário para iniciar o seu projeto de abertura de dados. Para desenvolver o projeto de forma mais robusta, recomendo a sua leitura atenta ao modelo “Piece of Cake”, nas páginas 141 a 162 da minha dissertação disponível aqui [1].
Figura 04 – Modelo de Processo de publicação de dados abertos “Piece of Cake”. Fonte: ÁVILA (2015) [1].
Além disso, acompanhe aqui no Blog toda a minha série de posts sobre o tema Dados Abertos. Na seção de Palestras, você confere diversos slides de palestras que ministrei sobre o assunto ao longo de minha carreira e na seção Na Mídia, você confere diversas entrevistas concedidas para veículos de TV e Rádio sobre Dados Abertos.
Conte conosco para apoiá-lo no seu projeto de abertura de dados. Deixe seu comentário ou entre em contato pelas nossas redes sociais ou demais meios de contatos disponíveis aqui no blog.
Se depois deste post você ainda tem dúvidas sobre o que são os Dados Abertos e o seu potencial, confira este vídeo:
Até a próxima!!!
Referências:
[1] ÁVILA, T. J. T. Uma proposta de modelo de processo para publicação de dados abertos conectados governamentais. 223 p. Dissertação (Mestrado) — Instituto de Computação, Universidade Federal de Alagoas, Maceió, Alagoas, Brasil, 2015. Dissertação de Mestrado em Modelagem Computacional do Conhecimento.
[2] BERNERS-LEE, T. Linked data. 2006. Acesso em: 17 jan. 2018. Disponível em: <http://www.w3.org/DesignIssues/LinkedData.html>
[3] BRASIL. Kit de Dados Abertos. Acesso em: 17 jan. 2018. Disponível em: <http://kit.dados.gov.br/>
[4] EAVES, D. The Three Laws of Open Government Data. 2009. Disponível em:
<http://eaves.ca/2009/09/30/three-law-of-open-government-data/>.
[5] OKF. Guia de Dados Abertos. 2015. Disponível em:<http://opendatahandbook.org/guide/pt_BR>.
[6] W3C. Best Practices for Publishing Linked Data. 2014. Acessado em 02/05/2017. Disponível em: <http://www.w3.org/TR/ld-bp/>.
[1] Disponível em: http://kit.dados.gov.br/Processo-sist%C3%AAmico/
Parabéns Thiago, ótimo material para esclarecer de uma vez por toda a finalidade de dados abertos e como fazer de forma correta!