Queremos compartirte algunos consejos a tener en cuenta para abrir datos y evitar algunos de los problemas más comunes. Sobre todo, si estás por incursionar en temas de apertura de datos en tus organización o quieras emprender iniciativas dateras desde la mirada del Gobierno Abierto e instituciones afines. 

Para este punto, lo deseable es ya haber elegido el conjunto de datos que se abrirá. Sin embargo, esta es una actividad que ocurre múltiples veces. Si aún no decides qué conjunto de datos abrir, se puede crear una lista y elegir con qué datos empezar.

Antes de comenzar, ten en cuenta lo siguiente:

  • Uno por uno. Si es la primera vez que abres datos, lo mejor es hacerlo de a poco. No es necesario publicar todos los datos que tienes o, si tienes un conjunto de datos muy grande, puedes hacerlo por partes o secciones. 
  • Consulta a las personas usuarias. Una buena práctica es preguntar a la comunidad, pues son quienes accederán y utilizarán los datos. Este acercamiento podría, aporta información sobre qué datos pueden ser valiosos.

Una vez que hayas elegido el dataset que se dará a conocer, debes tener en cuenta las siguientes consideraciones:

1. Licencia.

Por licencia, nos referimos a Creative Commons. Estos son modelos de contratos que otorgan públicamente el derecho a utilizar una publicación protegida por derechos de autor. A menor restricción en las licencias, mayores son las posibilidades de utilizar contenidos. De esta forma, determina los derechos de propiedad intelectual de los datos para impedir que terceros usen, reutilicen y redistribuyan los datos sin permiso explícito.

2. Disponibilidad de los datos.

Los datos abiertos deben estar tanto legal como técnicamente abiertos. 

La primera opción es la descarga masiva de datos, a través de un sitio de internet o repositorio y que las personas usuarias puedan acceder a ellos y almacenarlos en su propia computadora. 

La segunda opción es a través de servicios en línea como una API, esta opción puede implicar ciertos costos y conocimiento técnico Sin embargo, una de las ventajas es que el público puede elegir los datos que le interesan sin necesidad de descargar todo el set de datos. Otra es que generalmente están conectadas a una base de datos que se actualiza en tiempo real garantizando que la información esté actualizada.

Si no sabes aún en qué formato hacerlos disponibles, te recomendamos que primero los hagas descargables masivamente.

3. Haz un diccionario de datos.

Los diccionarios de datos forman parte de los metadatos; es decir, información sobre un conjunto de datos, como su título y descripción, método de recopilación, autor o editor, área y período de tiempo cubierto, licencia, fecha y frecuencia de publicación, entre otras. Es esencial publicar datos con metadatos adecuados para ayudar tanto a la detección como a la usabilidad de los datos. 

Los diccionarios de datos son de suma importancia, ya que, al poner a disposición del público los datos, su alcance es mucho mayor y se requiere un instrumento que permita entender el conjunto de datos.

El diccionario de datos debe describir el contenido de cada columna. Por eso, cuando se publique un conjunto de datos abiertos, se debería publicar también una URL al documento que contenga su diccionario de datos, independientemente de su formato. 

4. Manejo de datos personales y sensibles.

Los datos personales se refieren a los registros u otra información que por sí sola o vinculada con otros datos, puede revelar la identidad de una persona. Es recomendable anonimizar los datos; es decir, no publicar datos sensibles, como teléfono, dirección, nombres o apodos, entre otros. 

Una forma de dar abrir datos éticamente es agregándolos; es decir, dándolos a conocer de manera más general. Por ejemplo, podría ser por grupos de edad en lugar de edades específicas de cada observación o demarcaciones geográficas menos específicas, como ciudades en vez de municipios o colonias o, utilizar números en lugar de nombres como identificadores.

5. Haz que el público los conozca

Abrir datos no sirve de mucho si no hay quien los utilice. Asegúrate de que la gente pueda encontrar la fuente del material. Cuanto más fácil sea para las personas usuarias descubrir los datos, más rápido se construirán nuevas y útiles herramientas.

Hay una serie de herramientas que están en la web diseñadas específicamente para facilitar la búsqueda de bases de datos

Una de las más populares es el DataHub, un catálogo y almacén de bases de datos de todo el mundo. El sitio facilita que individuos y organizaciones publiquen materiales y a su vez que las personas usuarias encuentren el material que necesiten.

Además, hay docenas de catálogos específicos para diferentes sectores y lugares. Estas comunidades específicas han creado sistemas de catálogos para sus archivos, ya que a menudo los datos requieren de publicación.

Con estas consideraciones en la mesa, cuéntanos: ¿cuál ha sido tu experiencia al momento de abrir datos? ¿Fue fácil o difícil hacerlo? ¿Conoces iniciativas que lo hayan hecho en tu país? Déjanos tu comentario, escríbenos a escueladedatos@socialtic.org o mándanos un tuit a @EscueladeDatos.