Categorización y datos de referencia
Adaptado del Manual de datos sobre el gasto: Spending Data Handbook (en inglés).
Una de las maneras más eficaces de hacer que los datos sean más significativos para el análisis es combinarlo con los datos de referencia y las hojas de código. A diferencia de los datos de transacciones (como series cronológicas de estadísticas o cifras presupuestarias), los datos de referencia no reflejan la realidad – simplemente contienen detalles adicionales sobre la categoría de los planes, programas gubernamentales, personas, empresas o zonas geográficas mencionadas en los datos.
Por ejemplo, en el presupuesto federal alemán, cada línea se identifica por un código de once dígitos. Este código incluye identificadores de tres dígitos para el propósito funcional y económico del presupuesto. Al ampliar los datos presupuestarios con los títulos y descripciones de cada entrada económica y funcional, ahora los ciudadanos tienen dos maneras diferentes de consultar, como los compromisos por pensiones globales del gobierno, o la suma de todos los programas con funciones de defensa.
Los principales grupos de datos de referencia que son utilizados en finanzas públicas son los identificadores geográficos y los identificadores de empresas y otras organizaciones.
Datos de referencia
Los datos de referencia son las categorías incluidas en un conjuntos de datos financieros. Pueden incluir descripciones de los programas gubernamentales, económicos, esquemas de clasificación funcional o institucional, gráficos de cuentas y muchos otros tipos de sistemas utilizados para clasificar y asignar gastos.
Algunos de estos datos de referencia están estandarizadas por las Naciones Unidas; consultarlas en (http://unstats.un.org/unsd/cr/registry/regcst.asp?Cl=4). También en CAD de la OCDE, códigos sectoriales (http://www.oecd.org/dac/aidstatistics/dacandcrscodelists.htm). Sin embargo, la gran mayoría de los gobiernos utilizan sus propias hojas de código para asignar y clasificar el gasto. En tales casos, a menudo es aconsejable solicitar el acceso a las versiones de la lista de códigos utilizados por el gobierno, incluidos aquellos conceptos que cambiaron en el tiempo.
Existe una biblioteca de datos de referencia que puede ser reutilizado en diferentes proyectos. Es un activo valioso para cualquier organización que trabaja con las finanzas públicas. Hay que compartir estos datos con otras organizaciones es crucial, ya que podrán activar salidas comparables y abrir opciones para la futura integración de datos. Repositorios existentes incluyen la Norma IATI (http://iatistandard.org/) y datahub.io.
Identificadores geográficos
Los identificadores geográficos son utilizados para describir los límites administrativos o lugares específicos dentro de conjunto de datos. Mientras que algunas clasificaciones regionales (como las NUTS-UE) son publicadas en la web, también hay un número creciente de bases de datos abiertas que contienen nombres geográficos – incluyendo geonames.org y world.db desarrollado recientemente.
Otra técnica relacionada es el proceso de georreferenciación inversa: traducir una dirección legible para humanos en un par de coordenadas. Servicios como nominatim (http://nominatim.openstreetmap.org/) no sólo permiten a los usuarios generar mapas precisos de proyectos en una región, sino también saber quién es el responsable de la administración. Esto significa que los proyectos que tengan dirección precisa también pueden ser agregados por estado, región o cualquier otra unidad geográfica.
Además, muchos países tienen shapefiles de sus distritos políticos y geográficos disponibles (por lo general, a través del censo o agencias de interiores) que pueden ser importados en aplicaciones de mapas personalizados, como TileMill (http://mapbox.com/tilemill/).
Empresa y los identificadores de organización
En los datos de gasto que incluye receptores fuera del gobierno, no sólo encontrarás empresas que actúan como proveedores de gobierno, sino también a otros tipos de entidades, incluyendo organizaciones de caridad, asociaciones, gobiernos extranjeros, partidos políticos e incluso los individuos que actúan como receptores directos.
La identificación de estas entidades es bastante difícil, ya que la única información que da el gobierno es a menudo un simple nombre (que puede no identificar de forma exclusiva el beneficiario, por ejemplo, «MS»). También la mayoría de los países (si no todos) mantienen registros de empresas que asignan algún tipo de identificación único de una empresa. Estas bases de datos a menudo no son accesibles y no son utilizadas de manera consistente a través de diferentes partes del gobierno. Identificadores alternativos, como los identificadores de impuestos y los ID de empresa de los proveedores de información de empresas privadas (como Dun & Bradstreet en los EEUU) complican aún más este proceso.
Como alternativa, los registros abiertos están comenzando a recopilar información de una forma que sea fácil volver a usar y por lo tanto permite el intercambio de bases de datos que han sido aumentados con dicha información. OpenCorporates.com (http://opencorporates.com) es una nueva empresa que recopila información de las empresas de todo el mundo y proporciona una aplicación que le da consistencia a los datos con la lista de países conocidos. Ofrecen un servicio donde las empresas vinculan información sobre una compañía y lo relacionan con el nombre de la empresa. Esto es especialmente útil cuando se tiene un conjunto de datos que ofrecen un montón de empresas. Matching (o conciliación) para las personas jurídicas te permite obtener más información acerca de las empresas (por ejemplo, la dirección registrada o presentaciones legales), y hace que sea más fácil para que coincida con otros conjuntos de datos o el intercambio con otras organizaciones.
El proyecto IATI de transparencia está trabajando en estándares similares para otras organizaciones; por ejemplo, para homogeneizar a los gobiernos extranjeros y las organizaciones benéficas que trabajan en el espacio de desarrollo.
Tareas
- Infórmate – Busca si tu gobierno usa una clasificación estándar para los datos, como la de COFOG. Para mayor información sobre lo que es COFOG, visita http://en.wikipedia.org/wiki/Classification_of_the_Functions_of_Government
-
Si tiene hojas de código para sus datos, intenta combinarlos con el conjunto de datos principal. Toma el curso Merging data course (en inglés) si necesitas ayuda.
-
Intenta georreferenciar tus datos. Por ejemplo: ¿Tus datos incluyen proyectos particulares? ¿Puedes encontrar una dirección para ellos? ¡Si es así, puedes codificar de forma geográfica y ponerlos en un mapa! Echa un vistazo a el curso de georreferenciación.
Si tienes datos, intenta responder a la pregunta «¿Cuánto recibió la compañía X del gobierno?». Puede que tengas que corregir errores y encontrar respuestas a preguntas, tales como ¿»es la empresa X» lo mismo que «la empresa X Ltd»? (Ésta es la razón por la cual es importante homogeneizar a las organizaciones).
Si no hay datos de las empresas de tu país, utiliza el servicio de la reconciliación company data for your country (en inglés), para obtener más información acerca de la empresa (en el lado derecho de la página en OpenCorporates.com).