dtm_201307

Manuel Ríos

Este post y tutorial es la segunda contribución de Manuel Ríos a Escuela de Datos. Compartimos su semblanza: 

Hombre. Mexicano. Gustoso de la tecnología y su impacto. Comprometido con la sociedad y con mi país. Economía, innovación, desarrollo, entre otros.


Raw es una aplicación web y abierta de visualización de datos creada por Density Design del Politécnico de Milán.

Raw permite visualizar datos a través de diseños de gráficas en vectores basándose en las librerías D3 (Data-Driven Documents) de JavaScript, que permiten controlar gráficas interactivas y dinámicas. La aplicación puede ser usada totalmente vía web, o puede ser descargada para personalización y edición (tiene licencia abierta).

El uso de Raw es bastante sencillo, y nos permite crear más de 15 tipos de diagramas de datos. En la imagen siguiente se ve un ejemplo de un diagrama de datos conocido como Scatter Plot (diagrama de dispersión). En él, montamos una base de datos de ejemplo que contiene 26 películas de Hollywood con sus respectivos géneros, presupuestos, recaudaciones en taquilla y calificaciones por IMBD.

Raw1

Lo que esta imagen nos muestra es:

En el eje vertical (y), la cantidad recaudada en taquilla por la película.
En el eje horizontal(x), la calificación obtenida por IMBD.
Cada color de círculo representa un genero diferente.
El tamaño del círculo es proporcional al presupuesto utilizado por la película.

En Raw, la base puede ser escrita en la misma aplicación o copiada y pegada de un archivo tipo Excel. Asimismo, nos permite exportar la gráfica en tres diferentes formatos, principalmente para uso web: Imagen (PNG), data model (Json) y vector gráfico (vsog).

Como crear un diagrama de visualización en Raw

  1. En el cuadro de texto insertamos los datos. Se pueden escribir directamente o copiar y pegar de algún archivo de datos. Vemos que son muy parecidos a un archivo de Excel.

Raw2

  1. Seleccionamos el tipo de diagrama que más nos guste. Existen 15 tipos diferentes.

Raw3

En el lado izquierdo se nos muestran las características de cada diagrama. Por ejemplo:

  • Scatter Plot es un diagrama con dos ejes (tipo plano cartesiano) que muestra dos variable con etiquetas.
  • Convex Hull nos muestra en un mapa de puntos, ayudándonos a identificar puntos en la misma categoría.
  • Circle Packing y Clustered Force Layout nos ayudan a representar jerarquías comparando valores.
  • Alluvial Diagram nos ayuda a identificar categorías y su correlación con diferentes elementos.

Cada uno de los diagramas representa los datos de forma diferente y puede ser usado para diferentes propósitos. Quizás si queremos ver valores agrupados podamos usar un modelo de Circle Packing. Si queremos ver un plano con comparación mas general, podremos usar un Scatter Plot. Si queremos separar por categorías y ver correlaciones, quizás nos convenga un diagrama de fluidos como Alluvial Diagram.

3.- En este caso elegimos el diagrama Scatter Plot, y nos muestra cómo queremos acomodar los datos. Para crear un diagrama como el de arriba, los acomodamos de la siguiente manera:

Raw4

4. Posteriormente se puede editar los colores, el tamaño, etc.

Raw5

5. Cuando termines, puedes descargar el archivo en tres formatos diferentes: json, png y vsg, o copiar un pedazo de código en HTML para insertarlo en página web.

Raw6