El hombre invisible está en tu hoja de cálculo y esta revolviendo tus datos
Introducción
Algo muy oscuro pasa en tus hojas de cálculo… y no es agradable.
Figura 1: Póster de la película The Invisible Man, 1933. Reproducida bajo Fair Use.
“Incluso la luna me tiene miedo”, dice el famoso hombre invisible, mejor conocido como Dr. Griffen, quien después de experimentar con su propio cuerpo se vuelve un cruel villano. Si tienes tiempo y quieres, te recomendamos que veas el trailer. Cosas misteriosas comienzan a pasar en un pequeño pueblo: pisadas en la nieve sin dueño, objetos domésticos que vuelan por el aire, gente que es arrojada por las escaleras, y, en este caso… ¡desorden en tus datos!
Nosotros no podemos ver al hombre invisible (por algo es invisible), pero sí le podemos seguir la pista, como en la nieve.
En esta imagen, es muy claro el error que provocó el hombre invisible… pero no todos son tan obvios.
-
Espacios blancos de más al final
-
Tablas insertadas en el final de las líneas
-
Cuidado con los saltos de línea que puedes agregar cuando le hacees Clic Enter o Ctrl + Enter.
Todos éstos se llaman caracteres no detectables y no se despliegan en las hojas de cálculo… pero sí notarás sus terribles consecuencias cuando analices los datos. Cuidado; las hojas de cálculo sí validan estos comandos como verdaderos datos.
En la película, la policía tiende una trampa para atrapar al hombre invisible. Nosotros podemos hacer lo mismo en con nuestra hoja de cálculo. Al final de esta sección aprenderás:
-
Cómo los caracteres que no son visibles pueden causar estragos en tus datos.
-
Cómo remover esta serie de funciones y caracteres.
Algunas tareas
Para hacer las siguientes tareas necesitas:
-
Hojas de cálculo, ya sea de Excel u Open/Libre Office.
-
Una copia de la hoja de ejemplo para esta sección.
-
Una copia del curso de bases de datos (en inglés: GRAIN’s data on land grabbing).
Tarea rápida (15 minutos)
-
Descarga y guarda la hoja de ejemplo en tu computadora.
-
En la columna A, encontrarás todo tipo de caracteres invisibles que pueden arruinar tus hojas. En las columnas B-E, encontrarás diferentes métodos para remover esos caracteres. La manera más fácil de removerlo es mediante el uso de la función de recortar en la columna B; la función limpiar en la columna C; o las dos combinadas en la columna D. También está el pegado especial en la columna E.
-
Aplicar un “auto filtro” a la base de datos. Dale click a la flecha que sale de lado derecho, y una lista saldrá con los números de las distintas entradas de las columnas. Si le das click en auto-filtro en todas las columnas (A-E), puedes darte cuenta de cómo remover los diferentes errores invisibles.
-
Dale doble click a las celdas para ver las fórmulas. Podrás ver cómo las funciones “trabajan». Te daremos más información más tarde.
-
Ahora inténtalo tú mismo. Crea una columna de datos y aplica los métodos antes mencionados en tu hoja de cálculo.
Tarea larga (30-60 minutos)
Del manual de tips, ve a la sección de limpieza de datos, y busca el apartado 2: Whitespace and new lines – data that shouldn’t be there (en inglés), que trata acerca de los datos que no deben de ir. Encontrarás mucho más información del tema y la manera en que puedes enfrentar este problema.
Lista de lecturas
-
Este video tutorial en YouTube, Excel is Fun (en inglés), sobre cómo limpiar y recortar datos que no sirven.
-
Puedes leer la página sorprendentemente útil de Microsoft para aprender a remover todos los caracteres no deseados aquí. Mucha de la información aplica para Open/Libre Office y Google Spreadsheets, pero cuidado, porque también tienen diferencias. Pon especial atención a las funciones en Excel, LibreOffice, Google Spreadsheet, y cómo limpiar en Excel, Open/Libre Office, Google Docs.
-
Lee las características de los documentos: pegado especial (Excel, Open/Libre Office, Google Docs). Auto-filtros (Excel, Open/Libre Office, Google Docs).
-
Si te quieres volver experto en atrapar al hombre invisible. puedes leer esto.
Descansa y reflexiona
El hombre invisible puede aparecer en cualquier momento, así que debes estar siempre vigilante:
-
¿Cómo se pueden introducir los espacios en blanco en tus datos?
-
¿Se te ocurre otra manera de abordar el problema?
Después, pasa a la tercera sección del tutorial: Tus datos están embrujados.