RECURSOS

IDENTIFICAR

¿Qué información requieres para entender una problemática, para fortalecer un argumento o validar una hipótesis? ¿Dónde pueden estar esos datos? ¿En qué formatos están y qué tan fáciles de usar son?

 

Identificar datos nos lleva a conocer nuestras fuentes de datos a profundidad y detalle. Un recuento de esta experiencia está en la reflexión sobre Cómo empezar a crear una base de datos sobre feminicidio.

 

Si después de responder las preguntas anteriores aún no tienes certeza sobre qué datos pueden ser útiles, recomendamos explorar datos externos. Del Manual de Periodismo de Datos 1.0, el capítulo "Una Guía para Trabajos de Campo" es útil para identificar fuentes de datos públicos en Internet.

 

Y si cambian las fuentes de datos previamente identificadas, a través del servicio de Google Alerts, recibe notificaciones por correo electrónico de los cambios en las bases de datos en línea que sean de tu interés. Más detalle en “Cómo programar alertas para datos web cambiantes

 

También es importante identificar qué formatos tienen los datos que requieres. Comúnmente pensamos en números y palabras, pero existen formatos con especificaciones propias, como es el caso de los datos geoespaciales. Estos tutoriales describe los sistemas de coordenadas cartográficas.

 

 

OBTENER

Una vez identificados, obtener datos fáciles de procesar y analizar puede ser también una tarea compleja. Si no existen o están públicamente disponibles, es necesario generar los datos preguntando directamente a las personas o recabando información desde la calle.

 

Para ello puedes utilizar formularios en línea gratuitos como los de Google o Surveymonkey. Para recabar evidencia adicional a las respuestas de un formulario, incluyendo geolocalización (ei. longitud y latitud), fotografías, audios o videos, tanto en contextos con y sin acceso a Internet, existe Kobo. Una guía para su uso está en https://socialtic.org/blog/guia-kobo-levantamiento-comunitario-de-datos/

 

Para solicitar información pública existente pero no disponible, en algunos países y ciudades se deben realizar solicitudes de acceso a la información. Bajo una perspectiva periodística el capítulo "Su Derecho a la Información" nos brinda recomendaciones para realizar peticiones de acceso a la información.

 

Cuando los datos están en formatos cerrados o no procesables por máquinas, como el papel, algunos PDF o sitios web, se deben utilizar herramientas para la extracción de datos.

 

Para extraer datos de imágenes o digitalización de papel a través de mecanismos de reconocimiento de caracteres (OCR) puedes utilizar:

 

 

Para extraer datos desde PDF puedes utilizar:

 

 

Para extraer datos desde sitios web, puedes utilizar:

 

LIMPIAR

La limpieza de datos es necesaria para corregir errores, duplicaciones de valores, homologar formatos a columnas, eliminar caracteres indeseados, estandarizar categorías y unir o separar columnas. Conoce todo lo que debes saber sobre el origen, errores comunes, desconfiguración, formatos de fechas y numéricos, pruebas estadísticas de rutina para comprobar que tu base de datos es confiable a través de la Guía Quarz para la limpieza de datos.

 

Puedes limpiar datos utilizando funciones de hojas de cálculo. Aprende cómo buscar y reemplazar, filtrar y utilizar fórmulas sencillas para limpiar datos en la guía Introducción a la limpieza de datos con hoja de cálculo

 

Para tareas de limpieza más potentes y de mayor cantidad de datos, es recomendable utilizar Open Refine. Estos tutoriales describen la herramienta y te guían a través de sus funcionalidades:

 

 

ANALIZAR

El análisis de datos básicamente busca pedirle respuestas a “preguntas” que se les hacen a una base de datos. Para ello debemos aprovechar herramientas comunes como las hojas de cálculo, así como técnicas de estadística para saber todo lo que los datos "tienen que decir".

 

Los siguientes recursos nos guían en distintos niveles de análisis de datos:

 

 

 

 

 

 

 

 

 

 

 

Cuando analizamos datos geográficos, es importante conocer cómo hacer mapas. Esas guías nos facilitan aprender a hacer mapas y utilizar distintas herramientas:

 

 

 

 

ACCIONAR

El impacto de los análisis de los datos puede ser internos, tomando decisiones basadas en datos, o externos, influenciando a otras personas con mensajes basados en datos.

 

Para identificar las tácticas y elementos que componen la comunicación basada en datos se recomienda consultar estos recursos:

 

 

 

 

 

Existen muchas herramientas que permiten visualizar datos, incluyendo:

 

 

 

 

 

 

 

Y finalmente, la siguiente guía establece los elementos para evaluar el impacto de las visualizaciones de datos.

Small Data es un proyecto de SocialTIC.

Los contenidos están bajo una licencia de Creative Commons by-NC-SA 2.5 MX