Ver perfil

Salvy Data. Boletín 1. ¿Qué hacemos con nuestros archivos?

@SalvyData
@SalvyData
Salvy Data. Boletín 1. ¿Qué hacemos con los documentos de una investigación después de haberla publicado?

Este boletín es un espacio para compartir ideas y herramientas sobre el manejo de datos. Puedes ponerte en contacto si tienes preguntas o si quieres compartir datos e ideas. Este es mi correo salvydata@gmail.com y también puedes seguirme en Twitter @SalvyData.
Empecemos.
Salvy Data, la historia detrás del dato.
Salvy Data, la historia detrás del dato.
¿Las “3 R” funcionan con datos?
Voy a comparar mi experiencia con datos con las 3 R: reusar, reciclar y reducir. ¿Qué pasa con la información y los documentos que ya no ocupo después de publicar un artículo?
●   ¿Los guardo en un cajón del escritorio?
●   ¿Los almaceno en un disco duro o en google drive?
●   ¿Termina en el basurero?
●   ¿Comparto los documentos con otro colega?
Cuando hablo de las “3R” hablo de un propósito: la colaboración. También está relacionada con la búsqueda de herramientas que nos permitan almacenar, abrir datos y buscar de manera sencilla la información que acumulamos para que pueda ser útil para la comunidad. ¿Qué experiencias existen en las redacciones que aplican el reusar y reutilizar información? ¿Ha significado esta práctica reducir el tiempo de producción de artículos?
Empecemos hablando de los tipos de datos: los estructurados y los no estructurados. Los primeros son aquellos que están ordenados de tal manera que es sencillo extraer información y suelen formar parte de bases de datos. En cambio los no estructurados pueden ser fotos, documentos, correos, entre otros archivos, que no están resguardados bajo una lógica y cuya búsqueda puede tomar más tiempo.
Para hacer que la información pueda servir para generar conocimiento, algunas redacciones han implementado una tecnología conocida como gestores de documentos. Son programas donde puedes almacenar toda clase de documentos, que son transformados a través de un lector de "OCR” que reconoce texto -incluso en imágenes- y luego a través de un buscador como el de Google te permite buscar por palabras clave las páginas donde aparece un término de búsqueda que te interesa.
Imagina que tienes un documento de 1,000 páginas y quieres saber en qué página mencionan el nombre de una persona: el gestor de documentos te ayuda a encontrar esa página en segundos.
Puede que hace cinco años hayas concluido una investigación basada en un expediente administrativo y hayas dejado archivado ese documento en una librería virtual a la que tienen acceso tus compañeros. ¿Y si en ese documento hay información no publicada pero útil para la historia de un colega que está por publicar una historia? Ese el propósito de un gestor de documentos, servir como biblioteca de consulta.
Sin embargo, el uso de estas tecnologías tiene ventajas y desventajas.
Aleph
Esta herramienta fue desarrollada por OCCRP, una organización de periodistas de investigación de Europa del Este. Es útil para investigar corrupción transnacional ya que dispone de documentos de registros de empresas de un centenar de países, además de documentos de acceso público.
Ventaja:
●   Es gratis
●   Fácil de usar
●   Permite búsquedas por palabras clave
Desventaja
●   La versión pública de este gestor de documento no permite subir archivos de documentos que estemos trabajando. Lo cual puede limitarte.
Datashare
Es una herramienta del ICIJ, una organización de periodismo de investigación premiada con el Pulitzer por la investigación de los Papeles de Panamá. La herramienta cuenta con una base ya integrada que permite hacer búsqueda de empresas.
Ventajas:
●   Es una herramienta de software libre.
●   Puede descargarse en la computadora
●   Permite búsquedas rápidas a través de palabras claves
Desventajas:
●   Se necesita tener conocimientos mínimos de programación para correr el gestor de documentos de manera local en tu computadora.
Overview Docs
Esta herramienta permite cargar documentos, los “ocerea” (transforma de imagen a texto) y genera repositorios de documentos. Cuenta con un motor de búsqueda, que permite con palabras claves identificar palabras dentro de documentos.
Ventajas:
●   Es software libre
●   El “OCR” reconoce muy bien el texto en las imágenes y permite dividir documentos “PDF” de miles de páginas en archivos individuales.
Desventajas:
●   Es necesario contar con la ayuda de alguien que sepa de programación para correr el gestor de documentos en tu computadora o también para instalarlo en un servidor.
Pinpoint
Esta plataforma de Google te permite crear repositorios de documentos (incluidas imágenes y pdf) y permite hacer búsquedas inteligentes.
Ventajas:
  • Es muy útil si no tienes conocimientos previos de programación. No necesitas escribir comandos.
  • Te permite hacer “back up” de documentos que acumulas de coberturas previas y es una forma efectiva de organizar tu archivo.
  • Te permite trabajar en repositorios privados; crear repositorios públicos o también funciona con un google drive que te permite crear una lista de usuarios que tienen acceso a tus repositorios de documentos.
Desventajas:
  • A diferencia de otros gestores de documentos no te permite la extracción de texto de las páginas.
  • Si decides descargar todos los archivos del repositorio, debes hacerlo uno por uno. No tiene una opción para descargar la carpeta que contiene todos los archivos.
¿Te ha gustado? No
@SalvyData
@SalvyData @salvydata

Hay una historia detrás de cada dato y acá te ayudamos a buscar esas historias. Abrimos datos de Centroamérica. Puedes escribirme a salvydata@gmail.com

Para cancelar tu suscripción, haz clic aquí.
Si te han remitido este boletín y te ha gustado, puedes suscribirte aquí.
Created with Revue by Twitter.