Skip to content
@argendatafundar

argendata.fundar

Argentina, entenderla para transformarla

     

Argendata es un proyecto de gran escala a través del cual Fundar apuesta a crear un sitio de referencia en lo que concierne a datos sobre Argentina. En línea con las principales premisas de Fundar, tiene como objetivo aportar conocimiento e incidir en la conversación pública a partir de la evidencia, y a través de un riguroso proceso de generación de contenidos y gestión de datos.

Sobre los datos

El trabajo de recopilación, gestión y puesta a disposición de datos en Argendata se basa en tres pilares que enmarcan las acciones, herramientas y procesos: transparencia y reproducibilidad, calidad de datos y armonización.

  • Administración de recursos: desarrollo y mantenimiento de estándares y programas para facilitar la gestión, control y posprocesamiento de datos elaborados por investigadores con el objetivo de minimizar la distancia entre procesos de investigación individuales y la necesidad de contar con información armonizada y coherente.

  • Control de calidad y reportes: programas que permiten realizar consultas sistemáticas sobre la calidad de los datos, de acuerdo a los estándares del proyecto.

  • Armonización del código fuente: gestión de programas y flujos de trabajo para administrar de manera armónica el proceso de generación de datos, con el objetivo de procurar la reproductibilidad y actualización en el tiempo.

A su vez, las diferentes acciones de la gestión de datos están directamente vinculadas al proceso más amplio de generación de contenido de Argendata. Esto implica, por un lado, la interacción con las y los investigadores durante la etapa de generación de datos, y por otro lado, la búsqueda para estandarizar y armonizar, tanto datos como procesos.

Más concretamente, los datos publicados en Argendata salen de un proceso de trabajo de varias etapas. Estas son:

  • la generación de contenido por parte de investigadores (que incluye el procesamiento de datos, instrucciones o código para su generación y la narrativas asociada a cada ítem o gráfico)

  • la armonización de las instrucciones o código que generan los datos (incluyendo tanto el acceso a fuentes como el procesamiento de las mismas)

  • la transformación de datasets que serán utilizados por el Frontend para generar las visualizaciones.

En este espacio se disponibilizan las herramientas con las que abordamos cada una de las tareas antes reseñadas:

Tiene como objetivo principal dar estructura organizativa al proyecto para simplificar los procesos de creación y ejecución de controles sobre los conjuntos de datos. Este programa permite tanto la administración del sistema de archivos compartido como la interacción para el QA entre investigadores y el equipo de datos durante el proceso de generación de datos.

El repositorio contiene un diccionario de entidades geográficas normalizado para el uso de Argendata.

El proyecto procura la armonización del proceso de generación de datos: Explorar, Transformar y Cargar (ETL, por sus siglas en inglés). El flujo de trabajo acá definido procura reducir la fricción de la actualización de datos, automatizando siempre que sea posible los pasos ejecutados por las y los investigadores de cada tópico. Desde la descarga de fuentes crudas, los procesos de limpieza y la generación de conjuntos de datos necesarios para las visualizaciones.

Un paquete de R con un conjunto de funciones auxiliares del proceso de ETL que procuran facilitar el flujo de trabajo con fuentes y outputs.

En este repositorio se comparten los datasets definitivos agrupados por tópicos. Se disponibilizan para la descarga desde el sitio web de Argendata.

Biblioteca para Python que busca facilitar la escritura, ejecución, reproducibilidad y el versionado del código fuente que se realice para manipular datos estructurados. Forma parte del conjunto de herramientas de Argendata para el análisis y procesamiento de datos manual-asistidos. Tiene como principal objetivo formatear los datos según las necesidades del código utilizado por Frontend para las visualizaciones.

En este repositorio se comparten los scripts de Python que funcionan como “recetas” para la transformación de recursos de data para llevarlos al formato requerido por Frontend para la visualización.

Popular repositories Loading

  1. data data Public

    Repositorio de datos públicos de argendata

    7 2

  2. geonomencladores geonomencladores Public

    geonomenclador Argendata

    HTML 1

  3. qa qa Public

    Control de calidad de datos

    Python 1

  4. etl etl Public

    Explorar, Transformar y Cargar - Armonización del proceso de generación de datos

    R 3

  5. argendataR argendataR Public

    Librería de R para ETL de argendata

    R 1

  6. data-transformers data-transformers Public

    Extensión sintáctica de Python para generar transformaciones automatizables

    Python

Repositories

Showing 8 of 8 repositories
  • etl Public

    Explorar, Transformar y Cargar - Armonización del proceso de generación de datos

    argendatafundar/etl’s past year of commit activity
    R 0 3 1 0 Updated Nov 15, 2024
  • transformers Public

    Recetas ejecutables de data-wrangling para generar CSVs listos a ser graficados.

    argendatafundar/transformers’s past year of commit activity
    Python 0 1 0 0 Updated Nov 11, 2024
  • data Public

    Repositorio de datos públicos de argendata

    argendatafundar/data’s past year of commit activity
    7 2 0 0 Updated Nov 7, 2024
  • argendataR Public

    Librería de R para ETL de argendata

    argendatafundar/argendataR’s past year of commit activity
    R 0 CC-BY-4.0 1 3 0 Updated Nov 3, 2024
  • .github Public
    argendatafundar/.github’s past year of commit activity
    0 0 0 0 Updated Oct 25, 2024
  • qa Public

    Control de calidad de datos

    argendatafundar/qa’s past year of commit activity
    Python 0 1 28 0 Updated Aug 20, 2024
  • data-transformers Public

    Extensión sintáctica de Python para generar transformaciones automatizables

    argendatafundar/data-transformers’s past year of commit activity
    Python 0 0 1 0 Updated Jul 17, 2024
  • geonomencladores Public

    geonomenclador Argendata

    argendatafundar/geonomencladores’s past year of commit activity
    HTML 1 0 0 0 Updated Jul 17, 2024

People

This organization has no public members. You must be a member to see who’s a part of this organization.

Top languages

Python R HTML

Most used topics

Loading…