Este website contiene el material para la materia Bases de Datos No Relacionales (o NoSQL para brevedad) para Ciencia de Datos.
Las BDs relacionales no son suficientes para contar toda la historia de un evento o de un objeto de negocio, de una orden, de un cliente, o de un envío. Frecuentemente la huella está dispersa en transacciones de una base de datos, visitas a unas páginas web, audios de atención a cliente, geolocalizaciones a lo largo de una ruta, texto libre en comentarios, grafos de redes sociales, y datos en memoria de los sistemas involucrados. Necesitamos saber interactuar con dichas bases de datos, y sobre todo, necesitamos poder consolidarlas en un repositorio central para lograr hacer analítica de todas las partes de la historia, sin dejar fuera ninguna fuente con la que corramos peligro de "quedar ciegos". En esta materia veremos como interactuar con dichas BDs no-relacionales (NoSQL = Not only SQL), y como construir dicho repositorio central.
En una frase, esta materia trata de consolidación de datos para contar una historia completa.
- 1er y único parcial individual: 60%
- 1er avance proyecto final: 20%
- 2o y último avance proyecto final: 20%
Tendrán un componente teórico y/o un componente práctico.
El componente práctico consistirá generalmente en uno de a) crear o alterar una BD, b) diseñar una BD, c) generar datos en una BD con una cierta forma, o d) generar un reporte analítico.
El componente teórico es un examen de opción múltiplemen la plataforma Socrative en el cual podrás sacar apuntes o usar una o varias de las plataformas que configuraremos a lo largo del semestre (PostgreSQL, DBeaver, VSCode, Anaconda, etc).
Será enteramente práctico y consistirá en el desarrollo de un proyecto integral con todo lo visto en el semestre. Daremos más detalles más adelante durante el curso.
Usen el el correo institucional ([email protected]) o Slack.
Pero preferentemente usen Slack.
Por Slack. Abajo las ligas de descarga:
Una vez que descarguen Slack, hagan click en esta liga para que sean automágicamente agregados a nuestro workspace.
Viernes de 8AM a 11AM.
La sesión 1 será por Zoom, en este link, y solo durará de 8 a 10.
A partir de la 2a sesión estaremos presenciales en el salón RHCC302 de 8 a 11.
Aquí en Github. Es importante que si nunca has usado Github, o algún otro sistema de control de versiones, leas esta guía para que no te agarren en curva y tengas de menos los fundamentos de estas plataformas.
- Document - MongoDB - Download
- Graph - Neo4J - Download
- Wide column - MonetDB - Download
- Data lake - AWS Lake Formation - Download
- Cuenta de AWS - Suministrada por mi
Dependiendo de como vengan de experiencia y las materias previas que hayan cursado, necesitarán:
Check back here often.
A continuación el temario, fecha por fecha: