TL;DR Vamos a dedicar un día a crear o adaptar recursos léxicos en español para generación de lenguaje.
¡Lingüinis del mundo! Se acerca el NaNoGenMo y queremos darle el pistoletazo de salida mejorando los recursos léxicos para generación de lenguaje disponibles en español.
El NaNoGenMo es una iniciativa para pasarse noviembre escribiendo código que genere literatura. Es una iniciativa a imagen del NaNoWriMo, que dedica noviembre a escribir literatura de la forma tradicional.
Para poder escribir código que genere literatura se necesitan ciertos recursos, como listados de palabras y así. Nos mola mucho el repositorio corpora de Darius Kazemi, que contiene listados de libros, comidas, etc., así que vamos a ir copiando su contenido a este repo, adaptándolo y localizándolo al español, fichero a fichero, como ayuda a todos aquellos que quieran dedicar su NaNoGenMo a generar literatura en español.
El domingo 1 de noviembre durante todo el día: conéctate el rato que puedas o llévate el Día de Todos los Corpus hasta la sopa, ¡organízate como quieras!
Tienes instrucciones detalladas en el fichero de instrucciones para constribuir.
Además nos estaremos coordinando en nuestro Discord, así que te invitamos a entrar. Allí podemos repartirnos tareas, socializar y aportar sugerencias. Puedes unirte desde este enlace.
Después, recopilaremos en un listado todas las contribuciones para visualizar cuánto se ha avanzado.
Aunque no sepas programar, ¡puedes aportar! Los ficheros JSON tienen un formato muy sencillito e intuitivo, así que el trabajo real es el de adaptar listas de vocabulario. Además, la propia interfaz de Github permite editar texto plano más o menos igual que en Wikipedia. Y en nuestro Discord habrá mentores que estarán encantados de ayudar a quien tenga dudas o problemas. ¡Tú pásate a preguntar! No lo dudes y anímate a poner tu granito de arena.
Puedes reservarte un fichero (para evitar pisarnos y trabajar repetido) pidiéndotelo en esta hoja de tareas.