Example of how to debiasing a model using adversarial approach. Based on Stijn Tonk
Explicación de la utilización de modelo Adversarial Basado en GAN para realizar debiasing de un modelo. El modelo original realiza predicciones de salario sesgadas por raza y sexo, visible mediante p%-rule (odds).
A través de un entrenamiento adversarial (explicado en profundidad en el notebook), se consigue des-sesgar el modelo con sólo una pequeña penalización en el rendimiento.
Clasificador original |
Clasificador des-sesgado |
|
---|---|---|
AUC | 0.9 | 0.82 |
Accuracy | 0.85 | 0.81 |
p%-rule sexo | 0.34 | 0.80 |
p%-rule raza | 0.45 | 0.99 |
Proceso ampliado, modificado, traducido y comentado de Fairness in ML - Stijn Tonk.
Se ha realizado traducción de explicaciones, adición de algunas explicaciones, comentarios en el código y alguna pequeña modificación en el mismo.
Añadido anexo explicativo de GAN.
-
Explicación en GoDataDriven
-
Notebook original en EQUILAGO, basado en UCBerkeley
-
Código originial en EQUILAGO
Bibliografía del anexo sobre GANs
-
Amini, A. (Enero de 2019). MIT 6.S191 (2019): Deep Generative Modeling. Obtenido de https://www.youtube.com/watch?v=yFBFl1cLYx8
-
Goodfellow, I. (9 de Diciembre de 2016). Introduction to Generative Adversarial Networks. NIPS 2016 Workshop on Adversarial Training. Barcelona. Obtenido de http://www.iangoodfellow.com/slides/2016-12-9-gans.pdf
-
Goodfellow, I. (2017 de Agosto de 24). Introduction to GANs, NIPS 2016 | Ian Goodfellow, OpenAI. Obtenido de https://www.youtube.com/watch?v=9JpdAg6uMXs
-
Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., . . . Bengio, Y. (2014). Generative Adversarial Networks. En Z. Ghahramani, & M. Welling, Advances in Neural Information Processing Systems 27 (págs. 2672-2680). Curran Associates, Inc. Obtenido de http://papers.nips.cc/paper/5423generative-adversarial-nets.pdf