Hoy tuvimos una charla muy interesante sobre Kaggle y Machine Learning, en la que se habló del proceso de competir prediciendo ventas.
La charla tuvo dos partes.
Presentación de Kaggle, de la competición Rossman y nociones básicas de cómo enfocarla
Javier Tejedor, con categoría de maestro en Kaggle hizo una presentación para introducir este sitio web de competiciones, así como el caso concreto de [Rossman y la predicción de ventas] (https://www.kaggle.com/c/rossmann-store-sales). En esa misma presentación nos contaba cómo enfocar este tipo de competiciones, con las estrategias a seguir en cuanto a validación, clave para alcanzar una puntuación alta en el “leaderboard”. Terminaba hablando sobre uno de los algoritmos más empleado, XGBoost.
Ejecución de código para preparar los datos y preparar submissions en la competición
A continuación, Javier nos demostró paso a paso, desde la carga de los datos iniciales hasta la preparación del archivo para hacer la submission. Incluso se hicieron varias submissions, algunas alcanzando un nivel aceptable tratándose de un modelo sencillo, sin stacking. Aquí se puede descargar el código de la preparación de datos Y aquí el de la modelización y la preparación de submissions
Si queréis ver el vídeo de esta magnífica presentación, podeís hacerlo en nuestro canal de Youtube Os dejamos el enlace al vídeo
Os esperamos en la siguiente, el próximo 8 de enero, en la que tendremos a nuestro experto Jerónimo Carranza, nuestro experto en Ciencia de Datos y GIS.
Hasta el próximo Meetup !!