11 Alternativas a Kaggle en Competiciones de Data Science

Daniel Morales
Jun 25, 2021

11 Alternativas a Kaggle en Competiciones de Data Science

Jun 25, 2021 8 minutes read

Las competiciones en data science son un campo muy particular del machine learning aplicado, o de lo que comúnmente se conoce como AI aplicada. Desde el punto de vista de un data scientist, tiene la particularidad de simular un ambiente real para la solución de un problema de machine learning. Desde el punto de vista de una empresa tiene la particularidad de resolver un problema de forma colaborativa (siguiendo la sabiduría de las masas) y obteniendo los beneficios derivados de ella: como el benchmark, nuevas ideas, diferentes soluciones. 

Como mencionamos en un blog post anterior acerca de las competiciones en data science, hace un tiempo nacieron varias plataformas entre las cuales se encuentra Kaggle y en las cuales las empresas grandes de tecnología de Silicon Valley e incluso Multinacionales tratan de solucionar problemas realmente complejos con la ayuda de personas externas, por medio de algo llamado “competiciones en data science”. 

Esto se daba ya que el talento interno no podía solucionar estos problemas, ya que no tenían el tiempo, los recursos o las capacidades. Obviamente se trataba de problemas realmente complejos.

Estas plataformas de competiciones en data science le permiten a la empresa acceder a un pool de talento global de especialistas en data science que iban desde PHDs hasta autodidactas que se lanzaban en la aventura de solucionar el reto planteado por la empresa que patrocina una competición. 

Los premios obviamente son exorbitantes, donde incluso Netflix llegó a pagar 1 millones de dólares por una solución de machine learning. 

Patrocinar una competición allí tiene una inversión que oscila entre los $20.000 USD y los $100.000 USD en promedio. Un lujo que solo pueden permitirse las grandes tecnológicas (o las multinacionales). 

Y las startups? Pues bien, a menos que hayas levantado una Serie B o una Serie C, quizás puedas permitirte el lujo de patrocinar una competición de $20.000 USD, o incluso tener un equipo interno de data scientists que te ayude a experimentar o a resolver un problema con machine learning. 

Pero ¿qué pasa con las empresas que están en etapa más temprana y no tienen estos fondos o ese talento interno? Es por ello que hemos dedicado este blog post, para mostrar otras opciones de patrocinio de competiciones en data science


1- DataSource.ai



Objetivos de la empresa: Startups y PYMES
Tipo de concursos: Premios en metálico
Sistema de concurso: Normalmente cada concurso dura 2-3 meses
Promedio de concursos abiertos por mes: 1
Media de premios en dinero: Desde $3.000 dólares en adelante

El enfoque de esta plataforma es democratizar las competiciones en data science. Otras plataformas de competiciones en data science están enfocadas en empresas muy grandes, en premios muy altos y en problemas muy complejos. 

Esto se traduce en competiciones que solo pueden ser pagadas por empresas con bolsillos profundos, competiciones que tardan meses en completarse, y que están hechas para data scientists y equipos “super-senior”. 

Al fin de cuentas patrocinar una competición de $20.000 USD (o 1 millón de USD) no es para todo tipo de empresas. 

Por ello decidieron re-pensar la forma en que están construidas las competiciones en data science y decidimos enfocarnos en startups de cualquier tamaño y de cualquier parte del mundo, que puedan pagar competiciones acordes a un presupuesto de startup, que no tomen tanto tiempo en ser resueltas (8 semanas), que puedan lanzar más de una, dos o tres competiciones (porque lo pueden pagar) y en las cuales puedan participar todo tipo de talento en data science, de cualquier nivel y desde cualquier parte del mundo. 


2- Numerai



Objetivos de la empresa: Finanzas, Criptografía
Tipo de concursos: Criptopremios
Sistema de concurso: Continuo
Promedio de concursos abiertos por mes: Continuo

En el Torneo Numerai se construyen modelos de aprendizaje automático sobre datos financieros abstractos para predecir el mercado de valores. Tus modelos pueden ser apostados con la criptomoneda NMR para ganar recompensas basadas en el rendimiento. Los modelos apostados de Numerai se combinan para formar el Meta Modelo que controla el capital del fondo de cobertura de Numerai en el mercado de valores global. 

Aquí las empresas no pueden patrocinar competiciones, Numerai es el mismo patrocinador y es quien entrega los premios


3- International Data Analysis Olympiad (IDAHO)




Objetivos de la empresa: Hecho por Yandex solamente
Tipo de concursos: Premio en dinero y prácticas
Sistema de concursos: Suele durar 1 año cada concurso
Promedio de concursos abiertos por año: 1
Cantidad media de premios: 10.000 dólares


IDAHO es una competición anual organizada por la Escuela Superior de Economía y Yandex. Este evento está abierto a todos los equipos y personas, ya sean estudiantes de grado, posgrado o doctorado, empleados de empresas, investigadores o nuevos científicos de datos.





4- DrivenData




Objetivos de la empresa: Empresas sociales
Tipo de concursos: Premio en dinero y Kudos
Sistema de concurso: Suele durar entre 2 y 4 meses cada concurso
Promedio de concursos abiertos por mes: 2
Media de premios en metálico: 17.000 dólares


DrivenData aporta prácticas de vanguardia en ciencia de datos y crowdsourcing a algunos de los mayores retos sociales del mundo y a las organizaciones que los asumen


5- CodaLab






Objetivos de la empresa: Empresas sociales y grandes empresas
Tipo de concursos: Conocimiento
Sistema de Competición: Suele durar entre 3 y 6 meses cada concurso
Promedio de concursos abiertos por mes: 1
Media de premios: Casi todos son de conocimiento 

Plataforma de código abierto Codalab para la investigación computacional. Los concursos se celebran en aras de la investigación colaborativa y la prueba de códigos.


6- DataHack & DSAT



Objetivos de la empresa: Empresas sociales y grandes empresas
Tipo de concursos: Kudos
Sistema de concursos: Normalmente cada concurso dura entre 2 y 4 meses
Promedio de concursos abiertos por mes: 1
Premio medio en metálico: Todos son hackathons sin premio final 

Esta plataforma básicamente te permite competir con los mejores del mundo en problemas de ciencia de datos de la vida real, aprender trabajando en problemas del mundo real, mostrar tu experiencia y ser contratado en las mejores empresas, construir tu perfil, y estar en la cima de las competiciones y ganar premios lucrativos



7- Machine Hack



Objetivos de la empresa: Empresas sociales y grandes empresas
Tipo de concursos: Premio en dinero y Kudos, Entrevistas
Sistema de concursos: Normalmente cada concurso dura entre 2 y 4 meses
Promedio de concursos abiertos por mes: 1
Media de premios en metálico: Todos son hackathons sin premio final 


Machine Hack es una plataforma online para competiciones de Machine Learning. En Machine Hack, tienes la oportunidad de probar y practicar tus habilidades de ML. En esta plataforma, tienes la oportunidad de competir contra cientos de científicos de datos, con nuestros Hackathons curados por la industria.  


8- Tianchi




Objetivos de la empresa: Grandes empresas
Tipo de concursos: Premio en dinero y Kudos
Sistema de concursos: Suele durar entre 3 y 6 meses cada concurso
Promedio de concursos abiertos por mes: 1
Media de premios en metálico: 100.000 dólares


Tianchi es una comunidad de crowdsourcing de científicos de datos globales que organiza competiciones de big data en varias industrias. Esta competición de big data tiene premios millonarios y casos de prueba de negocios reales. Tienes la oportunidad de competir contra las élites de la IA de todo el mundo.


9- KDD Cup


Objetivos de la empresa: Organizado por ACM Special Interest Group
Tipo de concursos: Premio en metálico
Sistema de competición: Suele durar 1 año cada concurso
Promedio de concursos abiertos por mes: 1
Cantidad media de premios: 12.000 dólares



Es el concurso anual de minería de datos y descubrimiento de conocimientos organizado por el ACM Special Interest Group on Knowledge Discovery and Data Mining, la principal organización profesional de mineros de datos. En la mayoría de los años hay archivos anuales que incluyen conjuntos de datos, instrucciones y ganadores.


10- vizdoom




Objetivos de la empresa: Organizado por VIZDOOM
Tipo de concursos: Premio en dinero
Sistema de concurso: Suele durar 1 año cada concurso
Promedio de concursos abiertos por mes: 1
Media de premios en metálico: No se aplica


VIZDOOM permite desarrollar robots de IA que juegan a DOOM utilizando la información visual (el buffer de la pantalla).


11- Crowd AnalytiX



Objetivos de la empresa: Empresas medianas
Tipo de concursos: Premio en dinero y Kudos
Sistema de concurso: Normalmente cada concurso dura entre 2 y 4 meses
Promedio de concursos abiertos por mes: 1
Media de premios en metálico: 7.000 dólares

Los expertos en datos colaboran y compiten para construir y optimizar algoritmos de IA, ML, NLP y Deep Learning


Conclusion

Si eres un data scientists, definitivamente tendrás muchas opciones de aprendizaje y participacion. Pero asegurate de que tambien puedas tener una verdadera posibilidad de ganar!

Si eres una empresa y estas pensando en solucionar un problema de data science, no dudes en tomar la decision por el mejor!

Join our private community in Discord

Keep up to date by participating in our global community of data scientists and AI enthusiasts. We discuss the latest developments in data science competitions, new techniques for solving complex challenges, AI and machine learning models, and much more!