¿Cuáles Son Los Resultados Que Se Esperan De Un Proyecto de Data Science?

Daniel Morales
Jun 11, 2021

¿Cuáles Son Los Resultados Que Se Esperan De Un Proyecto de Data Science?

Jun 11, 2021 5 minutes read

Desde la perspectiva de una empresa, los proyectos de data science deben tomarse siempre como experimentos. Recuerden que estamos hablando de ciencia, y la ciencia basa muchas de sus teorías con base en los resultados de una serie de experimentos. Desde aquí, muchas empresas empiezan con las asunciones erróneas, pensando que los resultados son ciencias exactas, de las cuales debe haber una respuesta única y verdadera. 

La realidad es que muchos de los proyectos de data science fracasan es por la falta de iteración que hace falta una vez se obtienen los primeros resultados, y porque no se adopta una mirada científica al proceso, o sea una mirada experimental. Pero cuáles son esos resultados que se esperan? Pues bien, los resultados más comunes esperados de un proyecto de data science son:

  1. APIs
  2. Integraciones
  3. Aplicaciones y/o Plataformas
  4. Reportes
  5. Presentaciones


1-  APIs



Las APIs son un conjunto de subrutinas, funciones y procedimientos (o métodos, en la programación orientada a objetos) que ofrece cierta biblioteca para ser utilizado por otro software como una capa de abstracción. 

Esto suena un poco confuso, pero es más fácil de lo que parece. Se trata de código que puede ser compartido entre máquinas. Aquí las peticiones no las hace un usuario desde un navegador, sino que las hace un programa a otro programa, y el resultado son trozos de código que luego pueden ser leídos y tratados. 

Las APIs es la forma más común de resultado esperado por una empresa que pretende desarrollar un proyecto de data science, hablando específicamente de modelos predictivos, ya que permite integrar fácilmente la solución dentro de los actuales programas internos de la empresa, sin necesidad de preocuparse por una integración profunda, o por la incompatibilidad de lenguajes de programación, de dispositivos o de sistemas internos. 

Es así como una empresa que tiene una fuerte presencia web, IoT, o móvil, puede usar inmediatamente una solución de data science sin la necesidad de invertir grandes recursos. 

Los requerimientos una API, como resultado esperado de un experimento de data science son:
  • Páginas de ayuda o documentación bien escrita, entendible y reproducible
  • El código debe estar bien documentado
  • El código debe estar controlado por versiones

2- Integraciones



Las integraciones son un poco más complejas desde el punto de vista técnico, ya que se trata de integrar una solución dentro de los sistemas actuales de la empresa. 

Así, si por ejemplo todo el desarrollo actual web se ha realizado en Java, y la solución de machine learning fue entregada en Python, el equipo de ingeniería de software tendrá que ingeniárselas para integrar ambos lenguajes dentro del stack, sea por medio de Microservicios internos u otras técnicas de acoplamiento de aplicaciones. Ni hablar si la empresa tiene un stack monolítico. Si este último es el caso, debería optar por una API. 

3- Aplicaciones y Plataformas



Otra solución común, es crear un servicio externo, y completamente diferente al servicio principal de la empresa. Aquí se busca hostear el servicio en un dominio diferente, donde el objetivo es acceder solo para obtener los resultados del modelamiento predictivo. Esto es común para las empresas que usan ingeniera como marketing, haciendo programas predictivos para sumar leads a su pipeline de prospectos. 

Los requerimientos para estas aplicaciones y páginas web, como resultado esperado de un experimento de data science son:
  • Facilidad de uso de la herramienta
  • Páginas de ayuda o documentación
  • El código debe estar bien documentado
  • El código debe estar controlado por versiones


4- Reportes



Aquí ya no estaríamos hablando de modelos predictivos, sino de data análisis en general. El resultado más común y esperado es un reporte o serie de reportes donde se espera entender los datos históricos, el porqué de los resultados históricos y las conclusiones de los mismos. 

Generalmente están llenos de datos estadísticos útiles para la toma de decisiones. Sirven para los comités de gerencia, marketing o recursos humanos. Existen muchos formatos para ello, pero lo ideal sería no solamente presentar el reporte, sino tener la oportunidad de hacer una presentación y contar una historia sobre dichos datos. 

Lo ideal es que los reportes que se le entreguen estén
  • Claramente redactados
  • Incluyan una narración en torno a los datos
  • Creación de un conjunto de datos analíticos
  • Análisis
  • Graficos claros, e incluso interactivos
  • Conclusiones concisas
  • Omitir detalles innecesarios
  • Reproducible

5- Presentaciones




En las presentaciones, es donde los data scientists cuentan historias con los datos. Se espera un informe detallado pero concluyente sobre los datos históricos para la toma de decisiones. Esto ayuda a cualquier área de la empresa, y puede ser presentado en cualquier comité empresarial. 

Los mismos criterios exactos para las presentaciones:
  • Claridad:
  • Incluyan una narración en torno a los datos
  • Creación de un conjunto de datos analíticos
  • Análisis
  • Conclusiones concisas
  • Graficos claros, e incluso interactivos
  • Omitir detalles innecesarios
  • Reproducible


Conclusion


Como podemos ver existen varios tipos de resultados cuando esperamos ejecutar un proyecto de data science. Vemos la importancia de tener los objetivos claros, lo que podemos lograr, pero lo más importante de todo: tomar el proyecto como un experimento, no como una solución mágica a todos nuestros problemas. 
Join our private community in Discord

Keep up to date by participating in our global community of data scientists and AI enthusiasts. We discuss the latest developments in data science competitions, new techniques for solving complex challenges, AI and machine learning models, and much more!