Los 3 Principios Básicos De Una Empresa Basada En Datos

Daniel Morales
Feb 19, 2021

Los 3 Principios Básicos De Una Empresa Basada En Datos

Feb 19, 2021 8 minutes read

Los datos son a veces llamados el "nuevo petróleo", una fuente de riqueza recién descubierta que es extraída de las profundidades de los archivos corporativos y gubernamentales. Algunos contadores están tan entusiasmados con el valor potencial de los datos que los contabilizan de la misma manera que un activo físico.

Si bien es cierto que los datos pueden aumentar el valor de una organización, este recurso no tiene ningún valor intrínseco. Al igual que el petróleo, los datos necesitan ser extraídos y deben ser refinados con la calidad adecuada. Los datos necesitan ser transportados a través de las redes de información antes de que puedan ser utilizados para crear nuevo valor. El valor de los datos no está en la información en sí misma, sino que se produce durante las transformaciones que experimenta.

La analogía entre los datos y el petróleo es sólo parcialmente correcta en que los datos son un recurso infinito. Los mismos datos pueden ser utilizados muchas veces para un propósito a veces originalmente no deseado.

La capacidad de utilizar los datos para más de un objetivo es una de las razones por las que la ciencia de los datos ha ganado popularidad en torno a las mesas de trabajo. Los altos directivos están buscando formas de extraer valor de los llamados "datos oscuros". Los científicos de datos utilizan estas fuentes de datos olvidadas para crear nuevos conocimientos, tomar mejores decisiones y generar innovaciones.

Zbynek Burival - Unsplash


La pregunta que surge de esta introducción es cómo manejar y analizar los datos para que se conviertan en un recurso valioso. Presentaremos un modelo normativo para crear valor a partir de los datos utilizando tres principios básicos derivados de la arquitectura. 

Este modelo es útil para los científicos de datos como una comprobación interna para asegurar que sus actividades maximizan el valor. Los administradores pueden utilizar este modelo para evaluar los resultados de un proyecto de ciencia de datos sin tener que entender las complejidades matemáticas del data science.

Los 3 Principios Básicos De Una Empresa Basada En Datos

Aunque la ciencia de datos es una actividad por excelencia del siglo XXI, para definir una buena ciencia de datos, podemos inspirarnos en un arquitecto e ingeniero romano que vivió hace dos mil años.

Vitruvius es inmortalizado a través de su libro "About Architecture", que inspiró a Leonardo Da Vinci a dibujar a su famoso hombre de Vitruvio. Vitruvio escribió que un edificio ideal debe exhibir tres cualidades: utilitas, firmitas y venustas, o utilidad, solidez y estética.

Vitruvius en Data Science



Los edificios deben tener utilidad para que puedan ser utilizados para su propósito. Una casa debe ser funcional y cómoda; un teatro debe ser diseñado para que todos puedan ver el escenario. Cada tipo de edificio tiene sus requisitos funcionales.

En segundo lugar, los edificios deben ser sólidos en el sentido de que sean lo suficientemente firmes para soportar las fuerzas que actúan sobre ellos. Por último, los edificios deben ser estéticos. En palabras de Vitruvio, los edificios deben parecerse a Venus, la diosa romana de la belleza y la seducción.

Las reglas de Vitruvio para la arquitectura también pueden aplicarse a los productos de la ciencia de datos. (Lankow, J., Ritchie, J., & Crooks, R. (2012). Infografía: El poder de la narración visual. Hoboken, N.J: John Wiley & Sons, Inc

La ciencia de  datos necesita tener utilidad; necesita ser útil para crear valor. El análisis debe ser sólido para que se pueda confiar en él. Los productos de la ciencia de datos también deben ser estéticos, con el fin de maximizar el valor que proporcionan a una organización, como se muestra

1- La Utilidad en la Ciencia de Datos

Markus Spiske - Unsplash


¿Cómo sabemos que algo es útil? La respuesta simple, pero no muy esclarecedora, es que cuando algo es útil, tiene utilidad. Algunos filósofos interpretan la utilidad como la capacidad de proporcionar el mayor bien para el mayor número de personas. Esta definición es bastante convincente, pero requiere contextualización. Lo que es correcto en una situación puede no ser tan beneficioso en otra.

Para que una estrategia de ciencia de datos tenga éxito, debe facilitar los objetivos de la organización. Los científicos de datos son oportunistas en el enfoque que utilizan para resolver problemas. El perspectivismo implica que los mismos datos pueden ser utilizados para diferentes cuestiones, dependiendo de la perspectiva que se adopte sobre la información disponible y el problema en cuestión.

Después de digerir un informe de investigación o de ver una visualización, los administradores deben preguntarse: "¿Qué es lo que hago diferente hoy en día como resultado?" La utilidad en la ciencia de los datos depende de la capacidad de los resultados para que los profesionales puedan influir positivamente en la realidad. En otras palabras, el resultado de la ciencia de los datos debería consolar a la administración en el sentido de que los objetivos se han cumplido o proporcionar ideas prácticas para resolver los problemas existentes o prevenir los futuros.

2- La Solidez en la Ciencia de Datos

Creating a Data-Driven Organization


Al igual que un edificio debe ser sólido y no derrumbarse, un producto de datos debe ser sólido para poder crear valor comercial. La solidez es donde la ciencia y los datos se encuentran. 

La solidez de un producto de datos se define por la validez y la fiabilidad del análisis, que son principios científicos bien establecidos como se muestra en la siguiente figura. La solidez de la ciencia de los datos también requiere que los resultados sean reproducibles. Por último, los datos, y el proceso de creación de productos de datos, deben ser gobernados para asegurar resultados beneficiosos.

La diferencia que distingue a las formas tradicionales de análisis de negocios y la ciencia de  datos es el enfoque sistemático para resolver los problemas. La palabra clave en el término ciencia de los datos no es, pues, datos, sino ciencia. La ciencia de los datos sólo es útil cuando los datos responden a una pregunta útil, que es la parte científica del proceso. 

Este enfoque sistemático garantiza que los resultados de la ciencia de datos sean fiables para decidir cursos de acción alternativos. La ciencia de datos sistemáticos utiliza los principios de la investigación científica, pero su enfoque es más pragmático. 

Mientras que los científicos buscan verdades generales para explicar el mundo, los científicos de los datos buscan pragmáticamente resolver los problemas. Los principios básicos que sustentan este enfoque metódico son la validez, la fiabilidad y la reproducibilidad de los datos, los métodos y los resultados.

3- La Estética en la Ciencia de datos

Ugur Peker - Unsplash


Vitruvio insistió en que los edificios, o cualquier otra estructura, debían ser hermosos. La estética de un edificio causa más que una simple sensación agradable. Los lugares diseñados arquitectónicamente estimulan nuestro pensamiento, aumentan nuestro bienestar, mejoran nuestra productividad y estimulan la creatividad.

Aunque es evidente que los edificios deben ser agradables a la vista, la estética de los productos de datos podría no ser tan obvia. El requisito de la ciencia de datos estéticos no es un llamado al embellecimiento y la ofuscación de los feos detalles de los resultados.

El proceso de limpieza y análisis de los datos es inherentemente complejo. Presentar los resultados de este proceso es una forma de contar historias que reduce esta complejidad para asegurar que un producto de datos sea comprensible.

La cadena de valor de la ciencia de los datos comienza con la realidad, descrita por los datos. Estos datos se convierten en conocimiento, que los administradores utilizan para influir en la realidad para alcanzar sus objetivos. Esta cadena que va de la realidad al conocimiento humano contiene cuatro transformaciones, cada una de ellas con oportunidades de pérdida de validez y fiabilidad.

El último paso de la cadena de valor requiere que el usuario de los resultados de la ciencia de datos interprete la información para sacar la conclusión correcta sobre su futuro curso de acción. La reproducibilidad es uno de los instrumentos para reducir al mínimo la posibilidad de una interpretación errónea de los análisis. Otro mecanismo para asegurar una interpretación adecuada es producir una ciencia de datos estética.

La estética en la ciencia de datos consiste en crear un producto de datos, que puede ser una visualización o un informe, diseñado para que el usuario saque conclusiones correctas. Un gráfico desordenado o un informe incomprensible limita el valor que se puede extraer de la información. 

Estaremos hablando más en detalle sobre cada uno de estos en proximas entrada, te esperamos!
Join our private community in Discord

Keep up to date by participating in our global community of data scientists and AI enthusiasts. We discuss the latest developments in data science competitions, new techniques for solving complex challenges, AI and machine learning models, and much more!