¿Cómo Crear su Equipo de Análisis de Datos?

Louise de Leyritz
Aug 28, 2021

¿Cómo Crear su Equipo de Análisis de Datos?

Aug 28, 2021 20 minutes read

Revisado por Kat Holmes — Data Director ITV

A medida que las empresas reconocen el poder decisivo de los datos para alcanzar los objetivos empresariales, la mayoría espera poner los datos en el asiento del conductor de sus estrategias de negocio y de producto. Esto implica reunir un equipo de datos sólido que pueda propagar eficazmente sus conocimientos en las diferentes áreas de la empresa. Por desgracia, no es una tarea fácil.

Para estar realmente orientadas a los datos, las empresas deben crear tres capacidades: estrategia de datos, gobernanza de datos y análisis de datos.


3 pilares para las empresas basadas en datos - Imagen de Pitch

Estrategia
: La estrategia de datos es la hoja de ruta de su organización para utilizar los datos para alcanzar sus objetivos. Requiere una clara comprensión de las necesidades de datos inherentes a la estrategia empresarial. ¿Por qué se recogen datos? ¿Intenta ganar dinero, ahorrar dinero, gestionar el riesgo, ofrecer una experiencia excepcional al cliente, o todo lo anterior?

Gobernanza: La gobernanza de los datos es un conjunto de procesos, funciones, políticas, normas y métricas que garantizan el uso eficiente de la información para que su organización alcance sus objetivos. Una estrategia de gobierno de datos bien elaborada garantiza que los datos de su empresa sean fiables, precisos y estén disponibles.

Analítica: El término "análisis de datos" se refiere al proceso de análisis de datos en bruto para sacar conclusiones sobre la información que contienen. Por lo general, las personas involucradas en el análisis de datos en una organización son ingenieros de datos, analistas de datos y científicos de datos.

En última instancia, su capacidad para aprovechar los datos dependerá de estos tres pilares. Si está leyendo esto y se da cuenta de que su organización no posee ninguno de ellos, no se preocupe. Para eso estamos aquí. Un buen punto de partida es crear un equipo de análisis sólido, que esté estrechamente vinculado a los objetivos estratégicos de su empresa. Es el primer pilar de su organización de datos, y el tema central del artículo.

A la hora de crear un equipo de análisis de datos, los responsables de datos suelen plantearse las siguientes preguntas:
  • ¿Qué tamaño debe tener este equipo?
  • ¿Cuántos ingenieros de datos, analistas de datos, científicos de datos?
  • ¿Cómo interactúa el equipo con el resto de la organización?
  • ¿Qué estructura debe tener el equipo de datos? ¿Centralizada o integrada?

Tienen razón; tener un equipo de datos fuerte ya no es un lujo, sino que es esencial para la propia supervivencia de una empresa hoy en día.

Pero empecemos por lo básico.


¿En qué punto de su viaje de datos se encuentra?


Antes de crear un equipo de datos, es importante que te des cuenta de dónde estás en tu "viaje de datos", porque esto afectará directamente a la estructura de tu equipo. Por ello, esta parte está dedicada a una evaluación simplificada de la madurez de los datos. Cuidado, el tamaño de la empresa y la madurez de los datos son dos cosas diferentes. Tu organización puede ser grande pero inmadura a nivel de datos.

La madurez de los datos es el camino hacia la obtención de un valor tangible de sus activos de datos. Proponemos un marco sencillo de evaluación de la madurez de los datos, en el que se mide su capacidad para comprender su pasado, conocer su presente y predecir su futuro. ¿Qué quiero decir con esto?

Bueno, en la mayoría de las empresas cada departamento tiene su propio conjunto de KPI que apoyan la ejecución de la estrategia corporativa. No basta con definirlos, sino que hay que hacer un seguimiento claro de los mismos, y también hay que tener la capacidad de predecir los resultados futuros con respecto a estos KPI. Esta capacidad se basa en un conocimiento claro de su presente, que, a su vez, se basa en una sólida comprensión del pasado. Si hace esto, habrá encontrado una forma sencilla de evaluar la madurez de sus datos. Por ejemplo, si no es capaz de identificar los impulsores de los ingresos de su empresa (su pasado), significa que necesita trabajar en su madurez de datos aportando visibilidad a su negocio antes de intentar predecir los resultados futuros. No recomendamos saltarse los pasos. Es como la jerarquía de necesidades de Maslow, pero para los datos.


Jerarquía de necesidades de datos - Imagen de Louise de Leyritz

Veamos un par de ejemplos prácticos:

El retorno de la inversión en marketing. Defina su ROI, a través de múltiples canales, utilizando un modelo de atribución identificado. A continuación, comprenda su evolución en los 12 meses anteriores y, sobre todo, sus impulsores (identifique los canales que rinden, la época del año, el producto, ....). A continuación, realice un seguimiento diario/semanal/mensual de su evolución gracias a una herramienta de generación de informes en la que confíe ("presente"). Prevea su presupuesto de marketing basándose en estos modelos predictivos ( futuro).

Satisfacción del cliente. Defina su medida de satisfacción del cliente. ¿Es NPS, CSAT? Todo el mundo en su empresa debería compartir un entendimiento común sobre cómo se calcula. Al igual que en nuestro ejemplo anterior, calcule su evolución en los 12 meses anteriores, encuentre sus impulsores (pasado). A continuación, realice un seguimiento diario de la satisfacción de sus clientes con cuadros de mando de confianza. Identifique las acciones que debe emprender desde hoy para aumentarla. Su comprensión del pasado y del estado actual de la satisfacción de los clientes le permitirá predecir eficazmente la pérdida de clientes (futuro).

Comprender el pasado y el presente se conoce comúnmente como realizar análisis descriptivos. La analítica descriptiva ayuda a una organización a entender su rendimiento proporcionando un contexto para ayudar a los principales interesados a interpretar la información. Este contexto suele presentarse en forma de visualización de datos, incluyendo gráficos, cuadros de mando, informes y tablas. Cuando se analizan los datos para pronosticar el futuro, se está realizando un análisis predictivo. La idea de la analítica predictiva es tomar los datos históricos e introducirlos en un modelo de aprendizaje automático que tenga en cuenta los patrones clave. Aplicar este modelo a los datos actuales y esperar que prediga el futuro. Utilizaremos los términos de análisis descriptivo y predictivo a lo largo del artículo para referirnos a la comprensión del pasado, el presente o la predicción del futuro.

Si se da cuenta de que su organización no está totalmente madura (es decir, no tiene una comprensión clara de su pasado y su presente), he aqui nuestras recomendaciones sobre cuáles deberían ser los próximos pasos de su equipo de datos.

Leer También: ¿Que Es Open Innovation en Data Science?

Actores clave de un equipo de análisis de datos


Un equipo de análisis de datos suele estar compuesto por cuatro funciones principales, que se detallan a continuación.
  1. Ingeniero de datos: Son los responsables de diseñar, construir y mantener los conjuntos de datos que se pueden aprovechar en los proyectos de datos. Como tal, los ingenieros de datos trabajan estrechamente con los científicos de datos y los analistas de datos. También incluimos aquí el nuevo papel de ingeniero de análisis, aunque, en la práctica, este papel se encuentra entre el análisis y la ingeniería.
  2. Científico de datos: Utilizan matemáticas y estadísticas avanzadas y herramientas de programación para construir modelos predictivos. Las funciones de los científicos de datos y los analistas de datos son bastante similares, pero los científicos de datos se centran más en el análisis predictivo que en el descriptivo.
  3. Analista de datos: Utilizan los datos para realizar informes y análisis directos. Mientras que los científicos de datos y los ingenieros suelen interactuar con los datos en su estado bruto o sin refinar, los analistas trabajan con datos que ya han sido limpiados y transformados en formatos más fáciles de usar.
  4. Analista de negocio/analista de operaciones: Ayudan a la organización a mejorar sus procesos y sistemas. Se centran en la elaboración de cuadros de mando, responden a las preguntas del negocio y proponen su interpretación. Son ágiles y se sitúan a caballo entre las TI y el negocio para ayudar a salvar la distancia y mejorar la eficiencia. Suelen trabajar con un área de negocio específica, como el marketing o las finanzas, y sus conocimientos de SQL pueden abarcar desde cuadros de mando básicos hasta análisis avanzados.
  5. Jefe de análisis de datos: Proporcionan una supervisión estratégica al equipo de datos. Su objetivo es crear un entorno que permita a todas las partes acceder a los datos que necesitan sin problemas, desarrollar las habilidades de la empresa para obtener información significativa de los datos y garantizar la gobernanza de los datos. También actúan como puente entre el equipo de datos y la unidad de negocio principal, actuando tanto como visionario como líder técnico

¿Qué tamaño debe tener el equipo?


Diferentes empresas crearán equipos de datos de diferentes tamaños, no hay una talla única para todos. Hemos estudiado la estructura de los equipos de datos de más de 300 empresas, con un rango de 300 a 1000 empleados, y hemos obtenido las siguientes conclusiones:
  1. Como regla general, deberías aspirar a tener un total del 5-10% de empleados con conocimientos de análisis de datos en tu empresa. Algunas empresas, como Amazon o Facebook, forman a una gran parte de sus empleados, pero las hemos excluido de nuestro análisis.
  2. Las primeras contrataciones de un nuevo equipo de datos suelen ser un ingeniero de datos y un analista de datos. Con sólo estas dos funciones, las organizaciones ya pueden realizar algunos análisis descriptivos básicos. A la hora de crear un equipo más amplio, hay que pensar en el conjunto de habilidades que se necesitan. Un proyecto de datos típico requiere las siguientes habilidades: base de datos, desarrollo de software, aprendizaje automático, visualización, colaboración y habilidades de comunicación. Es muy raro encontrar personas que posean todas estas habilidades. Por lo tanto, debe ser consciente de qué habilidad aporta cada candidato. Independientemente del número de personas que decida contratar, su equipo debería cubrir idealmente este conjunto de habilidades. El punto en el que se encuentra en su viaje de datos también influye en quién contrata y en qué fase. Por lo general, los analistas de datos se centran en comprender el pasado. Es decir, toman los datos que usted tiene y tratan de entender los impulsores del crecimiento y otras métricas. Los analistas de negocio/obs se orientan hacia el presente (dashboarding). Por último, los científicos de datos se centran en predecir los resultados futuros. Por lo tanto, si tiene problemas para entender su pasado, contrate a un analista de datos en lugar de a un científico de datos.
  3. Lo que debería guiar en última instancia el tamaño de su equipo de datos es el número de enunciados de problemas empresariales y la complejidad de los problemas más graves. Observe el tamaño de su hoja de ruta y establezca cuántas personas necesita para completar sus proyectos de datos en un tiempo razonable. Si se da cuenta de que su equipo de datos tardará más de un año en completar sus proyectos, probablemente sea el momento de ampliar el equipo. También le animamos a que analice la relación entre ejecución y construcción. Los miembros de su equipo de datos "funcionan" cuando trabajan en las operaciones diarias del negocio, centrándose en el rendimiento actual de la organización. Se "construyen" cuando trabajan en proyectos a largo plazo, como la adición de nuevas características al producto. Su equipo de datos debería estar funcionando 2/3 del tiempo y construyendo 1/3 del tiempo. Si tu equipo de datos pasa todo su tiempo centrándose en las necesidades del día a día, estás poniendo en peligro el futuro de tu empresa, y probablemente sea el momento de ampliar el equipo.
  4. Por último, es posible que tengas que hacer algunas contrataciones específicas para un proyecto. Si eres una empresa de tecnología financiera que lleva a cabo un proyecto de detección de fraudes, o una empresa especializada en el envío de logística, es posible que quieras contratar a alguien que conozca las particularidades de tu sector..

¿Cómo se integra el equipo de datos en la empresa?


No existe una estructura perfecta para un equipo de análisis, y es probable que su estructura cambie muchas veces. Si la estructura de su equipo de datos no ha cambiado en los últimos 2 años, es probable que sea una estructura subóptima. ¿Por qué? Porque las necesidades de datos de su empresa evolucionan rápidamente, lo que exige una adaptación de la estructura de su equipo de datos. Además, tenga en cuenta que cuanto más estática sea su organización, más difícil será el siguiente cambio. Por esta razón, no prescribimos una estructura determinada, sino que presentamos los modelos más comunes y cómo pueden adaptarse a diferentes tipos de empresas.

El primer paso que hay que dar para estructurar el equipo de datos es encontrar a las personas de datos que ya existen en la organización. Puede que no sean sólo las personas con el término "datos" en su título, sino que podrían ser cualquier empleado que no tenga miedo al análisis de datos o que ya tenga conocimientos de SQL, como los analistas de negocio/analistas de operaciones. Si no se toma la molestia de localizar cuidadosamente a las personas que ya tienen datos, es probable que acabe con una estructura de equipo de datos no planificada, que probablemente no se ajuste a las necesidades de su empresa.

Leer También: ¿Cómo Hacer de Su Empresa Una Organización Basada En Datos?


Centralized model


Modelo centralizado para equipos de datos - Imagen de Louise de Leyritz

El modelo centralizado es la estructura más sencilla de implantar, y suele ser el primer paso para las empresas que pretenden orientarse hacia los datos. Sin embargo, este modelo presenta algunos inconvenientes, que se mencionan a continuación. Esta estructura suele dar lugar a una "plataforma" de datos centralizada, en la que el equipo de datos tiene acceso a todos los datos, y da servicio a toda la organización en una variedad de proyectos. Todos los ingenieros de datos, analistas y científicos de este equipo son dirigidos directamente por el jefe de datos. Con esta estructura, el equipo de datos informa en línea de puntos a los interesados en los datos basados en las unidades de negocio, en una relación de tipo consultor/cliente.

Este modelo flexible se adapta a las necesidades en continua evolución de una empresa en crecimiento. Si está al principio de su viaje de datos, es decir, si todavía le cuesta tener una visión clara de su pasado y su presente, esta es la estructura que recomendamos. Los primeros proyectos del equipo de datos tratarán de aportar visibilidad al negocio, asegurando que todos los departamentos de su organización tengan KPI y cuadros de mando en los que puedan confiar. Este tipo de estructura es especialmente buena para la analítica, donde la reutilización y la gobernanza de los datos son importantes.

Ventajas


✅ El equipo de datos puede ayudar en los proyectos de otros equipos mientras trabaja en su propia agenda.

✅ El equipo puede priorizar los proyectos de toda la empresa.

✅ Hay más oportunidades para el desarrollo del talento y las habilidades en un equipo centralizado. De hecho, el equipo de datos trabaja en una variedad más amplia de proyectos, y los ingenieros, científicos y analistas de datos pueden beneficiarse de los conocimientos de sus compañeros.

✅ El responsable de datos tiene una visión centralizada de la estrategia de la empresa y puede asignar al personal de datos a los proyectos más adecuados a sus capacidades.

✅ Fomenta el crecimiento de la carrera, ya que los ingenieros de datos, los científicos y tienen perspectivas claras de los roles de antigüedad.

Inconvenientes


❌ Alta probabilidad de desconexión entre el equipo de análisis de datos y otras unidades de negocio. En este modelo, los ingenieros de datos y los científicos de datos no están inmersos en las actividades cotidianas de otros equipos, lo que les dificulta identificar los problemas más relevantes que hay que abordar.

❌ Riesgo de que el grupo de analítica quede reducido a una función de "apoyo", sin que otros departamentos asuman sus responsabilidades.

❌ Como el equipo de datos sirve al resto de la empresa, otras unidades de negocio podrían sentir que sus necesidades no se atienden adecuadamente, o que el proceso de planificación es demasiado burocrático y lento.


Modelo descentralizado de equipos de datos - Imagen de Louise de Leyritz

En un modelo descentralizado, cada departamento contrata a su "propia" gente de datos, con una plataforma de datos centralizada. En este modelo, los analistas y científicos de datos se centran en los problemas de su unidad de negocio específica, con poca interacción con el personal de datos de otras áreas de la empresa. Con esta estructura, los analistas de datos informan directamente al jefe de su respectiva unidad de negocio.

Ventajas

✅ Los equipos integrados de personas de datos son ágiles y responden, porque se dedican a sus respectivas funciones de negocio y tienen un buen conocimiento del dominio.

✅ Los jefes de producto pueden asignar las tareas de datos a las personas más cualificadas para trabajar en ellas.

✅ Los equipos de datos empresariales no tienen que luchar por los recursos para construir su proyecto de datos porque los recursos se sientan en los equipos.

Inconvenientes

❌ Falta de fuente de la verdad, duplicación del contenido de los datos.

❌ La gente de datos acaba trabajando en temas redundantes debido a la falta de comunicación entre los diferentes equipos.

❌ La creación de silos conduce a la erosión de la productividad, ya que la gente de datos no puede aprovechar la experiencia de sus colegas como lo hacen en el modelo centralizado.

❌ Este modelo dificulta la asignación óptima de personal de datos a diferentes proyectos.

❌ A los directores de negocio, que no suelen tener formación técnica, les resulta difícil gestionar a los especialistas en datos y comprender la calidad de su trabajo.



Modelo federado/ Centro de excelencia

Un modelo federado es el más adecuado para las empresas que han alcanzado la madurez de los datos, tienen una estrategia de datos clara y se dedican al análisis predictivo


Modelo de centro de excelencia l- Imagen de Louise de Leyritz

En el modelo de centro de excelencia (COE), el personal de datos está integrado en las unidades de negocio, pero sigue habiendo un grupo centralizado que proporciona liderazgo, apoyo y formación. Si los analistas y científicos de datos se despliegan por los departamentos de negocio, seguirá habiendo un líder de datos (o un núcleo de líderes de datos según el tamaño de la empresa) que prioriza y supervisa los proyectos de datos. Esto garantiza que los proyectos de datos más beneficiosos se aborden primero.

Esta estrategia es la más adecuada para las empresas de mayor tamaño con una hoja de ruta de datos clara. El modelo de centro de excelencia implica un equipo de datos más grande, ya que se necesitan científicos de datos tanto en el COE como en las diferentes ramas de negocio. Si se trata de una empresa pequeña o mediana, es posible que sus necesidades no requieran un equipo de datos de este tamaño.

Este enfoque conserva las ventajas tanto del modelo centralizado como del integrado. Es una estructura más equilibrada en la que las acciones del equipo de datos están coordinadas, pero también mantiene a los expertos en datos integrados en las unidades de negocio.

De nuevo, es muy importante que sepas quién es tu gente de datos. Cuando cree un equipo centralizado al principio de su viaje de datos, asegúrese de no tener analistas/operadores de negocio integrados en otros departamentos. De lo contrario, terminará con un modelo mixto no deseado, creando un completo caos en su organización. Al crear un equipo centralizado, hay que asegurarse de que es deseado y planificado.

Ventajas


✅ El modelo de Centro de Excelencia ofrece las ventajas tanto del modelo centralizado como del integrado.

Sin embargo, sigue presentando algunos inconvenientes:

Inconvenientes

❌ Este modelo requiere una capa adicional de coordinación y comunicación necesaria para garantizar la alineación entre el COE y las unidades de negocio.

❌ No es adecuado para las organizaciones pequeñas y medianas, por lo que estas empresas pueden engancharse a los beneficios que puede aportar este modelo de centro y radio.

Palabras finales


La creación de un sólido equipo de análisis es un pilar clave que debe construirse si su empresa quiere estar orientada a los datos. La medida en que se extraiga valor empresarial de los datos depende, en última instancia, de la fuerza de este equipo y de su simbiosis con el resto de la empresa. No hay ningún consejo hecho a medida para el tamaño, la composición y la estructura de su equipo de datos. Por eso es necesario conocer el nivel de madurez de datos de su organización, para poder crear un equipo de datos adecuado a las necesidades de su empresa y alineado con su estrategia empresarial.

En Castor, escribimos sobre todos los procesos que intervienen en el aprovechamiento de los activos de datos: desde la pila de datos moderna, pasando por la composición de los equipos de datos, hasta la gobernanza de los datos. Nuestro blog cubre los aspectos técnicos y menos técnicos de la creación de valor tangible a partir de los datos.

En Castor, estamos construyendo una herramienta de documentación de datos para la generación de Notion, Figma y Slack. O de datos para los aficionados a Fivetran, Looker, Snowflake, DBT. Hemos diseñado nuestro catálogo para que sea fácil de usar, encantador y amigable.

¿Quieres comprobarlo? Póngase en contacto con nosotros y le mostraremos una demostración.

Publicado originalmente en https://www.castordoc.com.

Leer También:
-
¿Por qué las competiciones en data science son importantes para las startups?
-
Las Razones Por Las Que Todo Emprendedor Debe Implementar Inteligencia de Negocios (BI)
Join our private community in Discord

Keep up to date by participating in our global community of data scientists and AI enthusiasts. We discuss the latest developments in data science competitions, new techniques for solving complex challenges, AI and machine learning models, and much more!