Machine Learning
Programming
Deep learning
21 Recursos Para Aprender Matemáticas Para Data Science
Este es quizás uno de los mayores temores de quienes se inician en el área de data science, aprender/repasar matemáticas. Y es que seamos sinceros, a la gran mayoría de personas no les fue muy bien en matemáticas en la educación básica, quizás tampoco en la universidad y esto llena de temor y crea una barrera para quienes quieren explorar esta disciplina llamada data sciencePuedes leer más artículos de Data Science en español aquí En días pasados publiqué un post en Towards Data Science y aquí mismo en nuestro blog sobre un plan de estudio de data science para este año 2021, donde dí unas recomendaciones trimestrales, e hice énfasis en estudiar matemáticas y estadísticas para este primer trimestre, y del cual recibí muchas preguntas acerca de cuales materiales recomendaba puntualmente. Pues bueno, este post les responde estas dudas. Pero antes de ello quiero darles un contexto.Dejando de lado los factores o motivos que han llevado a que las mayorías detesten las matemáticas, es una realidad que las necesitamos en data science. Para mi, una de las mayores falencias que encontraba en las matemáticas era su falta de aplicabilidad en el mundo real, no le veía una razón de ser a las matemáticas intermedias y avanzadas, como por ejemplo al cálculo multivariable. Confieso que en el colegio y en la universidad no me gustaban por ese motivo, pero siempre me iba bien y sacaba buenas calificaciones y promedios por encima de la mayoría (sobre todo en estadística). Pero aún así no veía en qué podría usar una derivada o una matriz en el mundo real. Finalmente terminé como ingeniero de software y una vez entré al mundo de data science pude hacer la conexión entre las matemáticas, estadísticas y el mundo real.Por otro lado, es importante aclarar que no necesitamos una maestría en matemáticas puras para hacer proyectos de data science. Como ya he mencionado en posts anteriores existe un gran debate en la comunidad acerca de que tantas matemáticas realmente necesitamos para hacer un buen trabajo como data scientists. Podríamos decir que data science se divide en dos grandes campos laborales: research y producciónCon research nos referimos a la parte de investigación y desarrollo, que normalmente se da dentro de una gran empresa (normalmente tecnológica), o que se ha enfocado en temas tecnológicos de vanguardia (como por ejemplo investigaciones médicas). O también es un área que se desarrolla dentro de las universidades. Obviamente este sector tiene ofertas laborales muy limitadas. La gran ventaja es el conocimiento profundo de los algoritmos y sus implementaciones, así mismo será una persona capaz de crear variaciones de los algoritmos existentes, para mejorarlos. O incluso crear nuevos algoritmos de machine learning. La desventaja es la poca practicidad de su trabajo. Es un trabajo muy teórico, en el que muchas veces el único objetivo es publicar papers y se aleja de los casos de uso de los negocios en general. Para referencia sobre esto, hace poco vi este post en Reddit, les recomiendo leerlo. Puedes leer más artículos de Data Science en español aquí Con producción nos referimos a la parte práctica de esta disciplina, donde usarás generalmente y en tu dia a dia librerías tales como scikit-learn, Tensorflow, Keras, Pytorch y otras. Estas librerías operan como una caja negra, donde ingresas datos, obtienes una salida, pero no sabes en detalle qué ocurrió en el proceso. Esto también tiene sus ventajas y desventajas, pero sin duda nos facilita enormemente la vida al momento de poner modelos útiles en producción. Lo que no recomiendo es usarlas a ciegas, donde no tienes las bases mínimas de matemáticas para entender un poco sus fundamentos y ese es el objetivo de este post, guiarte y recomendarte algunos recursos valiosos para tener las bases necesarias y no operar a ciegas dichas librerías. Así que si usted decide enfocarse en Investigación y Desarrollo (Research), sí vas a necesitar matemáticas y estadística en profundidad (muy en profundidad). Si vas a irte por la parte práctica, las librerías te ayudarán a lidiar con la mayor parte de ello, bajo el capó. Cabe aclarar que la mayor cantidad de ofertas laborales, se encuentran en la parte práctica. Bien, luego de las aclaraciones anteriores, es momento de definir cuales son las temáticas puntuales necesarias para tener unas bases iniciales en matemáticas para data science. Algebra Lineal: Esta materia es importante para tener los fundamentos del trabajo con datos en forma vectorial y matricial, adquirir habilidades para resolver sistemas de ecuaciones algebraicas lineales y encontrar las descomposiciones matriciales básicas y la comprensión general de su aplicabilidad.Calculo Multivariable: Aquí es importante estudiar los mapas funcionales, los límites (en caso de secuencias, funciones de una y varias variables), la diferenciación (a partir de una sola variable hasta casos múltiples), la integración, construyendo así secuencialmente una base para la optimización básica. También es importante aquí estudiar los gradientes descendentes.Teoría de probabilidad: Aquí deberías aprender sobre las variables aleatorias, es decir, una variable cuyos valores se determinan mediante un experimento aleatorio. Las variables aleatorias se utilizan como modelo para los procesos de generación de datos que queremos estudiar. Las propiedades de los datos están profundamente vinculadas a las propiedades correspondientes de las variables aleatorias, como el valor esperado, la varianza y las correlaciones. Nota: estas materias son mucho más profundas de lo que acabo de mencionar, esta es simplemente una guía de las materias y recursos recomendados para abordar matemáticas en el ámbito de data science.Ahora que tenemos una mejor idea del camino que debemos tomar, vamos a examinar los recursos recomendados para abordar esta temática. Los dividiremos en básicos, intermedios y avanzados. En los avanzados tendremos recursos enfocados en deep learningBases: en esta primera sección de recursos recomendaremos las bases matemáticas. El pensamiento matemático, algebra y cómo implementar matemáticas con python. Puedes leer más artículos de Data Science en español aquí 1- Introducción al pensamiento matemáticoPrice: FreeImage by CourseraDescripción: Aprende a pensar como lo hacen los matemáticos, un poderoso proceso cognitivo desarrollado durante miles de años.El pensamiento matemático no es lo mismo que hacer matemáticas - al menos no como las matemáticas se presentan típicamente en nuestro sistema escolar. Las matemáticas escolares normalmente se centran en el aprendizaje de procedimientos para resolver problemas altamente estereotipados. Los matemáticos profesionales piensan de cierta manera para resolver problemas reales, problemas que pueden surgir del mundo cotidiano, o de la ciencia, o de las propias matemáticas. La clave del éxito en las matemáticas escolares es aprender a pensar dentro de la caja. Por el contrario, una característica clave del pensamiento matemático es pensar fuera de la caja, una habilidad valiosa en el mundo de hoy. Este curso ayuda a desarrollar esa crucial forma de pensar.Link: https://www.coursera.org/learn/mathematical-thinking#2- Fundación matemática para la IA y el aprendizaje automáticoPrecio: $46.99 usdImage by PacktDescripción: La Inteligencia Artificial ha ganado importancia en la última década, dependiendo mucho del desarrollo e integración de la IA en nuestra vida cotidiana. El progreso que la IA ya ha hecho es asombroso con innovaciones como los coches auto-conductores, el diagnóstico médico e incluso ganarle a los humanos en juegos de estrategia como el Go y el Ajedrez. El futuro de la IA es extremadamente prometedor y no está lejos de que tengamos nuestros propios compañeros robóticos. Esto ha empujado a muchos desarrolladores a empezar a escribir códigos y a desarrollar programas de IA y ML. Sin embargo, aprender a escribir algoritmos para la IA y el ML no es fácil y requiere un amplio conocimiento de programación y matemáticas. Las matemáticas juegan un papel importante ya que constituyen la base para la programación de estas dos corrientes. Y en este curso, hemos cubierto exactamente eso. Diseñamos un curso completo para ayudarte a dominar los fundamentos matemáticos necesarios para escribir programas y algoritmos para la IA y la ML.Link: https://www.packtpub.com/product/mathematical-foundation-for-ai-and-machine-learning-video/97817896132093- Matemáticas para programadoresPrice: $47.99Image by ManningPuedes leer más artículos de Data Science en español aquí Descripción: Para conseguir un trabajo en data science, aprendizaje de máquinas, gráficos por ordenador y criptografía, tienes que aportar fuertes habilidades matemáticas a la fiesta. Math for Programmers enseña las matemáticas que necesitas para estas carreras, concentrándose en lo que necesitas saber como desarrollador. Lleno de muchos gráficos útiles y más de 200 ejercicios y mini proyectos, este libro abre la puerta a carreras interesantes y lucrativas en algunos de los campos de programación más populares de hoy en día.Link: https://www.manning.com/books/math-for-programmers4- Algebra 1Price: FreeImage by KhanacademyLink: https://www.khanacademy.org/math/algebra5- Algebra 2Price: FreeImage by KhanacademyLink: https://www.khanacademy.org/math/algebra26- Maestría en matemáticas con PythonPrice: $12.99Image by UdemyPuedes leer más artículos de Data Science en español aquí Descripción: ¡Puedes aprender muchas matemáticas con un poco de programación!Mucha gente no sabe que Python es una herramienta muy poderosa para aprender matemáticas. Claro que puedes usar Python como una simple calculadora, pero ¿sabías que Python puede ayudarte a aprender temas más avanzados en álgebra, cálculo y análisis de matrices? Eso es exactamente lo que aprenderás en este curso.Link: https://www.udemy.com/course/math-with-python/7- Introducción a los modelos lineales y al álgebra matricialPrice: FreeImage by EdxDescripción: El álgebra matricial es la base de muchas de las herramientas actuales para el diseño experimental y el análisis de datos de alta dimensión. En este curso introductorio en línea de análisis de datos, utilizaremos el álgebra matricial para representar los modelos lineales que comúnmente se utilizan para modelar las diferencias entre las unidades experimentales. Realizaremos una inferencia estadística sobre estas diferencias. A lo largo del curso utilizaremos el lenguaje de programación R para realizar operaciones matriciales.Link: https://www.edx.org/course/introduction-to-linear-models-and-matrix-algebra8- Aplicando matemáticas con Python.Price: $20.99Image by PacktDescripción: Python, uno de los lenguajes de programación más populares del mundo, tiene un número de poderosos paquetes para ayudar a abordar problemas matemáticos complejos de una manera simple y eficiente. Estas capacidades centrales ayudan a los programadores a preparar el camino para construir aplicaciones emocionantes en varios dominios, como el aprendizaje de las máquinas y la ciencia de los datos, utilizando el conocimiento en el dominio de las matemáticas computacionales.Link: https://www.packtpub.com/product/applying-math-with-python/9781838989750Intermedio: en esta segunda sección recomendaremos resusos enfocados en calculo y probabilidad. 9- Calculo 1Price: FreeImage by KhanacademyLink: https://www.khanacademy.org/math/calculus-1Link: https://www.khanacademy.org/math/calculus-110- Calculo 2Price: FreeImage by KhanacademyLink: https://www.khanacademy.org/math/calculus-2Link: https://www.khanacademy.org/math/calculus-211- Calculo multivariablePrice: FreeImage by KhanacademyLink: https://www.khanacademy.org/math/multivariable-calculusLink: https://www.khanacademy.org/math/multivariable-calculus12- Matematicas para Data SciencePrecio: GratisPrice: FreeImage by CourseraPuedes leer más artículos de Data Science en español aquí Descripción: Detrás de numerosos modelos y construcciones estándar en la Ciencia de los Datos hay matemáticas que hacen que las cosas funcionen. Es importante entenderlo para tener éxito en la Ciencia de los Datos. En esta especialización cubriremos una amplia gama de herramientas matemáticas y veremos cómo surgen en la Ciencia de los Datos. Cubriremos campos tan cruciales como las Matemáticas Discretas, el Cálculo, el Álgebra Lineal y la Probabilidad. Para que su experiencia sea más práctica, acompañaremos a las matemáticas con ejemplos y problemas surgidos en la Ciencia de los Datos y mostraremos cómo resolverlos en Python.Link: https://www.coursera.org/specializations/mathematics-for-data-science13- Matematicas discretas en la practicaPrice: $24.99Image by PacktDescripción: Las matemáticas discretas son un campo de las matemáticas que se ocupa del estudio de los elementos finitos y distintos. Las teorías y los principios de las matemáticas discretas se utilizan ampliamente en la resolución de complejidades y en la construcción de algoritmos en la informática y en la computación de datos en la ciencia de los datos. Ayuda a comprender los algoritmos, las matemáticas binarias y generales que se utilizan comúnmente en las tareas basadas en datos.Link: https://www.packtpub.com/product/practical-discrete-mathematics/978183898314714- Matemáticas para la ciencia de los datos y el aprendizaje automático: Nivel universitarioPrecio: $12.99 usdPrice: $12.99Image by UdemyDescripción: En este curso aprenderemos matemáticas para la ciencia de los datos y el aprendizaje de las máquinas. También discutiremos la importancia de las matemáticas para la ciencia de los datos y el aprendizaje de las máquinas en la práctica. Además, el curso de Matemáticas para la ciencia de los datos y el aprendizaje de máquinas es un paquete de dos cursos de álgebra lineal y probabilidad y estadística. Así, los estudiantes aprenderán contenidos completos de probabilidad y estadística y álgebra lineal. No es que no vayas a completar todos los contenidos en este curso de 7 horas de videos. Este es un hermoso curso y he diseñado este curso de acuerdo a la necesidad de los estudiantes.Link: https://www.udemy.com/course/master-linear-algebra-and-probability-2-in-1-bundle/15- Habilidades matemáticas para ciencia de datosPrice: FreeImage by CourseraDescripción: Los cursos de ciencias de los datos contienen matemáticas... ¡no hay que evitarlo! Este curso está diseñado para enseñar a los alumnos las matemáticas básicas que necesitarán para tener éxito en casi cualquier curso de matemáticas de ciencias de los datos y fue creado para alumnos que tienen habilidades matemáticas básicas pero que no han tomado álgebra o pre-cálculo. Data Science Math Skills introduce el núcleo matemático sobre el que se basa la ciencia de los datos, sin complejidad adicional, introduciendo ideas y símbolos matemáticos desconocidos de una en una. Link: https://www.coursera.org/learn/datasciencemathskillsAvanzado: en esta última sección nos centraremos en la parte estadística (teoría de la probabilidad) y en la aplicación de las matemáticas a los algoritmos de deep learning. 16- Estadística y probabilidadPrice: FreeImage by KhanacademyLink: https://www.khanacademy.org/math/statistics-probabilityLink: https://www.khanacademy.org/math/statistics-probability17- Introducción a estadística inferencial: Precio: GratisPrice: FreeImage by UdacityDescripción: Las estadísticas inferenciales nos permiten sacar conclusiones a partir de datos que podrían no ser inmediatamente obvios. Este curso se centra en mejorar su capacidad para desarrollar hipótesis y utilizar pruebas comunes como las pruebas t, las pruebas ANOVA y la regresión para validar sus afirmaciones.Link: https://www.udacity.com/course/intro-to-inferential-statistics--ud20118- Métodos estadísticos y matemáticas aplicadas a la ciencia de los datosPrice: $124.99Image by PacktDescripción: El aprendizaje de las máquinas y el análisis de datos son el centro de atracción de muchos ingenieros y científicos. La razón es bastante obvia: su vasta aplicación en numerosos campos y las opciones de carrera en auge. Y Python es una de las principales plataformas de código abierto para la ciencia de los datos y la computación numérica. IPython, y su asociado Jupyter Notebook, proporcionan a Python interfaces eficientes para el análisis de datos y la visualización interactiva, y constituyen una puerta de entrada ideal a la plataforma. Si usted está entre los que buscan mejorar sus capacidades en el aprendizaje de las máquinas, entonces este curso es la elección correcta.Link: https://www.packtpub.com/product/statistical-methods-and-applied-mathematics-in-data-science-video/978178953921919- Explorando las matemáticas para programadores y científicos de datosPrecio: GratisImage by ManningDescripción: Unas buenas habilidades matemáticas son un prerrequisito si estás interesado en una carrera en ciencias de los datos, inteligencia artificial, criptografía o prácticamente cualquier campo tecnológico. Este mini ebook gratuito es el perfecto manual de aplicaciones matemáticas esenciales que necesitas para entrar en estas emocionantes y lucrativas carreras tecnológicas.Link: https://www.manning.com/books/exploring-math-for-programmers-and-data-scientists20- Matemáticas prácticas para deep learningPrice: $27.99Image by PacktDescripción: La mayoría de los programadores y científicos de datos luchan con las matemáticas, habiendo pasado por alto u olvidado conceptos matemáticos básicos. Este libro utiliza bibliotecas de Python para ayudar a comprender las matemáticas necesarias para construir modelos de aprendizaje profundo (DL).Link: https://www.packtpub.com/product/hands-on-mathematics-for-deep-learning/978183864729221- Matemáticas y Arquitecturas de Deep LearningPrice: $39.99Image by ManningDescripción: Los paradigmas matemáticos que subyacen en el aprendizaje profundo suelen comenzar como documentos académicos difíciles de leer, a menudo dejando a los ingenieros en la oscuridad sobre cómo funcionan realmente sus modelos. Matemáticas y Arquitecturas de Aprendizaje Profundo cierra la brecha entre la teoría y la práctica, estableciendo las matemáticas del aprendizaje profundo junto con las implementaciones prácticas en Python y PyTorch. Escrito por el experto en aprendizaje profundo Krishnendu Chaudhury, usted mirará dentro de la "caja negra" para entender cómo funciona su código, y aprenderá a comprender la investigación de vanguardia que puede convertir en aplicaciones prácticasLink: https://www.manning.com/books/math-and-architectures-of-deep-learningConclusiónEsta es una extensa recomendación sobre recursos para aprender matemáticas para data science, siguiendo el post anterior sobre el camino a seguir en este año 2021 para aprender data science. Cuando tenemos un tiempo limitado para el estudio debemos seleccionar los que mejor nos parezca y los que más se ajusten a nuestro estilo. Por ejemplo, podrías preferir los videos sobre los libros, así que vaya y elija lo que mejor se acomode a usted. Este material es suficiente tanto si desea dar una breve mirada a las matemáticas, como si quiere profundizar en ellas. Espero que lo encuentre útil. Si tienes otras recomendaciones de cursos, libros o videos, porfavor déjalas en los comentarios para que entre todos formemos enlaces de interes.Puedes leer más artículos de Data Science en español aquí PD: estamos creando un grupo privado de data scientists en Slack, si te quieres unir deja tus datos aqui: https://www.datacademy.dev/#slack¡Gracias por leer!
Daniel Morales
January 19, 2021