Cuando empecé la maestría en matemáticas aplicadas en agosto de 2018, me llevé la grata sorpresa de que íbamos a programar (llevaba ya bastantes meses sin hacerlo) y que iba a ser en un lenguaje casi completamente nuevo para mi por ese entonces. Digo grata porque es una de las actividades intelectuales que más me gusta, y apenas si había hecho, leído o escrito algo en Python, que fue el primer lenguaje que usamos. Al siguiente semestre comenzamos con R, y en el último año los usamos ambos de manera constante.
Esto me permitió ganar cierta habilidad en su uso y adentrarme en el mundo del análisis de datos, que, como he escrito en alguna otra entrada, es un campo que me interesó bastante porque está relacionado con temas que me gustaban de antaño, como la IA y el ML.
Así que, el primer recurso que quiero compartirles en este post es el siguiente canal de Youtube, CCTMéxico. Me gusta el enfoque que tiene, el cual es hacer cortos y sencillos ejemplos de diferentes métodos, modelos y herramientas de análisis de datos y ML.
¿Cuál considero que debe ser tu objetivo si te gusta esta área?: tener una lista de scripts base con la mayor cantidad de modelos implementados, para poder ajustarlos posteriormente a las necesidades específicas de algún cliente. Ah, y sobre todo, entender qué es lo que está haciendo el código, porque la mayoría hace maravillas en unas pocas líneas, pero lo magia está sucediendo detrás, y detrás significa ir a la documentación y entender las operaciones y conceptos matemáticos que está aplicando.
Por otro lado, ya que me encuentro desde hace algunos meses en búsqueda de oportunidades laborales en esta área, me he encontrado con que, además de que existen múltiples perfiles para el cargo de analista de datos (como lo he explicado en otras entradas), también es necesario tener algún conocimiento en ingeniería de software. Es decir, es planear, desarrollar e implementar código. Y esto va más allá de Python y de R, porque se necesitan otros lenguajes de programación y otras herramientas.
No saben lo mucho que me ha costado entender y aceptar esto. Es decir, si yo voy a analizar datos, TAMBIÉN debo saber por ejemplo de dónde salen esos datos, y casi siempre saben de un sitio web. Entonces debe conocer o manejar algo de desarrollo web, de backend, frontend, bases de datos, servidores, cloud y muchísimos otros lenguajes, herramientas y etapas de desarrollo.
Esto me ha costado bastante entenderlo, porque es el cuadro completo, y pocas personas lo saben, lo dicen, o al menos lo comparten. Al parecer ya es imposible trabajar diciendo únicamente que manejas herramientas de análisis de datos, como Python y R. Ahora también debes saber cómo vas a encajar e interactuar con el resto del equipo de trabajo, hablando tanto de personas como de herramientas.
Así que, bueno, luego de mucha frustración he comenzado a ver la luz al respecto, y para eso les comparto este video de Platzi donde se hace una introducción a este proceso que les estoy mencionando, y este otro canal de Youtube llamado Fazt donde encuentran una vasta cantidad de material acerca de frameworks, lenguajes de programación y proyectos relacionados con la programación web.
Hasta una próxima oportunidad.