El Data Science o la Ciencia de los Datos, muchas veces confundida con el concepto de Big Data, es una evolución del tradicional análisis de datos. Con el avance de las nuevas tecnologías y la irrupción de la cuarta revolución industrial, las técnicas que antaño nos servían para analizar y extraer información de los datos, han quedado obsoletas. Esto ha sucedido básicamente por dos razones:
- En primer lugar, porque han aparecido métodos de análisis mucho más potentes y precisos.
- Y en segundo lugar, porque la cantidad y la calidad de los datos de que disponemos han crecido tan exponencialmente que los antiguos métodos ya no son ni tan precisos ni tan eficientes en muchos casos.
La figura del Data Scientist
Así pues, se precisa de una figura que sea la pertinente (r)evolución del típico analista de datos. Una figura capaz de entender las nuevas tecnologías y las nuevas metodologías de análisis, capaz de reinventarse y seguir aprendiendo a gran velocidad y, sobre todo, capaz de traducir todo a un lenguaje “apto para todos los públicos”. Poniendo todos estos requisitos en una coctelera y agitándola surge la figura del Data Scientist, esa evolución del analista de datos tradicional que andábamos buscando.
¿Cómo trabaja un Data Scientist y cuál es su metodología?
ay diversas metodologías de trabajo, y como la mayoría tienen los mismos puntos clave, el siguiente gráfico es muy ilustrativo de lo que es el ciclo de vida de un proyecto llevado a cabo por un Data Scientist.
¿Quieres saber cómo afrontar la ruta de tu vida? ¡Descúbrelo!
- Se empieza por la comprensión del problema de negocio, típicamente manteniendo reuniones con los usuarios finales del proyecto y actualizándose con la literatura disponible y ejemplos previamente realizados en ese campo.
- Seguidamente hay que entender con qué datos se cuenta, dónde y cómo se puede disponer de ellos y la accesibilidad a los mismos.
- En el siguiente paso se limpian y preparan los datos.
- Una vez tenemos el conjunto de datos limpio y “sano”, se empieza el proceso de modelización*.
- Con los resultados de los modelos pasamos a la evaluación de los resultados**
- Finalmente los proyectos suelen terminar con el despliegue de los modelos, industrializándolos o embebiéndolos en el sistema informático del cliente.
¿Quieres saber más sobre Data Science?
Para todos aquellos interesados en saber un poquito más sobre Data Science os dejamos algunas lecturas recomendadas:
- Extenso artículo sobre qué es Data Science, quién es un Data Scientist y algún otro concepto básico del “mundillo”: Haz click aquí
- Artículo sobre las diferencias entre un estadístico y un Data Scientist: Haz click aquí
- Interesante web de entrevistas en formato podcast a diferentes Data Scientists: Haz click aquí