El científico de datos, un perfil muy codiciado en las empresas

En los últimos años, los gurús y expertos en tecnología dejan caer una y otra vez una frase en sus presentaciones. El dato es el petróleo del siglo XXI. Es el latiguillo que oímos una y otra vez. Y por más que se haya convertido en un tópico manido, no deja de ser verdad.

En las compañías, el volumen de datos crece sin parar y de forma significativa. El problema es que la inmensa mayoría de esos datos que van a definir el futuro del negocio y a marcar las vías de ingresos de las entidades todavía están sin analizar y, por tanto, sin explotar. De hecho, se calcula que en estos momentos se está analizando menos del 0,5% de los datos mundiales.

Por todo ello es por lo que han adquirido tanta relevancia en los últimos tiempos los llamados científicos de datos o data scientists, que se han convertido en uno de los perfiles más codiciados por las corporaciones, y también en uno de los mejor pagados. Y es que al final alguien tiene que organizar los sistemas para sacarle partido al inmenso big data que sustenta la economía actual.  

Se calcula que en estos momentos se está analizando menos del 0,5% de los datos mundiales

Pero ¿qué es un científico de datos? Por decirlo de forma directa y con pocas palabras, es el responsable de recolectar, analizar e interpretar la ingente cantidad de información (nueva y heredada) en una organización. Un data scientist aplica sus conocimientos en programación, matemáticas y estadística a enormes bases de datos, muchas veces desestructurados, es decir, irreconocibles para las herramientas informáticas clásicas de las compañías, como un PDF, un correo electrónico o una hoja de cálculo.

No confundir con un analista de datos

Conviene distinguir al científico de datos del analista de datos o data analyst. Son perfiles bastante parecidos, pero tienen sus diferencias. El analista también recolecta datos y hace análisis estadísticos, pero suele usar herramientas estándar para explotarlos. En todo caso, su objetivo también es mejorar procesos, productos y servicios de la compañía. Sin embargo, el científico de datos va más allá y recurre a herramientas avanzadas de análisis y se espera de él que genere algoritmos para solucionar problemas específicos o dar respuestas a preguntas nuevas por parte de los gestores empresariales. 

La formación de un científico de datos debe ser diversa. Josh Wills, estadístico que trabajó al máximo nivel para Slack, resumió el tema diciendo que un científico de datos es alguien “que es mejor en estadística que cualquier programador, y mejor programador que cualquier estadístico”.

El científico de datos va más allá y recurre a herramientas avanzadas de análisis y se espera de él que genere algoritmos para solucionar problemas específicos

Más allá de eso, un buen data scientist deberá compaginar conocimientos matemáticos, estadísticos y de programación. Y también deberá tener capacidad de comunicación y, por descontado, conocer bien el negocio de la empresa que le contrata.

Y, como tiene que lidiar con datos, tendrá que conocer los aspectos legales relacionados con la protección de los mismos. Y, por supuesto, deberá mostrar cierta audacia, como la que exhibía aquel experto en datos interpretado por Christian Bale en la película ‘La gran apuesta’ (‘The big short’), que mirando con lupa el comportamiento de las hipotecas en Florida en los años previos a la crisis inmobiliaria de 2008, logró predecir que el sistema iba a colapsar.

Un salario muy por encima de la media

Desde hace años hay una inflación de salarios en el sector tecnológico por la carestía de profesionales formados y la falta de vocaciones en los estudiantes para cursar carreras técnicas. En el mundo de la gestión de los datos y de la programación este problema se agudiza. Y por eso hoy el científico de datos está entre los perfiles mejor pagados del sector según muchos portales especializados y firmas de recruiment.  

¿Necesitas un experto en Data & IoT?