El papel del científico de datos varía según el sector, pero hay capacidades, experiencia, educación y formación que son comunes y le darán ventaja en su carrera en la ciencia de datos.
Los científicos de datos son expertos en datos analíticos que utilizan la ciencia de los datos para descubrir ideas a partir de cantidades masivas de datos estructurados y no estructurados, para ayudar a dar forma o satisfacer necesidades y objetivos empresariales específicos. Los científicos de datos son cada vez más importantes en las empresas, ya que las organizaciones confían más en el análisis de datos para impulsar la toma de decisiones y se apoyan en la automatización y el aprendizaje automático como componentes básicos de sus estrategias de TI.
Descripción del puesto de científico de datos
El objetivo principal de un científico de datos es organizar y analizar los datos, a menudo utilizando software específicamente diseñado para la tarea. Los resultados finales del análisis de un científico de datos deben ser lo suficientemente fáciles de entender para todas las partes interesadas, especialmente las que trabajan fuera de TI.
El enfoque del análisis de datos de un científico de datos depende de su sector y de las necesidades específicas de la empresa o el departamento para el que trabaja. Antes de que un científico de datos pueda encontrar el significado de los datos estructurados o no estructurados, los líderes empresariales y los directores de departamento deben comunicar lo que están buscando. Por ello, un científico de datos debe tener suficiente experiencia en el dominio del negocio para traducir los objetivos de la empresa o del departamento en productos basados en datos, como motores de predicción, análisis de detección de patrones, algoritmos de optimización y similares.
Para obtener más información sobre las descripciones de los puestos de trabajo de los científicos de datos desde el punto de vista de la contratación, consulte “Descripción de los puestos de trabajo de los científicos de datos: Consejos para conseguir los mejores talentos”.
Científico de datos frente a analista de datos
Los científicos de datos suelen trabajar con los analistas de datos, pero sus funciones difieren considerablemente. Los científicos de datos suelen dedicarse a la investigación y la predicción a largo plazo, mientras que los analistas de datos tratan de apoyar a los líderes empresariales en la toma de decisiones tácticas a través de informes y consultas ad hoc destinadas a describir el estado actual de la realidad de sus organizaciones sobre la base de datos presentes e históricos.
Así, la diferencia entre el trabajo de los analistas de datos y el de los científicos de datos se reduce a menudo a la escala de tiempo. Un analista de datos puede ayudar a una organización a entender mejor cómo utilizan sus clientes su producto en el momento presente, mientras que un científico de datos puede utilizar las ideas generadas por ese análisis de datos, para ayudar a diseñar un nuevo producto que anticipe las necesidades futuras de los clientes.
Salario de los científicos de datos
La ciencia de los datos es un campo de rápido crecimiento, y el BLS predice un crecimiento del empleo del 22% entre 2020 y 2030. El científico de datos también está demostrando ser una carrera satisfactoria a largo plazo, ya que los 50 mejores trabajos de Estados Unidos de Glassdoor clasifican al científico de datos como el tercer mejor trabajo de Estados Unidos.
Según los datos de la Guía Salarial de Tecnología e Informática 2021 de Robert Half, el salario medio de los científicos de datos, basado en la experiencia, oscila entre los 100.000 y los 180.000 euros.
Responsabilidades de los científicos de datos
La principal responsabilidad de un científico de datos es el análisis de datos, que comienza con la recopilación de datos y termina con las decisiones empresariales basadas en los resultados analíticos.
Los datos que analizan los científicos de datos proceden de muchas fuentes, incluyendo datos estructurados, no estructurados o semiestructurados. Cuantos más datos de alta calidad estén a disposición de los científicos de datos, más parámetros podrán incluir en un determinado modelo y más datos tendrán a mano para entrenar sus modelos.
Los datos estructurados están organizados, normalmente, por categorías que facilitan a los ordenadores su clasificación, lectura y organización automática. Esto incluye los datos recogidos por los servicios, productos y dispositivos electrónicos, pero rara vez los datos recogidos a partir de la entrada humana. Los datos de tráfico de un sitio web, las cifras de ventas, las cuentas bancarias o las coordenadas del GPS recogidas por tu smartphone son formas estructuradas de datos.
Los datos no estructurados, la forma de datos que más crece, proceden más bien de la entrada de personas: opiniones de clientes, correos electrónicos, vídeos, publicaciones en redes sociales, etc. Estos datos son más difíciles de clasificar y menos eficientes de gestionar con la tecnología, por lo que requieren una mayor inversión para su mantenimiento y análisis. Las empresas suelen confiar en las palabras clave para dar sentido a los datos no estructurados y extraer los datos relevantes mediante términos de búsqueda.
Los datos semiestructurados se sitúan entre los dos. No se ajustan a un modelo de datos, pero tienen metadatos asociados que pueden utilizarse para agruparlos. Algunos ejemplos son los correos electrónicos, los archivos binarios ejecutables, los archivos comprimidos, los sitios web, etc.
Normalmente, las empresas emplean a científicos de datos para manejar los datos no estructurados y los semiestructurados, mientras que otro personal de TI gestiona y mantiene los datos estructurados. Sí, los científicos de datos se ocupan de muchos datos estructurados, pero las empresas buscan cada vez más aprovechar los datos no estructurados al servicio del objetivo de ingresos, lo que hace que los enfoques de los datos no estructurados sean clave para el papel de los científicos de datos.
Requisitos de los científicos de datos
Cada industria tiene su propio perfil de datos que los científicos de datos deben analizar. Estas son algunas de las formas más comunes de análisis que los científicos de datos pueden realizar en una variedad de industrias, según el BLS.
Negocios: El análisis de los datos de las empresas puede informar de las decisiones en torno a la eficiencia, el inventario, los errores de producción, la lealtad de los clientes y más.
Comercio electrónico: Ahora que los sitios web recogen algo más que datos de compra, los científicos de datos ayudan a las empresas de comercio electrónico a mejorar el servicio al cliente, encontrar tendencias y desarrollar servicios o productos.
Finanzas: Los datos sobre cuentas, transacciones de crédito y débito y otros datos financieros similares son vitales para el funcionamiento de una empresa. Pero para los científicos de datos del sector financiero, la seguridad y el cumplimiento de la normativa, incluida la detección del fraude, son también preocupaciones importantes.
Gobierno: Los macrodatos ayudan a los gobiernos a tomar decisiones, apoyar a los ciudadanos y controlar la satisfacción general. Al igual que en el sector financiero, la seguridad y el cumplimiento de la normativa son preocupaciones primordiales para los científicos de datos.
Ciencia: Gracias a los recientes avances informáticos, los científicos pueden recopilar, compartir y analizar mejor los datos de los experimentos. Los científicos de datos pueden ayudar en este proceso.
Redes sociales: Los datos de las redes sociales pueden informar sobre la publicidad dirigida, mejorar la satisfacción del cliente, establecer tendencias en los datos de localización y mejorar las funciones y los servicios.
Sanidad: Las historias clínicas electrónicas requieren una dedicación a los grandes datos, la seguridad y el cumplimiento. En este caso, los científicos de datos pueden ayudar a mejorar la sanidad
Habilidades de los científicos de datos
Según William Chen, Director de Ciencia de Datos en Quora, las cinco principales habilidades para los científicos de datos incluyen una mezcla de habilidades duras y blandas:
- Programación: La “más fundamental del conjunto de habilidades de un científico de datos”, la programación mejora tus habilidades estadísticas, te ayuda a “analizar grandes conjuntos de datos” y te da la capacidad de crear tus propias herramientas, dice Chen.
- Análisis cuantitativo: El análisis cuantitativo mejora tu capacidad para realizar análisis experimentales, escalar tu estrategia de datos y te ayuda a implementar el aprendizaje automático.
- Intuición del producto: Entender los productos te ayudará a realizar análisis cuantitativos y a predecir mejor el comportamiento del sistema, establecer métricas y mejorar las habilidades de depuración.
- Comunicación: Posiblemente las habilidades blandas más importantes en todas las industrias, las habilidades de comunicación fuertes te ayudarán a “aprovechar todas las habilidades anteriores enumeradas”, dice Chen.
- Trabajo en equipo: Al igual que la comunicación, el trabajo en equipo es vital para el éxito de una carrera en la ciencia de los datos. Requiere ser desinteresado, aceptar la retroalimentación y compartir el conocimiento con tu equipo, dice Chen.
Ronald Van Loon, director general de Intelligent World, añadió a la lista la perspicacia empresarial. Van Loon afirmó que una fuerte visión empresarial es la mejor manera de canalizar las habilidades técnicas de un científico de datos. Es necesario discernir los problemas y los posibles retos que hay que resolver para que una organización crezca.
Para profundizar en lo que se necesita para sobresalir como científico de datos, véase “Habilidades y rasgos esenciales de los científicos de datos de élite“.
Educación y formación de los científicos de datos
Hay muchas maneras de convertirse en un científico de datos, pero la ruta más tradicional es la obtención de una licenciatura. La mayoría de los científicos de datos tienen un título de máster o superior, según los datos de la BLS, pero no todos los científicos de datos lo tienen, y hay otras formas de desarrollar las habilidades de la ciencia de datos. Antes de iniciar un programa de educación superior, querrás saber en qué sector vas a trabajar para averiguar las habilidades, herramientas y software más importantes.
Dado que la ciencia de los datos requiere cierta experiencia en el ámbito empresarial, el papel varía según el sector, y si trabajas en una industria muy técnica, es posible que necesites más formación. Por ejemplo, si trabajas en la sanidad, la administración pública o la ciencia, necesitará un conjunto de habilidades diferente al que necesita si trabaja en marketing, negocios o educación.
Si quieres desarrollar ciertas habilidades para satisfacer las necesidades específicas del sector, existen clases online, campamentos de entrenamiento y cursos de desarrollo profesional que pueden ayudarte a perfeccionar tus habilidades. Hay diversos másteres en universidades internacionales como la de Stanford, la de Berkeley, Carnegie Mellon, Harvard…
Certificaciones en ciencia de datos
Además de los campamentos de entrenamiento y los cursos de desarrollo profesional, hay un montón de valiosas certificaciones de big data y certificaciones de ciencia de datos que pueden impulsar tu currículum y tu salario.
- Profesional de análisis certificado (CAP)
- Certificación de generalista de la plataforma de datos Cloudera
- Consejo de Ciencia de Datos de América (DASCA) Científico de Datos Senior (SDS)
- Científico principal de datos (PDS) del Consejo de Ciencia de Datos de América (DASCA)
- Certificado profesional de ciencia de datos de IBM
- Certificación de Microsoft: Fundamentos de Azure AI
- Certificado por Microsoft: Azure Data Scientist Associate
- Certificado abierto de científico de datos (Open CDS)
- Profesional certificado en IA y aprendizaje automático por SAS
- Científico de datos certificado por SAS
- Certificado de desarrollador de Tensorflow
Otros puestos de trabajo en la ciencia de los datos
El científico de datos es sólo un título de trabajo en el campo en expansión de la ciencia de datos, y no todas las empresas que hacen uso de la ciencia de datos están contratando a científicos de datos “per se”. Aquí están algunos de los títulos de trabajo más populares relacionados con la ciencia de datos y el salario promedio para cada posición, según datos de PayScale:
- Director/Gerente de análisis
- Analista de inteligencia empresarial
- Analista de datos
- Arquitecto de datos
- Ingeniero de datos
- Analista de investigación
- Científico de investigación
- Estadístico
-Sarah K. White and Thor Olavsrud, cio.com