El sector de la salud es uno de los ámbitos que genera más volumen de datos: los registros médicos, las pruebas clÃnicas, las informaciones genéticas, los objetos conectados o las bases de datos son solo algunos ejemplos de las incontables fuentes de información que produce este sector. Ahora bien, ¿cuáles son los principales beneficios de la ciencia de datos para la salud? Agnès Pérez Millan y Laia Subirats Maté, profesoras e investigadoras de los Estudios de Informática, Multimedia y Telecomunicación de la UOC, lo analizan en este artÃculo imperdible.
1. Mejor calidad de servicio de los sistemas de salud
Hace años que se acuñó el término medicina 4P, que quiere decir predictiva, preventiva, personalizada y participativa, y la ciencia de datos puede hacer que la medicina sea más 4P. En cuanto a la predicción, puede ser útil para crear sistemas que realicen diagnósticos más precoces para que asà se puedan curar antes las enfermedades. Del mismo modo, la ciencia de datos puede mejorar en gran medida la prevención de las enfermedades. Por ejemplo, el uso de sistemas de monitorización de la alimentación, el ejercicio fÃsico o el sueño ha provocado una explosión de datos, los llamados big data, y la ciencia de datos permite analizar todo ese alud de información.
La ciencia de datos también ayuda a que la medicina sea más participativa; asÃ, la lÃnea conocida como ciencia ciudadana aplicada a la salud hace a los ciudadanos partÃcipes de su salud en primera persona. En estas iniciativas los ciudadanos pueden compartir datos y participar en proyectos cientÃficos realizando tareas como, por ejemplo, anotar imágenes médicas. Todo ello hace que los ciudadanos entiendan mejor su salud y que, por tanto, puedan tomar decisiones más informadas sobre lo que les va bien y lo que no en materia de salud, además de permitir que conozcan más iniciativas cientÃficas.
2. Medicina personalizada
En cuanto a la personalización, un ejemplo serÃa la información genómica de las personas, con la que se pueden personalizar todavÃa más lostratamientos; no solo tenemos más cantidad de datos, sino también algoritmos de recomendación que permiten ajustar mejor los tratamientos.
La inteligencia artificial (IA), tan de moda actualmente, también entra en juego y nos permite estudiar a los pacientes a nivel individual gracias a los datos históricos que se han ido recopilando a lo largo de los años; de esta manera, en un futuro podremos ofrecer un tratamiento especÃfico según sus caracterÃsticas. Sin embargo, debe tenerse en cuenta la ética que implican estos procesos y que los algoritmos necesitan estar muy entrenados porque no podemos asumir errores cuando tratamos la salud de las personas, como explicaremos con más detalle en otros puntos del artÃculo.
Para que la medicina sea personalizada se requieren una gran cantidad de datos y saber cómo tratarlos, de ahà la importancia de la ciencia de datos hoy en dÃa.
3. Diferencias entre pacientes en una misma enfermedad
Actualmente gana peso la idea de que la definición de una enfermedad suele ser un nombre, pero eso no quiere decir que no haya subtipos dentro de cada una. Por ejemplo, si diagnostican cáncer a alguien, todo el mundo pregunta ¿de qué? Hemos asumido que no todos son iguales, pero cuando se ha respondido y tenemos un diagnóstico más concreto, eso no quiere decir que todas las personas que lo sufren sean iguales. Por ejemplo, en algunos casos son más agresivos y en otros menos. Aquà la ciencia de datos juega un papel importante. Tener acceso a los datos y saber estudiarlos nos puede permitir identificar subtipos de pacientes que sufren una misma patologÃa, ya que la gran cantidad de datos nos puede ayudar a detectar ciertas diferencias entre pacientes que pueden agruparlos en subtipos dentro de una patologÃa para asà definir un perfil más concreto.
4. Reducción de costos y pruebas en los sistemas de salud
Otra lÃnea donde tiene impacto la ciencia de datos es la reducción de costos de los sistemas de salud, por diferentes motivos: mejora de la asignación de recursos, mejora de la ingenierÃa de procesos, tratamientos más eficientes y reutilización del conocimiento por medio de estándares internacionales y la representación formal de la información.
El acceso a miles de datos, ya sean actuales o históricos, permite estudiar si todas las pruebas que se realizan son necesarias. La ciencia nos permite valorar si se llegarÃa a las mismas decisiones clÃnicas con datos históricos, sin usar todo el conjunto de datos que se utilizaron. Eso harÃa posible detectar si todos eran necesarios o si con menos datos habrÃamos llegado al mismo punto. Asà pues, detectar pruebas que no son necesarias tiene dos grandes ventajas: el paciente no se tiene que someter a tantas pruebas y, por otra parte, para la Administración implica una reducción de costos en sanidad. Este hecho solo es posible gracias al aumento de datos que se ha producido en la actualidad, consecuencia del trabajo que se ha sido realizando durante todos estos años y que está haciendo que crezca la ciencia de datos.
5. Reducción de sesgos y desigualdades para la globalización de los modelos
La ciencia de datos también puede hacer que se reduzcan los sesgos y las desigualdades en medicina. Por ejemplo, hay toda una lÃnea en la ciencia de datos de diseño de algoritmos justos que contribuye a que se reduzcan los sesgos. También existen iniciativas de catálogos de sesgos, asà como iniciativas para describir los metadatos cuidadosamente y establecer los procesos necesarios para evitar los sesgos en medicina. No podemos olvidar a las poblaciones minoritarias, históricamente infrarrepresentadas tanto por lo que respecta a las enfermedades minoritarias, la etnia, el sexo y el género como a clase social.
Actualmente, nos encontramos ante un interés creciente, en todos los ámbitos, por entrenar algoritmos de IA que apoyen en la clÃnica, ya sea en el diagnóstico, la reducción de listas de espera, los costos, etcétera. En esta lÃnea, la ciencia de datos desempeña un gran papel. Por un lado, para crear y entrenar los algoritmos necesarios a fin de lograr estos objetivos. Y, por el otro, por una cuestión muy importante: para poner sobre la mesa algunos aspectos que se deben tener en cuenta, como la necesidad de entrenar esos algoritmos con una cantidad elevada de datos para que sean fiables y reproducibles. Si queremos que funcionen esos algoritmos con una alta fiabilidad y que se puedan acabar de implementar se necesita diversidad en los datos empleados: de sexos, de etnias, de paÃses, etc. En resumen, necesitamos conjuntos de datos heterogéneos, que dificultan el entrenamiento de los algoritmos pero que son la única solución para lograr algoritmos fiables y reproducibles.
