Data Science Biomédico: el reto de construir modelos predictivos para mejorar el rendimiento de los atletas
CIENCIAS DE LA COMPUTACIÓN / BIOINFORMÁTICA.
Hoy charlamos con Fátima Sánchez, Responsable de la Unidad de Bioinformática en el Centro Nacional de Investigaciones Cardiovasculares y profesora de Data Science en Kschool.
Sánchez cuenta con una dilatada experiencia en el desarrollo de modelos probabilísticos para el análisis de datos biomédicos de alta dimensionalidad y centra su actividad en el impacto que estos ítems pueden suponer en la calidad y esperanza de vida de las personas. Hoy le damos la bienvenida a Universia, especialmente a la semana temática “Datos de competición” en la que charlaremos sobre biomedicina y el impacto del análisis de datos en el estado físico de los atletas. Y es que la Ciencia de Datos y la Inteligencia Artificial se han convertido en aliados en el mundo del deporte para conseguir mejorar el rendimiento de quienes compiten a nivel profesional así como a la prevención ante los efectos adversos que pueda suponer la práctica deportiva.
Fátima ¿podrías hablarnos de tu proyecto y de cómo los datos pueden llegar a prolongar la vida de las personas? ¿esto aplicaría de manera singular a los deportistas?
Efectivamente, como data scientist biomédica me dedico a analizar diferentes tipos de datos, tanto moleculares (DNA, RNA, proteínas, metabolitos, etc) como fenotípicos (estilo de vida, características socioeconómicas, demográficas, etc), con el fin de entender mejor los procesos que causan la transición de la salud a la enfermedad, para poder prevenirla. En concreto, estoy centrada en el estudio de las enfermedades cardiovasculares y de otras enfermedades relacionadas con el envejecimiento.
En este sentido, actualmente se habla mucho no solo de la edad cronológica, sino también de la edad biológica, mucho más determinante de la calidad y esperanza de vida de las personas.
La edad biológica tiene un componente genético, pero también un componente modificable, que depende en gran medida del estilo de vida. Se está estudiando cómo la práctica de ejercicio moderado y también a nivel profesional afecta a nuestra edad biológica.
Habitualmente se necesita un gran volumen de datos para poder sacar valor de estos a través de técnicas de IA como el Aprendizaje Automático (Machine Learning) o el Aprendizaje Profundo (Deep Learning) ¿En la biomedicina también obtenéis grandes volúmenes o trabajáis con pequeñas muestras (Small Data) para tomar decisiones? ¿Cómo conseguís los datos para que sean aptos para vuestras investigaciones?
En biomedicina llevamos muchos años trabajando con grandes cohortes de individuos, decenas de miles, que pueden ser estudiados de manera prospectiva o retrospectiva. Para estos individuos se miden cientos de parámetros, a menudo de forma longitudinal.
Desde hace aproximadamente una década se han incorporado a estos estudios medidas moleculares, lo que añade una gran complejidad a nivel de análisis de datos, pero también nos permite entender la salud y la enfermedad en su totalidad.
Por poner un ejemplo, una persona tiene 3,200 millones de bases de DNA en cada una de sus células y varios miles de genes y proteínas expresados. Esto ha aumentado exponencialmente la complejidad de los datos que manejamos y nos ha introducido de lleno en el mundo del Big Data, permitiéndonos utilizar técnicas de aprendizaje máquina para la predicción de outcomes de salud y una mejor caracterización de la enfermedad. La reducción en el precio de las pruebas ómicas es lo que esta permitiendo incorporar este tipo de datos a grandes cohortes de individuos.
Por otra parte, se está haciendo un gran esfuerzo para diseñar instrumentos que permitan capturar de manera automática y cuantitativa datos de estilo de vida, como pueden ser las pulseras de movimiento o las básculas inteligentes por poner ejemplos que todo el mundo conoce. Esto está mejorando muchísimo la calidad de los datos recogidos y, en consecuencia, la precisión de los modelos predictivos.
La biomedicina une la tecnología computacional y la estadística con la gestión de los datos biológicos. De esta manera la evolución del Big Data, la IA o el Machine Learning están revolucionando este campo.
¿Cómo se trasladan los avances ocurridos en estos últimos años en esta especialidad a los deportistas? ¿qué impacto ha tenido en general en el mundo del deporte?
Como comentaba antes, la mejora en la calidad de los datos obtenidos ha sido un factor crítico en el éxito en el uso de la IA, en todas las áreas, también en la optimización de la práctica deportiva.
En este sentido, hay múltiples proyectos que tratan de diseñar diferentes tipos de elementos para monitorizar de forma muy precisa los datos de rendimiento y las constantes vitales de los atletas. Gracias a esto, y a la universalización de este tipo de pruebas por el abaratamiento de la tecnología, se pueden construir modelos que predigan de manera muy precisa y, sobre todo, personalizada, dónde debe mejorar cada deportista para alcanzar un mejor rendimiento. A la vez, se puede monitorizar de manera muy pormenorizada el estado de salud de los deportistas, evitando en muchos casos efectos adversos.
En otro ámbito, también relacionado con el mundo del deporte, la IA se está también utilizando para predecir el impacto de eventos deportivos o la adherencia de los fans a un equipo en función de las campañas de marketing y fidelización que se realizan.
Un deportista necesita entrenamiento para llegar a lo más alto, pero también conocer su cuerpo para tener en cuenta posibilidades de mejora, limitaciones… ¿Para que un preparador físico o un entrenador pueda obtener el mejor rendimiento de un deportista qué datos necesita y cómo puede obtenerlos?
Efectivamente, la cantidad y la calidad de los datos es la clave de la revolución en la que estamos inmersos. Yo siempre digo que los algoritmos de IA existen desde los años 50 (del pasado siglo) pero el éxito actual y la generalización de su uso ha venido dada por la democratización de distintos elementos que permiten recoger muchos datos y de forma muy precisa.
En una simple pulsera de movimiento tenemos información desde el número de pasos hasta la capacidad aeróbica. La asimetría del paso, la frecuencia cardiaca, y la monitorización de la alimentación, esto también ha significado una gran revolución. El desarrollo de wearables, dispositivos que llevamos encima y que miden todos estos parámetros por medio de sensores, es un campo donde se está avanzando muchísimo a día de hoy, y que está contribuyendo a la revolución de la que hablábamos antes porque permiten además hacer un seguimiento exhaustivo del deportista, no sólo limitado a ciertos momentos en los que se realiza un chequeo médico.
¿Qué varía en este proceso cuando un deportista se prepara para competir de forma inminente? ¿Cómo la data podría hacer que su preparación sea óptima?
Además de la recogida de gran cantidad de datos distintos por medio de sensores, hay otra gran revolución sucediendo actualmente: el desarrollo de algoritmos de inteligencia artificial explicables. Es decir, no sólo somos capaces de predecir cuál va a ser el rendimiento de un deportista en su próxima competición en base a su forma física y la calidad de sus entrenamientos, sino que podemos también encontrar las variables que diferencian a un deportista que ha ganado una competición de otro que no.
Esta información es crítica para diseñar planes de entrenamiento personalizados que permitan mejorar el rendimiento.
¿Qué perfiles profesionales están implicados en un estudio biomédico cuando el paciente es un deportista?
Por supuesto médicos -cardiólogos y expertos en medicina deportiva, entre otros- pero también nutricionistas, fisioterapeutas, y por otro lado ingenieros biomédicos y físicos para desarrollar los instrumentos que capturen la información y matemáticos, estadísticos e informáticos que desarrollen e implementen los algoritmos necesarios para el procesado y modelado de toda esa información.
Es un área sumamente multi-disciplinar.
Ya para terminar… ¿cómo le recomendarías que planteara su formación a quien desea conseguir esta especialización?
Depende de en qué parte del proceso quieran trabajar. Desde mi perspectiva como data scientist, necesitamos formarnos en tres áreas: Estadística -para poder procesar los datos y entender los algoritmos de aprendizaje máquina a implementar-, informática -para poder recoger los datos generados e implementar los algoritmos- y por último es muy importante formarse en el área de conocimiento para el que vayamos a trabajar.
Es imposible realizar un buen análisis de datos si no se conocen sus peculiaridades. En este caso es fundamental aprender cómo funciona el cuerpo humano y conocer las bases de la medicina deportiva.
Muchas gracias, Fátima, por compartir tu conocimiento con nosotros y, sobre todo, por aportar las claves para quienes desean formarse y especializarse en Data Scientist Biomédico, una alternativa profesional con alta empleabilidad en la que el análisis de los datos se une a los conocimientos médicos para mejorar la calidad de vida de las personas y el rendimiento de los deportistas.
Si este artículo te ha resultado interesante descubre más sobre Big data y deporte en la semana Datos de competición.
Sitio Fuente: Universia México