Paula Petrone: “Queremos desarrollar tecnologías de data science y e-health que mejoren la salud de las personas a corto plazo”
Entrevista a Paula Petrone, jefa del grupo de Ciencia de Datos Biomédicos del programa Severo Ochoa de ISGlobal
26.10.2021Entrevista realizada por Yvette Moya-Angeler
Paula Petrone nació en Buenos Aires (Argentina) en 1976, hija de dos arquitectos de una familia de origen italiano que la incentivaron para que descubriera su vocación y se sintiera libre de seguirla.
Se doctoró en Biofísica en Estados Unidos (Universidad de Stanford), se mudó a Suiza para trabajar como consultora de data science (ciencia de datos) de la industria farmacéutica y biotecnológica, y en 2016 llegó con su familia a Barcelona, donde llevó a cabo un postdoctorado en el BarcelonaBeta Brain Research Center. Tiene dos hijos (“Me encantaría que lo pusieras”), de 6 y 8 años.
Desde diciembre de 2020, Petrone lidera el nuevo grupo de Ciencia de Datos Biomédicos del programa Severo Ochoa de ISGlobal, decidida a sacar provecho de los datos y la analítica avanzada para resolver preguntas complejas relacionadas con la salud humana.
La conversación tiene lugar al mediodía, en “el horario del almuerzo” que a veces dedica a correr por la playa. “Recibo una cantidad de sol, de luz y de rumor del mar que me ponen en una situación especial para pensar o descansar”, dice de ese momento que defiende como fundamental. “Siento que nuestra atención está muy dispersa por muchísimos estímulos que recibimos, y para mí es muy importante bloquearme esa hora diaria de autocuidado y reflexión.”
A. Cabrera / ISGlobal
¿Por qué eres científica?
Desde muy pequeña tenía clarísimo que quería ser astronauta. Escribía libros y cuentos relacionados con el espacio. A los 18 años conseguí una beca juvenil para visitar la NASA y, aunque fue una gran experiencia, ahí me di cuenta de que ir al espacio no era lo mío, que lo que me gustaba era la investigación científica: quería ser parte del desarrollo de la nueva ciencia, entender el porqué de las cosas, el porqué del movimiento de los astros y, en definitiva, saber por qué existe todo. Para contestar a estas preguntas me debatí entre estudiar filosofía o física.
Elegiste física…
Sí. Pero, de nuevo, cuando empecé la carrera sentí que los problemas de los astros nos quedaban muy lejos, ¡con los muchos que ya tenemos en la Tierra! Y empecé a querer profundizar en lo relativo a la biología. Decidí que lo mío era la biofísica, que es la física enfocada a resolver problemas biológicos. O sea, quería poder entender las proteínas, las enfermedades… y buscar curas para estas enfermedades. Hice mi tesis de doctorado en Biofísica en la Universidad de Stanford, en Estados Unidos, y a partir de ahí empecé una carrera en la industria farmacéutica y biotecnológica. Durante más de diez años me dediqué a usar la física y la biología para encontrar nuevas terapias en el sector privado. Por eso mi perfil es un poco diferente del de otros investigadores académicos.
Durante más de diez años me dediqué a usar la física y la biología para encontrar nuevas terapias en el sector privado. Por eso mi perfil es un poco diferente del de otros investigadores académicos
¿En qué se nota esa diferencia?
Tengo una visión quizás utilitarista de la actividad científica. Me interesan prioritariamente los proyectos que pueden resultar en mejoras a corto plazo de la medicina y el sistema sanitario. Hay que decir también que nunca tuve la destreza manual que necesita un biólogo o un químico para desarrollarse exitosamente en un laboratorio: rompía cosas, ¡arruinaba los experimentos!
¿Eso fue determinante?
Sí. Hay un momento en la carrera de investigación científica en la que elegís laboratorio (wet lab) o computación (in silico, por el silicio de los ordenadores). Como tenía facilidad para la parte matemática y la computación (empecé a programar cuando era muy pequeña) se me dio muy naturalmente especializarme en los métodos in silico, que significa que los experimentos se hacen con un computador, a través de simulaciones de la realidad utilizando algoritmos.
Como tenía facilidad para la parte matemática y la computación (empecé a programar cuando era muy pequeña) se me dio muy naturalmente especializarme en los métodos in silico, que significa que los experimentos se hacen con un computador, a través de simulaciones de la realidad utilizando algoritmos
¿Tienes una mente matemática?
No lo creo. Me gusta mucho escribir, y todo lo que se relaciona con lo humanístico y las personas. Más allá de mi trabajo académico, me interesa entender el impacto de la inteligencia artificial en nuestra vida cotidiana y cómo se integra en nuestras actividades y habilidades personales. Y también me interesan los aspectos éticos de la aplicación de la inteligencia artificial, sobre todo en la medicina. Esto incluye comprender los aspectos de sesgo y las limitaciones de la inteligencia artificial. También me interesa contribuir a divulgarlo.
A. Cabrera / ISGlobal
¿Cómo viviste tu etapa en la industria farmacéutica?
En esos años siempre estuve involucrada en la parte de investigación y desarrollo. Esto es la aplicación de distintas técnicas de ciencia de datos (data science) para integrar una cantidad ingente de datos (de proteínas, compuestos, experimentos, etc.) utilizando machine learning, que es una técnica de inteligencia artificial. El objetivo era encontrar fármacos nuevos. Luego hice un postdoctorado en el BarcelonaBeta Brain Research Center y empecé a trabajar con imágenes de resonancia magnética del cerebro (Magnetic Resonance Images), para identificar los patrones que indican la aparición temprana de la enfermedad de Alzheimer. De esta forma, mis actividades e interés como analista de datos se trasladaron a un ámbito clínico. En los últimos cinco años he estado trabajando en esta integración de datos (datos de historias clínicas de pacientes con datos moleculares y datos químicos), lo que se conoce como health informatics o biomedical data science.
En los últimos cinco años he estado trabajando en la integración de datos (datos de historias clínicas de pacientes con datos moleculares y datos químicos), lo que se conoce como health informatics o biomedical data science
Tener en cuenta las especificidades de la mujer
¿Se trata de un campo emergente? ¿Hay pocas personas formadas en él todavía?
Hay muchísimas oportunidades en el campo de la ciencia de datos y están surgiendo cursos de máster especializados. Se vive mucha efervescencia en estas áreas pero los perfiles de analista que se encuentran son sobre todo generalistas. Biomedical data science, en cambio, es un nicho para personas con experiencia combinada en medicina, biología y química, cruzada con analítica de datos. No somos muchos.
A. Cabrera / ISGlobal
Y mujeres, ¿todavía menos?
Hay pocas mujeres en informática y ciencia de datos, pero estamos viendo que de a poco esta tendencia comienza a revertirse. Uno de mis esfuerzos divulgativos está dirigido a atraer a mujeres a este campo. Este año, con Karina Gibert, catedrática de la Universitat Politècnica de Catalunya (UPC), organizamos la conferencia Women in Data Science / Barcelona, una iniciativa de la Universidad de Stanford en la que participó ISGlobal con el objetivo de promocionar el rol de la mujer en las disciplinas científicas y tecnológicas.
Durante muchos años, la medicina no ha considerado activamente la perspectiva de género o de sexo: en los datos médicos provenientes de cohortes de estudio a menudo no se tiene en cuenta el sexo de los participantes. Muchas veces no aparece, por ejemplo, la fecha del período menstrual, y se ignora que el sistema inmunitario de la mujer y del hombre no es el mismo, especialmente durante la menstruación; tampoco se tiene presente una variable como la menopausia
Durante muchos años, la medicina no ha considerado activamente la perspectiva de género o de sexo: en los datos médicos provenientes de cohortes de estudio a menudo no se tiene en cuenta el sexo de los participantes. Muchas veces no aparece, por ejemplo, la fecha del período menstrual, y se ignora que el sistema inmunitario de la mujer y del hombre no es el mismo, especialmente durante la menstruación; tampoco se tiene presente una variable como la menopausia. En el ámbito de la salud mental, es fundamental entender que existe una variabilidad de género y de sexo, y que es importante capturar estas diferencias en las bases de datos que luego se utilizarán para estudios observacionales y predictivos.
En el ámbito de la salud mental, es fundamental entender que existe una variabilidad de género y de sexo, y que es importante capturar estas diferencias en las bases de datos que luego se utilizarán para estudios observacionales y predictivos
Por todas estas razones, y para mitigar los sesgos en los estudios y en las decisiones y acciones que dependen de ellos, es muy importante la diversidad en los equipos de desarrollo, tanto a nivel de producción como directivo. Hay que incentivar también a las nuevas generaciones a que piensen de manera inclusiva y fomentar el diseño de estudios más igualitarios.
En tus estudios, ¿ya tienes en cuenta estas variables?
Sí. Pero el obstáculo con el que nos encontramos es que a menudo estas variables no están representadas o faltan en las bases de datos. Hoy es habitual escuchar el término “Big Data” en referencia a la gran cantidad de datos acumulados que se captan a través de nuestros móviles y dispositivos digitales. Irónicamente, en biomedicina se habla de “pobreza de datos” ya que carecemos de muchas de las variables necesarias para el estudio, o bien la calidad de los datos no es la adecuada para un análisis estadístico.
Hoy es habitual escuchar el término ‘Big Data’ en referencia a la gran cantidad de datos acumulados que se captan a través de nuestros móviles y dispositivos digitales. Irónicamente, en biomedicina se habla de ‘pobreza de datos’ ya que carecemos de muchas de las variables necesarias para el estudio, o bien la calidad de los datos no es la adecuada para un análisis estadístico
Sin embargo, cada vez más la dimensión de sexo y de género se está convirtiendo en un requisito de todo estudio bien diseñado, y resulta especialmente importante para solicitar la financiación de proyectos. ¡Empezamos a ver cambios positivos!
Tratar de entender
¿Qué estáis estudiando en ISGlobal?
Participamos en un proyecto muy interesante para estudiar la efectividad parcial de la vacuna RTS, S contra la malaria. Es la primera vacuna que se demostró que podía proteger a bebés y a niños y niñas a partir de estudios clínicos llevados a cabo en África. El investigador Dídac Macià, en nuestro equipo, lidera este proyecto analítico en colaboración con el equipo de Carlota Dobaño y Gemma Moncunill. Como los datos son complejos, se necesita la aplicación de técnicas avanzadas de estadística y de machine learning para identificar qué determina la inmunidad frente a la malaria y por qué la vacuna confiere mejor protección a ciertas personas.
A. Cabrera / ISGlobal
¿Qué otras líneas de investigación tenéis en marcha?
Con la investigadora María Carolina Florian del Institut d’Investigació Biomèdica de Bellvitge (Idibell) estamos investigando los factores involucrados en el envejecimiento humano. Utilizamos técnicas de procesamiento de imagen de microscopía confocal para detectar diferencias constitutivas que se observan en tejidos de ratones jóvenes y ratones viejos. Esperamos comprender mejor los mecanismos de envejecimiento y en el futuro contribuir al desarrollo de fármacos que reviertan los trastornos degenerativos y mejoren la calidad de vida de los pacientes.
Los proyectos de health informatics pueden ser muy variados, por lo que cuentas.
Sí. Otro proyecto que estamos iniciando, en colaboración con María Jesús Pinazo e Irene Losada, tiene que ver con la enfermedad de Chagas, una enfermedad desatendida que padecen millones de personas, en su mayoría en países de renta media y baja. El Chagas permanece en estado latente durante años y el desafío algorítmico es identificar a aquellas personas que están en riesgo de padecer complicaciones y podrían beneficiarse de un tratamiento específico, para así orientar los recursos del sistema de salud de manera eficiente a quienes más lo necesitan.
La enfermedad de Chagas permanece en estado latente durante años y el desafío algorítmico es identificar a aquellas personas que están en riesgo de padecer complicaciones y podrían beneficiarse de un tratamiento específico, para así orientar los recursos del sistema de salud de manera eficiente a quienes más lo necesitan
Dentro de ISGlobal también empezamos a colaborar con la psicóloga e investigadora Ximena Goldberg identificando factores de riesgo de salud mental en el marco del proyecto COVICAT. Este proyecto me resulta apasionante porque integra la perspectiva de género, la realidad actual y factores clínicos y sociales. Buscamos poder entender y predecir la depresión y la ansiedad, e identificar a aquellas personas vulnerables que podrían beneficiarse de una intervención terapéutica. La idea es utilizar técnicas analíticas para guiar el diagnóstico temprano a partir de la adquisición de datos de comportamiento mediante dispositivos digitales, y acompañar a estas personas en su mejora utilizando terapia. Es decir, incorporar tecnología tanto al diagnóstico como al seguimiento de pacientes de salud mental.
¿No es muy fría la tecnología aplicada a problemas de salud mental?
Se empieza a ver que ciertas personas se sienten más cómodas interactuando con una aplicación o dispositivo digital que con otras personas, sobre todo cuando existen sesgos y tabúes en un ámbito tan privado como es la salud mental.
Estamos iniciando un proyecto ambicioso que tiene como fin desarrollar una plataforma que valore el riesgo de que las personas que viajan enfermen. El análisis de las bases de datos de 15.000 viajeros y viajeras permitiría identificar a las personas que corren mayor riesgo de sufrir infecciones y de ser hospitalizadas por esas infecciones, como la malaria, para así poner énfasis en las medidas preventivas y de profilaxis
¿Alguno de los proyectos en los que participas supone para ti un reto en especial?
Sí, el del exposoma, con Martine Vrijheid y los colegas del Exposome Hub. Ahí el objetivo es predecir el impacto que el conjunto de exposiciones ambientales tiene sobre el desarrollo de la persona desde la etapa prenatal hasta que es adulta; es decir, cómo esos factores a los que estamos expuestos en esos períodos tempranos nos afectan a nivel biológico y cómo pueden predisponernos a ciertas enfermedades. En este contexto, el investigador postdoctoral Nikos Stratakis lidera el estudio de los determinantes ambientales y biológicos de la obesidad infantil.
Asimismo, con Jose Muñoz, jefe del Servicio de Salud Internacional del Hospital Clínic de Barcelona, estamos iniciando un proyecto ambicioso que tiene como fin desarrollar una plataforma que valore el riesgo de que las personas que viajan enfermen. El análisis de las bases de datos de 15.000 viajeros y viajeras permitiría identificar a las personas que corren mayor riesgo de sufrir infecciones y de ser hospitalizadas por esas infecciones, como la malaria, para así poner énfasis en las medidas preventivas y de profilaxis.
A. Cabrera / ISGlobal
Juntar dos mundos: academia e industria
Ya llevas casi un año en ISGlobal. ¿Cómo fue tu llegada?
Me sentí muy bienvenida, recibida con entusiasmo por mis colegas. Me sorprende y alegra la cantidad de sinergias y colaboraciones que han surgido con distintos grupos que se han acercado para ver cómo podemos integrar data science en sus proyectos. A mí me interesa muchísimo poder colaborar con ellos, porque de cada uno aprendo algo nuevo. En definitiva, los data scientists somos como los bateristas de una banda de rock: no tiene mucho sentido que hagamos música en solitario, nos complementamos y enriquecemos con la música (los datos y su contexto) que nos procuran los colegas.
Los data scientists somos como los bateristas de una banda de rock: no tiene mucho sentido que hagamos música en solitario, nos complementamos y enriquecemos con la música (los datos y su contexto) que nos procuran los colegas
¿Cómo te ves de aquí a unos años?
Me gustaría poder realizar ciencia que tenga un impacto inmediato en la salud de las personas (a esto lo llamo ciencia intervencional). O sea, que los descubrimientos y las tecnologías que desarrollemos en el campo de la ciencia de datos y la salud digital puedan aplicarse para mejorar la salud a corto plazo. Por eso elijo solamente proyectos que tengan objetivos inmediatos. Y me interesa muchísimo la colaboración con los hospitales y con el sector privado (start-ups). Los hospitales nos pueden proporcionar datos para analizar y, además, con ellos podemos trabajar para resolver preguntas médicas. Las start-ups desarrollan nuevos productos en un entorno ágil y tenaz que es motivador.
Me gustaría poder realizar ciencia que tenga un impacto inmediato en la salud de las personas (a esto lo llamo ciencia intervencional). O sea, que los descubrimientos y las tecnologías que desarrollemos en el campo de la ciencia de datos y salud digital puedan aplicarse para mejorar la salud a corto plazo
Cuando trabajaba en la industria farmacéutica y de biotecnología echaba mucho de menos la investigación en el ámbito académico. Así que me siento muy feliz ahora porque puedo actuar de nexo entre mundos distintos: la investigación académica, en la que se realizan nuevos descubrimientos; la industria, en la que ocurre el desarrollo de la tecnología; y la clínica, en la que se valora el impacto de los productos novedosos.