Científicos del Instituto Europeo de Bioinformática (EMBL-EBI) del EMBL y del Centro Alemán de Investigación del Cáncer (DKFZ) utilizaron los registros sanitarios daneses para predecir los riesgos individuales de los 20 tipos de cáncer más comunes.
Este estudio estadístico es una prueba de concepto, pero el análisis sugiere que el modelo podría adaptarse y transferirse a otros sistemas de atención médica. Podría ayudar a identificar a las personas con un alto riesgo de desarrollar cáncer, para quienes se podrían probar programas de detección temprana.
La detección temprana del cáncer brinda a los pacientes más opciones de tratamiento y, en general, produce mejores resultados clínicos.
Aprovechar datos ricos en información
Este amplio estudio sistemático utilizó datos completos del registro sanitario danés, en el que se almacenan todos los diagnósticos clínicos de la población. Los investigadores analizaron sistemáticamente registros de salud, antecedentes familiares y datos de estilo de vida. Si bien el análisis no permite una predicción exacta de qué persona desarrollará cáncer, sí determina el riesgo individual y permite una comparación con personas de edad similar.
El modelo de predicción se entrenó por primera vez con datos recopilados entre 1995 y 2014 de 6,7 millones de adultos. El conjunto de datos de capacitación incluyó más de 90 millones de diagnósticos que abarcan más de 1.000 enfermedades diferentes.
Luego, el modelo se validó en conjuntos de datos del mismo registro, recopilados entre 2015 y 2018, que abarcan 4,7 millones de daneses. La concordancia entre las predicciones del modelo y el momento en que los individuos desarrollaron cáncer, si lo hubo, fue del 81%. El modelo tenía una alta precisión para los cánceres del sistema digestivo, así como para el cáncer de tiroides, riñón y útero.
Para probar si este modelo funcionaría con datos de salud de otros países, los investigadores aprovecharon datos del Biobanco del Reino Unido y lograron niveles comparables de precisión.
“Estos modelos no son perfectos, pero pueden proporcionar información valiosa para nuevos programas de detección del cáncer adaptados al riesgo”, afirmó Moritz Gerstung, jefe de división del DKFZ y líder del grupo de investigación visitante del EMBL-EBI.
“Pero la única manera de que esto funcione es teniendo un sistema para capturar y aprovechar datos de salud completos. El ecosistema de datos de salud danés es único porque contiene datos digitales para toda la población y abarca décadas. Sólo unos pocos países europeos ofrecen algo similar, incluyendo Finlandia, Islandia y Suecia, o cohortes especiales de investigación en el Reino Unido”, agregó.
Factores que influyen en el riesgo de cáncer
El trabajo confirmó factores bien conocidos que están asociados con el cáncer, como el tabaquismo y el consumo de alcohol. Los investigadores también encontraron que, si bien los antecedentes familiares son más informativos antes de los 45 años, a una edad mayor los antecedentes de enfermedades de un individuo son más informativos sobre su riesgo de cáncer.
El trabajo también sugiere que las personas que previamente padecieron múltiples enfermedades diferentes pueden tener un mayor riesgo de desarrollar cáncer.
“Un patrón típico es que, lamentablemente, las enfermedades, incluido el cáncer, a menudo aparecen en grupos. Esto no significa que las enfermedades anteriores causen cáncer, y la verdadera razón podría ser otra. Pero es una correlación que podría tenerse en cuenta. al calcular el riesgo de cáncer”, afirmó Gerstung.
“La novedad del estudio radica en los volúmenes y la riqueza de los datos que utilizamos y el trabajo que hicimos para ampliar modelos estadísticos bien establecidos”, dijo Alexander Jung, investigador postdoctoral de la Universidad de Copenhague y científico visitante en EMBL-EBI.
“Nuestro modelo cubre más de 1.000 factores que pueden contribuir al riesgo de que una persona desarrolle cáncer, y esto es enorme en comparación con modelos anteriores que sólo tomaban en consideración unos pocos factores”, destacó.