💡 Resumen (TL;DR):
- La universidad liberó el código en GitHub para centralizar investigaciones médicas y conectar datos clínicos fragmentados.
- La plataforma ya mapeó espacialmente más de mil millones de células cancerígenas en 16 grupos de pacientes.
- Elimina el proceso manual de cruzar bases de datos, permitiendo estudios simultáneos con miles de expedientes.
Investigadores del Centro Oncológico Kimmel y la Universidad Johns Hopkins publicaron el código de AstroID. Esta plataforma unifica resultados de laboratorio, secuencias genéticas y registros de imagenología en un solo sistema de consulta disponible globalmente a través de GitHub.
AstroID es una base de datos estructurada que clasifica información médica en seis niveles jerárquicos. El modelo organiza datos desidentificados, diagnósticos, eventos clínicos, especímenes, detalles de procesamiento y muestras individuales.
El sistema funciona sobre la arquitectura web REDCap y exporta directamente a formato SQL para fusionar registros con otras bases de biomarcadores. El modelo técnico se detalló en un artículo publicado el 25 de diciembre de 2025 en la revista científica Journal for Immunotherapy of Cancer.
“Lo que hace esta estructura es permitirme hacer preguntas a través de todos estos datos que ya se han recopilado, y a través de tipos de tumores, y combinarlo todo en el contexto de la experiencia longitudinal del paciente”, explicó Janis M. Taube, directora de la División de Dermatopatología en el Instituto Bloomberg~Kimmel.

Escalabilidad masiva para investigación médica
La institución ya desplegó el sistema para rastrear el historial de 16 cohortes de pacientes con distintos tipos de tumores. El equipo técnico mapeó y etiquetó espacialmente más de mil millones de células cancerígenas con metadatos clínicos.
Alexander Szalay, director del Instituto de Ciencia Intensiva de Datos en Johns Hopkins, delineó la meta del proyecto. “Lo que estamos intentando hacer es escalar para poder manejar pacientes en el orden de cientos o miles de pacientes en un estudio”, afirmó el directivo.
El software, apoyado económicamente por los Institutos Nacionales de Salud, elimina la necesidad de reconstruir expedientes desde cero para cada estudio. El equipo confirmó que la base de código se puede modificar para investigar enfermedades no neoplásicas o monitorear el envejecimiento natural.