La inteligencia artificial (IA) ya está dejando huella en la medicina, pero hay un cuello de botella que nadie puede esquivar: el acceso a datos clínicos en cantidad y calidad, sin poner en riesgo la privacidad de los pacientes. En ese punto los datos sintéticos empiezan a ser un factor clave.
Los datos sintéticos son conjuntos de información generados por algoritmos capaces de replicar las propiedades estadísticas de datos clínicos reales, pero sin exponer identidades ni historiales personales. No son bases “maquilladas”, sino que datos nuevos que reproducen patrones clínicos verosímiles. Como explica Diego Pereyra, director médico global de Healthcare en Softtek, “esta tecnología abre un nuevo horizonte para la investigación en salud, ya que acelera los ensayos clínicos, el desarrollo de nuevos medicamentos y permite que los hospitales construyan redes de datos confiables, con muestras representativas a escala regional o incluso global.”
Esa combinación permite algo que antes era casi imposible: simular escenarios médicos complejos, entrenar algoritmos de soporte al diagnóstico o validar terapias digitales sin recurrir a bases clínicas reales. También habilita trabajar con enfermedades raras o combinaciones muy poco frecuentes, donde la falta de volumen suele frenar la investigación.
Un impulso para Chile y la región
En América Latina, donde la fragmentación de los sistemas de salud y la escasez de repositorios clínicos robustos siguen siendo desafíos, los datos sintéticos se vuelven un acelerador. En Chile, la tecnología empieza a ganar un lugar prioritario en la agenda pública y gremial ligada a la digitalización sanitaria.
Durante el último tiempo, encuentros clave como el foro «IA y Salud en Chile 2026» (impulsado por la ACTI) y los debates liderados por el CENS (Centro Nacional en Sistemas de Información de Salud) han puesto el foco en la interoperabilidad, gobernanza de datos e investigación segura, como los pilares fundamentales para entrenar algoritmos de manera ética. Al mismo tiempo, las universidades han comenzado a empujar la formación de profesionales de la medicina en competencias de Machine Learning y modelos predictivos.
“Existen compañías especializadas en la generación de datos sintéticos que permiten preservar la privacidad sin sacrificar la calidad ni el valor clínico de la información. Estas soluciones cumplen con los marcos regulatorios más exigentes, como GDPR en Europa (Europrivacy) y HIPAA a nivel internacional”, destaca Pereyra, y agrega, “En nuestro país, los datos sintéticos pueden democratizar la innovación médica, permitiendo que hospitales y startups investiguen y desarrollen soluciones de IA sin depender de repositorios internacionales ni vulnerar la confidencialidad de los pacientes”.
Beneficios concretos
El impacto de esta tecnología se traduce en ventajas tangibles para todo el ecosistema sanitario. En primer lugar, permite el desarrollo de modelos clínicos más robustos al generar bases de datos equilibradas que reducen los sesgos y mejoran de forma sustancial la precisión diagnóstica. Asimismo, abre las puertas a una colaboración segura, haciendo posible que hospitales, universidades y empresas intercambien conocimientos clave sin la necesidad de compartir datos sensibles de las personas.
Por otro lado, en regiones donde los repositorios de información son escasos o están fragmentados, esta herramienta funciona como un verdadero «igualador» tecnológico que democratiza el acceso. Esto promueve una innovación sin fricciones, permitiendo validar algoritmos y acelerar soluciones que optimizan la atención médica, todo esto sin poner en riesgo la privacidad de los pacientes en ningún momento.
Es importante destacar que los datos sintéticos no llegan para reemplazar la información clínica real, sino para complementarla. En ese sentido, Diego Pereyra afirma que “son un puente que acelera la investigación y hace más segura la innovación médica, especialmente en países donde el acceso a grandes volúmenes de datos es limitado”.
Desafíos
Aunque el potencial es enorme, los especialistas remarcan que los modelos generativos deben ser evaluados con cuidado. La clave será asegurar que los datos sintéticos mantengan valor clínico y no introduzcan distorsiones. Transparencia, validación médica y estándares claros serán fundamentales para construir confianza entre profesionales, instituciones y pacientes.
“Los datos sintéticos habilitan una nueva unidad de negocio, basada en la monetización responsable de datos confiables, siempre bajo esquemas de colaboración segura, impulsando decisiones mejor informadas, investigación más ágil e innovación sostenible en el sistema de salud”, concluye el experto.