Cómo los datos sintéticos aceleran la investigación del coronavirus

Cuando su investigación pueda salvar a los pacientes con COVID-19, no querrá esperar la aprobación institucional para utilizar los datos de los pacientes en la investigación. Aquí hay una alternativa.

En medio de una crisis, a menudo es necesaria una acción rápida para evitar un mayor daño. Pero cuando opera en un entorno o industria regido por muchas reglas y regulaciones, la acción rápida puede ser bastante difícil.

Tal es el caso de la investigación en salud. Todos los días se recopilan muchos datos sobre los pacientes: su edad, sexo, origen étnico, afecciones de salud subyacentes y más. Pero los datos son sensibles y están protegidos. Después de todo, son algunos de los datos más personales que existen sobre las personas.

Imagen: terovesalainen – stock.adobe.com

Ahora imagine que es un investigador de atención médica que trabaja en temas relacionados con COVID19 pandemia. Esos datos son valiosos y poder trabajar con ellos rápidamente significa encontrar respuestas más rápido y potencialmente salvar más vidas.

«Si observa la forma tradicional en que accedemos a los datos de pacientes con fines de investigación e innovación, tiende a ser bastante engorroso y no particularmente oportuno», dijo Philip Payne, científico jefe de datos y decano asociado de salud y ciencia de datos en la Facultad de Medicina de la Universidad de Washington en St. Louis. «Eso es porque hay un conjunto muy complejo de obstáculos regulatorios, así como obstáculos técnicos».

Philip Payne

Philip Payne

Esos transportistas incluyen la necesidad de mantener la privacidad y confidencialidad de los pacientes. Pero el análisis de datos moderno que requiere muchas iteraciones requiere que los investigadores soliciten y esperen los datos. Es posible que los investigadores tengan que volver a los órganos de gobierno para obtener acceso a datos adicionales, y eso puede llevar semanas o meses. El estado protegido de los datos del paciente hace que sea difícil realizar una investigación analítica de datos de una manera que pueda aplicarse de manera rápida y ágil para impactar una crisis en rápida evolución como la pandemia de coronavirus.

La velocidad importa en una pandemia. Las reglas diseñadas para proteger la privacidad del paciente lo ralentizan todo. Pero tampoco puedes tirar esas reglas por la ventana.

Para acceder a los datos a la velocidad requerida y al mismo tiempo respetar las necesidades de privacidad y gobierno de los datos de los pacientes, la Universidad de Washington en St. Louis, Jefferson Health en Filadelfia y otras organizaciones de atención médica han optado por una alternativa, utilizando algo llamado datos sintéticos.

Gartner define datos sintéticos como datos que «se generan aplicando una técnica de muestreo a datos del mundo real o creando escenarios de simulación donde los modelos y procesos interactúan para crear datos completamente nuevos que no se toman directamente del mundo real».

Así es como Payne lo describe: «Podemos tomar un conjunto de datos de pacientes del mundo real pero luego producir un derivado sintético que estadísticamente sea idéntico a los datos de esas patentes. Puede profundizar en el nivel de función individual y se verá como los datos extraído del EHR (registro de salud electrónico), pero no hay información mutua que conecte esos datos con los datos de origen de los que se deriva «.

¿Por qué es eso tan importante?

«Desde el punto de vista legal, regulatorio y técnico, estos ya no son datos de sujetos humanos potencialmente identificables, por lo que ahora nuestros investigadores pueden literalmente ver un video de capacitación y obtener acceso al sistema», dijo Payne. «Pueden firmar un acuerdo de uso de datos e inmediatamente comenzar a iterar a través de su análisis».

Para más información sobre los datos en la empresa, lea:

Cómo el aprendizaje automático está influyendo en la diversidad y la inclusión

Por qué la ciencia de datos no es una ciencia exacta

Cómo COVID está cambiando el futuro de la tecnología

¿Prosperará el reconocimiento facial en la economía pospandémica?

En el caso de la Universidad de Washington y Jefferson Health, los investigadores están utilizando una plataforma para datos sintéticos llamada MDClone que se especializa en datos sintéticos en el cuidado de la salud. Esta plataforma toma datos de pacientes reales y examina la distribución estadística de las cosas que definen a esos pacientes. Las estadísticas sobre pacientes reales se transfieren al conjunto de datos sintéticos. Básicamente, la plataforma crea un conjunto simulado de pacientes. Los investigadores pueden comenzar el trabajo de análisis de datos utilizando los datos sintéticos después de una sesión de capacitación de una hora y firmar un acuerdo de uso de datos. Eso se compara con las semanas o meses requeridos cuando los investigadores necesitan obtener la aprobación de una junta de revisión institucional para usar datos reales de pacientes.

Esa velocidad es esencial cuando compites para obtener nuevas ideas sobre un nuevo coronavirus que ya ha matado a más de 150,000 personas en los Estados Unidos y más de 700,000 personas en todo el mundo. Los investigadores compiten por una vacuna y tratamientos.

Para la Universidad de Washington en St. Louis, el equipo de datos pudo reconocer otra tendencia importante sobre los pacientes en la red del sistema de salud de 15 hospitales y dos grupos de médicos. El equipo estaba analizando la carga máxima de pacientes anticipada, cuántos pacientes requerirían la UCI, cuántos requerirían ventiladores, cuántos requerirían diálisis y el personal requerido para todo esto.

El equipo pudo darse cuenta rápidamente de que sus hospitales en el norte de St. Louis estaban experimentando mayores tasas de ingresos y admisiones en UCI entre los pacientes con COVID-19. Un análisis de datos reveló que los afroamericanos tenían 2,5 veces más probabilidades de ser admitidos en el hospital que cualquier otro grupo de pacientes, dijo Payne. Una vez admitidos, las probabilidades de que los pacientes negros terminen en la UCI eran cuatro veces mayores que las de otras poblaciones de pacientes.

Payne dijo que el conocimiento llevó a trabajar con grupos de salud pública para brindar un mejor apoyo a las comunidades en riesgo.

La Universidad de Washington está utilizando MDClone en su primera implementación de Microsoft Azure en la nube, pero MDClone también se puede implementar localmente.

Para promover la investigación de COVID-19 y otros trabajos de salud avanzados, el mes pasado MDClone Anunciado The Global Network, una colaboración de investigación e intercambio de conocimientos que protege la privacidad del paciente mediante el uso de datos sintéticos. La Red Global se centrará en tres pilares de la investigación en su primer año: servicios de salud, medicina clínica y medicina de precisión. En el lanzamiento, los miembros incluyeron la Universidad de Washington, Jefferson Health e Intermountain Healthcare en los estados del oeste, entre varios otros. La red permite la colaboración entre estas organizaciones médicas, que es algo que puede acelerar y mejorar la investigación.

«Los datos sintéticos pueden eliminar las restricciones para compartir datos de forma externa para que pueda innovar más rápido», dijo Josh Rubel, director comercial de MDClone.

Jessica Davis ha pasado una carrera cubriendo la intersección de negocios y tecnología en títulos que incluyen Infoworld de IDG, eWeek y Channel Insider de Ziff Davis Enterprise, y MSPmentor de Penton Technology. Le apasiona el uso práctico de la inteligencia empresarial, … Ver biografía completa

Agradecemos sus comentarios sobre este tema en nuestros canales de redes sociales, o [contact us directly] con preguntas sobre el sitio.

Más información



Source link

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *