Investigadores de Nvidia detallan el sistema de transcripción de voz clínica impulsado por IA

En la Conferencia sobre inteligencia artificial en imágenes médicas 2020, que se celebró virtualmente este año, los investigadores de Nvidia presentaron un artículo que describe un sistema de inteligencia artificial que captura y transcribe el habla de los pacientes clínicos. El sistema identifica palabras clínicas y mapea las palabras en una base de datos de salud estandarizada, tareas que, según los investigadores, podrían aliviar la presión sobre los médicos a medida que experimentan un exceso de trabajo relacionado con la pandemia.

Los coautores sugieren la telemedicina como un uso potencial del sistema, un campo que ha visto una demanda sin precedentes durante la pandemia de coronavirus. En marzo, las consultas de salud virtual crecieron un 50%, según la investigación de Frost y Sullivan, con visitas médicas generales en línea en camino de alcanzar los 200 millones este año.

En el núcleo del sistema de los investigadores hay un BERT-Modelo de lenguaje basado en pre-entrenamiento de una manera auto-supervisada en un conjunto de datos de texto. (El aprendizaje auto-supervisado es un medio de entrenar modelos para realizar tareas sin proporcionar datos etiquetados). Bio-Megatron, un modelo con 345 millones de parámetros, variables de configuración internas del modelo, patrones ingeridos y aprendidos de 6.100 millones de palabras extraídas de PubMed. un motor de búsqueda de resúmenes sobre temas de ciencias de la vida.

Después de la capacitación previa, el modelo se ajustó en un conjunto de datos de procesamiento de lenguaje natural clínico creado por un antiguo Instituto Nacional de Salud (NIH) financiado Acuerdo del Centro Nacional de Computación Biomédica. Luego, se incorporó a un componente de reconocimiento automático de voz que realiza la identificación de palabras y compara las palabras con los conceptos en el Sistema Unificado de Lenguaje Médico (UMLS), una ontología desarrollada por la Biblioteca Nacional de Medicina de los NIH.

En experimentos que se ejecutan en tarjetas gráficas Nvidia V100 y T4, los investigadores informan que Bio-Megatron logró una precisión del 92,05% después de 1 milisegundo de procesamiento al tener en cuenta precisión y recuerdo. “Esto abre nuevas e importantes capacidades en sistemas donde la capacidad de respuesta a los pacientes, médicos e investigadores es primordial … Un modelo de reconocimiento de voz automático que puede extraer y relacionar conceptos clínicos clave de conversaciones clínicas puede ser muy útil”, escribieron. «Esperamos que nuestra contribución ayude a lograr mejores y más rápidas respuestas de los pacientes, lo que finalmente conducirá a una mejor atención al paciente».

La contribución de Nvidia a la comunidad de investigación se produce después de que los coautores de Microsoft propusieran un modelo de lenguaje biomédico «de vanguardia» denominado PubMedBERT. Afirmaron que lograron resultados líderes en la industria en tareas que incluyen el reconocimiento de entidades nombradas, extracción de información médica basada en evidencia, clasificación de documentos y más.

Source link

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *