Salesforce Research utiliza IA para estudiar medicina, economía y habla

En 2015, los investigadores de Salesforce que trabajaban en un sótano debajo de una tienda de muebles de Palo Alto West Elm desarrollaron el prototipo de lo que se convertiría en Einstein, la plataforma de inteligencia artificial de Salesforce que impulsa las predicciones en todos sus productos. En noviembre, Einstein está sirviendo más de 80 mil millones de predicciones por día para decenas de miles de empresas y millones de usuarios. Pero si bien la tecnología sigue siendo fundamental para el negocio de Salesforce, es solo una de las muchas áreas de investigación bajo el ámbito de Salesforce Research, la división de I + D de IA de Salesforce.

Salesforce Research, cuya misión es promover las técnicas de inteligencia artificial que allanan el camino para nuevos productos, aplicaciones y direcciones de investigación, es una consecuencia del compromiso del CEO de Salesforce, Mark Benioff, con la inteligencia artificial como motor de ingresos. En 2016, cuando Salesforce anunció por primera vez a Einstein, Benioff caracterizó la IA como «la próxima plataforma» en la que predijo que se construirán las aplicaciones y capacidades futuras de las empresas. El próximo año, Salesforce publicó una investigación que sugiere que el impacto de la IA a través del software de gestión de relaciones con los clientes agregará más de $ 1 billón a los productos internos brutos en todo el mundo y creará 800.000 nuevos puestos de trabajo.

Hoy en día, el trabajo de Salesforce Research abarca una serie de dominios que incluyen la visión por computadora, el aprendizaje profundo, el habla, el procesamiento del lenguaje natural y el aprendizaje por refuerzo. Lejos de ser de naturaleza exclusivamente comercial, los proyectos de la división abarcan desde drones que utilizan IA para detectar grandes tiburones blancos a un sistema que puede identificar signos de cáncer de mama a partir de imágenes de tejido. El trabajo continúa incluso cuando la pandemia obliga a los científicos de Salesforce a salir de la oficina por futuro previsible. Solo el año pasado, Salesforce Research lanzó un entorno: el Economista de IA – para comprender cómo la IA podría mejorar el diseño económico, una herramienta para probar la solidez del modelo de lenguaje natural y un marco que detalla los usos, riesgos y sesgos de los modelos de IA.

Según el gerente general de Einstein, Marco Casalaina, la mayor parte del trabajo de Salesforce Research se divide en una de dos categorías: investigación pura o investigación aplicada. La investigación pura incluye cosas como AI Economist, que no es inmediatamente relevante para las tareas que Salesforce o sus clientes realizan en la actualidad. La investigación aplicada, por otro lado, tiene una clara motivación empresarial y un caso de uso.

Un subcampo particularmente activo de la investigación aplicada en Salesforce Research es el habla. La primavera pasada, cuando se ordenó cada vez más a los representantes de servicio al cliente que trabajaran desde casa en Manila, EE. UU. y otros lugares, algunas empresas comenzaron a recurrir a la inteligencia artificial para cerrar las brechas resultantes en el servicio. Casalaina dice que esto estimuló el trabajo en el lado del centro de llamadas del negocio de Salesforce.

“Estamos trabajando mucho para nuestros clientes … con respecto a las señales de voz en tiempo real. Ofrecemos todo este proceso de coaching para representantes de servicio al cliente que se lleva a cabo después de la llamada ”, dijo Casalaina a VentureBeat en una entrevista reciente. “La tecnología identifica momentos que fueron buenos o malos, pero que de alguna manera se pudieron entrenar. También estamos trabajando en una serie de capacidades, como escaladas automáticas y finalización, así como en el uso del contenido de las llamadas para rellenar previamente los campos y hacer su vida un poco más fácil «.

Medicamento

La IA con aplicaciones para el cuidado de la salud es otro pilar de investigación en Salesforce, dijo Richard Socher, ex científico jefe de Salesforce, a VentureBeat durante una entrevista telefónica. Socher, que llegó a Salesforce tras la adquisición de MetaMind en 2016, dejó Salesforce Research en julio de 2020 fundó la empresa de motores de búsqueda You.com, pero sigue siendo un científico emérito en Salesforce.

“La visión médica por computadora, en particular, puede tener un gran impacto”, dijo Socher. “Lo interesante es que el sistema visual humano no se ha desarrollado necesariamente para ser muy bueno para leer radiografías, tomografías computarizadas, resonancias magnéticas en tres dimensiones o, lo que es más importante, imágenes de células que podrían indicar un cáncer … El desafío es predecir diagnósticos y tratamiento «.

Para desarrollar, entrenar y comparar modelos de atención médica predictiva, Salesforce Research se basa en una base de datos patentada que comprende decenas de terabytes de datos recopilados de clínicas, hospitales y otros puntos de atención en los EE. UU. Se anonimiza y no identifica, y Andre Esteva, director de AI médica en Salesforce Research, dice que Salesforce está comprometido a adoptar técnicas de preservación de la privacidad como el aprendizaje federado que asegura a los pacientes un nivel de anonimato.

«La próxima frontera está en torno a la medicina de precisión y las terapias de personalización», dijo Esteva a VentureBeat. “No se trata solo de lo que está presente en una imagen o lo que está presente en un paciente, sino de cómo será el futuro del paciente, especialmente si decidimos ponerlo en terapia. Usamos IA para tomar todos los datos del paciente: sus registros de imágenes médicas, su estilo de vida. Se toman decisiones y el algoritmo predice si vivirán o morirán, si vivirán en un estado saludable o insalubre, etc. «

Con este fin, en diciembre, Salesforce Research de código abierto ReceptorNet, un sistema de aprendizaje automático que los investigadores de la división desarrollaron en asociación con médicos del Instituto Lawrence J. Ellison de Medicina Transformativa de la USC de la Universidad del Sur de California. El sistema, que puede determinar un biomarcador crítico para los oncólogos a la hora de decidir el tratamiento adecuado para los pacientes con cáncer de mama, logró un 92% de precisión en un estudio publicado en la revista. Comunicaciones de la naturaleza.

Por lo general, las células de cáncer de mama extraídas durante una biopsia o cirugía se analizan para ver si contienen proteínas que actúan como receptores de estrógeno o progesterona. Cuando las hormonas estrógeno y progesterona se unen a estos receptores, alimentan el crecimiento del cáncer. Pero estos tipos de imágenes de biopsia están menos disponibles y requieren que un patólogo las revise.

Por el contrario, ReceptorNet determina el estado del receptor hormonal mediante tinción con hematoxilina y eosina (H&E), que tiene en cuenta la forma, el tamaño y la estructura de las células. Los investigadores de Salesforce entrenaron el sistema en varios miles de diapositivas de imágenes de H&E de pacientes con cáncer en “docenas” de hospitales de todo el mundo.

La investigación ha demostrado que muchos de los datos utilizados para entrenar algoritmos para el diagnóstico de enfermedades pueden perpetuar las desigualdades. Recientemente, un equipo de científicos del Reino Unido encontró que casi todos los conjuntos de datos de enfermedades oculares provienen de pacientes en América del Norte, Europa y China, lo que significa que es menos seguro que los algoritmos de diagnóstico de enfermedades oculares funcionen bien para grupos raciales de países con poca representación. En otro estudio, los investigadores de la Universidad de Stanford identificaron que la mayoría de los datos de EE. UU. Para estudios que involucran usos médicos de la IA provienen de California, Nueva York y Massachusetts.

Pero Salesforce afirma que cuando analizó ReceptorNet en busca de signos de sesgo relacionado con la edad, la raza y la geografía, descubrió que no había diferencias estáticas en su rendimiento. La compañía también dice que el algoritmo entregó predicciones precisas independientemente de las diferencias en la preparación de muestras de tejido.

«En la clasificación del cáncer de mama, pudimos clasificar algunas imágenes sin un proceso de tinción costoso y que requiere mucho tiempo», dijo Socher. “Para resumir, esta es una de las áreas en las que la IA puede resolver un problema de tal manera que podría ser útil en aplicaciones finales”.

En un proyecto relacionado detallado en un artículo publicado en marzo pasado, los científicos de Salesforce Research desarrollaron un sistema de inteligencia artificial llamado ProGen que pueden generar proteínas de una «manera controlable». Dadas las propiedades deseadas de una proteína, como una función molecular o un componente celular, ProGen crea proteínas tratando los aminoácidos que componen la proteína como palabras en un párrafo.

El equipo de Salesforce Research detrás de ProGen entrenó el modelo en un conjunto de datos de más de 280 millones de secuencias de proteínas y metadatos asociados, el más grande disponible públicamente. El modelo tomó cada muestra de entrenamiento y formuló un juego de adivinanzas por aminoácido. Durante más de un millón de rondas de entrenamiento, ProGen intentó predecir los siguientes aminoácidos a partir de los aminoácidos anteriores y, con el tiempo, el modelo aprendió a generar proteínas con secuencias que no había visto antes.

En el futuro, los investigadores de Salesforce tienen la intención de refinar la capacidad de ProGen para sintetizar proteínas novedosas, ya sean desconocidas o inexistentes, perfeccionando las propiedades específicas de las proteínas.

Ética

El trabajo ético de IA de Salesforce Research abarca la investigación pura y la aplicada. Ha habido un mayor interés en él por parte de los clientes, según Casalaina, quien dice que ha tenido una serie de conversaciones con clientes sobre la ética de la IA durante los últimos seis meses.

En enero, los investigadores de Salesforce publicaron Gimnasio Robustez, que tiene como objetivo unificar un mosaico de bibliotecas para reforzar las estrategias de prueba del modelo de lenguaje natural. Robustness Gym brinda orientación sobre cómo ciertas variables pueden ayudar a priorizar qué evaluaciones ejecutar. Específicamente, describe la influencia de una tarea a través de una estructura y evaluaciones previas conocidas, así como necesidades como la generalización de pruebas, la equidad o la seguridad; y limitaciones como la experiencia, el acceso a la computación y los recursos humanos.

En el estudio del lenguaje natural, las pruebas de robustez tienden a ser la excepción más que la norma. Uno reporte encontró que entre el 60% y el 70% de las respuestas dadas por los modelos de procesamiento del lenguaje natural estaban integradas en algún lugar de los conjuntos de entrenamiento de referencia, lo que indica que los modelos generalmente simplemente memorizaban respuestas. Otro estudio encontró que las métricas utilizadas para comparar modelos de aprendizaje automático e inteligencia artificial tendían a ser inconsistentes, rastreadas de manera irregular y no particularmente informativas.

En un caso de estudio, Salesforce Research hizo que un equipo de modelado de sentimientos en una “importante empresa de tecnología” midiera el sesgo de su modelo utilizando Robustness Gym. Después de probar el sistema, el equipo de modelado encontró una degradación del rendimiento de hasta un 18%.

En un estudio más reciente publicado en julio, los investigadores de Salesforce propuesto una nueva forma de mitigar el sesgo de género en las incrustaciones de palabras, las representaciones de palabras utilizadas para entrenar modelos de IA para resumir, traducir idiomas y realizar otras tareas de predicción. Las incrustaciones de palabras capturan los significados semánticos y sintácticos de las palabras y las relaciones con otras palabras, por lo que se emplean comúnmente en el procesamiento del lenguaje natural. Pero tienen una tendencia a heredar el sesgo de género.

La solución propuesta por Salesforce, Double-Hard Debias, transforma el espacio de incrustación en uno aparentemente sin género. Transforma las incrustaciones de palabras en un «subespacio» que se puede utilizar para encontrar la dimensión que codifica la información de frecuencia que distrae de los géneros codificados. Luego, “proyecta” el componente de género a lo largo de esta dimensión para obtener incrustaciones revisadas antes de ejecutar otra acción de desvanecimiento.

Para evaluar Double-Hard Debias, los investigadores lo probaron con el conjunto de datos de WinoBias, que consiste en oraciones pro-estereotipo de género y anti-estereotipo de género. Double-Hard Debias redujo la puntuación de sesgo de las incrustaciones obtenidas utilizando la Guante algoritmo de 15 (en dos tipos de oraciones) a 7.7 conservando la información semántica.

Trabajo futuro

De cara al futuro, dado que la pandemia deja en claro los beneficios de la automatización, Casalaina espera que esta siga siendo un área central de enfoque para Salesforce Research. Él espera que los chatbots creados para responder las preguntas de los clientes se vuelvan más capaces de lo que son actualmente, por ejemplo, así como las tecnologías de automatización de procesos robóticos que manejan tareas repetitivas de trastienda.

Hay cifras que respaldan las afirmaciones de Casalaina. En noviembre, Salesforce informó un aumento del 300% en Bot de Einstein sesiones desde febrero de este año, un aumento interanual del 680% en comparación con 2019. Eso se suma a un aumento del 700% en las predicciones para la asistencia del agente y la automatización del servicio y un aumento del 300% en las predicciones diarias para Einstein para el comercio en el tercer trimestre de 2020. En cuanto a Einstein para Marketing Cloud y Einstein para ventas, las predicciones de personalización de correo electrónico y dispositivos móviles aumentaron un 67% en el tercer trimestre, y hubo un aumento del 32% en la conversión de prospectos en compradores usando Puntaje de plomo de Einstein.

“El objetivo está aquí, y en Salesforce Research en general, es eliminar las bases para las personas. Se pone mucho énfasis en el modelo, la bondad del modelo y todo eso ”, dijo Casalaina. “Pero eso es solo el 20% de la ecuación. La parte del 80% es cómo lo usan los humanos «.

VentureBeat

La misión de VentureBeat es ser una plaza urbana digital para que los responsables de la toma de decisiones técnicas obtengan conocimientos sobre tecnología transformadora y realicen transacciones.

Nuestro sitio brinda información esencial sobre tecnologías y estrategias de datos para guiarlo mientras dirige sus organizaciones. Te invitamos a convertirte en miembro de nuestra comunidad, para acceder a:

  • información actualizada sobre los temas de su interés
  • nuestros boletines
  • contenido exclusivo de líderes de opinión y acceso con descuento a nuestros preciados eventos, como Transform
  • funciones de red y más

Hazte miembro

Source link

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *