N.World
Aprendizagem da máquina

Estudo de caso: Últimos desenvolvimentos no campo do processamento de linguagem natural (NPL), um PoC para BBVA

De Bosonit y Nfq temos participado com o departamento de BBVA Innovación de CIB & CS en una PoC. Testeamos los últimos avances surgidos en el campo del procesamiento del Processamento de Linguagem Natural (PNL), aplicação de IA e Aprendizagem de Máquina a la democratización del conocimiento de los equipos técnicos consiguiendo avances en la resolución y gestión de consultas e incidencias técnicas.

La PoC ha permitido al grupo adquirir un conocimiento acerca del estado actual del campo de NLP. También los límites en el que se encuentran los modelos más avanzados del sector y sus posibles aplicaciones. O resultado deste CdP é uma ferramenta de Q/A (Pergunta/Resposta). para la resolución de consultas/incidencias en base a la información histórica de BBVA.

Trabalhando com BBVA nesta prova de conceito é de grande valor e dá visibilidade ao Bosonit y Nfq en ámbitos y áreas donde nos conocían. El resultado de la prueba muestra un gran potencial de cara a productivizar el caso de uso e incluso incorporarlo dentro de nossa gama de serviços.

¿Quiénes han formado parte de este proyecto?

Para este desafio, a equipe do Grupo N foi formada por Manuel Ranea (Nfq) y Javier Gonzalez Peñalosa (Bosonit), que nos cuenta en qué ha consistido el proceso.

Ferramenta de Q/A com NPL Q&A

Em vista do lançamento do novo modelo de NLP llamado GPT-3 por parte de la compañía ABERTO IA con expendidos resultados en diversas tareas del área. Decidimos emprender una prueba de concepto en este campo. GPT-3 tem superado resultados diferentes marcados por modelos anteriores en tareas como la síntesis de información, Q&A, identificación de identidades propias y generación de texto lo que le hacia un perfecto modelo para la creación de un chatbot de preguntas. Mediante el este, se puede mantener conversaciones coherentes respecto a diferentes temas siendo capaz de mantener el contexto de la conversación. El problema de este modelo es que debido a su gran tamaño era imposible especializarlo en un sector tan técnico como podía ser nuestro la información de los diferentes departamentos del BBVA. También habría que apuntar que no se trataba de un Modelo OPEN-SOURCE lo que nos llevar?a un coste agregado para la compañía cada vez que se le solicitara información al modelo, haciendo inviable el proyecto con él.
Para solventar este problema utilizamos modelos mas pequeños tanto de IA aberta como a do Google que habrán sido puesto a disposición del publico para un uso libre. Escolhemos o GPT-2 e o BERT pois eles eram os candidatos perfeitos para nossa tarefa e eram modelos amplamente reconhecidos por seu desempenho. Uma vez treinados e testados estos modelos rápidamente nos dimos cuenta que eran incapaces de adaptarse a los textos técnicos. Los modelos estaban diseñados para generar texto de conversaciones informales o noticias, lo que tuvimos que cambiar la idea de desarrollo de nuestro producto. No era posible entrenar a modelos que fueran capaces de aprender todos los métodos y estrategias a la hora de resolver problemas técnicos que tiene el banco debido a que pequeños detalles o sentidos en la pregunta podrían hacer cambiar la respuesta que le diéramos al empleado haciendo que fuera Incorrecta.

Un ejemplo de ello, podría ser una problemática con la conexión de herramientas en diferentes sistemas operativos. El modelo si hubiera obtenido la información a la hora de entrenarlo sobre ese problema en Windows nos devolvería esa información pero en nuestro caso igual lo queríamos para solucionarlo en Linux. Surgiendo así, incoherencias en el resultado para el empleado.

Es por ello que consideramos cambiar nuestro enfoque primario y utilizar todo el potencial que ya teníamos de preguntas y respuestas en las diferentes plataformas del banco, para dar más peso a las respuestas de las personas y dejar que el modelo se encargara de buscar la respuesta y te devolviera la información mas acorde con tu pregunta.

Para llevar acabo nuestra herramienta usamos diferentes técnicas y modelos que nos permitieran agrupar toda esta información que poseíamos en una base de datos y a través de transformers (Ferramentas de última geração) nos permitieran sintetizar la información de las respuestas, para que el empleado sea capaz de buscar la solución mas cercana a su problema. En la información que teníamos había perguntas diretas, pero también había hilos donde participaban diferentes agentes respecto a un problema. En las soluciones con una sola respuestas usamos un modelo de síntesis normal, pero en los multihilos optamos por un modelo que no sólo sea capaz de recoger la información de los agentes, también, las interacciones entre ellos, y que nos ha permitido añadirle mayor valor a nuestro resultado.

Bosonit

Bosonit

Técnica e Dados

Você pode estar interessado em

Dê o salto
tecnológico.

Entre em contato conosco.