N.World
NLP

Bosonit TechXperience | "PNL e Modelos Linguísticos" de Javier González Peñalosa

Em nossa quarta TechXperience, Javier González, Data Cientistatomou as rédeas da apresentação e desenvolveu uma sessão sobre PNL (processamento de linguagem natural) e revisou alguns dos diferentes modelos de linguagem que podem ser encontrados hoje. 

Quem é Javier González Peñalosa?

Antes de mais nada, vocês devem se apresentar a Javier González Peñalosa. Javier, estudou economia no Universidade Ele recebeu o título de Mestre em Ciência da Computação pela Universidade de Zaragoza, o que lhe permitiu entrar no mundo da banca comercial. Apesar disso, ele queria se especializar no mundo de TI por meio de um mestrado em Grandes dados y Negócios Inteligência. Isto lhe permitiu entrar posteriormente no Bosonit na posição de Dados Ciência 

O que é PNL (Processamento de Linguagem Natural)?

O NLP se concentra em como as máquinas entendem, interpretam e processam a linguagem humana. Não se trata apenas de traduzir palavras, mas também de saber interpretar seus diferentes significados e frases de acordo com o contexto.  

O processamento da linguagem natural é a combinação de duas áreas diferentes, como lingüística e Aprendizagem da máquina. Não só traduz palavra por palavra para que os modelos entendam, mas também é necessário que haja uma relação entre essas palavras.  

Modelos linguísticos

Os modelos precisam entender todo o contexto para formar, relacionar e mostrar uma referência simples entre uma palavra e outra. Esta área engloba diferentes tarefas, sendo uma das mais comuns a classificação de textos.  

Hoje em dia, se formos a páginas como FilmAffinity ou IMDB, podemos encontrar diferentes críticas e ao processar este tipo de modelos é possível verificar se estes tipos de revisões foram positivas ou negativas para o filme. Esta é uma classificação para medir o sentimento desse texto.  

Outra das tarefas de classificação mais comuns seria a classificação de spam. Ao processar todo o e-mail, poderemos, com a criação de um modelo, categorizar se um e-mail é ou não spam. Agregando valor e automatizando o processo para o usuário.  

A geração de texto é outro dos modelos da PNL. Após o lançamento do GPT, os modelos generativos de texto vieram para a vanguarda. Ao inserir uma pequena quantidade de texto, ele é capaz de pegar o estilo de sua entrada e continuar gerando texto enquanto mantém o estilo. Um exemplo disso seria treinar esses modelos com o estilo de escrita de Gustavo Adolfo Becquer e acabar sendo capaz de replicar o estilo de Becquer.  

Mas a PNL não se concentra apenas no processamento de texto. Ao longo dos anos, ela vem avançando e vem cobrindo novos domínios dos quais podemos destacar: 

  • Áudio para texto: Com modelos como o wac2vec, somos capazes de processar todos os textos falados em diferentes idiomas. Um exemplo disso poderiam ser os assistentes que todos nós temos em nossos telefones celulares (por exemplo, Alexa ou Siri).  
  • Geração de imagens: A Open AI criou um projeto chamado DALLE onde, reunindo seus modelos de geração de texto (GPT) e de geração de imagem, eles puderam recriar em formato digital o texto escrito pelo usuário. 
  • Co-piloto: com seu modelo GPT-3, treinado em um projeto em colaboração com a Microsoft, tendo como entrada todos os repositórios públicos que existem no GitHub. Isto permite que modelos generativos escrevam código em diferentes linguagens de programação apenas através de texto. Uma excelente ferramenta na programação, fazendo progressos muito mais rápidos.  
Bosonit

Bosonit

Técnica e Dados

Você pode estar interessado em

Dê o salto
tecnológico.

Entre em contato conosco.