Explorando a Fronteira da IA: Acesso em Linguagem Natural

Mergulhe na vanguarda dos avanços da IA com linguagem natural como um modelo de interface do usuário. Uma jornada pelo cenário em constante evolução da IA.

Interação homem-máquina usando conversação em linguagem natural
Human-machine interaction using natural language conversation, natural style, super-8 color schema; Criada pelo autor usando a IA Midjourney

Uma série de aplicativos já está sendo lançada utilizando a IA do ChatGPT como uma plataforma para responder a perguntas dos usuários ou gerar textos sobre domínios específicos. É um uso interessante da tecnologia, mas com impacto ainda limitado. O jogo vai mudar quando a IA passar a atuar como um agente com acesso a registrar transações a partir da interface com o usuário em linguagem natural. Vamos sonhar um pouco?

Este é o primeiro de uma série de 3 artigos onde pretendo explorar possíveis avanços da IA em diferentes trilhas:

  1. Interface com o usuário em linguagem natural

  2. IA com acesso às bases de conhecimentos do negócio

  3. Sistemas dinâmicos com mudanças de processos e regras

O objetivo dessa série não é a de apresentar o estado atual da tecnologia disponível, mas desenhar os próximos estágios de evolução para guiar investimentos de pesquisa e desenvolvimento. Não se trata de prever o futuro, mas de projetá-lo a partir do que podemos ver hoje.

A Evolução da Interface com o Usuário

A maneira como interagimos com máquinas muda diariamente com a evolução tecnológica e a disponibilidade de novos produtos cada vez mais aprimorados. Algumas mudanças, contudo, podem ser classificadas como grandes ondas históricas de transformação que revolucionaram essa interação. Veja 3 das mais representativas no uso de computadores:

  1. A criação da Interface Gráfica de Usuário nos computadores pessoais da década de 1980.
  2. A navegação em hipertexto na World Wide Web com a popularização da Internet na década de 1990.
  3. A interação via toque na tela em dispositivos móveis na primeira década dos anos 2000.

A comunicação em linguagem natural com IAs baseadas em modelos de linguagem que estamos vivenciando no momento representa uma nova revolução na interface homem-máquina, possivelmente maior do que as 3 anteriores. Essa revolução está apenas começando.

Ondas evolutivas na interface homem-máquina
Ondas evolutivas na interface homem-máquina
(Criado pelo autor usando Microsoft Bing, Designer e Power Point)

Hoje: ChatBots com uso de Linguagem Natural

As novas inteligências artificiais baseadas em modelos de linguagem, como o ChatGPT, o Chat Bing ou Google Bard, são acessadas na forma de um ChatBot de uso genérico. Isso significa que o usuário deve acessar uma caixa de comando (prompt) e digitar uma instrução de entrada que será processada pela IA que irá produzir e retornar uma resposta.

Modelo de uso da IA hoje
Modelo de uso da IA hoje (Criado pelo autor)

Essas IAs também tem certa capacidade de manter o contexto de uma conversa, fazendo com que uma resposta possa não somente considerar as instruções da última entrada, mas também o histórico de informações trocadas em várias interações passadas. Isso torna seu uso muito mais conversacional do que simplesmente “pergunta e resposta” como nos tradicionais engines de busca na internet Google ou Bing. É possível “iterar” no processo de troca de mensagens e trabalhar com o ChatBot como um parceiro na construção de um conteúdo refinando progressivamente o resultado. 

Algumas aplicações já estão disponíveis a partir do treinamento dos modelos de linguagem genéricos com uma camada adicional de conhecimento proprietário sobre um domínio de conhecimento, especialidade ou negócio específico. Alguns exemplos de domínios são: mercado imobiliário [1][2], metodologias de gestão [3], metodologias de desenvolvimento de software [4]. Com esta camada adicional e especializada no domínio, os usuários podem fazer perguntas a um “consultor virtual” diferenciado.

O próximo passo na evolução é transformar o que hoje é uma aplicação de ChatBot em um Agente para ser utilizado como interface transacional por outras aplicações e equipamentos. Continue lendo esse artigo para entender.

Linguagem Natural: O ápice da Interface

Uma das principais barreiras para a inclusão digital hoje é a interface humano-computador. Para utilizar uma tecnologia, o usuário precisa aprender a usá-la. Não basta ter domínio do assunto tratado, é preciso conhecer a ferramenta e entender sua lógica de menus, botões, janelas, atalhos, estrutura.

Por exemplo, um engenheiro civil que seja muito bem formado e experiente na elaboração de plantas utilizando papel e nanquim, não está imediatamente capacitado a desenvolver projetos em uma ferramenta CAD. Na realidade, a interface complexa de menus e comandos representou uma barreira para vários profissionais mais antigos continuarem no mercado.

Um médico, após anos de treinamento e prática em medicina e conhecendo profundamente o corpo humano, ainda terá que aprender os comandos e passos descritos nos manuais dos equipamentos e softwares de diagnóstico para poder aproveitar os avanços da tecnologia.

Um gerente de contas em um banco precisa decorar uma série de códigos e ser treinado em dezenas de aplicativos para poder abrir contas, negociar investimentos, fazer empréstimos e atender às solicitações de seus clientes. E se mudar de emprego para trabalhar em um outro banco, terá que aprender tudo novamente, pois os sistemas são diferentes.

O poder da Interface de Usuário com Linguagem Natural

A disponibilização de uma interface em linguagem natural irá permitir a ampliação do uso da tecnologia para usuários menos digitais. O engenheiro ainda precisará conhecer engenharia, o médico precisará saber medicina e o gerente de banco terá que conhecer os produtos bancários, mas não precisarão perder tempo aprendendo os comandos, menus e interfaces específicas de um sistema.

A melhor maneira que a humanidade criou de se comunicar é através da linguagem. O que se apresenta num horizonte próximo são sistemas capazes de realizar transações a partir de comandos feitos em linguagem natural, com compreensão das necessidades levando em conta o contexto das solicitações do usuário.

Além do aumento da produtividade e eficiência, este tipo de interface irá permitir o acesso dos “iletrados digitais” na economia digital. Bastará ter domínio do assunto e saber se comunicar usando a linguagem de palavras para definir objetivos e indicar comandos para serem executados por um Agende de IA capaz de entender o que foi pedindo dentro do seu contexto.

Amanhã: Agentes de IA com Interface em Linguagem Natural

Um Agente é uma IA desenhada para pensar e agir de forma independente [5]. A partir de um objetivo fornecido pelo usuário, o Agente segue um diálogo interno para estabelecer as tarefas que precisa realizar e passa a executar comandos em interação com o ambiente externo retroalimentando o seu entendimento do contexto para reavaliar e ajustar os próximos passos até que o objetivo seja alcançado.

Além da modelo de linguagem grande (LLM) obtido por aprendizado de máquina, o agente é capaz de pesquisar informações online na internet, interagir com outros sistemas por comandos via troca de mensagens (API) e até trocar mensagens com outros usuários através de emails ou interfaces próprias.

Modelo de uso da IA amanhã
Modelo de uso da IA amanhã (Criado pelo autor)

Não se trata de uma automação convencional de tarefas porque as tarefas não precisam ser previamente definidas num modelo tradicional de programação. O Agente de IA pode redefinir e fazer os ajustes necessários para alcançar o objetivo definido pelo usuário de maneira autônoma e adequar-se durante o processo.

Isso muda a maneira como interagimos com sistemas. Conversando com seu Agente como se fosse um Assistente Pessoal, o usuário não precisa mais conhecer os comandos e interfaces dos sistemas que precisam ser acessados numa ordem específica para alcançar seu objetivo. Toda essa complexidade passa a ser transparente para o usuário e gerenciada pelo Agente.

Agentes de IA com Linguagem Natural no Seu Negócio

Pense num Agente de IA baseado em modelo de linguagem como um componente a ser acoplado ao seu negócio e configurado para dar acesso a todos os serviços digitais que sua empresa oferece a seus clientes, colaboradores e parceiros. Assim como criamos no passado um canal na Internet (Intranet ou Extranet) para aprimorarmos nossas interfaces e otimizar nossos negócios, pense que agora a nova interface é de linguagem natural e comece a se fazer as seguintes questões:

  • Quais stakeholders estão hoje fora do seu negócio e poderão ser integrados por esse novo canal com linguagem natural?
  • Quais novos serviços poderão ser prestados?
  • Que serviços (internos e externos) poderão ser melhorados com a simplificação da complexidade do acesso?
  • Quais processos podem ser totalmente (ou parcialmente) executados por IA?
  • Como isso pode representar um diferencial competitivo para o seu negócio?

Essas questões poderão indicar um caminho para que seu negócio possa explorar esse novo cenário e transformar a forma como a tecnologia é utilizada em sua organização.

Gaps: Desafios a Serem Vencidos

A maior parte dos exemplos que temos visto de uso da IA em negócios tradicionais ainda são de ChatBots de pergunta e resposta, com avisos de isenção de responsabilidade (disclaimer) sobre a qualidade das respostas, que muitas vezes não são de boa qualidade. Mas o futuro não está tão distante. Já existem plataformas e provedores de solução que permitem a criação de Agentes de IA que funcionam como interface para realizar as transações do seu negócio em linguagem natural. [6][7]

Mas é bom ressaltar que ainda há muito a ser feito antes de disponibilizar acesso às transações de sua empresa a uma IA. Uma série de desafios precisa ser superada com a inclusão de testes, experimentos e criação de barreiras para garantir que:

  • a IA utilizada tenha a capacidade de compreensão profunda do contexto e da intenção do usuário e não realize transações de maneira equivocada;
  • questões éticas sejam adequadamente endereçadas e evite que um Agente de IA possa causar danos ou prejudicar pessoas para alcançar seus objetivos;
  • a privacidade das informações seja garantida e o acesso seja restrito a alçadas e perfis definidos;
  • os dados utilizados para o treinamento da IA sejam livres vieses que venham a levar a decisões ou ações preconceituosas;
  • a IA melhore sua capacidade de lidar com ambiguidades e perguntas complexas sem “delírios” ou assumindo informações que podem levar a erros;
  • APIs sejam desenvolvidas para possibilitar o acesso a transações do seu negócio pelos agentes com a segurança necessária.

Não menosprezo a dificuldade para superar esses desafios, mas considero que serão superados em breve, ou seja, esteja pronto para alavancar a visão estratégica do seu negócio usando IA o quanto antes e aproveite a oportunidade do pioneirismo. 

Considerações Finais

Neste primeiro artigo da série, exploramos os avanços significativos na interface com o usuário através de linguagem natural, representados pelos novos modelos de linguagem. Constatamos que estamos vivendo uma revolução na interação humano-máquina, e a evolução tecnológica tem permitido que a comunicação com máquinas seja cada vez mais natural e intuitiva. Os ChatBots baseados em modelos de linguagem possibilitam uma interação mais conversacional, superando os tradicionais motores de busca na internet.

O potencial dessa interface em linguagem natural é notável, especialmente quando se trata de tornar a tecnologia mais acessível para usuários menos técnicos. Ao eliminar a necessidade de aprender interfaces complexas, Agentes de IA possibilitarão que profissionais de diversas áreas concentrem-se em suas especialidades sem perder tempo com treinamentos específicos de sistemas. Essa mudança tem o poder de promover a inclusão digital e oferecer oportunidades para “iletrados digitais” na economia digital.

No futuro, Agentes equipados com modelos de linguagem integrados a aplicações de negócio funcionarão como interfaces para realizar transações, tornando-se a forma primária de interação com os serviços oferecidos pelas empresas. 

Esta série de artigos tem como objetivo justamente projetar esses próximos estágios de evolução, guiando investimentos em pesquisa e desenvolvimento e impulsionando a sociedade em direção a uma era de maior interação e cooperação com a tecnologia. 

Sejamos pioneiros nessa jornada para construir um futuro onde a inteligência artificial e a linguagem natural caminhem lado a lado em harmonia, trazendo inovação e prosperidade para todos.

Aguarde os próximos artigos e deixe seus comentários para contribuir com essa discussão.

Referências

[1] Startup brasileira cria “ChatGPT do setor imobiliário”; https://imoveis.estadao.com.br/noticias/startup-brasileira-cria-chatgpt-do-setor-imobiliario/ 

[2]  Lais, uma assistente digital voltada para o mercado imobiliário; https://laisriopreto.com.br/ 

[3] PM Otto, um assistente digital para Gestão de Projetos; https://www.pmotto.ai/ 

[4] Ágil GPT, um assistente digital para metodologias ágeis de desenvolvimento de sistemas; https://argon.tec.br/mentoria-agil/

[5] What is an AI agent?; https://zapier.com/blog/ai-agent/

[6] Build AI Agents at Scale – No Coding Required!; https://fine-tuner.ai/ 

[7] AI Agents: Power Up Your Productivity; https://aiagent.app/ 

Outros artigos e videos sobre Inteligência Artificial