Pouca gente entendeu o maior avanço trazido pelo Chat GPT

O Chat GPT e outros modelos de linguagem que compreendem a linguagem natural representam o início da quarta onda na forma como interagimos com computadores.

Neste final de semana em uma reunião de família meu tio Zé, que embora já tenha passado dos 70 anos de idade, continua bastante atento e antenado com as novidades, me perguntou: “Você que trabalha na área de tecnologia, me responda uma coisa: esse tal de Chat GPT é tudo isso mesmo? Ou é só uma modinha passageira?” 

Chat GPT como um Oráculo Digital, Criado por IA usando Microsoft Designer

“Oráculo Digital”

Criado pelo autor usando IA
com Microsoft Designer

É possível que você já tenha se deparado com uma pergunta semelhante, ou mesmo esteja se fazendo essa mesma pergunta. Tenho experimentado bastante da tecnologia desde que ela foi disponibilizada publicamente e o assunto me interessa. Troco ideias com vários profissionais, leio artigos a respeito e procuro me manter atualizado. Sendo assim, não fiquei em cima do muro e respondi. “É sim, tio! Isso vai revolucionar o uso da tecnologia, mas não necessariamente naquilo que as pessoas estão olhando agora. O Chat GPT não é só um Google turbinado e muito menos um Oráculo Digital como muitos o estão vendo. Ele é um exemplo de como vamos interagir com tudo o que é relacionado a tecnologia no futuro.”

A intenção desse artigo é aprofundar um pouco mais sobre essa resposta que dei ao meu tio e estimular uma visão do futuro que está se formando com a difusão dessa tecnologia de modelos de linguagem baseados em inteligência artificial.

Modelos de Linguagem

O Chat GPT é apenas uma das tecnologias de modelos de linguagem baseadas em IA Generativa que estão sendo lançadas e estão causando alvoroço entre todo mundo que se interessa por tecnologia. 

Um modelo de linguagem baseado em IA é um software que utiliza uma técnica chamada aprendizado de máquina para treinar a partir de grandes quantidades de dados de texto e aprender a identificar padrões em palavras, frases e contextos. Depois de treinado, ele é capaz de gerar texto coerente e inteligível, bem como compreender e interpretar a linguagem natural.

Esses modelos de linguagem têm sido usados em várias aplicações já há algum tempo e você já deve estar utilizando alguns deles para realizar tarefas automáticas como:

  • Solicitar serviços através de um chatbot ao seu banco, seguradora ou companhia aérea.
  • Corrigir a ortografia, sintaxe ou até mesmo sugerir uma expressão mais clara para os textos que você escreve no editor de textos ou nos seus emails.
  • Traduzir textos inteiros de ou para um outro idioma.
  • Reconhecer o áudio de um texto falado e transformá-lo em texto escrito.
  • Avaliar se um post que você está escrevendo passa uma mensagem positiva ou negativa a respeito do assunto ou produto que está se referindo (talvez você ainda não tenha usado esse, mas certamente o dono do produto que você comentou no Facebook está usando).

Com o avanço da tecnologia, é esperado que modelos de linguagem baseados em IA se tornem ainda mais poderosos e capazes de lidar com tarefas cada vez mais complexas envolvendo linguagem natural.

Um Google turbinado

Googlar virou um verbo. Há muito tempo não passo mais vontade de saber as coisas. 

  • “Qual é mesmo o nome daquele ator que fez um cientista maluco em De Volta para o Futuro?” Google. 
  • “Quanto será que custa uma Ferrari zero Km?” Google. 
  • “Quantos anos tem a Xuxa?” Google. “Uau! Continua gata.”

Quando queremos pesquisar sobre alguma coisa, o acesso à base de conhecimento da Web está na mão através dos engines de busca como o Google. Basta colocar os termos desejados na rede e uma lista de páginas web relacionadas àqueles termos aparece e você pode lê-las e buscar respostas às suas dúvidas. Mas isso ainda pode ser considerado trabalhoso. Preciso escolher qual página clicar, ler o seu conteúdo e achar a informação relevante. Com o Chat GPT ou o Chat do Bing isso fica muito mais fácil.

Essas ferramentas de chatbot baseadas em IA tem acesso a essas páginas e não se esquecem do que já aprenderam. Além disso, são capazes de fazer associações que não estão diretamente escritas nas páginas e ainda gerarem uma resposta coerente e até inédita por meio dessas associações. Sendo assim a pesquisa torna-se muito mais fácil e podemos sim chamá-las de “Google turbinado”. Posso perguntar coisas como:

“Existe alguma evidência de que a Xuxa conheça o ator que fez o cientista maluco em De Volta para o Futuro ou que algum deles tenha comprado uma Ferrari?”

Os novos modelos de linguagem baseados em IA são capazes de responder perguntas assim, mas considerá-los como sendo Oráculos Digitais já é outra história.

As limitações do Chat GPT

As fontes nem sempre são confiáveis

Nem toda informação disponível na Web é informação confiável. Há muita desinformação travestida de informação. O modelo se baseia em aprendizagem por repetição de padrão e portanto tende a carregar vieses do conteúdo que utilizou para aprender. Por exemplo, se a maior parte do conteúdo de texto disponível para seu aprendizado da máquina dissesse que a terra é plana, essa informação seria propagada pela IA e isso pode ser perigoso.

Exemplos de perguntas que podem te trazer informações pouco confiáveis:

  • “Como tratar uma pessoa que apresenta o sintoma X?” 
  • “Onde devo investir meu dinheiro para ter maior rentabilidade?”
  • “Como faço para conseguir um namorada?”

Conhecimento não é a mesma coisa que sabedoria. O Chat GPT acumula muitos dados e tem a capacidade de acessá-los e formar respostas coerentes em linguagem natural a partir desses dados. Mas as respostas podem não ser as melhores para o seu contexto específico.

Delírios Digitais do Chat GPT

Além do risco da fonte de conhecimento estar errada, os modelos de linguagem baseados em IA também têm apresentado um comportamento que tem sido chamado de “delírios”.

Os “delírios” são respostas geradas que parecem plausíveis ou coerentes, mas que não fazem sentido no contexto da conversa. Essas respostas podem ser uma mistura de palavras e ideias que foram aprendidas a partir dos dados de treinamento, mas que não se encaixam necessariamente no contexto da conversa. Ou apresentam inverdades.

Por exemplo, perguntei quem estaria se apresentando no evento BALife 2023 que vou participar em Abril, uma conferência realizada pelo IIBA Chapter de Edimburgo. Tanto Chat GPT quanto Bing começaram a inventar uma sequência de palestras e palestrantes que não tinha relação alguma com o evento. Colocaram nomes de gente famosa como Bill Gates e Tom Cruise falando sobre o futuro da Análise de Negócios. Seria ótimo vê-los lá, mas não é verdade. Isso acontece porque o modelo está usando o contexto de informações que foram incluídas nos dados de treinamento para prever a próxima palavra que deve compor sua resposta de forma probabilística, mas nesse contexto específico esse conhecimento prévio não é relevante.

Existem algumas dificuldades no treinamento dessas ferramentas. Modelos de linguagem são alimentados com grandes quantidades de dados de texto, que incluem muitas expressões idiomáticas, sarcasmo, ironia e outros aspectos da linguagem natural que podem ser difíceis de entender completamente. Além disso, esses modelos podem não ter a capacidade de entender o contexto ou a intenção por trás das palavras e frases. Tudo isso pode gerar delírios como esses.

Avanços recentes estão ajudando a reduzir a incidência desses delírios. É possível que vejamos isso ocorrendo cada vez menos nas próximas versões e que estes problemas desapareçam em poucos anos, mas por enquanto é bom tomar cuidado e sempre verificar as fontes antes de compartilhar a informação obtida nos chatbots.

A grande revolução do Chat GPT

Algumas pessoas estão olhando para essas limitações do Chat GPT e achando que isso minimiza o seu impacto na transformação digital. Essas pessoas estão olhando para o lado errado da interface. 

entrada de texto >> Chat GPT >> saída de texto
entrada de texto >> Chat GPT >> saída de texto
(Criado pelo autor)

O mais impressionante do Chat GPT não é a sua capacidade de gerar textos coerentes, mas a sua capacidade de reconhecer coerência nas nossas mensagens e entender o que queremos dizer, mesmo que digamos de forma natural e desestruturada.

É na entrada de dados que o Chat GPT mais impressiona. Antes dele, para interagir com um aplicativo, eu sempre precisei acessar as opções disponíveis no menu, ou então conhecer os comandos pré estabelecidos para a realização de qualquer atividade automatizada.

Mesmo para dispositivos de comandos de voz eu sempre fui obrigado a me treinar para usá-los:

“Alexa, marque meu despertador para as 8:00”. Ela não entendeu. 
Qual é mesmo a palavra certa? “Configure o alarme? Ajuste um alerta?”

Com o Chat GPT essa comunicação é totalmente diferente. Ele é capaz de refinar continuamente a sua compreensão da linguagem natural através de sucessivas iterações de conversas com o usuário, mantendo o contexto e incrementando gradativamente a profundidade da conversa utilizando comunicação não estruturada e informal.

Alguns exemplos de coisas que eram impossíveis de lidar nos sistemas antigos, mas que o Chat GPT é capaz de entender e gerar respostas precisas:

  • Perguntas em linguagem coloquial, como “Qual é a boa?” ou “Que é que tem pra hoje?”.
  • Comentários que envolvem sarcasmo ou ironia, como “Ótimo, meu computador acabou de travar de novo!” (quando na verdade algo deu errado).
  • Frases ou perguntas que envolvem múltiplas ideias, como “Você sabe onde posso encontrar um bom café por aqui? Ah, e também estou procurando por um lugar que venda croissants de qualidade”.
  • Solicitações vagas ou genéricas, como “Me ajuda com isso” ou “Quero saber mais sobre isso”.
  • Perguntas ou comentários que envolvem gírias ou jargões específicos, que podem ser difíceis de entender para alguém que não está familiarizado com o assunto.

Em todos esses casos, o Chat GPT é capaz de compreender a intenção do usuário e gerar uma resposta precisa, sem a necessidade de um menu pré-estabelecido ou de uma linguagem formal e estruturada.

A interface para além do chatbot

O Chat GPT é apenas um exemplo de como vamos interagir com tudo o que é relacionado a tecnologia. No futuro qualquer tipo de aplicativo ou dispositivo automatizado como TVs, sistemas de segurança, sistemas hospitalares e de diagnóstico, sistemas especialistas para engenharia, desenvolvimento de software, controle de tráfego… tudo terá uma interface de comunicação baseado em linguagem natural. 

No filme Homem de Ferro da Marvel, o cientista Tony Stark acessa seu computador Jarvis conversando em linguagem natural para solicitar a execução de tarefas de forma simples e dinâmica para criar sua armadura. O que era ficção em 2008 está muito próximo de se tornar realidade.

Tony Stark conversando com Jarvis, seu Chat GPT pessoal no filme Homem de Ferro

Tony Stark using his computer by voice command to create his armor, watercolor, in the style of futurism, serene”

Criado pelo autor usando IA
com Microsoft Designer

Digressão para os nerds de plantão: Esse artigo tem uma visão positiva da evolução da tecnologia. Por isso não vou comentar que no filme em Vingadores: A Éra de Ultron a IA de Tony Stark acabou por concluir que para se alcançar a paz seria necessário destruir a raça humana.

"A Inteligência Artificial vai tomar o meu lugar?", entrevista com o Chat GPT

Para discutir os aspectos éticos e impactos da IA veja a entrevista que fiz com o Chat GPT: A Inteligência Artificial vai tomar o meu lugar?.

Exemplos do que vem pela frente

Quando os modelos de linguagem baseados em IA forem amplamente adotados em diversos tipos de aplicativos e dispositivos automatizados, o mundo será transformado de várias maneiras. A seguir alguns exemplos de como vamos interagir com nossos aplicativos:

  1. Comunicação mais natural: Os usuários poderão se comunicar com sistemas de forma mais natural e intuitiva, usando a linguagem que preferirem e sem precisar aprender interfaces complexas ou comandos específicos. Isso tornará a interação mais fácil e acessível para uma ampla gama de usuários que hoje são considerados analfabetos digitais e estão alijados do acesso ao que a tecnologia pode oferecer. Não será mais necessário ser treinado para usar os aplicativos, bastará saber se comunicar como fazemos com outros seres humanos.
  1. Personalização: Os sistemas serão capazes de aprender com as conversas anteriores do usuário, bem como de dados adicionais disponíveis, para oferecer uma experiência de usuário personalizada e adaptada às necessidades individuais. Além de um melhor entendimento de como o usuário se expressa, isso poderá ser especialmente útil em áreas como a saúde, onde os sistemas podem aprender com o histórico médico do paciente para oferecer diagnósticos mais precisos, ou a educação, onde sistemas poderão apoiar o aprendizado identificando as dificuldades e desenvolver as capacidades de forma individualizada.
  1. Automação avançada: Com sistemas que entendem e interpretam a linguagem natural, as tarefas de rotina serão mais facilmente automatizadas. Por exemplo, um sistema de segurança poderia não só ser programado para responder a comandos de voz específicos, como “trave todas as portas” ou “desligue todas as luzes”, mas também “identifique pessoas que estiveram neste local nos dias em que há relatos de roubos em que os autores ainda não foram identificados”. Você poderia acessar sua televisão dizendo “Reproduza em no máximo 5 minutos os principais trechos da novela de ontem que são relevantes para eu entender o desenrolar da trama”. À sua agenda você diria algo como “Reserve um tempo antes de cada compromisso que for agendado e que envolva deslocamento considerando o trânsito médio no horário agendado dos pontos de onde vou sair e onde devo chegar.”
  1. Redução de erros: Ao reduzir a necessidade de interfaces específicas e simplificar a interação do usuário com o sistema, o risco de erros será reduzido. Não será necessário conhecer todos os comandos e correr o risco de usar um comando errado ou acessar a opção equivocada. Por exemplo, em um sistema hospitalar, um médico poderia se comunicar com o sistema usando linguagem natural para obter informações sobre o histórico médico de um paciente e compará-lo com o último exame identificando prognósticos, reduzindo assim a possibilidade de erros de digitação ou interpretação. 
  1. Melhorias na eficiência: Ao automatizar tarefas rotineiras e simplificar a interação do usuário com o sistema, os processos serão mais eficientes. Por exemplo, em um ambiente de desenvolvimento de soluções de TI, um sistema especialista poderia ajudar um analista a identificar possíveis impactos na arquitetura de sistemas a partir de uma modificação de uma regra de negócio e encontrar soluções para problemas complexos usando a linguagem natural, economizando tempo e melhorando a produtividade.

Leia também o artigo Chat GPT como ferramenta para análise de negócios e veja exemplos práticos do seu uso para aumentar a produtividade no desenvolvimento de um aplicativo por uma startup.

No geral, a adoção de modelos de linguagem baseados em IA em uma ampla variedade de aplicativos e dispositivos automatizados têm o potencial de melhorar significativamente a vida das pessoas, tornando as interações mais intuitivas e eficientes.

A quarta onda da interface homem-máquina

O Chat GPT é sim um ponto de inflexão no modo como lidamos com a tecnologia. Neste artigo chamo a sua atenção e dou alguns exemplos para a transformação que ele representa na forma como implementamos a interface homem-máquina que vai mudar fortemente em todas as aplicações que utilizamos. 

Creio que essa mudança terá um impacto maior do que foram a adoção da interface gráfica nos primeiros PCs da década de 1980, a popularização da World Wide Web na década de 1990 e da tecnologia Touch nos Smart Fones nos anos 2000. 

Ondas evolutivas na interface homem-máquina
(Criado pelo autor usando Microsoft Bing, Designer e Power Point)

Essas mudanças tecnológicas tornaram acessíveis o uso da tecnologia a um número imenso de pessoas que não estavam aptas a utilizar as interfaces anteriores. Além da democratização ao acesso da tecnologia, a facilidade de uso trouxe também inúmeras novas possibilidades de funcionalidades antes inimagináveis.

Conclusão

Estamos no início de uma nova era e o futuro, apesar de MUITO incerto, é promissor. Não podemos negar que o impacto dos modelos de linguagem baseados em IA serão enormes apenas com base nas limitações atuais do Chat GPT. É preciso olhar além.

Certamente, há várias questões éticas e técnicas a serem tratadas para garantir que o impacto do uso dessa nova tecnologia possa trazer melhorias para a humanidade e evitar seus riscos. Isso também não pode ser negado, e deve ser tratado como tema prioritário na agenda estratégica de todas as organizações.


Referências

Para a produção deste artigo foram realizadas consultas e testes com os modelos de linguagem baseados em Inteligência Artificial:

As imagens usadas neste artigo foram criadas pelo autor usando o apoio da seguinte ferramenta de geração de imagem: