Atualizada: 21/05/2025

O que são as Ações de Código Generativas e como usá-las?

As Ações de Código Generativas são uma funcionalidade poderosa que permite incorporar operações de inteligência artificial generativa (para gerar texto, imagem, documentos, dados) diretamente nas Ações de Código da Botmaker.



O que é possível fazer com as Ações Generativas?


As Ações de Código Generativas permitem, por exemplo:

  • Extrair informações de imagens (ex.: dados de uma foto de documento, classificação de imagens, inventário a partir de uma foto etc.)
  • Analisar documentos (resumir, identificar riscos em contratos, extrair totais ou itens de uma fatura em PDF etc.)
  • Classificar e sintetizar mensagens de usuários (gerar resumos, detectar intenções, categorizar tickets com base na descrição livre do cliente etc.)
  • Processar respostas de APIs externas (usar IA para analisar e simplificar grandes respostas em JSON, por exemplo)

Elas são flexíveis e multimodais: funcionam com texto, imagens e documentos (PDF, PNG, JPG etc., até 20 MB).

Diferenças em relação a outras funcionalidades

  • Não é um agente inteligente: não mantém diálogo nem busca objetivos de longo prazo. Executa uma função ("tool") e retorna um resultado em uma variável.

  • Não utiliza a Knowledge Base ou Bases de Conteúdo como fonte principal: recomenda-se utilizá-la apenas se realmente for necessário e para fragmentos ou documentos muito grandes. Para regras específicas ou listas pequenas, é mais eficiente incluí-las diretamente no prompt.

  • Não substitui o uso clássico de Prompt ou agentes: é uma ferramenta pontual, ideal para resolver tarefas de processamento “one shot”.



Como configurar uma Ação de Código Generativa?


  1. Recebe o input (usuário, imagem, arquivo, API)

Pode ser:

  • Uma mensagem de texto do usuário;
  • Uma imagem (arquivo);
  • Um documento (PDF, etc.);
  • Um resultado de API (ex.: JSON já processado no fluxo).


  1. Estrutura a Code Action

A estrutura deve incluir:

  • Instruções (Prompt): Indique com clareza a tarefa desejada. Ex.: “Você é um assistente especialista em categorizar problemas domésticos. Leia as opções e classifique a mensagem do usuário nestas categorias...”

  • Input dinâmico (Query): O que será analisado (texto, imagem, arquivo etc.)

  • Opcional - Especificar Formato (Esquema): Se quiser o resultado em JSON, defina a estrutura desejada. Ex.: “Quero que retorne um JSON com as seguintes chaves: problema, resumo...”. Recomendado para processamento automatizado.

  • Escolher o modelo generativo: Vários modelos disponíveis (ex.: Flash para respostas rápidas e econômicas, Thinking/Reasoning para maior qualidade e profundidade).

  • Definir a variável de saída (Output): Onde o resultado será armazenado para uso posterior no fluxo.



Exemplo mínimo de estrutura


Exemplo básico de código:

https://gist.github.com/hernanliendo/a899224343d967e1fa09d2437579a156


Exemplo com multimídia, envie uma imagem e descreva o que há nela:

https://gist.github.com/hernanliendo/4a0f9745354863570f773b7c63a20b29


Exemplo em que ele analisa a mensagem do usuário e extrai informações em variáveis em um JSON:

https://gist.github.com/hernanliendo/011595222e2ebd3a1117fdbaade7bacc