O que são as Ações de Código Generativas e como usá-las?

Atualizada: 21/05/2025

O que são as Ações de Código Generativas e como usá-las?

As Ações de Código Generativas são uma funcionalidade poderosa que permite incorporar operações de inteligência artificial generativa (para gerar texto, imagem, documentos, dados) diretamente nas Ações de Código da Botmaker.

O que é possível fazer com as Ações Generativas?

As Ações de Código Generativas permitem, por exemplo:

Extrair informações de imagens (ex.: dados de uma foto de documento, classificação de imagens, inventário a partir de uma foto etc.)
Analisar documentos (resumir, identificar riscos em contratos, extrair totais ou itens de uma fatura em PDF etc.)
Classificar e sintetizar mensagens de usuários (gerar resumos, detectar intenções, categorizar tickets com base na descrição livre do cliente etc.)
Processar respostas de APIs externas (usar IA para analisar e simplificar grandes respostas em JSON, por exemplo)

Elas são flexíveis e multimodais: funcionam com texto, imagens e documentos (PDF, PNG, JPG etc., até 20 MB).

Diferenças em relação a outras funcionalidades

Não é um agente inteligente: não mantém diálogo nem busca objetivos de longo prazo. Executa uma função ("tool") e retorna um resultado em uma variável.
Não utiliza a Knowledge Base ou Bases de Conteúdo como fonte principal: recomenda-se utilizá-la apenas se realmente for necessário e para fragmentos ou documentos muito grandes. Para regras específicas ou listas pequenas, é mais eficiente incluí-las diretamente no prompt.
Não substitui o uso clássico de Prompt ou agentes: é uma ferramenta pontual, ideal para resolver tarefas de processamento “one shot”.

Como configurar uma Ação de Código Generativa?

Recebe o input (usuário, imagem, arquivo, API)

Pode ser:

Uma mensagem de texto do usuário;
Uma imagem (arquivo);
Um documento (PDF, etc.);
Um resultado de API (ex.: JSON já processado no fluxo).

Estrutura a Code Action

A estrutura deve incluir:

Instruções (Prompt): Indique com clareza a tarefa desejada. Ex.: “Você é um assistente especialista em categorizar problemas domésticos. Leia as opções e classifique a mensagem do usuário nestas categorias...”
Input dinâmico (Query): O que será analisado (texto, imagem, arquivo etc.)
Opcional - Especificar Formato (Esquema): Se quiser o resultado em JSON, defina a estrutura desejada. Ex.: “Quero que retorne um JSON com as seguintes chaves: problema, resumo...”. Recomendado para processamento automatizado.
Escolher o modelo generativo: Vários modelos disponíveis (ex.: Flash para respostas rápidas e econômicas, Thinking/Reasoning para maior qualidade e profundidade).
Definir a variável de saída (Output): Onde o resultado será armazenado para uso posterior no fluxo.

Exemplo mínimo de estrutura

Exemplo básico de código:

https://gist.github.com/hernanliendo/a899224343d967e1fa09d2437579a156

Exemplo com multimídia, envie uma imagem e descreva o que há nela:

https://gist.github.com/hernanliendo/4a0f9745354863570f773b7c63a20b29

Exemplo em que ele analisa a mensagem do usuário e extrai informações em variáveis em um JSON:

https://gist.github.com/hernanliendo/011595222e2ebd3a1117fdbaade7bacc