eventAtualizada: 21/05/2025
O que são as Ações de Código Generativas e como usá-las?
As Ações de Código Generativas são uma funcionalidade poderosa que permite incorporar operações de inteligência artificial generativa (para gerar texto, imagem, documentos, dados) diretamente nas Ações de Código da Botmaker.
O que é possível fazer com as Ações Generativas?
As Ações de Código Generativas permitem, por exemplo:
- Extrair informações de imagens (ex.: dados de uma foto de documento, classificação de imagens, inventário a partir de uma foto etc.)
- Analisar documentos (resumir, identificar riscos em contratos, extrair totais ou itens de uma fatura em PDF etc.)
- Classificar e sintetizar mensagens de usuários (gerar resumos, detectar intenções, categorizar tickets com base na descrição livre do cliente etc.)
- Processar respostas de APIs externas (usar IA para analisar e simplificar grandes respostas em JSON, por exemplo)
Elas são flexíveis e multimodais: funcionam com texto, imagens e documentos (PDF, PNG, JPG etc., até 20 MB).
Diferenças em relação a outras funcionalidades
- Não é um agente inteligente: não mantém diálogo nem busca objetivos de longo prazo. Executa uma função ("tool") e retorna um resultado em uma variável.
- Não utiliza a Knowledge Base ou Bases de Conteúdo como fonte principal: recomenda-se utilizá-la apenas se realmente for necessário e para fragmentos ou documentos muito grandes. Para regras específicas ou listas pequenas, é mais eficiente incluí-las diretamente no prompt.
- Não substitui o uso clássico de Prompt ou agentes: é uma ferramenta pontual, ideal para resolver tarefas de processamento “one shot”.
Como configurar uma Ação de Código Generativa?
- Recebe o input (usuário, imagem, arquivo, API)
Pode ser:
- Uma mensagem de texto do usuário;
- Uma imagem (arquivo);
- Um documento (PDF, etc.);
- Um resultado de API (ex.: JSON já processado no fluxo).
- Estrutura a Code Action
A estrutura deve incluir:
- Instruções (Prompt): Indique com clareza a tarefa desejada. Ex.: “Você é um assistente especialista em categorizar problemas domésticos. Leia as opções e classifique a mensagem do usuário nestas categorias...”
- Input dinâmico (Query): O que será analisado (texto, imagem, arquivo etc.)
- Opcional - Especificar Formato (Esquema): Se quiser o resultado em JSON, defina a estrutura desejada. Ex.: “Quero que retorne um JSON com as seguintes chaves: problema, resumo...”. Recomendado para processamento automatizado.
- Escolher o modelo generativo: Vários modelos disponíveis (ex.: Flash para respostas rápidas e econômicas, Thinking/Reasoning para maior qualidade e profundidade).
- Definir a variável de saída (Output): Onde o resultado será armazenado para uso posterior no fluxo.
Exemplo mínimo de estrutura
Exemplo básico de código:
https://gist.github.com/hernanliendo/a899224343d967e1fa09d2437579a156
Exemplo com multimídia, envie uma imagem e descreva o que há nela:
https://gist.github.com/hernanliendo/4a0f9745354863570f773b7c63a20b29
Exemplo em que ele analisa a mensagem do usuário e extrai informações em variáveis em um JSON:
https://gist.github.com/hernanliendo/011595222e2ebd3a1117fdbaade7bacc