O que é a inteligência artificial?

O atributo alt desta imagem está vazio. O nome do arquivo é what-is-artificial-intelligence-1024x682-1.jpg

Inteligência artificial (IA)

A inteligência artificial (IA) abrange muitas tecnologias complexas e emergentes que antes exigiam intervenção humana e agora podem ser realizadas por um computador.

De modo geral, a IA é um programa ou modelo não humano que demonstra uma ampla gama de resolução de problemas e criatividade.

Agente de IA

Um agente de IA (Inteligência Artificial) é um sistema que percebe o ambiente, toma decisões e age automaticamente para atingir um objetivo — muitas vezes sem precisar de intervenção humana constante.

📌 Em termos simples:

É como um “assistente inteligente” que não só responde, mas também age por conta própria.

🧠 Como um agente de IA funciona

Um agente de IA normalmente tem três partes principais:

  1. Percepção 👀
    Coleta informações (ex: texto, voz, dados de sistemas)
  2. Raciocínio/Decisão 🧠
    Analisa os dados e decide o que fazer
  3. Ação ⚙️
    Executa tarefas (responder, enviar algo, chamar uma API, etc.)

🤖 Exemplos práticos

  • Chatbots avançados (como assistentes virtuais)
    → Respondem perguntas e resolvem problemas
  • Agentes em e-commerce (agentic retail)
    → Recomendam produtos, negociam preços, finalizam compras
  • Assistentes de produtividade
    → Organizem calendário, enviem e-mails, gerenciem tarefas
  • Sistemas autônomos
    → Robôs, carros autônomos

🔥 Diferença: IA comum vs agente de IA

  • IA comum: responde quando você pede
  • Agente de IA: pode decidir e agir sozinho, com autonomia

🧩 Exemplo no seu contexto (AgentShop / e-commerce)

Um agente de IA poderia:

  • Conversar com o cliente
  • Entender o que ele quer
  • Buscar produtos automaticamente
  • Sugerir opções
  • Aplicar cupons
  • Finalizar a compra via Stripe

👉 Ou seja: ele vira um “vendedor inteligente automatizado”.

Espaçador

Separador

Agêntico / agêntica

A forma adjetiva de agente. Agêntico se refere às qualidades que os agentes têm (como autonomia).

loop agêntico

Um ciclo que um agente percorre até que uma condição de encerramento seja atendida. O ciclo normalmente consiste nas quatro etapas a seguir:

  1. Observe
  2. Motivo
  3. Agir
  4. Feedback

Fluxo de trabalho com agentes

Um processo dinâmico em que um agente planeja e executa ações de forma autônoma para alcançar uma meta. O processo pode envolver raciocínio, invocação de ferramentas externas e autocorreção do plano.

Orquestração de agentes

O gerenciamento e o roteamento centralizados de tarefas em vários subagentes ou chamadas de LLM. A orquestração de agentes divide tarefas complexas em subtarefas menores e as atribui aos subagentes mais eficientes.

comando do menos para o mais

Uma forma de encadeamento de comandos que divide problemas complexos em um conjunto ordenado de problemas mais simples. Por exemplo, confira uma estratégia de solicitação do menos para o mais para um determinado problema:

  1. Divida um problema complexo em uma lista ordenada de subproblemas mais simples. Neste exemplo, vamos supor que sejam três subproblemas.
  2. Comando 1: peça ao LLM para resolver o primeiro subproblema. O LLM retorna a resposta 1.
  3. Comando 2: integre toda ou parte da resposta 1 ao comando para resolver o segundo subproblema. O LLM retorna a resposta 2.
  4. Comando 3: integre toda ou parte da resposta 2 ao comando para resolver o terceiro subproblema. A resposta do LLM ao comando 3 é a resposta “final” ao problema complexo inicial.

Cada etapa depende da solução da etapa anterior.

Contraste com o comando de árvore de pensamento.

Comandos de árvore de pensamento (ToT)

Uma estratégia de comando sofisticada que incentiva um LLM a buscar e refinar as soluções intermediárias mais promissoras e abandonar o restante. O comando de árvore de pensamento usa um algoritmo como este:

  1. Divida um problema complexo em diferentes ramificações (estratégias em potencial), cada uma composta de várias etapas.
  2. Peça para o LLM trabalhar em cada ramificação de forma independente.
  3. Peça ao LLM para avaliar a qualidade da solução de cada ramificação após cada etapa.
  4. Continue refinando as ramificações mais promissoras e abandone o restante.
  5. Se uma ramificação promissora falhar, volte atrás e tente outras etapas promissoras.

Solte arquivos aqui para enviar

Solte arquivos aqui para enviar

Exemplo não-rotulado

#fundamentals

Um exemplo que contém atributos, mas nenhum rótulo. Por exemplo, a tabela a seguir mostra três exemplos não rotulados de um modelo de avaliação de imóveis, cada um com três recursos, mas sem valor da casa:

Número de quartosNúmero de banheirosIdade da casa
3215
2172
4234

No machine learning supervisionado, os modelos são treinados com exemplos rotulados e fazem previsões com exemplos sem rótulo.

No aprendizado semi-supervisionado e não supervisionado, exemplos sem rótulo são usados durante o treinamento.

Contraste um exemplo não-rotulado com um exemplo rotulado.

Exemplo rotulado

Um exemplo que contém um ou mais atributos e um rótulo. Por exemplo, a tabela a seguir mostra três exemplos rotulados de um modelo de avaliação de imóveis, cada um com três recursos e um rótulo:

QuartosBanheirosIdade da casaPreço da casa (rótulo)
3215US$ 345.000
2172US$ 179.000
4234US$ 392.000

No machine learning supervisionado, os modelos são treinados com exemplos rotulados e fazem previsões com exemplos sem rótulo.

Contraste exemplos rotulados com exemplos não rotulados.

Consulte Aprendizado supervisionado em “Introdução ao machine learning” para mais informações.

IA slop

#generativeAI

Saída de um sistema de IA generativa que prioriza a quantidade em vez da qualidade. Por exemplo, uma página da Web com IA slop é preenchida com conteúdo de baixa qualidade, gerado com IA e produzido de forma barata.

IA do lado do cliente

Enquanto a maioria dos recursos de IA na Web depende de servidores, a IA do lado do cliente é executada no navegador do usuário e realiza inferências no dispositivo dele. Isso tem vários benefícios, incluindo menor latência, custo reduzido para criar recursos, maior privacidade do usuário e acesso off-line.

A IA do lado do cliente usa modelos menores e otimizados, que são otimizados para performance. É possível que esses modelos tenham um desempenho melhor do que modelos maiores do lado do servidor para tarefas específicas. Avalie seu caso de uso para determinar qual solução é ideal para você.

IA integrada

Com a IA integrada, seu site se conecta às APIs do navegador ao processador local. O modelo integrado do navegador envia uma resposta, que a API retorna ao seu site.

IA integrada é uma forma de IA do lado do cliente, em que os modelos menores são integrados ao navegador. No Chrome, isso inclui o Gemini Nano e modelos especializados. Depois que esses modelos são baixados, todos os sites e aplicativos da Web que usam IA integrada podem pular o tempo de download e ir direto para a execução de recursos e a inferência local.

As APIs de IA integradas são projetadas para executar inferência no tipo certo de modelo para a tarefa. Por exemplo, a API Prompt executa inferência em um modelo de linguagem, enquanto a API Translator executa inferência em um modelo especialista integrado.

IA do lado do servidor

IA do lado do servidor abrange serviços de IA baseados na nuvem. Imagine o Gemini 1.5 Pro executado em uma nuvem. Esses modelos tendem a ser muito maiores e mais poderosos. Isso é especialmente verdadeiro para os modelos de linguagem grandes.

IA híbrida

IA híbrida se refere a qualquer solução que inclua um componente de cliente e de servidor. Exemplo:

  • Modelos do lado do cliente que têm um fallback para modelos do lado do servidor, criados para tarefas que não podem ser concluídas de maneira eficaz no dispositivo.
    • Talvez não haja recursos suficientes no dispositivo.
    • O modelo ou a API está disponível apenas em determinados ambientes.
  • Uma divisão de modelo entre cliente e servidor para segurança.
    • Por exemplo, é possível dividir um modelo para que 75% da execução aconteça no cliente e os 25% restantes sejam realizados em um servidor. Isso traz benefícios do lado do cliente, permitindo que parte do modelo fique fora do dispositivo, mantendo a privacidade.

Se você usa a API de solicitação, é possível configurar uma arquitetura híbrida com o Firebase AI Logic.

IA generativa

IA generativa é uma forma de machine learning que ajuda os usuários a criar conteúdo que parece familiar e imita a criação humana. A IA generativa usa modelos de linguagem para organizar dados e criar ou modificar texto, imagens, vídeo e áudio com base no contexto fornecido. A IA generativa vai além da correspondência de padrões e das previsões.

Um modelo de linguagem grande (LLM) tem vários (até bilhões) parâmetros que você pode usar para realizar uma ampla variedade de tarefas, como gerar, classificar ou resumir texto ou imagens.

Um modelo de linguagem pequeno (SLM) tem muito menos parâmetros para realizar tarefas semelhantes e pode ser usado no lado do cliente.

Processamento de linguagem natural (PLN)

O processamento de linguagem natural é uma classe de ML que ajuda os computadores a entender a linguagem humana, desde as regras de qualquer idioma específico até as idiossincrasias, o dialeto e a gíria usados pelas pessoas.

Advanced Heading

Entrada e saída

Um chatbot não é inerentemente um agente. Enquanto um chatbot responde a um mensageiro (humano ou não) e depende de um modelo para gerar conteúdo, como respostas a perguntas, um agente interage com ferramentas ou um banco de dados para concluir uma tarefa.

A entrada e a saída do modelo podem estar em diferentes modalidades, incluindo texto, imagem, áudio e vídeo. Um modelo pode aceitar apenas uma modalidade ou várias (modelos multimodais). É importante confirmar quais modalidades você precisa antes de escolher o modelo.

A entrada e a saída podem ser enviadas e recebidas em partes de streaming ou com base em solicitações.

Streaming

streaming divide um recurso enviado ou recebido em partes menores, oferecendo resultados em tempo real. A saída é ajustada continuamente à medida que a entrada é adicionada e ajustada.

Essa é uma técnica comum para navegadores usarem no recebimento de recursos de mídia, como buffer de vídeo ou carregamento parcial de imagens.

Saída baseada em solicitações

Para saída baseada em solicitação (ou “sem streaming”), o modelo aguarda a geração de toda a entrada, processa essa entrada como um todo e produz a saída.

Por exemplo, em uma janela de chat, em vez de o modal criar uma resposta enquanto o usuário digita, o modelo espera até que o usuário clique em um botão de envio. Depois que a mensagem é enviada, o modelo considera todas as entradas e responde.