Microsoft Copilot Edição de Imagem Inpainting: Comportamento da Máscara Explicado
🔍 WiseChecker

Microsoft Copilot Edição de Imagem Inpainting: Comportamento da Máscara Explicado

Ao usar o Copilot para editar uma imagem, você pode pedir para substituir, remover ou modificar regiões específicas. A ferramenta usa uma máscara para indicar à IA qual parte da imagem deve ser alterada. Muitos usuários percebem que a máscara nem sempre cobre exatamente o que pretendiam. Este artigo explica como o Copilot gera a máscara, por que às vezes seleciona demais ou de menos e como obter resultados consistentes. Você aprenderá as regras por trás do comportamento da máscara e como formular prompts para edições precisas.

Principais Conclusões: Comportamento da Máscara do Copilot para Edição de Imagens

  • Geração da máscara a partir de linguagem natural: O Copilot cria uma máscara com base na sua descrição em texto, não em uma ferramenta de seleção manual.
  • Especificidade da frase: Use substantivos precisos e palavras de localização como “lado esquerdo” ou “fundo” para restringir a área da máscara.
  • Refinamento iterativo: Se a primeira máscara estiver errada, ajuste seu prompt com mais detalhes em vez de repetir a mesma solicitação.

ADVERTISEMENT

Como o Copilot Gera a Máscara para Inpainting

Inpainting é o processo de preencher ou substituir uma área selecionada de uma imagem. O Copilot não permite desenhar um retângulo de seleção ou usar uma ferramenta laço. Em vez disso, ele lê seu prompt em linguagem natural e cria automaticamente uma máscara em nível de pixel. A IA analisa a imagem inteira e tenta identificar objetos ou regiões que correspondam à sua descrição. Essa máscara informa ao modelo de geração de imagem quais pixels manter e quais regenerar.

A máscara é gerada por um modelo de visão-linguagem que entende tanto o conteúdo da imagem quanto seu texto. Por exemplo, se você disser “substitua o carro vermelho por um carro azul”, o modelo encontra todos os pixels que pertencem ao carro vermelho e os marca como área da máscara. Tudo fora da máscara permanece inalterado. O desafio é que a IA pode interpretar suas palavras de forma diferente do que você pretendia. Uma frase como “a flor” pode significar uma flor específica ou um conjunto de flores, dependendo do contexto.

O Copilot usa um limite de confiança ao criar a máscara. Se o modelo tiver menos de 90% de certeza de que um pixel pertence ao objeto descrito, ele pode deixar esse pixel fora da máscara. Isso pode fazer com que a máscara perca bordas ou pequenas partes do objeto. Por outro lado, se o modelo superestimar, a máscara pode vazar para áreas ao redor. Entender esse limite ajuda você a escrever prompts que reduzem a ambiguidade.

O que a Máscara Não Cobre

A máscara afeta apenas a região que a IA acha que você deseja alterar. Sombras, reflexos e objetos sobrepostos geralmente são excluídos porque o modelo os trata como elementos separados. Se você quiser alterar um reflexo em um espelho, deve mencioná-lo explicitamente no prompt. A máscara também ignora áreas que o modelo considera parte do fundo, a menos que seu prompt nomeie especificamente o fundo.

Passos para Controlar a Máscara com Prompts Precisos

Você pode melhorar a precisão da máscara estruturando seu prompt com substantivos específicos, modificadores de localização e dicas de tamanho. Siga estes passos para obter a máscara desejada.

  1. Identifique o objeto alvo com um único substantivo
    Use a palavra mais específica para o objeto. Em vez de “a coisa na mesa”, diga “a caneca de cerâmica”. Quanto menos palavras você usar para o objeto, menor será a ambiguidade para o modelo.
  2. Adicione um modificador de localização
    Inclua onde o objeto está no quadro. Exemplos: “o carro à esquerda”, “a árvore em primeiro plano”, “o logotipo no canto superior direito”. Isso ajuda o modelo a isolar a instância correta quando existem vários objetos semelhantes.
  3. Descreva a alteração desejada antes do alvo
    Escreva a ação primeiro, depois o objeto. Por exemplo, “remova a marca d’água no centro inferior” informa ao modelo o que fazer e onde. A máscara se concentrará apenas na área da marca d’água.
  4. Use adjetivos de tamanho para precisão
    Se o objeto tiver várias partes, especifique o tamanho. Diga “o carro vermelho grande” ou “o botão azul pequeno”. A máscara excluirá itens semelhantes que não correspondam ao tamanho.
  5. Revise o resultado e refine o prompt
    Se a máscara cobrir demais, adicione uma frase negativa: “apenas a flor, não as folhas”. Se a máscara perder parte do objeto, adicione um detalhe: “a flor inteira, incluindo o caule”.

Exemplo: Corrigindo uma Máscara Excessivamente Ampla

Suponha que você tenha uma foto de uma pessoa usando uma camisa azul e queira mudar apenas a cor da camisa. Você digita “mude a camisa para vermelho”. O modelo pode mascarar o torso inteiro, incluindo os braços da pessoa, porque vê a camisa como uma região contínua. Para corrigir, digite “mude apenas o tecido da camisa no peito para vermelho” ou “mude a área da camisa entre o colarinho e o cinto”. As palavras de localização reduzem o tamanho da máscara.

ADVERTISEMENT

Problemas Comuns com a Máscara e Como Corrigi-los

A máscara cobre o objeto errado

Isso acontece quando seu prompt corresponde a um objeto diferente na imagem. Por exemplo, dizer “o cachorro” quando há dois cachorros. Adicione uma característica distintiva: “o cachorro marrom com a coleira vermelha”. Se a máscara ainda pegar o cachorro errado, descreva a posição do objeto em relação ao quadro: “o cachorro no lado esquerdo da imagem”.

A máscara deixa de fora bordas ou pequenos detalhes

O limite de confiança faz com que o modelo exclua pixels sobre os quais não tem certeza. Para incluir bordas, use palavras como “inteiro” ou “contorno completo”. Exemplo: “substitua o contorno inteiro da estrela por ouro”. O modelo reduzirá sua exigência de confiança para aquele objeto. Se o problema persistir, divida a edição em duas etapas. Primeiro, substitua o corpo principal. Depois, em um segundo prompt, corrija as bordas.

A máscara inclui o fundo

Quando o objeto tem uma cor semelhante ao fundo, a máscara pode vazar. Por exemplo, um carro branco em uma parede branca. Adicione uma descrição de limite: “o carro branco, excluindo a parede atrás dele”. Você também pode especificar a forma do objeto: “o corpo retangular do carro, não o espaço ao redor”.

A máscara não altera nada

Se o Copilot retornar a mesma imagem, a máscara pode estar vazia. Isso ocorre quando o modelo não consegue encontrar o objeto descrito. Verifique se o objeto está visível e não está ocluído. Se estiver parcialmente escondido, descreva apenas a parte visível: “a parte visível do gato atrás da planta”.

Geração de Máscara do Copilot vs. Seleção Manual em Outras Ferramentas

Item Máscara de Inpainting do Copilot Ferramentas de Seleção Manual
Método de seleção Automático a partir de linguagem natural Pincel, laço ou caneta
Precisão de pixel Depende da clareza do prompt e da confiança do modelo Controlada pelo usuário até o pixel individual
Tratamento de bordas IA estima bordas com base no reconhecimento de objetos Usuário pode suavizar ou refinar bordas
Múltiplos objetos Pode selecionar um objeto por prompt Pode selecionar várias áreas desconexas
Granularidade de desfazer Apenas desfazer a imagem inteira Histórico passo a passo
Curva de aprendizado Requer engenharia de prompt Requer conhecimento de ferramentas de seleção

A máscara do Copilot é mais rápida para edições simples, mas menos precisa para seleções complexas. Se você precisar de controle exato sobre a área da máscara, considere usar um editor de imagens dedicado primeiro e depois importar o resultado para o Copilot para aprimoramentos adicionais de IA.

Agora você entende como o Copilot constrói sua máscara a partir de suas palavras e por que a máscara às vezes se comporta de forma inesperada. Use substantivos específicos, palavras de localização e adjetivos de tamanho para reduzir ou expandir a máscara conforme necessário. Se a primeira tentativa falhar, refine o prompt em vez de repeti-lo. Para obter os resultados mais confiáveis, descreva a posição e os limites do objeto em cada prompt. Essa abordagem transforma a máscara automática do Copilot em uma ferramenta previsível para suas edições de imagem.

ADVERTISEMENT