Voltar ao blog
tutorial 2026-06-14

Amplie imagens 4× com IA do lado do navegador (sem signup, 2026)

Amplie imagens 4× com IA do lado do navegador (sem signup)

Você herdou uma pasta de fotos de férias de 2012, todas 1024×768 — pequenas o suficiente para um slideshow num monitor 1080p mas inúteis para uma impressão 4K, um pôster ou um header de blog em qualidade Retina moderna. Ou você está construindo uma landing page e a foto de banco perfeita só vem em 600×400. Ou você tem aquela foto querida de um parente que faleceu, tirada num smartphone antigo, e quer imprimir em 12×18 polegadas sem parecer screenshot de screenshot.

Este é o problema do upscaling de imagem, e ele foi transformado nos últimos 5 anos por modelos de deep learning que não só ampliam pixels (o que produz uma bagunça borrada) mas sintetizam novo detalhe plausível baseado no que aprenderam de milhões de imagens de treinamento. Os melhores modelos de 2026 rodam na sua aba em menos de 30 segundos por imagem, com resultados que teriam exigido uma assinatura de US$ 40/mês da Adobe em 2022.

Este guia explica como o upscaling com IA realmente funciona, quando é mágica vs. quando produz detalhe “alucinado” esquisito, e como usar a ferramenta Super Resolution do Ai2Done para upscaling 2× / 4× no navegador.

TL;DR

  • Upscaling com IA sintetiza novos pixels baseado no que uma rede neural aprendeu. Não é mágica — é pattern matching.
  • Upscale 2× e 4× funcionam bem para fotos. 8× é o limite antes que o detalhe “alucinado” fique óbvio.
  • Use o Ai2Done Super Resolution para upscaling no navegador com modelos ESRGAN / Real-ESRGAN rodando em WebGL.
  • Funciona melhor em: rostos, paisagens, comida, animais. Funciona pior em: texto em imagens (use OCR + re-render), pixel art (use uma ferramenta dedicada), JPGs muito comprimidos (artefatos são amplificados).
  • Privacidade importa: fotos de família, scans de documento, memorabília pessoal — faça isso localmente.

Por que isso é mais difícil do que parece

“Upscaling” soa como multiplicação: pega 800×600, faz virar 3200×2400, pronto. Os algoritmos clássicos para isso — interpolação bicúbica (default de todo editor de imagem), reamostragem Lanczos (ligeiramente mais sofisticada), vizinho mais próximo (para pixel art) — produzem saídas matematicamente corretas que ficam horríveis. A razão: quando você dobra as dimensões, tem 4× mais pixels mas a mesma quantidade de informação. Os novos pixels são necessariamente médias de vizinhos, o que produz suavidade.

Upscaling com IA faz uma pergunta diferente: “dada esta imagem 800×600, como pareceria uma foto 3200×2400 do mesmo sujeito?” Uma rede neural treinada em milhões de pares de imagens (baixa-res, alta-res) aprende a prever detalhe plausível de alta frequência — bordas nítidas, fios de cabelo, veias de folha, trama de tecido — que algoritmos só de matemática não conseguem recuperar porque a informação genuinamente não está nos pixels fonte.

O trade-off: upscalers de IA podem alucinar. Se o modelo nunca viu uma entrada similar, faz o melhor chute baseado em priors dos dados de treinamento. Rostos ganham rugas ou pintas extras que não estavam lá. Texto fica mais legível mas com letterforms sutilmente errados. Fundos ganham detalhe que não existia. Para uso artístico e foto de família, isso geralmente está bem (e frequentemente é preferível à suavidade do original). Para uso forense ou legal, imagens com upscale por IA não são a verdade original — são reconstruções plausíveis.

Os modelos open-source state-of-the-art em 2026:

  • Real-ESRGAN — melhor upscaler geral de foto, excelente em rostos, OK em texto.
  • ESRGAN (o predecessor) — ligeiramente menos agressivo, menos alucinações.
  • SwinIR — ligeiramente melhor em texturas naturais mas mais lento.
  • Latent Diffusion Super-Resolution (LDSR) — melhor qualidade, ~100× mais lento, GPU-only praticamente.

Para uso no navegador entregamos Real-ESRGAN compilado para ONNX-Web rodando em WebGL ou WebGPU onde suportado, caindo em CPU WebAssembly em dispositivos antigos.

Método 1: Ai2Done Super Resolution (no navegador, sem signup)

A ferramenta Super Resolution do Ai2Done roda Real-ESRGAN inteiramente no seu navegador:

  1. Abra /tools/super_resolution em qualquer navegador moderno.
  2. Solte sua imagem — JPG, PNG, WebP, HEIC aceitos.
  3. Escolha escala — 2× (mais rápido, ~5 segundos por imagem num laptop 2022+) ou 4× (mais lento, ~15-30 segundos).
  4. Escolha modelo — “Foto geral” (Real-ESRGAN x4plus, o default) para a maioria das fotos; “Anime / ilustração” (Real-ESRGAN anime) para cartoons e ilustrações.
  5. Clique em Upscale. Uma barra de progresso mostra o progresso da inferência; em dispositivos com WebGPU é quase em tempo real, no fallback WebGL é ~10× mais lento mas ainda usável.
  6. Preview lado a lado de original vs. ampliado aparece. Use um slider para comparar regiões.
  7. Baixe como PNG (default, sem perdas) ou JPG qualidade 95 (arquivo menor).

A coisa toda roda na sua aba. Suas fotos nunca sobem para um servidor, incluindo o nosso.

Em dispositivos suportados (Chrome / Edge em desktops modernos com WebGPU habilitado): upscale 4× de uma imagem 1024×1024 leva ~3-5 segundos. No fallback WebGL (dispositivos antigos, Safari): mesma operação leva ~30-60 segundos. No fallback CPU WASM (sem GPU): 2-5 minutos por imagem. Auto-detectamos o melhor backend; você pode sobrescrever em Settings.

Método 2: linha de comando Real-ESRGAN (para jobs em lote)

Para automatizar upscaling em dezenas de imagens, o binário Real-ESRGAN oficial é o caminho mais rápido:

# Instalar (uma vez, inclui os pesos do modelo)
pip install realesrgan

# Upscale 4x com o modelo de propósito geral
realesrgan-ncnn-vulkan -i input.jpg -o output.png -s 4 -n realesrgan-x4plus

Num desktop com GPU dedicada (Nvidia GTX 1660 ou melhor, AMD RX 580 ou melhor), isso roda ~5× mais rápido que a versão do navegador porque usa a GPU diretamente via Vulkan em vez de passar pela camada de abstração do WebGPU.

Esta é a resposta certa se você está fazendo upscale de 100+ fotos para um catálogo de impressão ou restaurando um arquivo inteiro de fotos de família. Overkill se você está fazendo upscale de 3 fotos para um blog post.

Método 3: Topaz Gigapixel AI (desktop comercial, o benchmark de qualidade)

Para quando resultados importam mais que orçamento, Topaz Gigapixel AI (US$ 99 pagamento único) é o padrão-ouro comercial. Inclui vários modelos especializados — um para fotos de baixa resolução, um para JPEGs comprimidos, um para arte, um para rostos — e a UI deixa você misturar saídas de modelo por região da imagem. A qualidade de saída é significativamente melhor que Real-ESRGAN em fotos com conteúdo misto.

Trade-off: é um app desktop (instalação de 3 GB), exige uma GPU potente para velocidade, e o custo por licença só faz sentido se você faz upscale frequentemente. Para uso ocasional, a ferramenta de navegador é mais que suficiente.

Como construímos o upscaler do navegador (deep-dive técnico)

A ferramenta Super Resolution do Ai2Done é construída sobre:

  • ONNX Runtime Web para inferência de modelo. ONNX é um padrão de formato de modelo que deixa o mesmo modelo rodar em WebGPU, WebGL e CPU WASM sem reescrever o código de inferência.
  • Pesos do modelo Real-ESRGAN x4plus (~67 MB), quantizados para fp16 para caber na memória de GPU de tier intermediário. Lazy-loaded só quando o usuário inicia um upscale (para a página carregar rápido).
  • WebGPU como backend primário de inferência no Chrome/Edge em hardware suportado (Mac M1+, Windows com GPU dedicada, Android com Adreno 7xx+). Cai para WebGL no Safari e Chrome antigo. Cai para CPU WASM (multi-thread, acelerado por SIMD) quando não há GPU disponível.
  • Inferência baseada em tile para imagens grandes. A entrada nativa do Real-ESRGAN é 256×256; para uma imagem 1024×1024 fazemos tile em 16 inferências, depois costuramos com mistura por sobreposição para evitar emendas. Isso é o que nos deixa fazer upscale de uma fonte 2048×2048 num celular sem OOMing.

A escolha de design interessante: deliberadamente não oferecemos restauração de rosto como modelo separado. Ferramentas como GFPGAN podem fazer coisas incríveis em rostos danificados ou de baixa res, mas frequentemente produzem resultados estranhamente “suavizados” que parecem o gêmeo da pessoa em vez da pessoa mesma. Para a maioria dos usuários o resultado padrão do Real-ESRGAN é mais fiel ao original.

FAQ

Q: A imagem ampliada vai parecer real ou “gerada por IA”? A: Para a maioria das fotos em upscale 2×, o resultado é indistinguível de uma foto em maior resolução da mesma cena. Em 4× as escolhas da IA ficam mais visíveis — detalhe extra no cabelo, leve suavização da textura da pele, mudanças sutis em fundos. Se isso é bom ou ruim depende do uso: para uma colagem de foto de férias é uma melhoria; para uma imagem forense ou admissível em tribunal, não é a verdade original.

Q: Posso ampliar texto numa imagem? A: Real-ESRGAN tenta, mas tipicamente produz texto que parece mais nítido mas tem letterforms sutilmente errados. Para imagens onde a legibilidade do texto importa (documentos escaneados, screenshots, notas manuscritas), uma abordagem muito melhor é: (1) rodar a fonte pela Image to Text OCR tool para extrair o texto, depois (2) re-renderizar o texto em alta resolução numa fonte real. Isso produz texto de fato correto em vez de texto plausivelmente parecido.

Q: Quão grande pode ser minha imagem de entrada? A: Em desktops modernos com GPUs dedicadas, até ~4000×4000 de entrada (16 MP) funciona bem e produz uma saída 16000×16000 (256 MP). Em celulares e GPUs integradas, ~2000×2000 (4 MP) de entrada é o limite prático antes da VRAM acabar. A ferramenta vai te avisar se sua entrada provavelmente falhará.

Q: Quanto tempo demora o upscaling? A: Um upscale 1024×1024 → 4096×4096 demora:

  • ~3-5 segundos em Mac M1/M2, Windows moderno com GPU dedicada (WebGPU)
  • ~15-30 segundos em GPU integrada Intel/AMD (WebGL)
  • ~2-5 minutos em fallback sem GPU (CPU WASM)

Q: Devo usar escala 2× ou 4×? A: 2× quando a fonte já está razoável (digamos, 1500×1000) e você quer um boost modesto de nitidez. 4× quando a fonte é genuinamente pequena (500×400 ou menos) e você precisa para um display maior. Ir além de 4× numa única passada produz alucinações visíveis; para upscale extremo, rode 4× → 4× como duas passadas, mas espere que o resultado divirja do original.

Q: Por que meu upscale 4× de um JPG mostra padrões estranhos que eu não via antes? A: Real-ESRGAN amplifica o que estiver na fonte, incluindo artefatos de compressão JPG (limites de bloco 8×8, ringing ao redor de bordas). Se a fonte tem compressão visível, rode nossa Image Compress tool primeiro para conseguir um PNG/WebP intermediário limpo, depois faça upscale. Ainda melhor: use a fonte de mais alta qualidade que você tem acesso.

Experimente agora

Amplie imagens 2× ou 4× com IA, no seu navegador, em segundos:

Abra a ferramenta Super Resolution →

Solte uma imagem, escolha escala, clique em Upscale. Sem signup, sem upload, sem taxa por imagem.

Leituras relacionadas


Última atualização 2026-06-14. A ferramenta Super Resolution roda 100 % no seu navegador usando ONNX Runtime Web — suas fotos nunca deixam seu dispositivo. A inferência acontece na sua GPU (ou CPU). Nunca coletamos, logamos ou analisamos os arquivos que você processa.