Amplía imágenes 4× con IA del lado del navegador (sin signup, 2026)
Amplía imágenes 4× con IA del lado del navegador (sin signup)
Heredaste una carpeta de fotos de vacaciones de 2012, todas 1024×768 — lo suficientemente pequeñas para una presentación en un monitor 1080p pero inútiles para una impresión 4K, un póster o una hero de blog moderna a calidad Retina. O estás construyendo una landing page y la foto stock perfecta solo viene en 600×400. O tienes una foto querida de un familiar que falleció, tomada con un smartphone temprano, y quieres imprimirla a 12×18 pulgadas sin que parezca una captura de una captura.
Este es el problema del image upscaling, y ha sido transformado en los últimos 5 años por modelos de deep learning que no solo amplían píxeles (lo que produce un desastre borroso) sino que sintetizan nuevo detalle plausible basándose en lo que han aprendido de millones de imágenes de entrenamiento. Los mejores modelos en 2026 corren en tu pestaña del navegador en menos de 30 segundos por imagen, con resultados que habrían requerido una suscripción de Adobe de $40/mes en 2022.
Esta guía explica cómo funciona realmente el upscaling con IA, cuándo es magia vs cuándo produce detalle "halucinado" inquietante, y cómo usar la herramienta Super Resolution de Ai2Done para upscaling 2× / 4× del lado del navegador.
TL;DR
- El upscaling con IA sintetiza nuevos píxeles basándose en lo que una red neuronal ha aprendido. No es magia — es pattern matching.
- El upscale 2× y 4× funcionan bien para fotos. 8× es el límite antes de que el detalle "halucinado" se vuelva obvio.
- Usa Ai2Done Super Resolution para upscaling del lado del navegador con modelos ESRGAN / Real-ESRGAN corriendo en WebGL.
- Funciona mejor en: caras, paisajes, comida, animales. Funciona peor en: texto en imágenes (usa OCR + re-render en su lugar), pixel art (usa una herramienta dedicada), JPGs altamente comprimidos (los artefactos se amplifican).
- La privacidad importa: fotos familiares, escaneos de DNI, recuerdos personales — haz esto localmente.
Por qué esto es más difícil de lo que parece
"Upscaling" suena a multiplicación: toma 800×600, hazlo 3200×2400, hecho. Los algoritmos clásicos para esto — interpolación bicúbica (el default de cada editor de imagen), Lanczos resampling (ligeramente más fancy), nearest-neighbor (para pixel art) — producen salidas matemáticamente correctas que se ven terribles. La razón: cuando doblas las dimensiones, tienes 4× la cantidad de píxeles pero la misma cantidad de información. Los nuevos píxeles son necesariamente promediados desde vecinos, lo que produce suavidad.
El upscaling con IA hace una pregunta diferente: "dada esta imagen 800×600, ¿cómo se vería una foto 3200×2400 del mismo sujeto?" Una red neuronal entrenada con millones de pares de imágenes (baja-res, alta-res) aprende a predecir detalle de alta frecuencia plausible — bordes afilados, mechones de pelo, venas de hojas, tejido de tela — que los algoritmos solo-matemáticos no pueden recuperar porque la información genuinamente no está en los píxeles fuente.
El trade-off: los upscalers de IA pueden halucinar. Si el modelo nunca ha visto una entrada similar, hace su mejor suposición basada en priors de datos de entrenamiento. Las caras ganan arrugas o lunares extra que no estaban ahí. El texto se vuelve más legible pero con letterforms sutilmente equivocadas. Los fondos ganan detalle que no existía. Para uso artístico y de fotos familiares, esto suele estar bien (y a menudo es preferible a la suavidad del original). Para uso forense o legal, las imágenes upscaleadas con IA no son la verdad original — son reconstrucciones plausibles.
Los modelos abiertos state-of-the-art en 2026:
- Real-ESRGAN — mejor upscaler general de fotos, excelente en caras, OK en texto.
- ESRGAN (el predecesor) — ligeramente menos agresivo, menos hallucinations.
- SwinIR — ligeramente mejor en texturas naturales pero más lento.
- Latent Diffusion Super-Resolution (LDSR) — mejor calidad, ~100× más lento, prácticamente solo-GPU.
Para uso del lado del navegador enviamos Real-ESRGAN compilado a ONNX-Web corriendo en WebGL o WebGPU donde se soporte, con fallback a CPU WebAssembly en dispositivos antiguos.
Método 1: Ai2Done Super Resolution (lado del navegador, sin signup)
La herramienta Super Resolution de Ai2Done corre Real-ESRGAN enteramente en tu navegador:
- Abre /tools/super_resolution en cualquier navegador moderno.
- Suelta tu imagen — se aceptan JPG, PNG, WebP, HEIC.
- Elige escala — 2× (más rápido, ~5 segundos por imagen en un portátil 2022+) o 4× (más lento, ~15-30 segundos).
- Elige modelo — "General photo" (Real-ESRGAN x4plus, el default) para la mayoría de las fotos; "Anime / illustration" (Real-ESRGAN anime) para dibujos animados e ilustraciones.
- Haz clic en Upscale. Una barra de progreso muestra el progreso de inferencia; en dispositivos con WebGPU es casi en tiempo real, en fallback WebGL es ~10× más lento pero aún usable.
- Aparece un preview side-by-side del original vs upscaleado. Activa un slider para comparar regiones.
- Descarga como PNG (default, lossless) o JPG calidad 95 (archivo más pequeño).
Todo el asunto corre en tu pestaña del navegador. Tus fotos nunca se suben a un servidor, incluido el nuestro.
En dispositivos soportados (Chrome / Edge en escritorios modernos con WebGPU activado): el upscale 4× de una imagen 1024×1024 tarda ~3-5 segundos. En fallback WebGL (dispositivos antiguos, Safari): la misma operación tarda ~30-60 segundos. En fallback CPU WASM (sin GPU en absoluto): 2-5 minutos por imagen. Auto-detectamos el mejor backend; puedes overridear en Settings.
Método 2: Real-ESRGAN línea de comandos (para trabajos batch)
Para automatizar upscaling en docenas de imágenes, el binario oficial Real-ESRGAN es el camino más rápido:
# Instalar (una vez, incluye los pesos del modelo)
pip install realesrgan
# Upscale 4x con el modelo general
realesrgan-ncnn-vulkan -i input.jpg -o output.png -s 4 -n realesrgan-x4plus
En un escritorio con una GPU discreta (Nvidia GTX 1660 o mejor, AMD RX 580 o mejor), esto corre ~5× más rápido que la versión del navegador porque usa la GPU directamente vía Vulkan en vez de pasar por la capa de abstracción de WebGPU.
Esta es la respuesta correcta si estás upscaleando 100+ fotos para un catálogo impreso o restaurando un archivo completo de fotos familiares. Overkill si estás upscaleando 3 fotos para un blog post.
Método 3: Topaz Gigapixel AI (escritorio comercial, el benchmark de calidad)
Para cuando los resultados importan más que el presupuesto, Topaz Gigapixel AI ($99 una vez) es el gold standard comercial. Incluye varios modelos especializados — uno para fotos de baja resolución, uno para JPEGs comprimidos, uno para arte, uno para caras — y la UI te deja mezclar salidas de modelo por región de imagen. La calidad de salida es significativamente mejor que Real-ESRGAN en fotos con contenido mixto.
Trade-off: es una app de escritorio (instalación de 3 GB), requiere una GPU robusta para velocidad, y el coste por licencia solo tiene sentido si upscaleas con frecuencia. Para uso ocasional, la herramienta del navegador es suficiente.
Cómo construimos el upscaler del navegador (deep-dive técnico)
La herramienta Super Resolution de Ai2Done está construida sobre:
- ONNX Runtime Web para inferencia de modelo. ONNX es un estándar de formato de modelo que deja correr el mismo modelo en WebGPU, WebGL y CPU WASM sin reescribir el código de inferencia.
- Pesos del modelo Real-ESRGAN x4plus (~67 MB), cuantizado a fp16 para encajar en memoria GPU de gama media. Lazy-loaded solo cuando el usuario inicia un upscale (así la página carga rápido).
- WebGPU como el backend de inferencia principal en Chrome/Edge en hardware soportado (Mac M1+, Windows con GPU discreta, Android con Adreno 7xx+). Hace fallback a WebGL en Safari y Chrome antiguo. Hace fallback a CPU WASM (multihilo, acelerado SIMD) cuando no hay GPU disponible.
- Inferencia basada en tiles para imágenes grandes. La entrada nativa de Real-ESRGAN es 256×256; para una imagen 1024×1024 hacemos tiles en 16 inferencias, luego cosemos con blending de overlap para evitar costuras. Esto es lo que nos permite upscalear una fuente 2048×2048 en un teléfono sin OOMear.
La elección de diseño interesante: deliberadamente no ofrecemos restauración de cara como modelo separado. Herramientas como GFPGAN pueden hacer cosas asombrosas en caras dañadas o de baja-res, pero a menudo producen resultados extrañamente "alisados" que se ven como el gemelo de la persona en vez de la persona misma. Para la mayoría de los usuarios el resultado estándar de Real-ESRGAN es más fiel al original.
FAQ
Q: ¿La imagen upscaleada se verá real o "generada por IA"? A: Para la mayoría de las fotos a upscale 2×, el resultado es indistinguible de una foto de mayor resolución de la misma escena. A 4× las elecciones de la IA se vuelven más visibles — detalle extra en pelo, ligero suavizado de textura de piel, cambios sutiles en fondos. Si esto es bueno o malo depende del uso: para un collage de fotos de vacaciones es una mejora; para una imagen forense o admisible en corte, no es la verdad original.
Q: ¿Puedo upscalear texto en una imagen? A: Real-ESRGAN lo intenta, pero típicamente produce texto que se ve más afilado pero tiene letterforms sutilmente equivocadas. Para imágenes donde la legibilidad del texto importa (documentos escaneados, capturas, notas a mano), un enfoque mucho mejor es: (1) pasa la fuente por la herramienta Image to Text OCR para extraer el texto, luego (2) re-renderiza el texto a alta resolución en una fuente real. Esto produce texto realmente-correcto en vez de texto que se ve plausible.
Q: ¿Qué tan grande puede ser mi imagen de entrada? A: En escritorios modernos con GPUs discretas, hasta ~4000×4000 de entrada (16 MP) funciona bien y produce una salida 16000×16000 (256 MP). En teléfonos y GPUs integradas, ~2000×2000 (4 MP) de entrada es el límite práctico antes de que se agote la VRAM. La herramienta te advertirá si tu entrada es probable que falle.
Q: ¿Cuánto tarda el upscaling? A: Un upscale 1024×1024 → 4096×4096 tarda:
- ~3-5 segundos en M1/M2 Mac, Windows moderno con GPU discreta (WebGPU)
- ~15-30 segundos en GPU integrada Intel/AMD (WebGL)
- ~2-5 minutos en fallback sin-GPU (CPU WASM)
Q: ¿Debería usar escala 2× o 4×? A: 2× cuando la fuente ya es razonable (digamos, 1500×1000) y quieres un boost modesto de sharpness. 4× cuando la fuente es genuinamente pequeña (500×400 o menos) y la necesitas para una pantalla más grande. Ir más allá de 4× en una pasada produce hallucinations visibles; para upscaling extremo, corre 4× → 4× como dos pasadas, pero espera que el resultado diverja del original.
Q: ¿Por qué mi upscale 4× de un JPG muestra patrones raros que no vi antes? A: Real-ESRGAN amplifica lo que sea que esté en la fuente, incluyendo artefactos de compresión JPG (límites de bloque 8×8, ringing alrededor de bordes). Si la fuente tiene compresión visible, corre primero nuestra herramienta Image Compress para obtener un intermedio limpio PNG/WebP, luego upscalea. Mejor aún: usa la fuente de máxima calidad a la que tengas acceso.
Pruébalo ahora
Amplía imágenes 2× o 4× con IA, en tu navegador, en segundos:
Abre la herramienta Super Resolution →
Suelta una imagen, elige escala, haz clic en Upscale. Sin signup, sin subida, sin tarifa por imagen.
Lecturas relacionadas
- Restaura fotos familiares antiguas con IA (en tu navegador) — para fuentes dañadas o descoloridas
- Compresión de imágenes para la web: ¿cuánto ahorras realmente? — la operación opuesta (archivos más pequeños para la web)
- Image OCR: extrae texto de cualquier imagen en 100+ idiomas — para texto en imágenes
- Explora el hub de herramientas de imagen con IA y herramientas de imagen
Última actualización 2026-06-14. La herramienta Super Resolution corre 100 % en tu navegador usando ONNX Runtime Web — tus fotos nunca abandonan tu dispositivo. La inferencia sucede en tu GPU (o CPU). Nunca recopilamos, logueamos ni analizamos los archivos que procesas.