返回博客
tutorial 2026-06-14

浏览器内 AI 把图片 4 倍放大(免注册,2026)

浏览器内 AI 把图片 4 倍放大(免注册)

你接手了一份 2012 年的旅行照片,全是 1024×768——在 1080p 显示器上放幻灯片还行,4K 打印、海报或现代视网膜级博客头图都没法用。或者你在做落地页,完美素材图只有 600×400。或者你有一张已故亲属的珍贵照片,早期智能机拍的,想印 12×18 英寸却怕看起来像截图的截图。

这就是图像放大问题。过去 5 年深度学习模型彻底改变了它——它们不只是把像素拉伸(那只会糊成一片),而是根据从数百万训练图学到的内容合成新的细节。2026 年最好的模型在你浏览器标签页里 30 秒内完成一张图,效果在 2022 年还得月付 $40 的 Adobe 订阅才能拿到。

本文会讲清楚 AI 放大究竟是怎么工作的、什么时候像魔法、什么时候产出让人毛骨悚然的"幻觉"细节、以及如何用 Ai2Done 的 Super Resolution 工具 做浏览器端 2× / 4× 放大。

TL;DR

  • AI 放大基于神经网络学到的模式合成新像素——不是魔法,是模式匹配。
  • 2× 与 4× 在照片上效果好。8× 之后"幻觉"细节会变得明显。
  • Ai2Done Super Resolution:浏览器端用 ESRGAN / Real-ESRGAN 模型,在 WebGL 中跑。
  • 最擅长:人脸、风景、食物、动物。最弱:图中文字(先 OCR 再重新渲染)、像素画(用专门工具)、重度压缩的 JPG(噪点会被放大)。
  • 隐私重要:家庭照片、证件扫描、个人纪念——本地完成。

为什么这件事比看起来更难

"放大"听起来像乘法:800×600 拉到 3200×2400 就完了。经典算法——双三次插值(所有图像编辑器的默认)、Lanczos 重采样(稍花哨)、最近邻(像素画)——产出的结果数学上正确,看起来却很糟糕。原因:你把尺寸翻倍,像素数变成 4 倍但信息量没变。新像素必须来自邻域平均,所以软。

AI 放大问的是另一个问题:"给定这张 800×600 图,同一主题的 3200×2400 照片大概长什么样?" 神经网络在数百万对 (低分辨率, 高分辨率) 图像上训练,学会预测合理的高频细节——锐利的边、发丝、叶脉、织物纹理——这些信息纯数学算法无法恢复,因为它们根本不在源像素里。

代价:AI 放大器会幻觉。模型没见过类似输入时,按训练先验做最佳猜测。人脸长出多余皱纹或痣;文字变更清晰但字形微妙错误;背景多出原本不存在的细节。艺术与家庭照片场景下通常没问题(且常比原图柔糊更好);取证或法律用途下,AI 放大图不是原始真相——而是合理重建。

2026 年开源 SOTA:

  • Real-ESRGAN——通用型照片放大器最佳,人脸出色,文字一般。
  • ESRGAN(前身)——略不那么激进,幻觉更少。
  • SwinIR——自然纹理略好但更慢。
  • Latent Diffusion Super-Resolution(LDSR)——画质最好,慢约 100 倍,实际上 GPU 专属。

我们浏览器端发布 Real-ESRGAN,编译到 ONNX-Web 跑在 WebGLWebGPU(如支持),老设备回退到 CPU WebAssembly

方法一:Ai2Done Super Resolution(浏览器端、免注册)

Ai2Done Super Resolution 工具 完全在你的浏览器内运行 Real-ESRGAN:

  1. 在任何现代浏览器中打开 /tools/super_resolution
  2. 拖入图片——支持 JPG、PNG、WebP、HEIC。
  3. 选缩放——2×(更快,2022+ 笔记本约每张 5 秒)或 4×(更慢,约 15-30 秒)。
  4. 选模型——"通用照片"(Real-ESRGAN x4plus,默认)适合多数照片;"动漫/插画"(Real-ESRGAN anime)适合卡通插画。
  5. 点击放大。进度条显示推理进度;WebGPU 设备近实时,WebGL 回退慢约 10 倍但仍可用。
  6. 原图 vs 放大 并排预览出现。拖动分隔线对比局部。
  7. 下载为 PNG(默认、无损)或 JPG 画质 95(文件更小)。

整件事在你的浏览器标签页内完成。照片不上传任何服务器,包括我们的。

支持设备上(Chrome / Edge 在启用 WebGPU 的现代桌面):1024×1024 图像 4× 放大约 3-5 秒。WebGL 回退(老设备、Safari):同操作 30-60 秒。CPU WASM 回退(完全无 GPU):2-5 分钟一张。我们自动选最优后端,可在"设置"中覆盖。

方法二:Real-ESRGAN 命令行(批量任务)

要自动化处理几十张图,官方 Real-ESRGAN 二进制是最快路径:

# 安装(一次性,含模型权重)
pip install realesrgan

# 用通用模型 4× 放大
realesrgan-ncnn-vulkan -i input.jpg -o output.png -s 4 -n realesrgan-x4plus

桌面带独立 GPU(Nvidia GTX 1660 或以上、AMD RX 580 或以上)时比浏览器版快约 5×——直接通过 Vulkan 调 GPU,不经过 WebGPU 抽象层。

适合为印刷图录放大 100+ 张照片、或修复整本家庭相册。对"博客文章放 3 张图"则属过度工程。

方法三:Topaz Gigapixel AI(商业桌面,画质基准)

效果优先、预算其次时,Topaz Gigapixel AI($99 一次性付)是商业金标准。带几个专门模型——低分辨率照片、压缩 JPEG、艺术、人脸——UI 允许在同图不同区域混合模型输出。复杂内容照片的画质显著优于 Real-ESRGAN。

代价:桌面应用(3 GB 安装包),需强力 GPU,按使用频率才划算。偶尔用浏览器工具足矣。

浏览器放大器是怎么做的(技术细节)

Ai2Done Super Resolution 工具 构建于:

  • ONNX Runtime Web 做模型推理。ONNX 是模型格式标准,让同一模型可在 WebGPU、WebGL、CPU WASM 上无需重写推理代码运行。
  • Real-ESRGAN x4plus 模型权重(约 67 MB),量化到 fp16 以适配中端 GPU 显存。仅在用户启动放大时按需加载(页面加载快)。
  • WebGPU 为主要推理后端,Chrome/Edge 在支持硬件(Mac M1+、Windows 带独立 GPU、Android Adreno 7xx+)上启用。Safari 与老 Chrome 回退到 WebGL。无 GPU 时回退到 CPU WASM(多线程、SIMD 加速)。
  • 分块推理处理大图。Real-ESRGAN 原生输入 256×256;1024×1024 图分 16 块推理、再用重叠混合拼接避免接缝。这就是为什么手机也能放大 2048×2048 源图而不爆内存。

值得说的设计选择:我们刻意不单独提供人脸修复模型。GFPGAN 这类工具在受损或低分辨率人脸上能做出惊人效果,但常产出像"双胞胎"而非本人的诡异平滑结果。多数用户标准 Real-ESRGAN 结果更忠于原图。

常见问题

Q:放大后看起来真实、还是"AI 生成"? A:多数照片 2× 放大后与同场景高分辨率照片不可分。4× 时 AI 选择开始可见——发丝多出细节、皮肤纹理略平滑、背景微变。好坏取决于用途:旅行拼图是改进;取证或庭审用图则不是原始真相。

Q:能放大图中文字吗? A:Real-ESRGAN 会尝试,但通常产出看起来更锐利但字形微妙错误的文字。文字清晰度重要的场景(扫描文档、截图、手写笔记),更好做法是:(1) 用 Image to Text OCR 工具 抽出文字,(2) 在真正的字体里高分辨率重新渲染。产出真正正确的文字,而非看起来合理的文字。

Q:输入图能多大? A:现代桌面+独立 GPU 上约 4000×4000(16 MP)输入没问题,产出 16000×16000(256 MP)。手机与集成 GPU 上约 2000×2000(4 MP)是 VRAM 耗尽前的实际上限。输入可能失败时工具会提醒。

Q:放大要多久? A:1024×1024 → 4096×4096:

  • M1/M2 Mac、现代 Windows+独立 GPU(WebGPU):3-5 秒
  • Intel/AMD 集成 GPU(WebGL):15-30 秒
  • 无 GPU 回退(CPU WASM):2-5 分钟

Q:选 2× 还是 4×? A:源已合理(如 1500×1000)且想适度提锐 → 2×;源真的小(500×400 以内)且要在更大显示上 → 4×。单次超过 4× 会产生可见幻觉;极端放大走 4× → 4× 两遍,但要预期结果偏离原图。

Q:4× 放大 JPG 出现以前看不到的怪图案是怎么回事? A:Real-ESRGAN 会把源里的一切(包括 JPG 压缩噪点、8×8 块边、振铃)都放大。源可见压缩时先用 Image Compress 工具 走一道得到干净 PNG/WebP 再放大。更好做法:用你能拿到的最高画质源。

现在就试

几秒钟用 AI 在浏览器内做 2× 或 4× 放大:

打开 Super Resolution 工具 →

拖入图、选缩放、点击放大。无注册、无上传、无单图收费。

相关阅读


最后更新于 2026-06-14。Super Resolution 工具 100% 在你的浏览器内通过 ONNX Runtime Web 运行——你的照片永远不会离开设备。推理在你的 GPU(或 CPU)上完成。我们不收集、不记录、不分析你处理的任何文件。