谷歌推王炸级图像生成功能Generative Powers of Ten 生成图像可无限放大

日期: 栏目:文章分享 浏览:1852 评论:172

12月8日 消息:谷歌推出了一项王炸级图像生成功能,名为Generative Powers of Ten,能够生成图像并实现可无限放大。这一技术创新在图像处理领域引起了广泛关注,为图像生成领域带来了新的可能性

这一目标是通过联合多尺度扩散采样方法实现的。这种方法鼓励不同尺度的一致性,同时保持每个单独采样过程的完整性。而传统的超分辨率方法可能很难在截然不同的比例下创建新的上下文结构,而这项新的方法能够比传统方法实现更深层次的缩放。

谷歌推王炸级图像生成功能Generative Powers of Ten 生成图像可无限放大-第1张图片-Ceacer网络

论文地址:https://arxiv.org/pdf/2312.02149.pdf

具体实现方法是使用预训练的扩散模型来同时去噪多个不同尺度的场景图像。每个缩放级别的噪声图像以及相应的提示同时输入到相同的预训练扩散模型中,返回对应的清晰图像的估计。然后采用多分辨率混合将这些区域融合成一致的缩放堆栈,并从一致的表示中重新渲染不同的缩放级别。最后,重新渲染的图像被用作DDPM采样步骤中的清晰图像估计。

与其他生成缩放视频的方法相比,这项新方法的观察结果显示,因果生成通常会导致较差的结果,因为先前的生成结果并不总是与后续的缩放级别兼容。而新方法的联合多尺度扩散采样方法则能够产生更深层次的缩放,并保持一致性,是一项重要的突破。


标签:

评论留言

  1. 小游客
    发布于:
    666
  1. 小游客
    发布于:
    66
  1. 小游客
    发布于:
    s j d j
  1. 小游客
    发布于:
    666
  1. 小游客
    发布于:
    ad
  1. 小游客
    发布于:
    xxfx
  1. 小游客
    发布于:
    6666
  1. 小游客
    发布于:
    1
  1. 小游客
    发布于:
    1
  1. 小游客
    发布于:
    感谢分享节点

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。发布前请先查看评论规则:点我查看