逆天!国产新型大模型 1.7 秒修复老照片,直达 8K 级别,速度与精度双突破!

博文小编

2025-08-12


如何把一张老照片修复得又快又好呢?
7月28日,中国科学院深圳先进技术研究院发布了一项名为HYPIR的图像复原大模型,最快1.7秒即可完成一张照片的复原,并且实现了8K级别的细节生成。
这一成果有望在文化传承与保护、影视修复以及科研、医疗等多个领域发挥积极作用。

以一张狮子图像为例,原图里的毛发和轮廓模糊不清,画面背景还存在比较明显的噪点,通过使用这款图像复原大模型,1秒左右,一张高清且充满细节的狮子图像就被成功修复了。

中国科学院深圳先进技术研究院数字所研究员董超介绍说,“如果我们单纯做锐化,那么这些毛发只是这些毛发,它没有办法有新的毛发出来,但是我们如果仔细看,除了锐化以外,它其实有新的毛发在旁边去辅助它,保持原图的特征不变,还能够恢复出清晰的细节,这是它最大的难度。”

据介绍,这款图像复原大模型目前已经过三次迭代升级,相较传统技术需要用图片制作软件逐个处理细节,它更智能,用时更短,而且能够修复出4K、8K的画质。而相比现有的文生图技术,它通过大量数据学习和训练以及算法的提取,修复出的图片细节更加准确。

1927年第五届索尔维会议合影修复

HYPIR大模型修复图像效果展示


HYPIR大模型处理图片纹理细节的效果展示
董超解释说,“结合最新的大语言模型和多模态大模型,同时我们过去十年里面积累了很多图像复原的技术,把这些技术合成在一起,模拟真实场景下的退化,让老照片也可以清晰地恢复出来。未来针对老电影,它可以做高清化,把珍贵的历史资料栩栩如生地展现出来;它同时可以辅助其他的科研领域,比如说显微技术、医疗成像、水下成像,都可以利用我们的技术进行改进,把图像变得清晰,做得更好。”
如果你也想要一探这场视觉革命的究竟,更深入地了解这款新型图像复原大模型背后的秘密,不妨读一读董超老师精心撰写的这本《底层视觉之美:高清大片背后的人工智能》!

为什么值得一读?

一部技术史,半卷人文诗
不同于冰冷的工具书,这是一场科技与美学的跨界对话。
翻开书页,没有公式轰炸,没有代码劝退——作者用散文般的语言,将底层视觉技术的前世今生娓娓道来。
从传统算法的“刀耕火种”,到深度学习的“智能核爆”,从实验室的深夜灵光,到商业落地的现实碰撞……技术细节被拆解成生动的故事,科研心路化作真诚的对话。
哪怕你是文科生,也能轻松读懂AI如何“让世界变清晰”。

作者及其团队

董超,博士生导师,中国科学院深圳先进技术研究院研究员,深圳理工大学教授,上海人工智能实验室双聘领军科学家。主要研究方向为底层视觉,包括图像超分辨率、去噪和增强等,发表相关论文100余篇,截至2024年年底,谷歌学术引用量超过40000次。2014年,提出深度超分辨率算法SRCNN,首次将深度学习引入图像超分辨率领域。2017年至今,多次带队参加国际图像超分辨率比赛,共获得9项冠军。2016-2018年就职于商汤科技,带领商汤超分团队率先开发了基于深度学习的数码变焦软件,并成功落地在VIVOX23手机上。2021年,被斯坦福大学评选为世界前2%顶尖科学家。2022年被清华大学评为AI2000人工智能全球最具影响力学者。2023年获得上海市技术发明奖一等奖。他所带领的研究团队XPixel是世界一流的底层视觉团队,在图像和视频的超分辨率、复原和生成方向有许多优秀的原创性成果。
胡锦帆,中国科学院深圳先进技术研究院2022级博士生XPixel团队成员,师从董超。研究方向为底层视觉,致力于探索该领域的可解释性问题。

顶尖学者推荐

吕健勤(南洋理工大学教授):“本书不仅是一部技术专著,更是一部富有温度的作品。作者以丰富的科研经验与独到的见解,为我们揭示了底层视觉技术的前世今生,同时通过美学的视角,带领读者感受计算机生成图像的魅力与挑战。无论是计算机视觉领域的专业人士,还是对高清影像、内容生成技术感兴趣的读者,都能从本书中受到启发,与作者产生共鸣。”
张磊(香港理工大学教授):“这是一本很独特的书。它不是枯燥的技术类书,而是用优美的散文化的文字,写出了作者对底层视觉的深刻理解和广泛的经验,通俗易懂。”
周建涛(澳门大学教授):“本书语言轻松,读下来几乎一气呵成。抛开技术层面,更吸引我的反而是技术背后的故事。底层视觉的学者对董老师的成名作之一——SRCNN 都颇为熟悉。他工作背后的信念、对当时新技术(深度学习)的坚持、研究的简洁之美,等等,都是从论文中读不到的。而恰恰是这些内容,让人颇受启发,指引读者去做更有创造力和影响力的工作。”

本书适合哪些读者?

理工科学生和科研人员:掌握底层视觉核心技术框架,获取领域前沿动态;
AI开发人员和产品经理:从算法原理到落地实战,解锁技术商业化密码;
影视/摄影爱好者:读懂高清影像背后的AI魔法,提升视觉审美维度;
任何对人工智能感兴趣的读者:无须专业背景,感受科技如何重塑人类感知世界的方式。

如何阅读本书?


当技术成为艺术,当代码谱写美学——
这本“有温度”的AI之书,等你开启一场颠覆认知的视觉之旅!👇

读者评论

相关博文

  • 社区使用反馈专区

    陈晓猛 2016-10-04

    尊敬的博文视点用户您好: 欢迎您访问本站,您在本站点访问过程中遇到任何问题,均可以在本页留言,我们会根据您的意见和建议,对网站进行不断的优化和改进,给您带来更好的访问体验! 同时,您被采纳的意见和建议,管理员也会赠送您相应的积分...

    陈晓猛 2016-10-04
    5825 753 3 7
  • 迎战“双12”!《Unity3D实战核心技术详解》独家预售开启!

    陈晓猛 2016-12-05

    时隔一周,让大家时刻挂念的《Unity3D实战核心技术详解》终于开放预售啦! 这本书不仅满足了很多年轻人的学习欲望,并且与实际开发相结合,能够解决工作中真实遇到的问题。预售期间优惠多多,实在不容错过! Unity 3D实战核心技术详解 ...

    陈晓猛 2016-12-05
    3544 36 0 1
  • czk 2017-07-29
    6434 28 0 1