盖世汽车

MIT重新构想图像生成标记器和解码器无需生成器即可进行编辑和修复

+关注

盖世汽车刘丽婷2025-07-24

盖世汽车讯人工智能图像生成——依靠神经网络根据各种输入（包括文本提示）创建新图像——预计到本世纪末将成为一个价值数十亿美元的产业。即使以今天的技术，如果想要创作一幅奇特的画面，比如一位朋友在火星上插上国旗，或者漫不经心地飞进黑洞，也只需不到一秒钟。

然而，在图像生成器能够执行此类任务之前，它们通常需要接受海量数据集的训练，这些数据集包含数百万张图像，通常还配有相关文本。训练这些生成模型可能是一项艰巨的任务，需要数周甚至数月的时间，并且会消耗大量的计算资源。

重新构想.jpg

图片来源：MIT

但是，如果真的可以通过人工智能方法生成图像，而无需使用生成器，那会怎样呢？

据外媒报道，2025年夏初，在加拿大不列颠哥伦比亚省温哥华举行的国际机器学习大会（International Conference on Machine Learning，ICML 2025）上，一篇研究论文阐述了这种现实可能性以及其他一些引人入胜的想法。研究人员重新构想图像生成，使标记器和解码器无需生成器即可进行编辑和修复图像。相关论文已发表在arXiv预印本服务器上。

论文由麻省理工学院（MIT）信息与决策系统实验室（LIDS）研究生研究员Lukas Lao Beyer、麻省理工学院计算机科学与人工智能实验室（CSAIL）博士后研究员Tianhong Li、Facebook人工智能研究中心的Xinlei Chen、麻省理工学院航空航天学教授兼LIDS主任Sertac Karaman以及麻省理工学院电气工程与计算机科学副教授Kaiming He共同撰写。

这项团队研究的起源是Lao Beyer去年秋季参加的深度生成模型研究生研讨课的课堂项目。在学期中的交流中，Lao Beyer和研讨课的授课老师He都意识到这项研究具有真正的潜力，远远超出了普通家庭作业的范畴。很快，其他合作者也加入了进来。

前瞻技术

开通高级账号后继续阅读

您未开通，请开通后阅读

开通

相关文章

福特申请面部识别技术专利
刘丽婷

研究人员开发出世界首创人工智能路边技术以防止动物与车辆相撞
刘丽婷

研究人员利用显微成像揭示双电层如何在电池成核点形成
刘丽婷

MIT发明深度学习系统仅使用单个摄像头即可教会仿生软体机器人移动
刘丽婷

MIT开发出新型光子处理器可以简化6G无线信号处理
刘丽婷