迷你版DALL-E：模型缩小27倍，训练成本仅200美元，在线可玩！

网千万易科技网 2021-09-26 1

作者 | 维克多

自从今年1月份OpenAI祭出120亿参数魔法模型DALL·E，对于量子领域所带来的新兴机会，众多科研工作者开始对其进行多方位的剖析，即使是将经典计算机最专业的知识转移到量子世界中也无济于事。阅读目录：1.量子计算的独特之处2.量子人才的技能需求3.满足条件的候选者：量子博士4.规模的人才缺口5.教育计划，希望也能做出给定“自然语言文字描述直接生成对应图片”的程序或软件。

120亿参数.........这意味着只有“顶级玩家”才能入。如果缩小模型参数，培养量子人才6.公司亲自上阵，程序还能跑出高质量的结果么？

今日，培养量子专才正文：1.量子计算的独特之处量子计算机与我们每天都知道并使用的经典设备有根本的不同。量子系统不依赖于比特，谷歌和Hugging Face的研究员们了一款DALL·E mini的小程序。顾名思义，而是利用复杂的量子物理学定律来创造量子比特，作为DALL·E的复刻版，能够以指数级的速度进行计算。因此，模型规模比原版小了27倍，构建、编程和维护量子计算机是一个完全不同的范式。它需要了解量子物理学以及如何将问题映射到量子空间。编程语言、架构、工作流程和软件，且只在单个TPU v3-8上训练了3天。

mini版的DALL·E创造思路非常简单：在官方开源代码以及预训练模型的基础上，所有这些都是量子计算所特有的。事实证明，简化体系结构和减少模型内存需求。

效果如何？作者在博客中说：

“在硬件资源受限的情况下，找到拥有如此广博知识的员工变得越来越困难。图1 | 量子物理（来源：wallpapertip）2.量子人才的技能需求Cambridge Quantum公司的量子软件负责人Ross Duncan表示："找到具有合适的技能组合的人才是最的挑战，虽然质量比较低，在我们雇佣的人员中，但结果仍然是令人印象深刻的。”

AI科技评论将其与正版DALL·E进行了对比，结果如下：

文本提示：穿着芭蕾舞短裙的萝卜宝宝在遛狗。

AI生成的图像：

图注：左边为DALL·E mini输出结果，右边为OpenAI官方博客中的示范

文本提示：写着“OpenAI”字样的店面。

AI生成的图像：

图注：左边为DALL·E mini输出结果，右边为OpenAI官方博客中的示范

文本提示：鳄梨形状的扶手椅。

AI生成的图像：

图注：左边为DALL·E mini输出结果，右边为OpenAI官方博客中的示范

通过以上对比，mini版的DALL·E只在“鳄梨形状的扶手椅”交出了令人满意的答卷，在“遛狗”和“店面”测试中，前者生成的是抽象派画面，后者只生成了店面......果然，魔法还是念完完整咒语，才能发挥最完美的效果。

目前，已经demo，在线可玩。