🌕 桂花香,月儿圆~
Gate 广场 · 中秋创作激励限时开启!
创作点亮中秋,带上热门话题发帖,就有机会瓜分 $5,000 中秋好礼! 🎁
立即报名参与 👉 https://www.gate.com/campaigns/1953
💡 参与攻略
1️⃣ 在广场发帖并带上话题 #Gate广场创作点亮中秋#
2️⃣ 内容需围绕广场官号(Gate广场_Official)每日发布的热点话题进行创作,并确保带上该热点话题及 #Gate广场创作点亮中秋# 标签
3️⃣ 发帖数量越多,内容越优质,互动量越高,奖励越丰厚!
💰 创作者专属奖励
🏆 Top 1:宝格丽中秋限定礼盒 + $100 合约体验券 + $100 GT
🥈 Top 2:宝格丽中秋限定礼盒 + $80 合约体验券 + $60 GT
🥉 Top 3:宝格丽中秋限定礼盒 + $60 合约体验券 + $30 GT
Top 4-10:宝格丽中秋限定礼盒 + $50 合约体验券
Top 11-20:多功能充电器 + $30 合约体验券
幸运奖(30 位):每人 $20 合约体验券
除此之外每位获奖者都将获得相应的社区流量扶持,增加您的社区影响力!
🍀 新用户特别福利:
第一次在活动期间发帖?恭喜你,还有机会冲击 $600 中秋赏月奖池!
完成任务(完善资料+关注5人+点赞/评论/转发5帖+带话题发首帖),30 位幸运用
DALL·E 3必应开测!马骑宇航员难题攻破,一张画指定50个物体,微软前所未有深度参与研究
来源:量子位
没收到资格也没关系,再加上第三方研究预览、OpenAI员工的内部试玩,各种测试案例纷纷涌现,包看过瘾。
最夸张的一个,要数**“指定画面中出现50个不同物体”**,结果足足画出了几百个。
在论文一般当成失败案例,当时还被AI悲观主义者马库斯好一顿嘲讽。
虽然没有明确说明,但贡献名单中研究部分就有至少3位微软工程师与研究员参与,推理优化部分更是大部分成员来自微软DeepSpeed团队。
这次合作模式的变化,也代表两家公司关系进一步加深。
一张画指定50个物体
由微软Bing首席执行官Mikhail Parakhin确认,最幸运的百分之几用户已经获得测试资格了。
提出画50个不同物体的网友,就是想测试DALL·E 3一张画中能容纳多少物体,类似大语言模型的**“上下文窗口”**。
首先他先让ChatGPT随机列出50个日常物体,然后直接要求把这些物体都画在一幅画里就可以了。完整的提示词是ChatGPT自己补全,再由DALL·E 3画出来。
ChatGPT在提示词中补充了一些细节:
一名中年波利尼西亚男性冲浪者有被阳光吻过的皮肤,他举着50种物品,奋力冲浪,其中包括茶杯、自行车、雨伞……海浪在他周围拍打,他的表情充满决心和轻微的恐慌,试图平衡这些物体和他的冲浪板。
结果一次尝试就得到了基本符合要求的图像,只是人物表情看起来更像是非常恐慌,而不是轻微恐慌。
ChatGPT回复如下:
您可以提供所需图像的详细描述。您越具体和详细,生成的图像就越接近您的愿望。
您可以指定图像的风格或媒介,例如“油画”、“照片”、“插画”、“卡通”、“水彩画”、“3D渲染”等。
默认情况下,图像以1729x1024分辨率生成。但如果您的描述建议使用全身肖像或更适合高纵横比的内容,则将以1024x1792生成图像。如果需要,您还可以请求正方形分辨率 (1024x1024)。
:如果您没有指定,我通常会根据您的描述创建四个不同的图片。但是,您可以请求特定数量(最多四个)。
:如果您对初始结果不满意,可以提供反馈并请求修改。虽然我无法直接修改现有图像,但我可以使用您的反馈来生成更符合您的愿景的新图像。
:如果您想修改以前的图像,我可以使用该图像元数据中的种子来生成新版本。这确保了原始图像和修改后的图像之间的一定一致性。
存在某些限制。例如公众人物的形象,以及最近100年内的艺术家的风格,都无法直接创建。
重点在后面:
然而,我可以提供替代方案或使用形容词来捕捉特定风格的本质,而无需直接引用它。
马骑宇航员难题破解
OpenAI内部员工中,Will DePue是最积极公开DALL·E 3试玩结果的了。
在马骑宇航员测试中,他表示其实也不是100%成功。
只要付出一些努力,你就能得到几乎所有想要的。
几乎不可能,需要大量的提示工程,而且很难复现。
如果你是MidJourney资深用户,不妨试试能不能成。
更多错误尝试中还出现了一个双头长颈鹿。
微软OpenAI通力合作
DALL·E 3这次巨大提升,除了整合ChatGPT,图像生成部分具体是怎么做到的呢?
很可惜,鉴于OpenAI越来越Close的趋势,很可能不会像前两代那样公布论文了,只能从贡献名单中略作猜测。
DALL·E 2论文共有5位作者。
一致性模型比当前最流行的扩散模型速度更快,3.5秒就能生成64张256*256的图像。
但宋飏此次属于次要研究贡献,不确定是否DALL·E 3使用了一致性模型,更可能是在改良扩散模型中借鉴了他的方法。
此外,除了DALL·E 2作者和ChatGPT团队的欧阳龙等,至少有3位研究者来自微软。
Jianfeng Wang博士毕业于中科大,在微软任主任研究员。
Lijuan Wang博士毕业于清华大学,在微软任主任研究经理。
两人曾参与无限画布图片生成NUWA-Ininity的研究。
Deepspeed是开源的深度学习优化库,减少计算功耗和内存使用,在现有硬件上通过更好的并行来训练和推理大规模分布式模型。
但既然GPT-4在Bing上是免费提供的,将来DALL·E 3免费玩也可以期待一波了~
参考链接:
[1]
[2]
[3]