好消息!Stable Diffusion 3允许商业化,很快开源更大版本模型

2024-07-06 13:00
摘要:7月6日凌晨,著名开源大模型平台Stability AI修改了社区许可协议,最新发布的文生图模型Stable Diffusion3Medium允许商业化(以下简称“SD3-M”)。如果企业、个人开发者每年收入低于100万美元(大约726万元人民币)..

7月6日凌晨,著名开源大模型平台Stability AI修改了社区许可协议,最新发布的文生图模型Stable Diffusion3Medium允许商业化(以下简称“SD3-M”)。

如果企业、个人开发者每年收入低于100万美元(大约726万元人民币),只需向Stability AI填写一份申请,就可以免费将SD3-M用于商业化,包括数据微调、开发生成式AI应用等。

这个消息对于个人开发者和初创企业来说是相当好的,可以免费商用目前最强的文生图片模型之一,可与闭源模型Midjourney、DALL·E3相媲美,同时学术研究机构仍然不受限制地使用SD3-M那个协议不变。

开源地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium

填写申请地址:https://stability.ai/community-license

SD3-M是Stability AI在今年6月12日开源的,当时的规定只能用于学术研究,想商业化只能加入他们的超级会员服务

SD、SD2、SDXL等免费开源和商业化全球下载量超过数千万,也为Stability AI带来超百万开发者,这更强的3代咋就抠抠搜搜了呢。

很快Stability AI自己也意识到格局太小了,加上最新换了一个很有魄力的CEO,决定还是回归本质拥抱社区吧。

根据最新修改的协议显示,这个100万美元收入是一个硬性指标,就是说无论你是通过SD3-M获取的100万美元收入还是公司其他业务,例如,你是一家塑料厂公司,每年收入1000万美元,就无法免费商用SD3-M

此外,Stability AI表示,为了提供更好的模型、架构和微调方法,未来几周内会发布一个更大版本的模型。并且会继续分享给社区的用户,言外意思就是说会继续开源。

一提到“未来几周内”,已经有网友开始瑟瑟发抖了,伙计这可能是3个月以后的事了~~

其实“几周内”这个梗是OpenAI带出来的,当初展示的Sora距今已经4个多月了还在邀请测试。GPT-4o的语音模式说好了几周内发布,又延期两个月,现在一听到几周内发布,脑袋嗡一下就要炸了~

当然对于Stability AI能及时修改协议,普惠广大的开发者和小型企业,大家还是非常开心滴。

对其感激之情犹如滔滔江水、连绵不绝~

100万门槛设的刚刚好,商用协议改的很棒!

根据之前Stability AI公开的技术报告显示, SD3-M模型拥有20亿参数,平均生成图片的时间约为2—10秒,推理效率极高对硬件的要求相对较低,非常适合在PC、手机和平板等移动设备上使用

SD3-M与前几代相比,在图片质量、文本语义还原、光影、色彩有了很大提升,尤其是文本嵌入方面改变很大,减少了字体识别不好、嵌入不正确等问题。

训练数据集方面,SD3-M使用了包含10亿张图片的公开和合成数据进行了预训练,同时针对特定艺术风格和领域,使用了3000万张图片进行了微调以及300万张偏好图片。

以下是SD3-M生成的图片欣赏:

一艘老式的蒸汽朋克风格的飞艇翱翔在一个庞大的哥伦布时代城市景观之上,伴随着复杂的发条机制和蒸汽动力引擎。

一座白色建筑顶部放着一张红色沙发。涂鸦强上写着“城市最佳景观”。

在一片漆黑的深海背景中,发着奇异光芒的透明水母正在四处游动。

超现实、梦幻般的场景,一只蝴蝶从一朵充满活力的抽象花朵中出现,周围环绕着旋转的迷幻图案。

一个印有“他们说在这里思考不好”的纸板箱,纸板箱很大,放在剧场舞台上。

一座舒适的小屋在树林里有温暖的光,外面下着雪,一杯热气腾腾咖啡放在树桩上,被树木包围。

一个充满科技感的现代化教室,孩子们通过虚拟现实头盔学习历史事件,机器人教师在一旁指导,墙上显示着互动式教学内容。

红色的火星表面,人类建立的第一个殖民地,有透明穹顶覆盖的居住区,科学家们在户外进行研究,背景是隐约可见的地球。

本文素材来源Stability AI官网,如有侵权请联系删除

END

更新于:5个月前