Stability AI 预览 Stable Diffusion 3 文本到图像模型

2024-02-26

总部位于伦敦的人工智能实验室 Stability AI 公布了其新型文本到图像模型 Stable Diffusion 3 的早期预览版。这一先进的生成式人工智能模型旨在根据文本提示创建高质量图像,并在多个关键领域提高性能。


就在 Stability AI 的最大竞争对手 OpenAI 发布 Sora 之后几天,Stability AI 又宣布了这一消息--Sora 是一种全新的人工智能模型,能够根据简单的文字提示生成近乎逼真的高清视频。


Sora 还没有向公众开放,但它却引发了人们对其制造逼真假视频潜力的担忧。OpenAI 表示,它正在与错误信息和仇恨内容方面的专家合作,在广泛提供该工具之前对其进行测试。


根据 Stability AI 的说法,与之前的版本相比,Stable Diffusion 3 在处理多主体图像生成方面的能力明显提高。这样,用户就可以将更详细的提示包含到多个元素中,并取得更好的效果。 


除了对复杂提示的改进外,新版本还提升了整体图像质量和拼写准确性。Stability AI 声称,这些升级解决了影响过去文本到图像模型的一些一致性和连贯性问题。



虽然 Stability Diffusion 3 还未公开,但 Stability AI 已经为有兴趣提前使用 Stable Diffusion 3 的用户开放了等待名单。预览阶段将允许 Stability AI 收集反馈意见,并在计划于今年晚些时候全面发布之前继续完善该模型。


Stability AI 表示,它还在与专家合作测试 Stable Diffusion 3,确保它能减轻潜在的危害,这与 OpenAI 对 Sora 的做法类似。


"我们相信安全、负责任的人工智能实践。这意味着我们已经采取并将继续采取合理措施,防止不良行为者滥用 Stable Diffusion 3。稳定人工智能公司表示:"安全始于我们开始训练模型之时,并贯穿整个测试、评估和部署过程。


"为了准备这次早期预览,我们引入了许多保障措施。通过与研究人员、专家和社区的持续合作,我们希望在模型即将公开发布时,能够进一步创新,并保持完整性。


Stable Diffusion 3 提供了一系列模型大小,从低端的 8 亿个参数到高端的 80 亿个参数。Stability AI 公司表示,这种选择范围旨在平衡创造性性能和不同计算资源用户的可访问性。 


"Stability AI 解释说:"我们始终致力于确保生成式人工智能的开放性、安全性和普遍可及性。


"通过Stable Diffusion 3,我们努力提供适应性强的解决方案,使个人、开发者和企业能够释放他们的创造力,这与我们激活人类潜能的使命不谋而合。"


相关标签