1. Luma 简介


image-20260529232445551

名称Luma
支持语言英文、中文、德文、法文、日文等多种语言
核心能力图像生成、视频生成、音频生成、视频修改、3D 捕捉
开发商Luma AI
网址https://lumalabs.ai
支持模型Ray3.14(视频)、GPT Image 2(图像)、ElevenLabs v3(音频)等多家模型

Luma 是由 Luma AI 推出的一站式 AI 创意平台。公司最初专注于 3D 捕捉与 NeRF 技术,随后凭借旗舰产品 Dream Machine 迅速确立在 AI 视频生成领域的领先地位,目前全球注册用户已逾 3000 万。

Dream Machine 不止于 AI 生成工具的定位,而是一个融合创意构思、多模态生成与团队协作的一体化创作工作台。2026 年 3 月,Luma 正式发布全新的"智能体(Agents)"架构,由自研的"统一智能(Unified Intelligence)"模型家族驱动。该家族首款模型 Uni-1 采用仅解码器(decoder-only)自回归 Transformer 架构,可在单一多模态推理系统内将语言 token 与图像 token 纳入同一序列协同处理,实现从语言推理到像素渲染的端到端生成。这一设计使 AI 由被动的生成工具升级为主动参与创作的协作伙伴。

基于上述统一架构,Luma 智能体可自动编排多个业界领先的 AI 模型协同作业,覆盖文本、图像、视频与音频等多种模态,所调用的模型既包括 Luma 自研的 Ray3.14,也涵盖 Google Veo 3、Nano Banana Pro、ByteDance Seedream、ElevenLabs 语音模型及 GPT Image 2 等第三方模型。同时,智能体在创作全程中保持上下文一致性,并通过迭代式自我评估(self-critique)持续优化输出,为创作者提供从概念简报到最终交付的全流程智能协作体验。

评论

0
还没有评论,来写第一条吧