谷歌正在 Gemini 中测试 Veograms 系统,以加速视频生成,并同步开发全新的音乐曲目生成工具。此次更新旨在将 Gemini 打造成一个面向多媒体内容创作的一站式工作平台。
谷歌计划在 Gemini 生态系统中正式引入 Veograms 功能,标志着其视频内容生成方式正转向基于模板的模式。Veograms 本质上是一套预设的视觉布局模板,用户可在生成视频前选择特定结构或主题,而无需从零开始逐字编写提示词(prompt)。
这一系统主要面向希望简化视频制作流程、又不具备高级提示工程技能的用户。此前,Veograms 已在小范围测试中亮相,而此次更广泛的部署将使结构化视频生成能力覆盖到更多 Gemini 用户。通过使用现成模板,不仅能提升生成结果的一致性,还能显著降低视频生成的使用门槛。
除了视频工具外,内部代码中的线索还表明,谷歌正在积极开发直接集成于 Gemini 的音乐生成功能。这些新工具将允许用户创建完整的音乐音轨,早期样例已展示出对摇滚、爵士和低保真(lo-fi)等风格的支持。
目前尚不清楚该音乐功能是否会基于一个全新的专用模型推出,但谷歌显然有意将创意能力从纯视觉内容扩展至音频领域。预计音乐生成功能将深度整合进 Gemini 的统一界面,用户可直接在平台内创作并下载完整的音频文件。
一旦全面上线,Veograms 与音频工具的加入将成为谷歌当前战略的重要一步——即把 Gemini 塑造成一个“全能型”AI创意工作空间,直接对标其他多模态人工智能平台。不过,截至目前,这两项新功能(尤其是音乐生成模型)的具体公开发布时间仍未确定。