Google Gemini(前身为 Google Bard)现在终于具备了与竞争对手 ChatGPT 媲美的图像生成功能。你只需在 Gemini 中输入简单的文本提示词,即可生成各种类型的图片。这项全新的图像生成功能目前对所有用户免费开放,其背后由最新的 Imagen 2 模型提供技术支持。本指南将详细介绍如何在 Google Gemini 上生成图像,并将其与竞争对手 ChatGPT 进行对比分析。
第一步: 在浏览器中访问 https://gemini.google.com/app。
第二步: 在输入框中输入生成图片的文本指令。你可以使用“绘制”、“生成”或“创建”等动作词汇作为开头。请详细描述你希望在图像中看到的内容。
例如,你可以要求 Gemini “生成一张猫咪坐在阳光明媚的花园里的图片”,或者 “创作一幅机器人在做披萨的卡通插画”,然后点击发送按钮。为了获得更好的效果,请确保你的提示词包含清晰的细节。
根据你的指令,Google Gemini 可能需要几分钟来生成图像。默认情况下,Gemini 会生成 两张 图像,分辨率为固定的 1536×1536 像素。你可以点击下载图标保存图片,或点击图片在全屏模式下查看。如果需要更多选择,可以点击“生成更多”按钮。
Google Gemini 在图像生成方面存在一些限制:
分辨率固定:目前生成的图像分辨率固定为 1536×1536 像素,且无法更改。
内容安全限制:为了规避伦理、隐私及法律风险,Google Gemini 无法生成 真实人物的照片,以及包含暴力、冒犯性、色情内容或受版权保护的材料。
数字水印:Gemini 生成的图像带有数字水印。它使用名为 SynthID 的系统,这是一种嵌入图像中的隐形水印,意在表明“嘿,我是由 AI 制作的!”。
这就是使用 Google Gemini 生成图像的方法。与 ChatGPT 相比,Google Gemini 的图像生成服务是免费的。在我们的测试中,基于所获得的结果,Google Gemini 生成的图像质量优于 ChatGPT。当然,它也存在一些缺点,例如图像分辨率固定等。
1. Gemini 如何从文本生成图像?
Google Gemini 使用其最新的文生图模型来生成图像。在文本提示词中,你可以直接要求 Google Gemini 生成图像,系统便会进行处理。默认情况下,Google 会生成两张图像。
2. Gemini 可以创建任何风格的图像,还是仅限于特定格式?
Google Gemini 的图像格式并不局限于特定风格,它可以生成不同风格的图像。但是,它不能生成真实人物的图像,且提示词中不能包含露骨内容或受版权保护的材料。此外,Google Gemini 生成的图像分辨率固定为 1536×1536 像素。
3. 如何为 Gemini 提供生成图像的输入指令?
你可以输入包含“创建”、“生成”、“制作”等词汇的文本提示词。例如:你可以输入 “生成山脉的图片” 或 “创建一幅拥有茂密高大树木的森林图片” 等。提示词越详细,获得的图像效果就越好。
4. Gemini 能否与其他软件或平台集成以实现更流畅的工作流?
不能。目前,Google Gemini 生成的图像无法与其他软件或平台集成以实现工作流自动化。
5. 使用 Gemini 进行图像生成的费用是多少?
Google Gemini 的使用是免费的。你可以无额外成本地生成图像。