原文详情点此查看:

https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

音频理解能力:

https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb

在 Google AI Studio 中获取 API 密钥 :

https://aistudio.google.com/app/prompts/new_chat

Gemini API 说明书:

https://github.com/google-gemini/cookbook

2024年4月9日谷歌Gemini 1.5 Pro更新,根据提供的网页内容,以下是对谷歌Gemini 1.5 Pro模型免费开放的归纳总结:

  1. Gemini 1.5 Pro 在 Google AI Studio 中推出
    • 提供了Gemini 1.5 Pro型号供开发人员试用,可以使用100万个上下文窗口进行调试、创建和学习。
  2. Gemini 1.5 Pro 在180+个国家/地区推出
    • 在Gemini API中提供Gemini 1.5 Pro公共预览版,具有原生音频理解功能和新的文件API,可轻松处理文件。
    • 推出了系统指令和JSON模式等新功能,提供更好地控制模型输出的能力。
    • 将发布优于同类模型的下一代文本嵌入模型。
  3. 使用音频和视频模式解锁新用例
    • 在Gemini API和Google AI Studio中加入音频理解功能,Gemini 1.5 Pro可以对上传到Google AI Studio中的视频进行图像和音频推理。
  4. Gemini API 改进
    • 推出了系统指令,可以指导模型的响应,在Google AI Studio和Gemini API中使用。
    • 推出了JSON模式,指示模型输出JSON对象,支持从文本或图像中提取结构化数据。
    • 改进了函数调用,可以选择模式来限制模型的输出,提高可靠性。
  5. 具有改进性能的新嵌入模型
    • 开发人员将能够通过Gemini API访问下一代文本嵌入模型,优于具有可比维度的现有模型。
  6. Gemini API 和 Google AI Studio 的未来改进
    • 未来Gemini API 和 Google AI Studio 将会有更多的改进,使其成为使用Gemini进行构建的最简单方法。
    • 探索代码示例和快速入门,在新的Gemini API Cookbook中加入社区频道。

相关导航

暂无评论

暂无评论...