什么是OpenAI连续12天的“Shipmas”活动?
OpenAI 首席执行官 Sam Altman 分享了有关该活动的更多细节,该活动于太平洋时间 2024年12月5日上午 10 点开始,并将在 12 个工作日内每天举行,其中包括发布或演示,每个工作日,OpenAI都会有一场直播,展示新的产品或演示。
在哪里可以访问直播?
直播在 OpenAI 网站上举行,之后立即发布到其 YouTube 频道。为了方便访问,OpenAI 还将在直播开始前 10 分钟在其 X 帐户上发布直播链接,该时间约为太平洋时间上午 10 点/北京时间第二天的凌晨2点。
OpenAI 网站:https://openai.com/12-days/
第十二天,最后一天,12 月 19 日,星期五:
在 OpenAI 的最后一天,OpenAI 发布了其最新的模型 o3,包括 o3 和 o3 mini。
- 如之前报道的,跳过“o2”命名的原因是 Telefonica 的 O2 电信品牌存在,这可能导致混淆和版权问题。
- OpenAI 表示,该技术尚不向公众开放。
- O3 在各种基准测试中都优于 O1,包括数学和科学,这可以从它在 AIME 2024(竞赛数学基准测试)和 GPQA(包含生物学、物理和化学问题的博士水平科学基准测试)中的表现中看出。
- o3 在 ARC-AGI 基准测试上也取得了新的最高分,这意义重大,因为它表明该模型正在接近通用人工智能(AGI),尽管需要明确的是,它还没有达到。
- O3 Mini 是 O3 系列中的一款新型号,将支持三种推理选项:低、中和高。思考时间决定性能。在低级别上,它在 Codeforces Competition Code 基准测试中的性能与 o1-mini 相同,但在中高级别上,它的性能可以与 o1 相当,甚至更好。这一表现在其他评估中保持一致。
- 除了内部安全测试外,OpenAI 还首次向外部安全测试开放 o3 模型。安全研究人员可以通过在 OpenAI 网站上填写表格来抢先体验该模型,该网站将开放至 1 月 10 日。
- Sam Altman 在直播结束时分享说,o3 模型计划于 1 月底推出,之后将推出完整的 o3 模型。
- 据 OpenAI 称,该公司还引入了 Delibative Alignment,“一种训练范式,直接向推理 LLM 传授人类编写和可解释的安全规范的文本,并训练它们在回答之前明确推理这些规范”。
第十一天,12 月 19 日,星期四:
在“OpenAI 12 天”的倒数第二天,openai公司专注于发布有关其 MacOS 桌面应用程序及其与其他应用程序的互操作性的版本。
用户现在可以在 MacOS 上使用桌面应用程序来查看和自动化 ChatGPT 的工作。2025 年将有更多此类版本的发布,但在此之前,OpenAI 一直在引入以下三个功能。
使用“Work with Apps”按钮,用户现在可以使用更多的编码应用程序。该列表包括:BBEdit、MatLab、Nova、Script Editor、TextMate、Android Studio、AppCode、CLion、DataGrip、GoLand、IntelliJ IDEA、PHPStorm、PyCharm、RubyMine、RustRover、WebStorm、Prompt 和 Warp。
对于使用 ChatGPT 进行写作的用户,桌面应用程序现在支持 Apple Notes、Quip 和 Notion。
最后,适用于 MacOS 的桌面应用程序现在支持高级语音模式,同时与其他应用程序一起使用。
功能已经发布。您只需拥有 MacOS 应用程序的最新版本以及 Plus、Pro、Team、Enterprise 和 Edu 订阅即可。
为了缓解隐私问题,OpenAI 表示, ChatGPT 只有在手动提示时才能与应用程序一起使用。当该功能处于活动状态时,用户知道将附加到邮件中的内容。
第 12 天,我们有一些超级特别的事情,所以不要错过,OpenAI 在预告其即将到来的周五发布。
第十天,12 月 18 日,星期三:
美国的手机用户可以通过直接拨打一个免费号码,联系名为1-800-ChatGPT的聊天机器人,每月免费通话时间长达15分钟,其他地区用户可通过WhatsApp短信和这个机器人对话。
通过拨打 1-800-ChatGPT,您现在可以通过免费电话访问聊天机器人。OpenAI 鼓励用户将 ChatGPT 保存在他们的联系人中以便于访问。
用户可以拨打美国的任何地方;在其他国家/地区,用户可以在 WhatsApp 上向 ChatGPT 发送消息。用户每月可获得 15 分钟的免费 ChatGPT 通话。
在 WhatsApp 中,用户可以通过文本输入提示,就像他们与联系人中的任何其他人一样。在这种体验中,它只是一条短信。
电话呼叫功能适用于任何电话,从智能手机到翻盖电话 – 甚至是转盘电话。
主持人表示,这是为了让更多用户更容易使用 ChatGPT。
第九天,12 月 17 日,星期二:
OpenAI o1 推理模型 API 满血开放,成本暴降60%,定制升级:
o1 模型最终在 API 中不再预览,支持函数调用、结构化输出、开发人员消息、视觉功能和更低的延迟。
API 中的 o1 还具有一个新参数:“推理工作量”。该参数允许开发人员告诉模型在制定答案时投入了多少精力,这有助于提高成本效率。
OpenAI 还引入了对 Realtime API 的 WebRTC 支持,这使得开发人员可以更轻松地“跨平台构建和扩展实时语音产品”。
Realtime API 还获得了 60% 的音频令牌价格下降、对 GPT-4o mini 的支持以及对响应的更多控制。
OpenAI 表示,微调 API 现在支持偏好微调,允许用户“通过强化偏好响应并降低不偏好响应的可能性来优化模型,以支持期望的行为”。
OpenAI 还推出了新的 Go 和 Java SDK 测试版。
直播结束后,将在 OpenAI GitHub 平台上与主讲者一起举行“AMA”(问我任何事情)会议,持续一个小时。
第八天,12 月16日,星期一:
ChatGPT Search全面升级,免费开放,与Her打通了!
从今天开始,AI 搜索引擎可供所有用户使用,包括所有可以在可以访问 ChatGPT 的地方登录的免费用户。该功能以前仅适用于 ChatGPT Plus 用户。
允许用户从 ChatGPT 浏览网页的搜索体验在移动设备上变得更快、更好,现在具有丰富的地图体验。升级包括图像丰富的视觉效果。
搜索已集成到 Advance Voice 模式中,这意味着您现在可以在与 ChatGPT 交谈时进行搜索。要激活此功能,只需以与常规相同的方式激活 Advance Voice,然后口头询问它。然后,它将通过从 Web 中提取来口头回答您的查询。
第七天,12月13日,星期五:
“OpenAI 12 天”活动进入第 7 天,OpenAI 公司为 ChatGPT 带来了 Projects 功能,支持用户上传文件、设置自定义指令、分组聊天和数据等,让其更容易根据需求定制 ChatGPT。
Projects 功能整合支持 Canvas 以及 ChatGPT Search 网络连接,助力 ChatGPT 向“万能应用”目标迈进。OpenAI 首席产品官 Kevin Weil 和团队成员 Drew Schuster、Thomas Dimson 演示了 Projects 功能的实用性。
用户可以为每个 Projects 提供特定指令,覆盖全局指令,实现更精细的控制。在单个聊天中,AI 可以提取 Projects 内存储的数据,并进行调整或创建新表格。
从今天开始,它将向 Plus、Pro 和 Teams 用户推出。 OpenAI 表示将尽快向免费用户开放。企业和教育用户将在明年初看到它的推出。
第六天,12月12日,星期四:
“OpenAI 12 天”活动已进入第六天,OpenAI 公司宣布为 ChatGPT 的高级语音模式带来视频输入和屏幕共享功能,并为迎接圣诞节,限时推出全新的圣诞老人模式。
- 高级语音模式现在具有屏幕共享和视觉功能,这意味着它可以帮助了解正在查看的内容,无论是来自手机摄像头还是屏幕上的内容。
- 这些功能建立在高级语音已经做得很好的基础上——像人类一样进行随意的对话。自然的对话可以被打断、可以多轮转、可以理解非线性的思路。
- 在演示中,用户从 ChatGPT 的高级语音中获取有关如何冲泡咖啡的指导。当演示者完成这些步骤时,ChatGPT 会口头提供见解和指导。
- 圣诞节还有另一个好处:用户可以使用新的圣诞老人声音。要激活它,用户所要做的就是单击雪花图标。 Santa 今天将在所有用户可以访问 ChatGPT 语音模式的地方推出。第一次与圣诞老人交谈时,即使您已经达到限制,您的使用限制也会重置,因此您可以与他交谈。
- 从今天开始到下周,视频和屏幕共享将在最新的移动应用程序中向所有 Team 用户以及大多数 Pro 和 Plus 订阅者推出。欧洲的 Pro 和 Plus 用户将“尽快”获得访问权限,Enterprise 和 Edu 用户将在明年初获得访问权限。
第五天,12月11日,星期三:
Apple Intelligence的升级与ChatGPT的集成
Apple 今天发布了 iOS 18.2。该版本包括跨 Siri、写作工具和视觉智能与 ChatGPT 的集成。因此,今天的直播侧重于介绍集成。
- Siri 现在可以识别您提出超出其范围的问题,而这些问题可能会从 ChatGPT 的回答中受益。在这些情况下,它会询问您是否要使用 ChatGPT 处理查询。在向 ChatGPT 发送任何请求之前,将始终出现通知用户并请求许可的消息,尽可能将控制权交到用户手中。
- 视觉智能是指 iPhone 16 系列的一项新功能,用户可以通过点击相机控制按钮来访问。摄像头打开后,用户可以将其对准某物并使用 Google 搜索网络,或使用 ChatGPT 详细了解他们正在查看的内容或执行其他任务,例如翻译或总结文本。
- Writing Tools 现在具有一个新的“Compose”工具,允许用户利用 ChatGPT 从头开始创建文本。借助该功能,用户甚至可以使用 DALL-E 生成图像。
以上所有功能都受 ChatGPT 的每日使用限制的约束,就像用户在 ChatGPT 上使用免费版本的模型时达到限制一样。用户可以在“设置”中选择是否启用 ChatGPT 集成。
第四天,12 月 10 日,星期二:
Canvas全量开放,在 Web 版上,不论免费用户还是付费用户都可以直接尝试使用 Canvas 的能力。
一是 Canvas 全面开放,已被直接整合进 ChatGPT 主要功能中; 二是Canvas 还能够直接在 Canvas 中运行 Python 代码,允许 ChatGPT 执行修复错误等编码任务。 三是 Canvas 现在可被 Customgpt 调用。
第三天,12 月 9 日,星期一:
OpenAI发布期待已久的AI视频生成模型Sora
这种视频模型被称为 Sora Turbo,比预览的 2 月模型更智能、更便宜。
Access(访问) 将于今天晚些时候在美国推出;用户只需要 ChatGPT Plus 和 Pro。
Sora 可以生成视频到视频、文本到视频等。
ChatGPT Plus 用户每月最多可以生成 50 个 480p 分辨率的视频或更少的 720p 视频。Pro 提供 10 倍以上的使用量。
新模型比预览的 2 月模型更智能、更便宜。
Sora 设有一个探索页面,用户可以在其中查看彼此的创作。用户可以单击任何视频以查看它是如何创建的。
现场演示展示了正在使用的模型。演示者输入了提示并选择了纵横比、持续时间甚至预设。我发现现场演示视频的结果非常逼真且令人惊叹。
OpenAI 还推出了 Storyboard,该工具允许用户为序列中的每一帧生成输入。
第二天,12 月 6 日,星期五:
强化微调功能效果显著:
微调后的 o1-mini 模型得分提高 80%,反超 o1 正式版。
可使用几十到几千个高质量数据,模型能通过强化学习探索和学习推理复杂任务。
功能演示及步骤介绍:
OpenAI 员工与伯克利实验室计算生物学家共同演示了强化微调功能全过程,以生物医学任务为例,AI 需根据病例症状找相关基因,训练数据包含病人信息、症状及要求。
评分模型会对模型答案评分,OpenAI 提供不同评分模型并支持自定义。
强化微调步骤包括在网页界面选择训练集和验证集,配置超参数,微调过程中可观察模型性能指标变化趋势,测试完成后可查看模型对每条验证数据的输出。
测试情况与未来计划:
OpenAI 内部测试中,强化微调在生物化学、安全、法律和医疗保健领域取得成功。
2025 年初将作为产品发布,企业、大学和研究院可申请测试通道
参考链接:
[1]申请表格:https://openai.com/form/rft-research-program/
[2]直播链接:https://www.youtube.com/live/fMJMhBFa_Gc
[3]参考链接:https://mp.weixin.qq.com/s/ulQ1ep1kEOGLqpDarNxo0A
第一天,12 月 5 日,星期四:
OpenAI 发布了 “满血版” 推理模型 o1 和 ChatGPT Pro。
o1的完整版:
- 除了数学和科学之外,对于各种提示都会更好
- 与 o1-preview 相比,犯重大错误的频率减少约 34%,同时思考速度加快 50%
- 今天推出,为所有ChatGPT Plus和现在的 Pro 用户取代 o1-preview
- 允许用户输入图像(如演示中所示)以提供多模式推理(对文本和图像进行推理)
ChatGPT Pro:
- 面向 ChatGPT Pro用户,让他们无限制地访问 OpenAI 所提供的最佳功能,包括无限制地访问 OpenAI o1-mini、GPT-4o 和高级语音
- 具有 o1 pro 模式,这是 o1 的一个版本,它使用更多的计算来更努力地思考,并为最困难的问题提供更好的答案
- 每月费用 200 美元(约合人民币 1455 元)
参考链接:
OpenAI o1 and o1 pro mode in ChatGPT — 12 Days of OpenAI: Day 1
https://www.youtube.com/watch?v=iBfQTnA2n2s&list=PLOXw6I10VTv9lin5AzsHAHCTrC7BdVdEM