OpenAI 宣布推出其全新产品 OpenAI o1,也就是此前广受期待的代号为“草莓(Strawberry)”生成式 AI 模型。
“o1 在回答问题之前会先思考--它可以在回复用户之前产生很长的内部思考链。”
准确地来说,o1 实际上一系列用于解决难题的全新推理模型,经过强化学习训练可以执行复杂的推理,擅长准确生成和调试复杂代码。目前发布的是 OpenAI o1-preview 版本以及 OpenAI o1-mini。OpenAI o1-mini 是一种速度更快、成本更低的推理模型,作为一款较小的模型,o1-mini 比 o1-preview 便宜 80%。
OpenAI 表示,对于复杂推理任务而言,新模型代表着 AI 能力的崭新水平,因此值得将计数重置为1,并将该系列命名为 OpenAI o1,给它一个有别于“GPT-4”系列的全新名号。
测试结果表明,OpenAI o1 在竞争性编程问题(Codeforces)中排名第 89 位,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列(o1 正确解答了 83% 的题目,而 GPT-4o 仅解答了 13%。),并在物理、生物和化学问题 (GPQA) 基准测试中超越人类博士级准确度。
ChatGPT Plus 和 Team 用户即日起便可以访问 o1-preview 和o1-mini,每周发送消息次数限制为 o1-preview 30 条消息和 o1-mini 50 条消息。而 ChatGPT Enterprise 和 Edu 用户将在下周初获得访问权限。
OpenAI 表示,它计划面向所有的 ChatGPT 免费用户提供 o1-mini 访问权限,但尚未确定发布日期。
值得一提的是,与 o1 的前身 GPT-4o 不同,o1 尚无法浏览网页或分析文件。该模型确实具有图像分析功能,但在进一步测试前已被禁用。
价格方面 o1 也相当昂贵。通过 API 使用 o1-preview,输入每百万 token 要收费 15 美元,输出每百万收费 60 美元。相比之下,GPT-4o 的百万 token 输入收费只有 5 美元,输出为 15 美元。
评论删除后,数据将无法恢复
OpenAI 发布全新的 o1 系列模型
OpenAI 宣布推出其全新产品 OpenAI o1,也就是此前广受期待的代号为“草莓(Strawberry)”生成式 AI 模型。
“o1 在回答问题之前会先思考--它可以在回复用户之前产生很长的内部思考链。”
准确地来说,o1 实际上一系列用于解决难题的全新推理模型,经过强化学习训练可以执行复杂的推理,擅长准确生成和调试复杂代码。目前发布的是 OpenAI o1-preview 版本以及 OpenAI o1-mini。OpenAI o1-mini 是一种速度更快、成本更低的推理模型,作为一款较小的模型,o1-mini 比 o1-preview 便宜 80%。
OpenAI 表示,对于复杂推理任务而言,新模型代表着 AI 能力的崭新水平,因此值得将计数重置为1,并将该系列命名为 OpenAI o1,给它一个有别于“GPT-4”系列的全新名号。
测试结果表明,OpenAI o1 在竞争性编程问题(Codeforces)中排名第 89 位,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列(o1 正确解答了 83% 的题目,而 GPT-4o 仅解答了 13%。),并在物理、生物和化学问题 (GPQA) 基准测试中超越人类博士级准确度。
ChatGPT Plus 和 Team 用户即日起便可以访问 o1-preview 和o1-mini,每周发送消息次数限制为 o1-preview 30 条消息和 o1-mini 50 条消息。而 ChatGPT Enterprise 和 Edu 用户将在下周初获得访问权限。
OpenAI 表示,它计划面向所有的 ChatGPT 免费用户提供 o1-mini 访问权限,但尚未确定发布日期。
值得一提的是,与 o1 的前身 GPT-4o 不同,o1 尚无法浏览网页或分析文件。该模型确实具有图像分析功能,但在进一步测试前已被禁用。
价格方面 o1 也相当昂贵。通过 API 使用 o1-preview,输入每百万 token 要收费 15 美元,输出每百万收费 60 美元。相比之下,GPT-4o 的百万 token 输入收费只有 5 美元,输出为 15 美元。