开源日报 | OpenAI“草莓”发布;Docker修改订阅计划;中国最大MoE开源大模型;AI编程提高局部生产效率;中东土豪盯上了半导体

来源: OSCHINA
编辑:
2024-09-13 18:46:37

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.9.13

今日要闻

OpenAI 发布全新的 o1 系列模型

OpenAI 宣布推出其全新产品 OpenAI o1,也就是此前广受期待的代号为“草莓(Strawberry)”模型。按照官方技术博客说法,o1 在推理能力上代表了人工智能最强的水平。“o1 在回答问题之前会先思考,它可以在回复用户之前产生很长的内部思考链。”OpenAI CEO Sam Altman 表示:“OpenAI o1 是一个新范式的开始:可以进行通用复杂推理的 AI。”
 

Docker 修改其订阅计划

Docker 宣布正在重新制定其订阅计划,以便所有计划都可以使用更多功能和服务,并且还将更新定价以反映新增功能。

Docker 的计划包括 Docker Personal、Docker Pro、Docker Team 和 Docker Business,这些计划均经过重新制定,使客户能够通过单一订阅访问所需的一切,并明确规定消费限制,还能够根据需要添加更多内容。计划变更将于 11 月 15 日生效。

随着新变化而来的还有价格的变化。Docker Personal 仍然免费,Docker Business 的定价也保持不变。Docker Pro 的价格从 5 美元 / 月涨至 9 美元 / 月,Docker Team 的价格从 9 美元 / 用户 / 月涨至 15 美元 / 用户 / 月。

元象发布中国最大MoE开源大模型 落地应用登顶港台榜

元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,加速AI应用低成本部署,将国产开源提升至国际领先水平。

该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升,同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。

免费下载大模型

Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A36B
魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A36B
Github:https://github.com/xverse-ai/XVERSE-MoE-A36B


今日观察

社交观察

神神叨叨的OpenAI和神神叨叨的草莓

可以这么理解,o1的Reasoning不是靠reflect的,这是relection70B的方式,但在对一个靠知识驱动的模型让它来去reasoning复杂的问题,其实就是自己问自己,还不是长步骤的思考(虽然cot能帮上一些忙)。o1的resaoning的实现是数据集的方式,草莓RL吐出来的数据就是带多步逻辑的,拿这个做pretrain。

- 微博 Transformer-周

英伟达CEO黄仁勋接受高盛采访

英伟达CEO黄仁勋昨天在接受高盛采访时,深度阐述了大家关心的重要问题:AI市场的前景,英伟达的护城河,以及供应链安全等。投资者显然对他的回答比较买账,英伟达股价昨天至今上涨了将近10%。这个采访信息量很大,比美国总统选举辩论精彩多了。无论是否同意他的观点,都值得一读。

- 微博 硅谷陈源博士

AI编程能提高局部生产效率的一个确定性的例子

AI编程能提高局部生产效率的一个确定性的例子: 在所有需要打日志的地方,Copilot 都能在输入一两个log开头的代码后,自动补全猜测的规整的日志打印,包含必要的局部变量打印。人工写的时候,这点通常是费劲的,有经验的程序员会力求打印好必要的debug, info, warning, error日志。新手往往日志不全或者不规整,诊断问题的时候就缺必要的日志。不过AI插件应该做的更Agent一点,在git提交的时候,自动把所有该打日志的地方批量补全,这是可以做到的,也是比较安全的操作。

- 微博 幻灰龙

知识图谱介绍:事物,而非字符串

最近GraphRAG比较受关注,翻译一篇很早之前谷歌介绍知识图谱搜索的文章,理解下底层逻辑。
​​搜索在很大程度上与发现有关——这是人类学习和拓宽视野的基本需求。但搜索仍然需要用户付出很多努力。所以今天我真的很兴奋的推出知识图谱,它将帮助你快速轻松的发现新的信息。执行一个查询,比如:[taj mahal](泰姬陵),四十多年以来,搜索基本上是对查询关键词的匹配。对于搜索引擎来讲,[taj mahal]这个关键词只是两个词而已。

- 微博  庆丰

一个独特的数据集:提示词数据集

这个数据集是从四个平台(Reddit、Discord、网站和开源数据集)中收集的15140个提示词,时间范围为2022年12月至2023年12月。其中,包括1,405个Jailbreak提示词(有统计规模最大)。
类比起来,提示词数据集就相当于之前的代码库吧。 https://github.com/verazuo/jailbreak_llms

- 微博 高飞

媒体观察

创新承压、洗牌持续,摩尔线程要做“国产英伟达”?

换言之,摩尔线程已建立从芯片、板卡、服务器、集群到软件的全栈AI智算产品线,市场认为摩尔线程是国内仅有能从功能上对标英伟达的国产GPU芯片厂商。但持续补齐软件生态、AI大模型技术迭代速度快带来的技术持续创新压力,以及国内GPU市场正进入洗牌阶段,让摩尔线程真正成为英伟达仍需持续发力。

- DoNews

大模型“鬼故事”缠上的不止百度

过去半年,市场对AI大模型的关注焦点从模型技术本身转向了智能应用的实际落地,AI预期也开始回调。因此,在基础大模型的投入与AI应用落地之间做出取舍,实际上已成为所有大模型玩家不可回避的共同难题。

- 市象

旋智即将推出多核心处理器!助力实现高性能电机控制产品

随着产业装备更新、汽车电子、新型空调热泵、工业控制等新兴应用需求的发展,电机控制芯片市场正经历快速增长,特别是对高能效、高性能电机控制处理器的需求急速上升。其中,国产替代空间巨大,亟待提升渗透率。

网易新闻

中东土豪盯上了半导体

芯片已成为现代社会不可或缺的关键资源之一。中东对半导体的进军,已然拉开帷幕,未来会如何演绎还不得而知。在推进先进人工智能的过程中,中东地区还面临如何在沙漠中确保计算设施能够有效运行,以及大量水资源消耗的问题。

在中东的沙漠中,能否开出半导体的花,仍面临诸多挑战,前路漫漫。

- 芯东西

我们的《黑神话:悟空》,应该由自己的网络靶场来守护

2024年,《黑神话:悟空》在全球玩家的热切期盼中上线,然而首个周末,Steam平台却因大规模DDoS攻击而崩溃,上百万玩家无法登录。据悉,这次攻击涉及近60个僵尸网络,攻击指令在一夜之间激增了2万多倍,攻击发生后,《黑神话:悟空》的实时在线人数一度骤降至百万以下。这场恶意攻击不仅重创了游戏体验,还为全球网络平台敲响了警钟,揭示了网络攻击的无处不在。

- 数据猿

外滩大会专门发起倡议 “开源”为何如此重要?

随着AI技术的发展,提高其安全性成为一个亟待解决的紧迫课题,而开源则是可靠一招。在日前举行的外滩大会上,赛事组委会发起开源倡议——支持并鼓励优秀参与者开源比赛模型,降低技术门槛、加强技术交流,进而帮助更多人检测伪造内容,助力AI向善。

- 上观新闻


今日推荐

开源项目

o2sh/onefetch

https://github.com/o2sh/onefetch

Onefetch 是一款由 Rust 编写的命令行 Git 信息工具,它将直接在终端中展示本地 Git 仓库的项目详情和代码统计等内容。工具完全离线可用(不需要网络连接)。

每日一博

分布式因果推断在美团履约平台的探索与实践

美团履约平台技术部在因果推断领域持续的探索和实践中,自研了一系列分布式的工具。本文重点介绍了分布式因果树算法的实现,并系统地阐述如何设计实现一种分布式因果树算法,以及因果效应评估方面 qini_curve/qini_score 的不足与应对技巧。希望能为从事因果推断相关工作的同学们提供一些启发或帮助。

图1 美团履约因果推断工具包


开源之声

用户观点

“你的开源项目真不错,但跟我的闭源软件功能类似,所以希望你能闭源,好方便我割韭菜”

  • 观点 1:现在很多开源确实导致了企业对程序员的需求没有那么大,所以现在那么程序员被裁掉,而且企业之间都用开源相互恶性竞争,导致产品利润减少,而且质量不高。
    • 观点 2:你也是个奇葩
  • 观点 3:考虑过造张假钞再要求人行别发行人民币吗
  • 观点 4:我有点怀疑那个闭源软件是不是用了开源的代码
    • 观点 5:别怀疑,现在没有人能不依靠开源的力量从头造轮子
  • 观点 6:哈哈哈哈哈哈 这人这个发言多少带点脑缺
    • 观点 7:和大佬说话还班门弄斧的,问人家懂不懂网络攻防
  • 观点 8:分分钟已经找过linux要求闭源了
  • 观点 9:李胜传奇之重生之前干IT
  • 观点 10:凭本事吃饭,大佬开源的都是大佬玩剩下的,实在是可笑不自量
  • 观点 11:把kvm、openstack、k8s、c、c++、python、go、postgres…等等全部闭源,他做一个出来收费,真是吃饱了,然后把锅砸了的逻辑……格局太小了,一辈子吃不了几个菜
  • 观点 12:这像是说,成龙不懂演戏,张学友不懂唱歌,哈哈
    • 观点 13:尤雨溪不懂vue,jk罗琳不懂哈利波特
  • 观点 14:> 无需 CA 证书即可捕获 SSL/TLS 通讯明文 这个怎么做到的 ……
    • 观点 15:直接用ebpf把密钥截获
  • 观点 16:国内开源届现状大赏
  • 观点 17:太抽象了 以至于我以为今天是愚人节
  • 观点 18:希望那人可以和鸿蒙对一下线,我看看谁能让他的ass off
  • 观点 19:他的意思是:我抄完了,你可以闭源了!
  • 观点 20:难道他真的是天才
  • 观点 21:没有开源的话,写源码的人不断的在给自己打补丁,但是个人能力有限;对源码有需求的,不断在重复造轮子[破涕为笑]。没有开源精神,互联网能发展到现在???这都是写系统,写语言的大佬们带头奉献的结果
  • 观点 22:第一反应,不应该是合作吗?
  • 观点 23:不如sspl直接看源,闭源的都得逼着开给你
  • 观点 24:因为我无耻,所以我希望你跟我一样无耻。
  • 观点 25:没有闭源的商业思维还想做闭源产品

OpenAI“草莓”发布:全新o1系列模型、具备类似人类的推理能力、开启“推理时间扩展”范式时代

  • 观点 1:终于上道了,gpt感觉就是玩具,推理才是真正实用的东西
  • 观点 2:实际使用下来,我个人的使用场景,并没有看到o1的特别大的优势。反而Claude 3 Opus依然效果是最好的。
  • 观点 3:希望工程师同行们可以指教我的看法是否正确,因为这方面我的掌握还不够。我个人认为是不是他们在跨区域“适配数据”所谓的思考就是单纯的“数据内容匹配”!如果open ai说他可以独立思考那我个人认为,这种能力未来不好说但是现在并不存在!是不是又是个大忽悠,炒股票吹泡泡的套路。哈哈
    • 观点 4:AI本质就是信息压缩,那么你相信md5可逆吗,反正我不信它

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

 

展开阅读全文
点击引领话题📣 发布并加入讨论🔥
0 评论
0 收藏
分享
返回顶部
顶部