开源日报 | 李彦宏内部讲话曝光;阿里25周年马云内部发声;今天的App必须要把自己AI化;软件有半衰期;开源大模型编程框架ell

来源: OSCHINA
编辑:
2024-09-11 19:02:00

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.9.11

今日要闻

Canonical 正在将 GraalVM 打包成 deb 格式引入 Ubuntu

Linux 发行版 Ubuntu 基础设施团队工程师最近在论坛中透露,他们正在为 GraalVM 制作 deb 软件包(不是 Ubuntu 优先支持的 snap)。

GraalVM 是一个高性能的 JDK 发行版。它旨在加速用 Java 和其他 JVM 语言编写的应用程序的执行,同时还为 JavaScript、Python、基于 LLVM 的语言(如 C 和 C++)以及许多其他流行编程语言提供运行时。

此外,GraalVM 为编程语言之间提供了高效互操作性,并将 Java 应用程序提前编译为本机可执行文件,从而加快启动时间并降低内存开销。

Oracle 提供了 GraalVM 的通用 Linux x86_64 和 ARM64 二进制包。但到目前为止,GraalVM 并未出现在 Debian/Ubuntu 的软件包仓库中,而 Debian 上的 GraalVM 软件包只有 GitHub 中的几个非官方包。

Reflection 70B AI 模型被曝第三方基准测试效果不佳

据 venturebeat 报道,上周推出的号称可与顶级商业大模型一较高下的开源大模型Reflection 70B今日被曝在第三方测试中表现不佳。

上周末独立的第三方评估人员和开源人工智能社区成员在 Reddit 和 Hacker News 上发帖,开始质疑该模型的性能,并表示无法自行复制。有些人甚至发现了一些回复和数据,表明该模型与 Anthropic 的 Claude 3.5 Sonnet 模型有关,也许只是一个薄薄的 “包装”。

在独立的人工智能评估机构Artificial Analysis在X上发布其对Reflection 70B的测试结果比HyperWrite最初声称的得分低得多之后,批评的声音越来越多。

Reflection 公司联合创始人兼首席执行官 Matt Shumer对此表示道歉,并表示这些差异归咎于模型上传到 Hugging Face 的过程中出现的问题,并承诺在上周修正模型权重,但至今仍未做到。

阿里25周年马云内部发声

这段话还是有水平的:“没有支付,我们创建支付;没有物流,我们参与物流;没有互联网支撑技术,我们投入云;信用不值钱,我们让信用变得无价。。。我们相信技术可以也必须帮助每一个普通人,让每一个普通的老百姓因为技术也获得尊严。”

李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型之间的差距会变大

“外界对大模型有相当多的误解,” 近日据媒体报道,李彦宏的一则内部讲话曝光。 在最近一次和员工交流中,李彦宏谈及三个大模型认知误区,涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。 李彦宏谈到,未来大模型之间的差距可能会越来越大。他表示,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。


今日观察

社交观察

今天的 App 把自己 AI 化,是他们必须要做的事情

现有 app 生态,的确开放程度非常低。但是用户用自然语言控制硬件的需求是明确的,天然的,合理合法的。

任何阻挠这种进程的公司,再强大,也必将崩塌。甲骨文强大吗?今天 PostgreSQL 已经完全干掉了 oracle。

今天的 app 把自己 ai 化,然后提供和其他人或者 app 交互的自然语言问答接口,是他们必须要做的事情。如果不做,那么基于 01 app 这种框架新开发的 app ,会干掉他们。

软件的迭代是很快的,消费者不是不喜欢新鲜玩意,商业战场也不是不会新陈迭代,这都是天道。

唯一的问题是,需要一个足够强大的驱动力。比如,我可以用自然语言控制我的手机和电脑了。

- 微博 李楠或kkk

前 OpenAI 科学家 william 开源了 ell 项目

ell是一个轻量级、功能性的 LM 编程库。ell 是因为使用 LangChainAI 这样的框架时的挫败感而构建的,遵循三个原则:

提示是程序,而不是字符串
提示是机器学习模型的参数
每个调用语言模型都值得其重量的信用
提示应该可读且科学

有了合适的工具,提示工程从一门黑暗的艺术变成了科学。

项目地址:github.com/MadcowD/ell

- 微博 蚁工厂

最近又流行讨论AI程序员

其实开发大部分时候,理解业务上下文,流程上下文,小微构架,找人,对需求,等等各种交互,写代码是叶子节点这部分,但是不是全部。
而且代码这种东西,其实是有时效性的,就是你要是不持续更新维护,它很快就腐化不满足新的需求或者bug没人修复,就是软件是有半衰期的。
 
不要说AI写代码了,就算你有两个不错的真人小组员给你写代码,你也还是有一堆事情要做,而且还常常做了好久没解决问题。
当然,潮流有时候就是范式的转移,潮流说代码会更多的由AI来写,那就真是这样,只是你要颠覆传统程序员的价值,那就请用新的组织结构,新的组织结构才能用上新范式的生产力,目前还没有。

- 微博 幻灰龙

「SkyOS · 天枢」研发背后,还有哪些你不知道的故事?

蔚来为什么要研发整车全域操作系统?这个过程中克服了哪些困难?整车全域操作系统的研发成功,给蔚来、给行业带来了怎样的改变?今天我们用七个小故事,来告诉你「SkyOS · 天枢」背后的点点滴滴。
- 微博  蔚来

开源微信机器人底层框架:wcf.js

GitHub 上一款强大、快速、开源的微信机器人底层框架:wcf.js。

github.com/wechatferry/wechatferry

具有如下特点:

- 为消息监听、发送以及群聊操作提供一站式解决方案;
- 内置强大且易用的 Agent 库,涵盖大部分常用操作;
- 内置开发者工具包,包括数据库管理、机器人技能列表以及日志记录;
- 具备强大的处理能力,高效管理数据与任务,确保系统稳定可靠;
- 可自由控制发消息的频率,降低风险;
- 项目完全开源免费且可自由定制。

- 微博 GitHubDaily

媒体观察

深圳机器人企业数量全国居首

随着人工智能浪潮的爆发,人形机器人有望深入各细分消费端,成为AI下一个重要落地应用场景。公开数据显示,目前国内现存机器人相关企业74.17万家,广东省机器人企业数量高达14.15万家。从城市分布来看,深圳市共有5.11万家相关企业,数量稳居全国首位,产业链总产值超过1700亿元,实现了从关键核心技术攻关到应用场景拓展的全过程创新发展。

- 深圳特区报记者

阿里巴巴走过1/4世纪 马云最骄傲的是什么?

阿里25岁再出发,承载着各界对它的期待。媒体人秦朔在一篇写阿里的文章里有一段表述:“这一过程(阿里三年整改)带来的朴素启示是,即使在某个时点看起来再强大的公司,其命运也是螺旋式的,既有筚路蓝缕、无畏探索,也有高歌猛进、汹涌澎湃,还有调整变革、熵增熵减。一次次地出发、试错与重构,一次次地改变世界与被世界改变,这才是完整的故事。”

如今的阿里蜕去了少年的稚气,它对“取舍”的理解也更加自如和自信。当电商平台“卷低价”“仅退款”伤及中小商家权益时,阿里电商平台果断反对内卷,率先优化政策。

- 财经故事荟

碎片的RISC-V生态江湖,RDI指明方向

生态问题依然是盘旋在RISC-V头顶最大的乌云。从发展历程来看,RISC-V是从物联网起家。IoT嵌入式场景适合“单兵”突破,对于生态的需求低,软硬件切换的代价小。但是,由于IoT是低曝光度领域,尽管RISC-V架构芯片的出货量已经突破百亿颗,但普通消费者对其感知度不高,生态也难以复用。向前推进,手机、电脑、服务器等强生态场景对于生态的要求很高,软硬件切换的代价大,需要广泛协同生态链。这方面国内虽有企业在发力,持续朝着高性能方向走,出现了一些芯片,让基于RISC-V的高性能芯片成为可能,但是还不够,高势能尚未形成。

因此,RISC-V发展如何更进一步?解决碎片化问题,搭建属于自己的生态,仍然是一个老大难题。弱生态场景感知度低、强生态场景尚待突破,能否找到合适目前RISC-V发展的生态场景?基于此,奕斯伟提出了:RDI(RISC-V Digital Infrastructure,RISC-V数字基础设施)的产业概念。

- 半导体产业纵横

为什么这家公司的芯片推理速度比英伟达快20倍?

OpenAI 在 2024 年初发布的文生视频大模型 Sora 以其惊艳的演示效果震撼了科技界。然而,由于模型复杂度带来的巨大计算量,其推理成本难以压缩至可控范围,以致这一突破性技术迟迟无法公开上线。据悉,OpenAI 正在探索更先进的芯片设计方案,以降低推理成本、提升推理速度,已初步展示出潜力的存算一体技术,很可能成为其重点研究的方向。存算一体不仅有望大幅提升推理速度,还可能彻底改变 AI 系统的设计理念,使得更复杂、更强大的 AI 应用成为现实,成为撬动下一代 AI 革命的支点,为人工智能的未来发展开辟一条全新的道路。通过持续的技术创新和市场验证,存算一体有望成为推动 AI 应用更广泛落地的关键推手,为人类社会带来更智能、更高效的技术体验。

- 腾讯研究院

李彦宏戳破大模型“跑分”假象:榜单不代表所有实力,未来模型的差距会变大

 

李彦宏是闭源大模型的坚定支持者,"在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。" 他解释说,比如开源的Linux,因为已经有了电脑,所以使用Linux是免费的。但这些在大模型时代不成立,大模型推理是很贵的,开源模型也不会送算力,还得自己买设备,无法实现算力的高效利用。

"效率上开源模型是不行的。" 他表示," 闭源模型准确讲应该叫商业模型,是无数用户分摊研发成本、分摊推理用的机器资源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都达到了90%多。"

- 一财网


今日推荐

开源项目

ikun-svelte / ikun-ui

https://github.com/ikun-svelte/ikun-ui

ikun-ui 是基于 Svelte.js 的 UnoCSS UI 库,可用于制作网站。

特性

  • 组件化设计 - 提供整洁美观的 UI 组件
  • 预设 CSS - 有 UnoCSS 预设包可供使用,轻松渲染 UI
  • 主题配置 - 使用 unocss 等属性模式进行设计。支持主题配置,自定义主题。

开源之声

用户观点

NGINX 项目迁移到 GitHub

  • 观点 1:从一个404仓库搬到另一个404仓库
  • 观点 2:最伟大的开源软件之一
  • 观点 3:与时俱进

---END---

展开阅读全文
点击加入讨论🔥(1) 发布并加入讨论🔥
1 评论
1 收藏
分享
返回顶部
顶部