来源: 投稿

2024-09-10 17:33:00

文章来源｜ByConity 开源社区

项目地址｜https://github.com/ByConity/ByConity

2024年8月，ByConity 1.0 正式发布，翻开了 ByConity 新的一页。1.0 版本有哪些不同，以及 1.x 版本会重点迭代哪些能力，下面为大家一一解读。

完整的数据仓库能力

从 ByConity 开源之初，我们一直将产品定位为开源云原生数据仓库。区别于传统 OLAP 产品，ByConity 采用存算分离的云原生架构，通过这种架构获得了弹性和降低资源浪费的优势，但与此同时也在一定程度上提高了产品的复杂度。定位为云原生数据仓库，是希望能够承担更多类型、更复杂的分析任务负载，无论是在线的实时分析还是离线数据的清洗/加工任务都能够胜任。更全面的能力能够帮助用户降低数据分析平台的整体复杂度。

传统的 OLAP 产品通过数据索引、列式存储、向量化执行等技术，注重对实时分析或者 Ad-hoc 分析的快速反应，满足低时延的要求。在数据加载进 OLAP 产品之前，往往需要经过复杂的数据清洗和转换过程，也就是大家熟知的 ETL 任务。在传统的数据分析架构中，这部分工作是由 Hive、Spark、Flink 等产品来完成的。

在 ByConity 1.x版本中，增加了对 BSP 模式的支持，减少数据加工和数据分析之间多系统耦合带来的运维负担，使ByConity 能够一站式完成数据接入、加工和分析。

1.0 版本中，在 BSP 模式下（settings bsp_mode = 1 打开 bsp 模式）增加了对 TableScan 算子并行度扩展的支持：一、通过设置 distributed_max_parallel_size，可以将 TableScan 的并行度进行扩展，实现资源平铺的功能，在资源有限的情况下实现对大表的处理；二、增加了对 task 重试的支持：通过设置 bsp_max_retry_num（task的最大重试次数，默认值为5），可以在作业的中间 task 发生失败时，从失败的 task 开始重试，而不是从头开始重试，进而大大减少 failover 对执行时长的影响。

后续的 1.x 版本中，我们还将推出基于资源感知的 BSP 模式，可以根据集群资源使用情况有序调度并发 ELT 任务，从而减少资源的挤占，避免频繁失败。

湖仓一体

在 ByConity 1.0 版本中的一个重要能力升级就是提升了湖仓一体的能力。ByConity 可以直接分析数据湖中的数据，而无需做数据搬迁，从而让用户可以更灵活的规划其数据分析架构。

Hive 外表查询性能在 1.0 版本中得到了非常大的提升。这主要得益于以下几点：

1、实现了外表的 Native Reader（Parquet/Orc），Native Reader 具有以下特点：

2、增加中间结果缓存。

3、结合 ByConity 查询优化器的统计信息自动收集，将 Filter 的有效下推，降低 IO 开销（1.x 版本）。

通过以上能力大大提升了 Hive 外表的查询性能，在 TPC-DS 测试中性能达到 Trino 的4倍。

除 Hive 外表外，在 1.0 版本中我们还支持了 Hudi 和 GLUE 的外表查询能力。在后续的 1.x 版本中，我们还将支持 Iceberg 和 Paimon 的外表能力。

MySQL 语义兼容

在 ByConity 0.x 版本中，主要支持 SQL 标准是 ClickHouse SQL 和 Ansi SQL。除 ClickHouse 生态外，MySQL 同样是当前主流的 OLAP 产品生态。过去一年中很多用户反馈从 MySQL 生态产品迁移到 ByConity 过程中有比较复杂的业务改写，以及部分工具不兼容。

在 1.0 版本中，ByConity 已经完成了 90% 以上的语法、函数、数据类型、DQL、DML、DDL 的兼容。此外，如MySQL Workbench、DBeaver、Navicat 等 IDE 工具，Tableau、QuickBI、FineBI 等主流 BI 工具的兼容性也在当前版本中完成。

在 1.x 版本中，我们希望和社区的贡献者们一起，在存储介质、数据导入、IDE、BI、数据治理工具等方面全面提升 ByConity 广泛的生态工具兼容性。

其他特性

1、默认开启优化器，支持开优化器简单查询走 local 模式，优化了开启优化器后简单查询性能下降的问题。

2、优化 Unique 表的 TableWrite 重试能力，提升 Unique 表可用性。

3、新增 bucket join 相关的能力。

4、提升 map 函数性能。

5、优化 disk cache 加载策略，支持按比例配置。

6、string 数据类型转化为 map，支持 nullable string。

7、支持导出数据导文件目录，支持 Worker 导出数据。

8、支持表级别的快照能力。

9、（Preview）增强高并发点查性能。

展望

未来，我们还将持续为提升分析性能和打造全面的数仓能力而努力。除此之外，我们还将向一体化分析引擎的方向进行探索，继续打磨倒排索引的能力，以及向向量检索和时空分析等场景进行探索。

ByConity 1.0 完整 Changelog：

https://github.com/ByConity/ByConity/releases/tag/1.0.0

关于 ByConity

ByConity 是字节跳动开源的云原生数据仓库，在满足数仓用户对资源弹性扩缩容，读写分离，资源隔离，数据强一致性等多种需求的同时，提供优异的查询，写入性能。

GitHub ｜https://github.com/ByConity/ByConity

添加小助手加入 ByConity 社区交流群

Azeroth008 2024-07-09 10:43

有自研操作系统挺好的啊，那些乱喷的人是什么心态？

开源博客 2024-09-14 22:13

Virtualbox新管网使用vw布局单位，高分屏上使用浏览器的缩放没效果，字体仍老大==

fasiondog 2024-09-14 17:26

👍

烈冰 2024-07-22 08:41

不如说国内90%的电脑都没安装CrowdStrike软件

fzn0268 2024-09-04 14:26

这是那个做代码生成器的老哥起的吧

Yanlongli 2024-07-11 17:28

降低了视觉复杂性，增高了操作复杂性。

kushu001 2024-08-14 15:24

为什么一定要强调“国产”？是开源的项目么？如果开源，是不是不接受国外开发者的贡献？我只是好奇，不带“国产”，是宣传不了了么😀

智布道 2024-08-13 12:02

不管是谁在打平安县城，我三五八团一定帮帮场子！

叨

叨叨颠颠 2024-09-14 16:17

代码这东西就和女人穿不同衣服一样，包装不同，就可以换个人样儿，其实里面还是。字符串替换--变量名改改、方法名改改、文件名改改，方法return的改为void，值参改形参，一个类改几个拼接，一个结构体改几个组合，一个方法改几代继承。哪个敢说这是抄，百分之百纯自研，原生态。

liming0101 2024-09-10 09:09

什么纳吉东西，还碰瓷黑神话

优秀良民 2024-07-10 16:17

明明能躺平，明明可以割韭菜，还花钱研发？为了找骂？说这个能割韭菜？你被割了？你买了吗？是谁年年换mac，是谁年年换iphone？华为的用户好像没有那么干的吧？真让我一个小米用户都看不下去了！

天

天1天1天 2024-09-14 16:56

文章写的也没错，至于是不是steam的功劳，也无所谓，反正能玩了。

279778325 2024-08-16 16:22

好不容易有个国产开发平台，没有鼓励只有贬低，就算宣传夸大怎么了？那么较真干什么？遍地都是夸大的广告宣传怎么不一个一个去找厂家？批判的同时想想自己能搞一个吗？为什么加上国产俩字就非要这么较真？

平波 2024-07-07 16:54

吃完就砸锅，好像那个啥纯血，吃完了，就想把小米，oppo、vivo的锅咂了；😂

kakai 2024-09-07 10:39

微信咋得罪你了？不管怎么样，微信此举哪怕从自身商业利益出发，让苹果降低中国税率这是利于中国人的，这个税率可不仅仅是针对微信的，还苹果大功一件，这是多么愚蠢、可耻的言论！

yh2216 2024-09-14 10:24

wps确实做的很棒，比微软的office好用，比libreoffice好用很多。wps加油，鸿蒙做的不错，继续加油，支持生态建设。

平波 2024-09-14 15:46

你真是行家里手啊，😂；这个本质是数学建模，就像初中数学中的板据两点确定一条直线，然后可以根据任意x,预测y值啊，其实就这么简单啊

zb79463626 2024-09-15 12:07

纯血鸿蒙不再是用android改的了，DevEco什么时候也纯血脱离Eclipse啊？😄

封神梦 2024-09-14 17:53

反正wps就是各种vip广告，挺恶心人的

平波 2024-09-14 15:57

我倒是觉得好用，像真人就行；我可不希望它是真正的智慧生物；深度这些东东，本质就是曲面建模和贝叶斯/马尔科夫链这种概率建模；只要知识量够大，算力够强，机器就越像人；它有没有意识，并不重要；因为人的意思，估计也是伪命题；

HalLi 2024-09-09 01:10

普通用户不懂就算了，怎么连程序员都不懂？苹果是全平台30%，国产是渠道服50%。微信、抖音这种大app哪来的渠道服，除了游戏，哪个app带渠道服。

osc_566335 2024-08-01 15:05

“虽然两人只有大专学历”—— 大专也算高等教育，现在这些媒体口中已经文盲一个级别的感觉了吗？

加百列Gabriel 2024-09-14 13:50

各位不要急着更新, 更新完之后linux虚拟机不支持3D加速了

开源中国首席路人王 2024-09-15 15:47

ipv6 tomcat需要改什么支持吗

Binx 2024-09-07 08:28

最好提高苹果税到80%，不然怎么彰显尊贵的苹果用户身份

Francesca 2024-09-15 17:30

会不会是你用的版本比较老，新版本应该没问题

Ask_x_Seek 2024-09-14 15:19

支持

Kevin586 2024-07-29 17:09

真降低成本还是得换go，java太吃内存了

infoworld 2024-09-11 18:00

感谢，正是有你们这些先驱做的实事，才能避免被国外的系统和应用垄断。

Artrener 2024-07-21 15:12

可以看他不爽，看360不爽，但人家说的是事实。比如说航空业的业内人士也这么说的。

blue_think 2024-08-26 11:00

别光喷华为啊，说点你自己的能力，到了什么程度，有什么成就，这样好歹有点说服力吧

无尽的拉格朗日 2024-09-14 12:56

底层代码大部分估计都能共用反正都是c/c++，上层界面层重写吧

我有我可以 2024-07-09 11:40

喷子们之所以喷，其本质是为自己的阴暗和自卑找理由罢了。

高排量低炭烧 2024-09-14 23:34

牛逼🤬

CloudShi83 2024-07-06 17:13

感谢祖师爷赏饭吃，给你磕一个

zb79463626 2024-08-26 15:51

IBM中国哪有什么研发? 全部都是测试！所谓的搞研发的都是去养老混日子的！

阳光满地 2024-09-15 00:25

加个证书那么简单的事，为什么还要等下一步再优化呢？

大后锋 2024-07-10 14:03

然后交警找责任方，打过去是牛逼高大上的生成式AI的客服

yh2216 2024-09-14 10:26

猜测：c++部分应该是切换了鸿蒙的系统api，UI则仅仅是使用鸿蒙的UI框架而已。

fastfail 2024-09-15 08:37

捞钱捞到手抽筋

来开源啊 2024-09-14 15:07

25× 23.1 √

简洛-默 2024-08-12 19:31

你是家里才通网吗? 龙芯早都弃用MIPS了，现在是自研的LoongArch。自己好好看看吧：https://loongarch.dev/zh-cn/posts/20210501-loongarch-manual/

songdragon 2024-08-14 13:11

这个对比的条件还存在好几个问题。 1. solon使用的是smart-http，spring使用的是undertow 2. solon启动本身的自动配置少于spring 这两点就决定了对比的维度不同，性能更好的原因大概率是web服务器、应用配置依赖导致的。如果要拉齐，需要使用同样的web服务器，spring应用排除掉所有的自动配置，只保留web必须的，才能说明框架的性能差距。现在这个结果，无法说明solon本身性能好。

Tobyee 2024-07-09 11:04

没GMS是借口，本质还是不想适配国内的手机系统，等鸿蒙Next出来，看微软拥抱不拥抱就知道了

Kevin586 2024-09-14 16:00

vagrant什么时候支持7.1我才更

深夜49 2024-09-14 14:36

免费版只能用30分钟，太坑了吧。

osc_566335 2024-08-05 10:48

os是媾粉聚集地还不了解吗？只要碰到国产、华子相关报道，必然评论区乌烟瘴气口伏声难止。还能期待啥有深度发言？大佬敢发这些，那还给搞前端什么都懂的“程序员”粪死？

我要探索宇宙 2024-09-16 14:43

3.5.2版本，队列redis能用集群模式的redis吗？

奶奶灰 2024-09-15 20:28

换kvm 了

呼呼南风 2024-09-14 11:18

幸好我把自己电脑换成win10了。

黑人牙膏 2024-07-21 12:12

真的人不要脸则无敌，只要他不尴尬，尴尬的是别人。

字节跳动开源 2024-09-14 16:05

可以的，可以看看发布的一些用户案例

longzz 2024-09-14 11:04

🤣65岁还在写代码吗？

浪_客 2024-09-15 12:54

继续用vm吧，ensp不让用新版vbox😂

dwingo 2024-07-18 10:12

不是不让用jni和unsafe啊, 只是做了"限制", 只要加命令行参数就能继续用, 目的是为了让使用者考量程序的安全性.

RustDesk 2024-09-16 11:20

惨淡

vb2005xu 2024-09-14 10:17

这数据有1%真吗

平波 2024-09-14 19:01

你了做过为为的项目啊；😂

osc_50722289 2024-09-06 13:51

如果苹果不让步，微信也不让步那就好看了！微信在中国深入寻常百姓家！支付社交微信根本离不开，如果微信不在IOS上更新，苹果“不用混了”

0day 2024-07-21 11:52

一个流氓也配谈安全？

完整的数仓能力，字节云原生开源数仓 ByConity 1.0 版本发布！

完整的数据仓库能力

湖仓一体

MySQL 语义兼容

其他特性

展望

热门内容

全站热门评论

热门资讯

精彩专栏

开发者进阶之深入理解 Linux 内核底层技术原理

程序员如何入门 AI 应用开发？

聊聊 Unity 与原生桥接

基于事件驱动的邀约自动化机制

Java虚拟线程探究与性能解析

浅析JVM invokedynamic指令和Java Lambda语法｜得物技术

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号

完整的数仓能力，字节云原生开源数仓 ByConity 1.0 版本发布！

完整的数据仓库能力

湖仓一体

MySQL 语义兼容

其他特性

展望

热门内容

全站热门评论

热门资讯

精彩专栏

开发者进阶之深入理解 Linux 内核底层技术原理

程序员如何入门 AI 应用开发？

聊聊 Unity 与原生桥接

基于事件驱动的邀约自动化机制

Java虚拟线程探究与性能解析

浅析JVM invokedynamic指令和Java Lambda语法｜得物技术

推荐关注

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号