原创

08/21 09:50

阅读数 1.4K

DeepFlow 可观测性平台以 eBPF 技术实现的零侵扰（Zero Code）分布式追踪为核心，不仅实现了面向应用的全栈（Full Stack）观测能力，同时通过开放的数据集成接口和智能标签（SmartEncoding）技术支持汇聚外部的 Metrics、Tracing、Logging、Profiling 等各类的海量观测数据，消除运维数据孤岛，为 IT 系统的运行维护、安全监测、运营分析提供统一的可观测性数据综合解决方案。

在本篇实践案例中，将向您介绍如何在 DeepFlow 可观测性平台快速集成主机指标数据，补充、丰富可观测性数据湖的信号种类，在业务异常的诊断过程中，对应用指标监测、分析的同时，快速调阅主机指标数据，快速分析业务异常与主机指标的关联关系，增强 IT 系统监控、诊断的全面性和工作效率。

01｜DeepFlow 主机指标集成方案

整体架构

本次实践中，使用 DeepFlow Agent + Grafana Alloy 在 CentOS 环境中实现了主机指标数据的快速集成，要点包括：

Alloy 的 unix_exporter 模块采集主机指标数据；
Alloy 通过 Prometheus Remote Write 接口将采集的主机指标数据发送到 DeepFlow Agent；
DeepFlow Agent 接收到主机指标数据后，与各类观测数据统一回送到 DeepFlow Server；
DeepFlow Server 对各类观测数据打上统一的标签，并构建统一的数据观测能力。

主机指标数据集成部署架构

部署 DeepFlow Agent

安装指导链接[1]

部署并运行后，DeepFlow Agent 开始对云端 K8s 集群中的应用服务进行零侵扰的 eBPF 数据采集，支持获取的数据主要包括：

应用调用的 RED 指标（支持的应用协议详见链接[2]）
分布式调用链追踪数据
应用实例 CPU、Memory Profiling 数据
慢文件读写事件
网络流量的 L3 吞吐、L4 吞吐、TCP 性能、TCP 异常、TCP 时延等指标

同时 DeepFlow Agent 默认开启数据集成接口（默认端口号为 38086）用于其他 Metrics、Tracing、Logging、Profiling 等数据的接收，其中用于 Prometheus 指标数据 Remote Write 的接口 API 为：/api/v1/prometheus。

部署 Grafana Alloy

第 1 步：安装 Grafana Alloy

安装指导链接[3]

第 2 步：修改运行配置文件

cat << EOF > /etc/alloy/config.alloy
logging {
  level = "warn"
}

prometheus.exporter.unix "local_system" {
  include_exporter_metrics = true
  disable_collectors       = ["mdadm"]
}

prometheus.scrape "scrape_metrics" {
  targets         = prometheus.exporter.unix.local_system.targets
  forward_to      = [prometheus.relabel.filter_metrics.receiver]
  scrape_interval = "10s"
}

prometheus.relabel "filter_metrics" {
  rule {
    action        = "replace"
    replacement   = "IP_OF_HOST"
    target_label  = "instance"
  }
  forward_to = [prometheus.remote_write.deepflowagent.receiver]
}

prometheus.remote_write "deepflowagent" {
    endpoint {
        url = "http://127.0.0.1:38086/api/v1/prometheus"
    }
}
EOF
DEFAULT_INTERFACE=$(ip route | grep default | awk '{print $5}')
DEFAULT_IP=$(ip -4 addr show $DEFAULT_INTERFACE | grep -oP '(?<=inet\s)\d+(\.\d+){3}')
sed -i "s|IP_OF_HOST|$DEFAULT_IP|g" /etc/alloy/config.alloy

DeepFlow Server 收到 DeepFlow Agent 回送的 Metrics 数据后，会尝试根据数据中的 instance 标签值标记更多的 DeepFlow 原生的可观测性标签（比如 chost、vpc、az、cloud、region 等），因此在 Metrics 数据集成时，上述 "filter_metrics" 的 "relabel" 策略用于确保 instance 填入正确的主机 IP。否则，在 DeepFlow 平台中将产生数据孤岛，且只能通过 tag.instance、tag.agent_hostname、tag.*** 等原生 Prometheus 标签检索分析所集成的 Metrics 数据。

第 3 步：启动服务

sudo systemctl start alloy
sudo systemctl enable alloy

（可选步骤）检查服务状态

sudo systemctl status alloy -l

（可选步骤）检查运行日志

sudo journalctl -u alloy -e

02｜统一观测效果

主机指标列表监控

进入 DeepFlow 中的指标-主机功能入口，可以快速调阅所有主机的 CPU 使用率、MEM 使用率、系统负载，用于对 IT 系统全部主机状态的快速浏览。

主机列表监控

主机指标详情监控

进入 DeepFlow 中的视图功能入口，可以通过内置的「主机指标详情监控」视图观测更详细的主机指标。

详情监控视图主要包括 CPU、内存、负载、磁盘、文件 IO、网络、进程等相关的监测指标曲线。

主机指标详情监控

应用观测与主机指标观测的统一

在此基础之上，还可以将内置的「主机指标详情监控」添加到应用监控子视图的「右滑窗」中，当发现应用指标异常时，便可以在「右滑窗」中一键调阅主机指标详情，快速诊断主机性能与应用服务异常的关联关系。

应用监控子视图「右滑窗」定制「主机指标监控视图」的方法

应用监控子视图右滑窗定制

应用监控子视图「右滑窗」定制「主机指标监控视图」后的统一观测效果

统一观测使用效果

03｜什么是 DeepFlow

DeepFlow 是云杉网络开发的一款可观测性产品，旨在为复杂的云原生及 AI 应用提供深度可观测性。DeepFlow 基于 eBPF 实现了应用性能指标、分布式追踪、持续性能剖析等观测信号的零侵扰（Zero Code）采集，并结合智能标签（SmartEncoding）技术实现了所有观测信号的全栈（Full Stack）关联和高效存取。使用 DeepFlow，可以让云原生及 AI 应用自动具有深度可观测性，从而消除开发者不断插桩的沉重负担，并为 DevOps/SRE 团队提供从代码到基础设施的监控及诊断能力。

GitHub 地址：https://github.com/deepflowio/deepflow

访问 DeepFlow Demo[4]，体验零侵扰、全栈的可观测性。

参考资料

[1]DeepFlow Agent 安装指导链接:
https://www.deepflow.io/docs/zh/ee-install/saas/cloud-host/

[2]应用调用的 RED 指标支持应用协议:
https://www.deepflow.io/docs/zh/features/l7-protocols/overview/

[3]安装 Grafana Alloy 链接:
https://grafana.com/docs/alloy/latest/set-up/install/linux/

[4]DeepFlow Demo: https://deepflow.io/docs/zh/ce-install/overview/

欢迎报名参与8月24日·DeepFlow可观测性Meetup·广州站，本次活动聚焦可观测领域，来自 DeepFlow、Greptime、腾讯云等多位可观测领域行业专家将一起深入探讨可观测领域的创新技术解决方案。

osc_566335 2024-08-05 10:48

os是媾粉聚集地还不了解吗？只要碰到国产、华子相关报道，必然评论区乌烟瘴气口伏声难止。还能期待啥有深度发言？大佬敢发这些，那还给搞前端什么都懂的“程序员”粪死？

longzz 2024-09-14 11:04

🤣65岁还在写代码吗？

深夜49 2024-09-14 14:36

免费版只能用30分钟，太坑了吧。

加百列Gabriel 2024-09-14 13:50

各位不要急着更新, 更新完之后linux虚拟机不支持3D加速了

HalLi 2024-09-09 01:10

普通用户不懂就算了，怎么连程序员都不懂？苹果是全平台30%，国产是渠道服50%。微信、抖音这种大app哪来的渠道服，除了游戏，哪个app带渠道服。

yh2216 2024-09-14 10:24

wps确实做的很棒，比微软的office好用，比libreoffice好用很多。wps加油，鸿蒙做的不错，继续加油，支持生态建设。

zb79463626 2024-08-26 15:51

IBM中国哪有什么研发? 全部都是测试！所谓的搞研发的都是去养老混日子的！

呼呼南风 2024-09-14 11:18

幸好我把自己电脑换成win10了。

智布道 2024-08-13 12:02

不管是谁在打平安县城，我三五八团一定帮帮场子！

封神梦 2024-09-14 17:53

反正wps就是各种vip广告，挺恶心人的

高排量低炭烧 2024-09-14 23:34

牛逼🤬

开源中国首席路人王 2024-09-15 15:47

ipv6 tomcat需要改什么支持吗

平波 2024-09-14 15:46

你真是行家里手啊，😂；这个本质是数学建模，就像初中数学中的板据两点确定一条直线，然后可以根据任意x,预测y值啊，其实就这么简单啊

字节跳动开源 2024-09-14 16:05

可以的，可以看看发布的一些用户案例

CloudShi83 2024-07-06 17:13

感谢祖师爷赏饭吃，给你磕一个

liming0101 2024-09-10 09:09

什么纳吉东西，还碰瓷黑神话

osc_50722289 2024-09-06 13:51

如果苹果不让步，微信也不让步那就好看了！微信在中国深入寻常百姓家！支付社交微信根本离不开，如果微信不在IOS上更新，苹果“不用混了”

来开源啊 2024-09-14 15:07

25× 23.1 √

Francesca 2024-09-15 17:30

会不会是你用的版本比较老，新版本应该没问题

奶奶灰 2024-09-15 20:28

换kvm 了

天

天1天1天 2024-09-14 16:56

文章写的也没错，至于是不是steam的功劳，也无所谓，反正能玩了。

dwingo 2024-07-18 10:12

不是不让用jni和unsafe啊, 只是做了"限制", 只要加命令行参数就能继续用, 目的是为了让使用者考量程序的安全性.

平波 2024-09-14 15:57

我倒是觉得好用，像真人就行；我可不希望它是真正的智慧生物；深度这些东东，本质就是曲面建模和贝叶斯/马尔科夫链这种概率建模；只要知识量够大，算力够强，机器就越像人；它有没有意识，并不重要；因为人的意思，估计也是伪命题；

0day 2024-07-21 11:52

一个流氓也配谈安全？

zb79463626 2024-09-15 12:07

纯血鸿蒙不再是用android改的了，DevEco什么时候也纯血脱离Eclipse啊？😄

Ask_x_Seek 2024-09-14 15:19

支持

vb2005xu 2024-09-14 10:17

这数据有1%真吗

osc_566335 2024-08-01 15:05

“虽然两人只有大专学历”—— 大专也算高等教育，现在这些媒体口中已经文盲一个级别的感觉了吗？

279778325 2024-08-16 16:22

好不容易有个国产开发平台，没有鼓励只有贬低，就算宣传夸大怎么了？那么较真干什么？遍地都是夸大的广告宣传怎么不一个一个去找厂家？批判的同时想想自己能搞一个吗？为什么加上国产俩字就非要这么较真？

RustDesk 2024-09-16 11:20

惨淡

blue_think 2024-08-26 11:00

别光喷华为啊，说点你自己的能力，到了什么程度，有什么成就，这样好歹有点说服力吧

kakai 2024-09-07 10:39

微信咋得罪你了？不管怎么样，微信此举哪怕从自身商业利益出发，让苹果降低中国税率这是利于中国人的，这个税率可不仅仅是针对微信的，还苹果大功一件，这是多么愚蠢、可耻的言论！

kushu001 2024-08-14 15:24

为什么一定要强调“国产”？是开源的项目么？如果开源，是不是不接受国外开发者的贡献？我只是好奇，不带“国产”，是宣传不了了么😀

fasiondog 2024-09-14 17:26

👍

Kevin586 2024-09-14 16:00

vagrant什么时候支持7.1我才更

Binx 2024-09-07 08:28

最好提高苹果税到80%，不然怎么彰显尊贵的苹果用户身份

平波 2024-09-14 19:01

你了做过为为的项目啊；😂

fzn0268 2024-09-04 14:26

这是那个做代码生成器的老哥起的吧

我有我可以 2024-07-09 11:40

喷子们之所以喷，其本质是为自己的阴暗和自卑找理由罢了。

yh2216 2024-09-14 10:26

猜测：c++部分应该是切换了鸿蒙的系统api，UI则仅仅是使用鸿蒙的UI框架而已。

阳光满地 2024-09-15 00:25

加个证书那么简单的事，为什么还要等下一步再优化呢？

简洛-默 2024-08-12 19:31

你是家里才通网吗? 龙芯早都弃用MIPS了，现在是自研的LoongArch。自己好好看看吧：https://loongarch.dev/zh-cn/posts/20210501-loongarch-manual/

fastfail 2024-09-15 08:37

捞钱捞到手抽筋

烈冰 2024-07-22 08:41

不如说国内90%的电脑都没安装CrowdStrike软件

开源博客 2024-09-14 22:13

Virtualbox新管网使用vw布局单位，高分屏上使用浏览器的缩放没效果，字体仍老大==

叨

叨叨颠颠 2024-09-14 16:17

代码这东西就和女人穿不同衣服一样，包装不同，就可以换个人样儿，其实里面还是。字符串替换--变量名改改、方法名改改、文件名改改，方法return的改为void，值参改形参，一个类改几个拼接，一个结构体改几个组合，一个方法改几代继承。哪个敢说这是抄，百分之百纯自研，原生态。

infoworld 2024-09-11 18:00

感谢，正是有你们这些先驱做的实事，才能避免被国外的系统和应用垄断。

Yanlongli 2024-07-11 17:28

降低了视觉复杂性，增高了操作复杂性。

songdragon 2024-08-14 13:11

这个对比的条件还存在好几个问题。 1. solon使用的是smart-http，spring使用的是undertow 2. solon启动本身的自动配置少于spring 这两点就决定了对比的维度不同，性能更好的原因大概率是web服务器、应用配置依赖导致的。如果要拉齐，需要使用同样的web服务器，spring应用排除掉所有的自动配置，只保留web必须的，才能说明框架的性能差距。现在这个结果，无法说明solon本身性能好。

Tobyee 2024-07-09 11:04

没GMS是借口，本质还是不想适配国内的手机系统，等鸿蒙Next出来，看微软拥抱不拥抱就知道了

优秀良民 2024-07-10 16:17

明明能躺平，明明可以割韭菜，还花钱研发？为了找骂？说这个能割韭菜？你被割了？你买了吗？是谁年年换mac，是谁年年换iphone？华为的用户好像没有那么干的吧？真让我一个小米用户都看不下去了！

大后锋 2024-07-10 14:03

然后交警找责任方，打过去是牛逼高大上的生成式AI的客服

黑人牙膏 2024-07-21 12:12

真的人不要脸则无敌，只要他不尴尬，尴尬的是别人。

浪_客 2024-09-15 12:54

继续用vm吧，ensp不让用新版vbox😂

无尽的拉格朗日 2024-09-14 12:56

底层代码大部分估计都能共用反正都是c/c++，上层界面层重写吧

平波 2024-07-07 16:54

吃完就砸锅，好像那个啥纯血，吃完了，就想把小米，oppo、vivo的锅咂了；😂

Artrener 2024-07-21 15:12

可以看他不爽，看360不爽，但人家说的是事实。比如说航空业的业内人士也这么说的。

Kevin586 2024-07-29 17:09

真降低成本还是得换go，java太吃内存了

我要探索宇宙 2024-09-16 14:43

3.5.2版本，队列redis能用集群模式的redis吗？

Azeroth008 2024-07-09 10:43

有自研操作系统挺好的啊，那些乱喷的人是什么心态？

DeepFlow 最佳实践 —— 主机指标数据集成及统一观测

01｜DeepFlow 主机指标集成方案

02｜统一观测效果

03｜什么是 DeepFlow

热门内容

全站热门评论

关于作者

作者的专辑

作者的其它热门文章

热门资讯

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号

DeepFlow 最佳实践 —— 主机指标数据集成及统一观测

01｜DeepFlow 主机指标集成方案

02｜统一观测效果

03｜什么是 DeepFlow

热门内容

全站热门评论

关于作者

作者的专辑

作者的其它热门文章

热门资讯

推荐关注

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号