中文小说模型、日语模型、embedding 模型...RWKV 社区 8 月动态速览！

来源: 投稿

作者: RWKV元始智能

2024-08-30 18:08:00

欢迎大家收看《RWKV 社区最新动态》第四期，本期内容收录了 RWKV 社区 8 月的最新动态。

8 月动态省流版（TL;DR）

RWKV 官方动态
- 发布 RWKV-6-ChnNovel 系列中文小说模型，适合写小说和角色扮演
- 发布 RWKV-6-Jpn 日语微调模型
- RWKV 中文文档新增了 RWKV pip 库使用指南与 RWKV 提示词指南
RWKV 社区项目
- RWKV Runner 更新 v1.8.7 版本，新增 function call 等功能
- RWKV 社区发布基于 RWKV-6 的 embedding 模型，含 Bi-Encoder 和 Cross-Encoder
基于 RWKV 的学术研究
- 基于多分支降噪器 “Symb-RWKV” 的 Music-Diff 音乐生成架构

RWKV 官方动态

发布 RWKV-6-ChnNovel 中文小说模型

2024 年 8 月 3 日起，RWKV 社区陆续发布了 1B6/3B/7B/14B 四种参数的 RWKV-6-ChnNovel 系列中文小说模型，及对应的小说扩写 state。

RWKV-6 小说模型下载链接：https://huggingface.co/BlinkDL/rwkv-6-misc/tree/main

RWKV-6 小说模型的用法，请参考：RWKV 发布中文小说模型，也擅长角色扮演！

RWKV-6-ChnNovel 中文小说模型基于 RWKV-6-World 基底模型微调，微调数据包含中文小说数据和指令（instruction）数据。

相较于 RWKV-6 基底模型， RWKV-6 中文小说模型在小说续写、小说扩写以及进行深层次的角色扮演功能上有非常好的效果。

演示：写中文小说

演示：角色扮演

如上图所示，若角色设定足够详细，模型角色扮演功能不会轻易跳出其对应的角色设定。

发布 RWKV-6-Jpn 日语微调模型

RWKV 发布 7B / 14B 两种参数的 RWKV-6-Jpn 日语微调模型。

RWKV-6-Jpn 下载地址：https://huggingface.co/BlinkDL/rwkv-6-misc

RWKV-6-Jpn 系列日语模型由社区成员 @OpenMOSE 进行 RLHF 后，在日语任务上表现更好。

OpenMOSE 发布的基准测试显示：RLHF 后 RWKV-6-Jpn 7B 日语模型可与其他 70B 的 Transformer 模型媲美。

RWKV 中文官网新增 pip 库使用指南与提示词指南

RWKV 官网的中文文档新增了聊天、续写两种模式的提示词指南与 RWKV pip 库使用指南。

“RWKV 提示词指南”介绍了如何向 RWKV 提问，包括完成任务、角色扮演等方面内容。

“RWKV pip 库使用指南”将指引你使用 RWKV pip 库开发基于 RWKV 模型的应用。

RWKV社区项目

RWKV Runner 项目更新

RWKV Runner 更新了 v1.8.7 版本，此版本调整了兼容性和 UI 界面，并新增了 function call 等功能：

新增了函数调用（function call）功能（由 RWKV 社区成员 @EliwiiKeeya 贡献）
在窄屏页面上添加悬浮 Web 导航（由 RWKV 社区成员 @HaloWang 贡献）
发布了 RWKV Runner Windows 安装器。Windows 安装器有完整的、正式的安装流程：会自动创建目录放置依赖，自动创建快捷方式启动，且自带卸载程序
Completion 续写页面已支持调整 penalty_decay 参数

function call 功能位置

社区发布 rwkv6 embedding 模型

RWKV 社区发布了 rwkv6_emb_4k_base 嵌入模型（embedding model），这是一个使用中文查询/上下文数据进行微调的 Bi-Encoder ，主要用于将文本转换成嵌入向量。

rwkv6_emb_4k_base 下载链接： https://huggingface.co/yueyulin/rwkv6_emb_4k_base

此外社区也发布了另一款 RWKV-6 嵌入模型 rwkv6_crossencoder，这是基于 RWKV-6 架构的 Cross-Encoder （交叉编码器）。Cross-Encoder 既可以用于生成嵌入向量的 embedding 任务，也可以用于重排序查询/上下文检索的 Rerank 任务。

rwkv6_crossencoder 下载地址：https://huggingface.co/yueyulin/rwkv6_crossencoder

RWKV 学术研究相关

Music-Diff 音乐生成模型

来自大连理工大学的研究团队提出了 Music-Diff 架构，该架构引入了 Joint Semantic Pre-training 方法来执行多变量扰动，并引入了多分支降噪器 “Symb-RWKV” 模型来恢复联合分布的噪声（通过 Pareto 优化来适应多个噪声目标）。

实验表明，与语言模型相比，在音符和语义层面进行扰动的联合概率扩散模型可以提供更多样本多样性和组成规律性。

Music-Diff 论文地址：https://arxiv.org/abs/2408.01950

关于《RWKV 社区动态》栏目

《RWKV 社区动态》栏目会不定期播报 RWKV 社区的最新消息，以帮助 RWKV 的关注者、爱好者、开发者更好地了解 RWKV 的发展情况。

《RWKV 社区最新动态》不定期更新，所以请保持关注我们的微信公众号（RWKV 元始智能）、QQ 频道（RWKV）等公开平台，以获取最新的消息。

加入 RWKV 社区

欢迎大家加入 RWKV 社区，可以从 RWKV 中文官网了解 RWKV 模型，也可以加入我们的 QQ 频道和群聊，一起探讨 RWKV 模型。

RWKV 中文官网：https://rwkv.cn/
QQ 频道：https://pd.qq.com/s/9n21eravc

osc_50722289 2024-09-06 13:51

如果苹果不让步，微信也不让步那就好看了！微信在中国深入寻常百姓家！支付社交微信根本离不开，如果微信不在IOS上更新，苹果“不用混了”

我有我可以 2024-07-09 11:40

喷子们之所以喷，其本质是为自己的阴暗和自卑找理由罢了。

封神梦 2024-09-14 17:53

反正wps就是各种vip广告，挺恶心人的

开源博客 2024-09-14 22:13

Virtualbox新管网使用vw布局单位，高分屏上使用浏览器的缩放没效果，字体仍老大==

浪_客 2024-09-15 12:54

继续用vm吧，ensp不让用新版vbox😂

fzn0268 2024-09-04 14:26

这是那个做代码生成器的老哥起的吧

osc_566335 2024-08-01 15:05

“虽然两人只有大专学历”—— 大专也算高等教育，现在这些媒体口中已经文盲一个级别的感觉了吗？

Azeroth008 2024-07-09 10:43

有自研操作系统挺好的啊，那些乱喷的人是什么心态？

fasiondog 2024-09-14 17:26

👍

字节跳动开源 2024-09-14 16:05

可以的，可以看看发布的一些用户案例

黑人牙膏 2024-07-21 12:12

真的人不要脸则无敌，只要他不尴尬，尴尬的是别人。

longzz 2024-09-14 11:04

🤣65岁还在写代码吗？

Yanlongli 2024-07-11 17:28

降低了视觉复杂性，增高了操作复杂性。

叨

叨叨颠颠 2024-09-14 16:17

代码这东西就和女人穿不同衣服一样，包装不同，就可以换个人样儿，其实里面还是。字符串替换--变量名改改、方法名改改、文件名改改，方法return的改为void，值参改形参，一个类改几个拼接，一个结构体改几个组合，一个方法改几代继承。哪个敢说这是抄，百分之百纯自研，原生态。

vb2005xu 2024-09-14 10:17

这数据有1%真吗

HalLi 2024-09-09 01:10

普通用户不懂就算了，怎么连程序员都不懂？苹果是全平台30%，国产是渠道服50%。微信、抖音这种大app哪来的渠道服，除了游戏，哪个app带渠道服。

深夜49 2024-09-14 14:36

免费版只能用30分钟，太坑了吧。

我要探索宇宙 2024-09-16 14:43

3.5.2版本，队列redis能用集群模式的redis吗？

kakai 2024-09-07 10:39

微信咋得罪你了？不管怎么样，微信此举哪怕从自身商业利益出发，让苹果降低中国税率这是利于中国人的，这个税率可不仅仅是针对微信的，还苹果大功一件，这是多么愚蠢、可耻的言论！

烈冰 2024-07-22 08:41

不如说国内90%的电脑都没安装CrowdStrike软件

简洛-默 2024-08-12 19:31

你是家里才通网吗? 龙芯早都弃用MIPS了，现在是自研的LoongArch。自己好好看看吧：https://loongarch.dev/zh-cn/posts/20210501-loongarch-manual/

天

天1天1天 2024-09-14 16:56

文章写的也没错，至于是不是steam的功劳，也无所谓，反正能玩了。

RustDesk 2024-09-16 11:20

惨淡

平波 2024-09-14 19:01

你了做过为为的项目啊；😂

平波 2024-09-14 15:46

你真是行家里手啊，😂；这个本质是数学建模，就像初中数学中的板据两点确定一条直线，然后可以根据任意x,预测y值啊，其实就这么简单啊

无尽的拉格朗日 2024-09-14 12:56

底层代码大部分估计都能共用反正都是c/c++，上层界面层重写吧

Francesca 2024-09-15 17:30

会不会是你用的版本比较老，新版本应该没问题

yh2216 2024-09-14 10:26

猜测：c++部分应该是切换了鸿蒙的系统api，UI则仅仅是使用鸿蒙的UI框架而已。

Kevin586 2024-07-29 17:09

真降低成本还是得换go，java太吃内存了

阳光满地 2024-09-15 00:25

加个证书那么简单的事，为什么还要等下一步再优化呢？

liming0101 2024-09-10 09:09

什么纳吉东西，还碰瓷黑神话

开源中国首席路人王 2024-09-15 15:47

ipv6 tomcat需要改什么支持吗

dwingo 2024-07-18 10:12

不是不让用jni和unsafe啊, 只是做了"限制", 只要加命令行参数就能继续用, 目的是为了让使用者考量程序的安全性.

Tobyee 2024-07-09 11:04

没GMS是借口，本质还是不想适配国内的手机系统，等鸿蒙Next出来，看微软拥抱不拥抱就知道了

高排量低炭烧 2024-09-14 23:34

牛逼🤬

blue_think 2024-08-26 11:00

别光喷华为啊，说点你自己的能力，到了什么程度，有什么成就，这样好歹有点说服力吧

Ask_x_Seek 2024-09-14 15:19

支持

优秀良民 2024-07-10 16:17

明明能躺平，明明可以割韭菜，还花钱研发？为了找骂？说这个能割韭菜？你被割了？你买了吗？是谁年年换mac，是谁年年换iphone？华为的用户好像没有那么干的吧？真让我一个小米用户都看不下去了！

加百列Gabriel 2024-09-14 13:50

各位不要急着更新, 更新完之后linux虚拟机不支持3D加速了

Kevin586 2024-09-14 16:00

vagrant什么时候支持7.1我才更

奶奶灰 2024-09-15 20:28

换kvm 了

来开源啊 2024-09-14 15:07

25× 23.1 √

Binx 2024-09-07 08:28

最好提高苹果税到80%，不然怎么彰显尊贵的苹果用户身份

yh2216 2024-09-14 10:24

wps确实做的很棒，比微软的office好用，比libreoffice好用很多。wps加油，鸿蒙做的不错，继续加油，支持生态建设。

智布道 2024-08-13 12:02

不管是谁在打平安县城，我三五八团一定帮帮场子！

大后锋 2024-07-10 14:03

然后交警找责任方，打过去是牛逼高大上的生成式AI的客服

CloudShi83 2024-07-06 17:13

感谢祖师爷赏饭吃，给你磕一个

0day 2024-07-21 11:52

一个流氓也配谈安全？

kushu001 2024-08-14 15:24

为什么一定要强调“国产”？是开源的项目么？如果开源，是不是不接受国外开发者的贡献？我只是好奇，不带“国产”，是宣传不了了么😀

infoworld 2024-09-11 18:00

感谢，正是有你们这些先驱做的实事，才能避免被国外的系统和应用垄断。

osc_566335 2024-08-05 10:48

os是媾粉聚集地还不了解吗？只要碰到国产、华子相关报道，必然评论区乌烟瘴气口伏声难止。还能期待啥有深度发言？大佬敢发这些，那还给搞前端什么都懂的“程序员”粪死？

songdragon 2024-08-14 13:11

这个对比的条件还存在好几个问题。 1. solon使用的是smart-http，spring使用的是undertow 2. solon启动本身的自动配置少于spring 这两点就决定了对比的维度不同，性能更好的原因大概率是web服务器、应用配置依赖导致的。如果要拉齐，需要使用同样的web服务器，spring应用排除掉所有的自动配置，只保留web必须的，才能说明框架的性能差距。现在这个结果，无法说明solon本身性能好。

zb79463626 2024-09-15 12:07

纯血鸿蒙不再是用android改的了，DevEco什么时候也纯血脱离Eclipse啊？😄

fastfail 2024-09-15 08:37

捞钱捞到手抽筋

279778325 2024-08-16 16:22

好不容易有个国产开发平台，没有鼓励只有贬低，就算宣传夸大怎么了？那么较真干什么？遍地都是夸大的广告宣传怎么不一个一个去找厂家？批判的同时想想自己能搞一个吗？为什么加上国产俩字就非要这么较真？

zb79463626 2024-08-26 15:51

IBM中国哪有什么研发? 全部都是测试！所谓的搞研发的都是去养老混日子的！

呼呼南风 2024-09-14 11:18

幸好我把自己电脑换成win10了。

平波 2024-07-07 16:54

吃完就砸锅，好像那个啥纯血，吃完了，就想把小米，oppo、vivo的锅咂了；😂

平波 2024-09-14 15:57

我倒是觉得好用，像真人就行；我可不希望它是真正的智慧生物；深度这些东东，本质就是曲面建模和贝叶斯/马尔科夫链这种概率建模；只要知识量够大，算力够强，机器就越像人；它有没有意识，并不重要；因为人的意思，估计也是伪命题；

Artrener 2024-07-21 15:12

可以看他不爽，看360不爽，但人家说的是事实。比如说航空业的业内人士也这么说的。

中文小说模型、日语模型、embedding 模型...RWKV 社区 8 月动态速览！

8 月动态省流版（TL;DR）

RWKV 官方动态

发布 RWKV-6-ChnNovel 中文小说模型

演示：写中文小说

演示：角色扮演

发布 RWKV-6-Jpn 日语微调模型

RWKV 中文官网新增 pip 库使用指南与提示词指南

RWKV社区项目

RWKV Runner 项目更新

社区发布 rwkv6 embedding 模型

RWKV 学术研究相关

Music-Diff 音乐生成模型

关于《RWKV 社区动态》栏目

加入 RWKV 社区

热门内容

全站热门评论

热门资讯

精彩专栏

开发者进阶之深入理解 Linux 内核底层技术原理

程序员如何入门 AI 应用开发？

聊聊 Unity 与原生桥接

基于事件驱动的邀约自动化机制

Java虚拟线程探究与性能解析

浅析JVM invokedynamic指令和Java Lambda语法｜得物技术

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号

中文小说模型、日语模型、embedding 模型...RWKV 社区 8 月动态速览！

8 月动态省流版（TL;DR）

RWKV 官方动态

发布 RWKV-6-ChnNovel 中文小说模型

演示：写中文小说

演示：角色扮演

发布 RWKV-6-Jpn 日语微调模型

RWKV 中文官网新增 pip 库使用指南与提示词指南

RWKV社区项目

RWKV Runner 项目更新

社区发布 rwkv6 embedding 模型

RWKV 学术研究相关

Music-Diff 音乐生成模型

关于《RWKV 社区动态》栏目

加入 RWKV 社区

相关链接

热门内容

全站热门评论

热门资讯

精彩专栏

开发者进阶之深入理解 Linux 内核底层技术原理

程序员如何入门 AI 应用开发？

聊聊 Unity 与原生桥接

基于事件驱动的邀约自动化机制

Java虚拟线程探究与性能解析

浅析JVM invokedynamic指令和Java Lambda语法｜得物技术

推荐关注

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号