打开网易新闻 查看精彩图片

始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel推出邀请注册奖励活动,最高可得算力券+token包380元奖励,欢迎参与和支持!

2025 年 11 月 1 日,RWKV7-G0a3 13.3B推理模型开源发布。这是世界迄今最强的纯 RNN 大语言模型。团队以 RWKV6-world-v2.1 14B 模型为基础,仅继续训练 2T tokens(加入了蒸馏的 35B tokens from DeepSeek v3.1),即获得了有竞争力的效果。它依然是纯预训练模型(无后训练,无刷榜),评测成绩符合模型实际使用体验。模型已更新上线始智AI-wisemodel开源社区,欢迎大家前去体验。

其中,RWKV 模型名称的G1/G1a/G1a2/G0a3等字段是训练数据的版本,数据质量 G > G > G > G#,数据数量 G1 > G0。简单规则:同一参数选择最新的模型,效果最好。

打开网易新闻 查看精彩图片

模型地址

https://wisemodel.cn/models/rwkv4fun/RWKV-7-G1/file

01.

模型性能评估

benchmark-multilang
打开网易新闻 查看精彩图片
benchmark-multilang

打开网易新闻 查看精彩图片

Uncheatable Eval 评测

Uncheatable Eval使用最新的论文/新闻/代码/小说等实时数据,测试压缩率(“压缩即智能”),评估基底语言模型的真实语言建模能力和泛化能力。

benchmark-uncheatable
打开网易新闻 查看精彩图片
benchmark-uncheatable

打开网易新闻 查看精彩图片

MMLU & MMLU PRO

评估模型在多学科的综合知识(MMLU PRO 比 MMLU 更难)。

benchmark-mmlu
打开网易新闻 查看精彩图片
benchmark-mmlu

打开网易新闻 查看精彩图片

GSM8K

评估模型在中学难度数学应用题的推理能力。

benchmark-gsm8k
打开网易新闻 查看精彩图片
benchmark-gsm8k

打开网易新闻 查看精彩图片

MATH500

测试模型在更难数学问题的解题能力。

benchmark-math500
打开网易新闻 查看精彩图片
benchmark-math500

打开网易新闻 查看精彩图片

CEval

以多行业真实试题,评估模型中文理解和专业知识。

benchmark-ceval
打开网易新闻 查看精彩图片
benchmark-ceval

02.

模型实战

G0a3 系列模型加入更多数据,显著提升 vibe coding 能力。

Tips 写代码,推荐解码参数:Temperature=1,Top_P=0.3,Presence Penalty=1,Frequency Penalty=0.1,decay=0.99 在下述代码示例中,我们把模型生成的 HTML 内容放到 https://html.onlineviewer.net/ 进行预览。

首先:用 SVG 画一只橘猫的侧面图(毕加索风格),即使关闭思考模式,也能生成合理的结果:

vibe-web-svgcat
打开网易新闻 查看精彩图片
vibe-web-svgcat

继续:用SVG画一张深圳夜景配图,包含建筑剪影和霓虹灯带,视觉主色调明确为深蓝 (背景)与霓虹粉 (点缀/光效)

vibe-web-svg
打开网易新闻 查看精彩图片
vibe-web-svg

继续:请生成一个单文件 HTML 页面,主题:武松打虎。页面需包含:标题、简介段落、一段描写打虎场景的正文、至少一张配图(可用占位图 URL),并用干净的 CSS 美化页面(响应式)。输出完整的 HTML 文件源码。

打开网易新闻 查看精彩图片

vibe-web-wusongTips 所有生成的代码都在文末附录。我们会持续发布 vibe coding 能力显著更强的模型。

如前所述,RWKV 作为纯 RNN 模型,尤其适合大规模并行生成。我们提供了大规模并行生成网页的推理工具:

  • 后端:https://github.com/RWKV-Vibe/rwkv_lightning

  • 前端:https://github.com/xun082/RWKV-code

效果预览:

打开网易新闻 查看精彩图片

batch-web 故事创作Tips 创作任务推荐的解码参数:Temperature=0.6,Top_P=0.7,Presence Penalty=2,Frequency Penalty=0.2

我们在新模型主蒸 DeepSeek v3.1,可以看到它的显著风格:

story
打开网易新闻 查看精彩图片
story

03.

优化推理速度

RWKV 团队与北京智源研究院合作优化推理效率,使用 FlagOS 的 FlagGems Triton 语言算子库,在保持精度的前提下提升了模型的推理速度。

例如,由于 RWKV 架构在设计时支持 FFN 无损稀疏化,在 bsz 1 时,FlagGems 算子 rwkv_mm_sparsity 对比 CUDA matmul 可提升 74% 到 202% 速度。进一步配合 CUDA Graph 优化,RWKV-7 的 bsz=1 推理 Decode 端到端速度在英伟达 RTX5090 提升 28%,在英伟达 A100 提升 135%。

目前显示速度已达:

https://github.com/BlinkDL/Albatross/tree/main/faster_251101

  • 模型RWKV-7 13.3B fp16,显卡RTX5090 with CUDAGraph and sparse FFN (lossless),推理速度 66+ token/s(bsz1

  • 模型RWKV-7 7.2B fp16,显卡RTX5090 with CUDAGraph and sparse FFN (lossless),推理速度 123+ token/s(bsz1

  • 模型RWKV-7 7.2B fp16,显卡RTX5090,推理速度 10250+ token/s (bsz960

04.

如何使用RWKV模型

本地部署

可以使用 RWKV Runner、Ai00、RWKV pip 等推理工具本地部署 RWKV 模型。RWKV 模型也适配了 llama.cpp、ollama 等热门的模型推理工具。

目前最快的 RWKV 推理工具是 Albatross:

https://github.com/BlinkDL/Albatross

由于 RWKV7-G0a3 13.3B 是新模型,目前建议使用 RWKV Runner以保证得到正确结果。可以在RWKV 官网 - 模型推理教程中查看上述推理工具的使用教程。

05.

附录代码

vibe coding 1:svg 绘制橘猫

vibe coding prompt:用 SVG 画一只橘猫的侧面图(毕加索风格)


"zh"> "UTF-8"> "viewport" content="width=device-width, initial-scale=1.0"> 毕加索风格橘猫
"container" >
毕加索风格橘猫
"svg-container" > "300" height= "400" viewBox= "0 0 300 400" > "100%" height= "100%" fill= "" /> "M150,100 C180,80 220,90 230,120 C240,150 220,180 190,190 C160,200 130,180 120,150 C110,120 130,90 150,100 Z" fill= "" /> "M120,80 L140,60 L160,80 L140,100 Z" fill= "" /> "M180,80 L200,60 L220,80 L200,100 Z" fill= "" /> "130" cy= "140" r= "15" fill= "" /> "170" cy= "140" r= "15" fill= "" /> "135" cy= "140" r= "5" fill= "white" /> "165" cy= "140" r= "5" fill= "white" /> "M150,170 L145,185 L155,185 Z" fill= "" /> "M140,190 Q150,200 160,190" stroke= "" stroke-width= "2" fill= "none" /> "130" y1= "170" x2= "100" y2= "165" stroke= "" stroke-width= "1.5" /> "130" y1= "175" x2= "100" y2= "170" stroke= "" stroke-width= "1.5" /> "130" y1= "180" x2= "100" y2= "175" stroke= "" stroke-width= "1.5" /> "170" y1= "170" x2= "200" y2= "165" stroke= "" stroke-width= "1.5" /> "170" y1= "175" x2= "200" y2= "170" stroke= "" stroke-width= "1.5" /> "170" y1= "180" x2= "200" y2= "175" stroke= "" stroke-width= "1.5" /> "M150,190 C120,210 80,230 70,270 C60,310 80,350 120,370 C160,390 200,370 220,330 C240,290 230,250 210,220 C190,190 170,180 150,190 Z" fill= "" /> "M120,290 L100,320 L110,340 L130,320 Z" fill= "" /> "M180,290 L200,320 L190,340 L170,320 Z" fill= "" /> "M220,330 L240,360 L230,380 L210,360 Z" fill= "" /> "M160,330 L140,360 L150,380 L170,360 Z" fill= "" /> "M220,330 C250,320 270,300 260,270 C250,240 230,230 210,240 C190,250 180,270 190,290 C200,310 220,320 220,330 Z" fill= "" /> "100" cy= "325" r= "5" fill= "" /> "110" cy= "345" r= "5" fill= "" /> "130" cy= "325" r= "5" fill= "" /> "140" cy= "345" r= "5" fill= "" /> "160" cy= "325" r= "5" fill= "" /> "170" cy= "345" r= "5" fill= "" /> "200" cy= "325" r= "5" fill= "" /> "210" cy= "345" r= "5" fill= "" /> "230" cy= "325" r= "5" fill= "" /> "240" cy= "345" r= "5" fill= "" /> "260" cy= "325" r= "5" fill= "" /> "270" cy= "345" r= "5" fill= "" /> "M150,100 L120,80" stroke= "" stroke-width= "2" stroke-dasharray= "5,3" /> "M150,100 L180,80" stroke= "" stroke-width= "2" stroke-dasharray= "5,3" /> "M150,190 L120,290" stroke= "" stroke-width= "2" stroke-dasharray= "5,3" /> "M150,190 L180,290" stroke= "" stroke-width= "2" stroke-dasharray= "5,3" /> "M150,190 L220,330" stroke= "" stroke-width= "2" stroke-dasharray= "5,3" /> "M150,190 L160,330" stroke= "" stroke-width= "2" stroke-dasharray= "5,3" />

"description"> 这只"highlight">毕加索风格的橘猫采用了立体主义的几何形状和鲜明的色彩对比,展现了艺术与自然的完美结合。通过简化的形状和抽象的线条,捕捉了猫咪的优雅姿态和独特个性。


vibe coding 2:svg 绘制深圳夜景

vibe coding prompt:用SVG画一张深圳夜景配图,包含建筑剪影和霓虹灯带,视觉主色调明确为深蓝 (背景)与霓虹粉 (点缀/光效)


"zh-CN"> "UTF-8"> "viewport" content="width=device-width, initial-scale=1.0"> 深圳夜景
"container" >
深圳夜景
"svg-container" > "800" height= "500" viewBox= "0 0 800 500" > "800" height= "500" fill= "" /> "M0,300 Q100,250 200,280 T400,270 T600,290 T800,300 L800,500 L0,500 Z" fill= "" /> "0" y= "450" width= "800" height= "50" fill= "" /> "buildings" > "50" y= "200" width= "40" height= "150" fill= "" /> "90" y= "180" width= "35" height= "170" fill= "" /> "135" y= "220" width= "30" height= "130" fill= "" /> "175" y= "190" width= "40" height= "160" fill= "" /> "225" y= "210" width= "35" height= "140" fill= "" /> "300" y= "150" width= "60" height= "200" fill= "" /> "360" y= "120" width= "70" height= "230" fill= "" /> "440" y= "160" width= "50" height= "190" fill= "" /> "490" y= "140" width= "65" height= "210" fill= "" /> "565" y= "170" width= "55" height= "180" fill= "" /> "650" y= "200" width= "40" height= "150" fill= "" /> "695" y= "180" width= "35" height= "170" fill= "" /> "735" y= "220" width= "30" height= "130" fill= "" /> "775" y= "190" width= "40" height= "160" fill= "" /> "825" y= "210" width= "35" height= "140" fill= "" /> "neon-lights" > "50" y= "200" width= "40" height= "5" fill= "" class= "neon-light" /> "90" y= "180" width= "35" height= "5" fill= "" class= "neon-light" /> "135" y= "220" width= "30" height= "5" fill= "" class= "neon-light" /> "175" y= "190" width= "40" height= "5" fill= "" class= "neon-light" /> "225" y= "210" width= "35" height= "5" fill= "" class= "neon-light" /> "300" y= "150" width= "60" height= "5" fill= "" class= "neon-light" /> "360" y= "120" width= "70" height= "5" fill= "" class= "neon-light" /> "440" y= "160" width= "50" height= "5" fill= "" class= "neon-light" /> "490" y= "140" width= "65" height= "5" fill= "" class= "neon-light" /> "565" y= "170" width= "55" height= "5" fill= "" class= "neon-light" /> "650" y= "200" width= "40" height= "5" fill= "" class= "neon-light" /> "695" y= "180" width= "35" height= "5" fill= "" class= "neon-light" /> "735" y= "220" width= "30" height= "5" fill= "" class= "neon-light" /> "775" y= "190" width= "40" height= "5" fill= "" class= "neon-light" /> "825" y= "210" width= "35" height= "5" fill= "" class= "neon-light" /> "M100,250 Q150,200 200,250 T300,200 T400,250 T500,200 T600,250 T700,200 T800,250" fill= "none" stroke= "" stroke-width= "3" class= "neon-light" /> "150" cy= "180" r= "3" fill= "" class= "neon-light" > " class= "neon-light" > " class= "neon-light" > " class= "neon-light" > " class= "neon-light" > " class= "neon-light" > " class= "neon-light" > " /> "685" cy= "65" r= "15" fill= "" />


vibe coding 3:武松打虎 web

vibe coding prompt:请生成一个单文件 HTML 页面,主题:武松打虎。页面需包含:标题、简介段落、一段描写打虎场景的正文、至少一张配图(可用占位图 URL),并用干净的 CSS 美化页面(响应式)。输出完整的 HTML 文件源码。


"zh-CN"> "UTF-8"> "viewport" content="width=device-width, initial-scale=1.0"> 武松打虎 - 水浒传经典故事 武松打虎
"subtitle">水浒传经典故事之一

"container" > "intro" > 故事简介

《武松打虎》是中国古典四大名著之一《水浒传》中的经典章节,讲述了武松在景阳冈上与一只猛虎搏斗并最终将其击毙的英勇事迹。这一故事不仅展现了武松的勇猛无畏,也体现了中国传统文化中"义薄云天"的侠义精神。

武松原是山东清河县人,因杀死杀兄仇人西门庆而被迫逃亡,途经景阳冈时遭遇猛虎。在酒醉状态下,他凭借过人的勇气和武艺,与老虎展开殊死搏斗,最终成功将其击毙,成为民间传颂的英雄人物。

"story" > 故事正文
话说武松在孟州牢城营做了三年牢,后来被释放,前往东京投奔哥哥武大郎。路经山东阳谷县境内的景阳冈时,已是黄昏时分。武松走得口渴难耐,见路边有一家酒店,便进去喝酒。

店家见武松生得壮实,便劝他多饮几杯。武松本就性情豪爽,又加上连日赶路劳累,便喝了十八碗烈酒。酒酣耳热之际,店家告诉他前方有一条景阳冈,上面有一只吃人的吊睛白额大虫,劝他不要独自前往。

武松却不以为然,认为自己身强力壮,何惧猛虎?他拍案叫道:"你这厮休要危言耸听!若真有那畜生,我必教他知道爷爷的手段!"说罢,提起行李,摇摇晃晃地向景阳冈走去。

刚上冈不远,忽听得树林中风声飒飒,草木簌簌。武松定睛看时,只见一只斑斓猛虎从林中窜出,直扑过来。武松虽然酒醉,但见到猛虎,酒醒了一半,急忙抽出朴刀迎战。

那老虎扑到近前,武松举刀砍去,却被老虎躲过。老虎反身一扑,武松侧身闪避,与老虎扭打在一起。两人(虎)缠斗良久,武松渐渐觉得力气不支,心想:"今日若死在此处,岂不冤枉!"便奋力挣脱,滚到一旁。

武松见老虎扑空,立即翻身跃起,趁老虎回头之际,一刀砍在老虎颈上。老虎吃痛,转身再扑。武松又是一刀,这次砍中老虎前腿。老虎吃痛,怒吼连连,再次扑来。

武松见老虎伤势严重,知道它已是强弩之末,便不再躲闪,挺刀直刺。这一刀正中老虎心窝,老虎发出一声惨嚎,倒地而死。武松取出老虎眼珠吞下,又割下老虎皮毛,带着尸体回到阳谷县,献给县太爷。

县太爷闻讯亲自前来查看,见果然是一只猛虎,便命人将武松送回孟州牢城营。武松因此事迹传扬开来,声名大振,后来更是成为梁山好汉之一。

"image-section" > "https://images.unsplash.com/photo-1578662996442-48f60103fc96?ixlib=rb-1.2.1&auto=format&fit=crop&w=800&q=80" alt="武松打虎场景">
"image-caption">武松与老虎搏斗的经典场景




© 2023 中国古典文学故事 | 《水浒传》经典篇章

----- END -----

打开网易新闻 查看精彩图片

wisemodel相关:

系列模型:

关于wisemodel更多

1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。

2

欢迎加盟wisemodel开源社区

始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看