始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel推出邀请注册奖励活动,最高可得算力券+token包380元奖励,欢迎参与和支持!
2025 年 11 月 1 日,RWKV7-G0a3 13.3B推理模型开源发布。这是世界迄今最强的纯 RNN 大语言模型。团队以 RWKV6-world-v2.1 14B 模型为基础,仅继续训练 2T tokens(加入了蒸馏的 35B tokens from DeepSeek v3.1),即获得了有竞争力的效果。它依然是纯预训练模型(无后训练,无刷榜),评测成绩符合模型实际使用体验。模型已更新上线始智AI-wisemodel开源社区,欢迎大家前去体验。
其中,RWKV 模型名称的G1/G1a/G1a2/G0a3等字段是训练数据的版本,数据质量 G > G > G > G#,数据数量 G1 > G0。简单规则:同一参数选择最新的模型,效果最好。
模型地址
https://wisemodel.cn/models/rwkv4fun/RWKV-7-G1/file
01.
模型性能评估
Uncheatable Eval 评测
Uncheatable Eval使用最新的论文/新闻/代码/小说等实时数据,测试压缩率(“压缩即智能”),评估基底语言模型的真实语言建模能力和泛化能力。
MMLU & MMLU PRO
评估模型在多学科的综合知识(MMLU PRO 比 MMLU 更难)。
GSM8K
评估模型在中学难度数学应用题的推理能力。
MATH500
测试模型在更难数学问题的解题能力。
CEval
以多行业真实试题,评估模型中文理解和专业知识。
02.
模型实战
G0a3 系列模型加入更多数据,显著提升 vibe coding 能力。
Tips 写代码,推荐解码参数:Temperature=1,Top_P=0.3,Presence Penalty=1,Frequency Penalty=0.1,decay=0.99 在下述代码示例中,我们把模型生成的 HTML 内容放到 https://html.onlineviewer.net/ 进行预览。
首先:用 SVG 画一只橘猫的侧面图(毕加索风格),即使关闭思考模式,也能生成合理的结果:
继续:用SVG画一张深圳夜景配图,包含建筑剪影和霓虹灯带,视觉主色调明确为深蓝 (背景)与霓虹粉 (点缀/光效):
继续:请生成一个单文件 HTML 页面,主题:武松打虎。页面需包含:标题、简介段落、一段描写打虎场景的正文、至少一张配图(可用占位图 URL),并用干净的 CSS 美化页面(响应式)。输出完整的 HTML 文件源码。
vibe-web-wusongTips 所有生成的代码都在文末附录。我们会持续发布 vibe coding 能力显著更强的模型。
如前所述,RWKV 作为纯 RNN 模型,尤其适合大规模并行生成。我们提供了大规模并行生成网页的推理工具:
后端:https://github.com/RWKV-Vibe/rwkv_lightning
前端:https://github.com/xun082/RWKV-code
效果预览:
batch-web 故事创作Tips 创作任务推荐的解码参数:Temperature=0.6,Top_P=0.7,Presence Penalty=2,Frequency Penalty=0.2
我们在新模型主蒸 DeepSeek v3.1,可以看到它的显著风格:
03.
优化推理速度
RWKV 团队与北京智源研究院合作优化推理效率,使用 FlagOS 的 FlagGems Triton 语言算子库,在保持精度的前提下提升了模型的推理速度。
例如,由于 RWKV 架构在设计时支持 FFN 无损稀疏化,在 bsz 1 时,FlagGems 算子 rwkv_mm_sparsity 对比 CUDA matmul 可提升 74% 到 202% 速度。进一步配合 CUDA Graph 优化,RWKV-7 的 bsz=1 推理 Decode 端到端速度在英伟达 RTX5090 提升 28%,在英伟达 A100 提升 135%。
目前显示速度已达:
https://github.com/BlinkDL/Albatross/tree/main/faster_251101
模型
RWKV-7 13.3B fp16,显卡RTX5090 with CUDAGraph and sparse FFN (lossless),推理速度 66+ token/s(bsz1)模型
RWKV-7 7.2B fp16,显卡RTX5090 with CUDAGraph and sparse FFN (lossless),推理速度 123+ token/s(bsz1)模型
RWKV-7 7.2B fp16,显卡RTX5090,推理速度 10250+ token/s (bsz960)
04.
如何使用RWKV模型
本地部署
可以使用 RWKV Runner、Ai00、RWKV pip 等推理工具本地部署 RWKV 模型。RWKV 模型也适配了 llama.cpp、ollama 等热门的模型推理工具。
目前最快的 RWKV 推理工具是 Albatross:
https://github.com/BlinkDL/Albatross
由于 RWKV7-G0a3 13.3B 是新模型,目前建议使用 RWKV Runner以保证得到正确结果。可以在RWKV 官网 - 模型推理教程中查看上述推理工具的使用教程。
05.
附录代码
vibe coding 1:svg 绘制橘猫
vibe coding prompt:用 SVG 画一只橘猫的侧面图(毕加索风格)
"zh">
"UTF-8">
"viewport" content="width=device-width, initial-scale=1.0"> 毕加索风格橘猫
"container"
>
毕加索风格橘猫
"svg-container"
>
"300"
height=
"400"
viewBox=
"0 0 300 400"
>
"100%"
height=
"100%"
fill=
""
/>
"M150,100 C180,80 220,90 230,120 C240,150 220,180 190,190 C160,200 130,180 120,150 C110,120 130,90 150,100 Z"
fill=
""
/>
"M120,80 L140,60 L160,80 L140,100 Z"
fill=
""
/>
"M180,80 L200,60 L220,80 L200,100 Z"
fill=
""
/>
"130"
cy=
"140"
r=
"15"
fill=
""
/>
"170"
cy=
"140"
r=
"15"
fill=
""
/>
"135"
cy=
"140"
r=
"5"
fill=
"white"
/>
"165"
cy=
"140"
r=
"5"
fill=
"white"
/>
"M150,170 L145,185 L155,185 Z"
fill=
""
/>
"M140,190 Q150,200 160,190"
stroke=
""
stroke-width=
"2"
fill=
"none"
/>
"130"
y1=
"170"
x2=
"100"
y2=
"165"
stroke=
""
stroke-width=
"1.5"
/>
"130"
y1=
"175"
x2=
"100"
y2=
"170"
stroke=
""
stroke-width=
"1.5"
/>
"130"
y1=
"180"
x2=
"100"
y2=
"175"
stroke=
""
stroke-width=
"1.5"
/>
"170"
y1=
"170"
x2=
"200"
y2=
"165"
stroke=
""
stroke-width=
"1.5"
/>
"170"
y1=
"175"
x2=
"200"
y2=
"170"
stroke=
""
stroke-width=
"1.5"
/>
"170"
y1=
"180"
x2=
"200"
y2=
"175"
stroke=
""
stroke-width=
"1.5"
/>
"M150,190 C120,210 80,230 70,270 C60,310 80,350 120,370 C160,390 200,370 220,330 C240,290 230,250 210,220 C190,190 170,180 150,190 Z"
fill=
""
/>
"M120,290 L100,320 L110,340 L130,320 Z"
fill=
""
/>
"M180,290 L200,320 L190,340 L170,320 Z"
fill=
""
/>
"M220,330 L240,360 L230,380 L210,360 Z"
fill=
""
/>
"M160,330 L140,360 L150,380 L170,360 Z"
fill=
""
/>
"M220,330 C250,320 270,300 260,270 C250,240 230,230 210,240 C190,250 180,270 190,290 C200,310 220,320 220,330 Z"
fill=
""
/>
"100"
cy=
"325"
r=
"5"
fill=
""
/>
"110"
cy=
"345"
r=
"5"
fill=
""
/>
"130"
cy=
"325"
r=
"5"
fill=
""
/>
"140"
cy=
"345"
r=
"5"
fill=
""
/>
"160"
cy=
"325"
r=
"5"
fill=
""
/>
"170"
cy=
"345"
r=
"5"
fill=
""
/>
"200"
cy=
"325"
r=
"5"
fill=
""
/>
"210"
cy=
"345"
r=
"5"
fill=
""
/>
"230"
cy=
"325"
r=
"5"
fill=
""
/>
"240"
cy=
"345"
r=
"5"
fill=
""
/>
"260"
cy=
"325"
r=
"5"
fill=
""
/>
"270"
cy=
"345"
r=
"5"
fill=
""
/>
"M150,100 L120,80"
stroke=
""
stroke-width=
"2"
stroke-dasharray=
"5,3"
/>
"M150,100 L180,80"
stroke=
""
stroke-width=
"2"
stroke-dasharray=
"5,3"
/>
"M150,190 L120,290"
stroke=
""
stroke-width=
"2"
stroke-dasharray=
"5,3"
/>
"M150,190 L180,290"
stroke=
""
stroke-width=
"2"
stroke-dasharray=
"5,3"
/>
"M150,190 L220,330"
stroke=
""
stroke-width=
"2"
stroke-dasharray=
"5,3"
/>
"M150,190 L160,330"
stroke=
""
stroke-width=
"2"
stroke-dasharray=
"5,3"
/>
"description"> 这只"highlight">毕加索风格的橘猫采用了立体主义的几何形状和鲜明的色彩对比,展现了艺术与自然的完美结合。通过简化的形状和抽象的线条,捕捉了猫咪的优雅姿态和独特个性。
vibe coding 2:svg 绘制深圳夜景vibe coding prompt:用SVG画一张深圳夜景配图,包含建筑剪影和霓虹灯带,视觉主色调明确为深蓝 (背景)与霓虹粉 (点缀/光效)
"zh-CN">
"UTF-8">
"viewport" content="width=device-width, initial-scale=1.0"> 深圳夜景
"container"
>
深圳夜景
"svg-container"
>
"800"
height=
"500"
viewBox=
"0 0 800 500"
>
"800"
height=
"500"
fill=
""
/>
"M0,300 Q100,250 200,280 T400,270 T600,290 T800,300 L800,500 L0,500 Z"
fill=
""
/>
"0"
y=
"450"
width=
"800"
height=
"50"
fill=
""
/>
"buildings"
>
"50"
y=
"200"
width=
"40"
height=
"150"
fill=
""
/>
"90"
y=
"180"
width=
"35"
height=
"170"
fill=
""
/>
"135"
y=
"220"
width=
"30"
height=
"130"
fill=
""
/>
"175"
y=
"190"
width=
"40"
height=
"160"
fill=
""
/>
"225"
y=
"210"
width=
"35"
height=
"140"
fill=
""
/>
"300"
y=
"150"
width=
"60"
height=
"200"
fill=
""
/>
"360"
y=
"120"
width=
"70"
height=
"230"
fill=
""
/>
"440"
y=
"160"
width=
"50"
height=
"190"
fill=
""
/>
"490"
y=
"140"
width=
"65"
height=
"210"
fill=
""
/>
"565"
y=
"170"
width=
"55"
height=
"180"
fill=
""
/>
"650"
y=
"200"
width=
"40"
height=
"150"
fill=
""
/>
"695"
y=
"180"
width=
"35"
height=
"170"
fill=
""
/>
"735"
y=
"220"
width=
"30"
height=
"130"
fill=
""
/>
"775"
y=
"190"
width=
"40"
height=
"160"
fill=
""
/>
"825"
y=
"210"
width=
"35"
height=
"140"
fill=
""
/>
"neon-lights"
>
"50"
y=
"200"
width=
"40"
height=
"5"
fill=
""
class=
"neon-light"
/>
"90"
y=
"180"
width=
"35"
height=
"5"
fill=
""
class=
"neon-light"
/>
"135"
y=
"220"
width=
"30"
height=
"5"
fill=
""
class=
"neon-light"
/>
"175"
y=
"190"
width=
"40"
height=
"5"
fill=
""
class=
"neon-light"
/>
"225"
y=
"210"
width=
"35"
height=
"5"
fill=
""
class=
"neon-light"
/>
"300"
y=
"150"
width=
"60"
height=
"5"
fill=
""
class=
"neon-light"
/>
"360"
y=
"120"
width=
"70"
height=
"5"
fill=
""
class=
"neon-light"
/>
"440"
y=
"160"
width=
"50"
height=
"5"
fill=
""
class=
"neon-light"
/>
"490"
y=
"140"
width=
"65"
height=
"5"
fill=
""
class=
"neon-light"
/>
"565"
y=
"170"
width=
"55"
height=
"5"
fill=
""
class=
"neon-light"
/>
"650"
y=
"200"
width=
"40"
height=
"5"
fill=
""
class=
"neon-light"
/>
"695"
y=
"180"
width=
"35"
height=
"5"
fill=
""
class=
"neon-light"
/>
"735"
y=
"220"
width=
"30"
height=
"5"
fill=
""
class=
"neon-light"
/>
"775"
y=
"190"
width=
"40"
height=
"5"
fill=
""
class=
"neon-light"
/>
"825"
y=
"210"
width=
"35"
height=
"5"
fill=
""
class=
"neon-light"
/>
"M100,250 Q150,200 200,250 T300,200 T400,250 T500,200 T600,250 T700,200 T800,250"
fill=
"none"
stroke=
""
stroke-width=
"3"
class=
"neon-light"
/>
"150"
cy=
"180"
r=
"3"
fill=
""
class=
"neon-light"
>
"
class=
"neon-light"
>
"
class=
"neon-light"
>
"
class=
"neon-light"
>
"
class=
"neon-light"
>
"
class=
"neon-light"
>
"
class=
"neon-light"
>
"
/>
"685"
cy=
"65"
r=
"15"
fill=
""
/>
vibe coding 3:武松打虎 webvibe coding prompt:请生成一个单文件 HTML 页面,主题:武松打虎。页面需包含:标题、简介段落、一段描写打虎场景的正文、至少一张配图(可用占位图 URL),并用干净的 CSS 美化页面(响应式)。输出完整的 HTML 文件源码。
"zh-CN">
"UTF-8">
"viewport" content="width=device-width, initial-scale=1.0"> 武松打虎 - 水浒传经典故事
武松打虎
"subtitle">水浒传经典故事之一
"container"
>
"intro"
>
故事简介
《武松打虎》是中国古典四大名著之一《水浒传》中的经典章节,讲述了武松在景阳冈上与一只猛虎搏斗并最终将其击毙的英勇事迹。这一故事不仅展现了武松的勇猛无畏,也体现了中国传统文化中"义薄云天"的侠义精神。
武松原是山东清河县人,因杀死杀兄仇人西门庆而被迫逃亡,途经景阳冈时遭遇猛虎。在酒醉状态下,他凭借过人的勇气和武艺,与老虎展开殊死搏斗,最终成功将其击毙,成为民间传颂的英雄人物。
"story"
>
故事正文
话说武松在孟州牢城营做了三年牢,后来被释放,前往东京投奔哥哥武大郎。路经山东阳谷县境内的景阳冈时,已是黄昏时分。武松走得口渴难耐,见路边有一家酒店,便进去喝酒。
店家见武松生得壮实,便劝他多饮几杯。武松本就性情豪爽,又加上连日赶路劳累,便喝了十八碗烈酒。酒酣耳热之际,店家告诉他前方有一条景阳冈,上面有一只吃人的吊睛白额大虫,劝他不要独自前往。
武松却不以为然,认为自己身强力壮,何惧猛虎?他拍案叫道:"你这厮休要危言耸听!若真有那畜生,我必教他知道爷爷的手段!"说罢,提起行李,摇摇晃晃地向景阳冈走去。
刚上冈不远,忽听得树林中风声飒飒,草木簌簌。武松定睛看时,只见一只斑斓猛虎从林中窜出,直扑过来。武松虽然酒醉,但见到猛虎,酒醒了一半,急忙抽出朴刀迎战。
那老虎扑到近前,武松举刀砍去,却被老虎躲过。老虎反身一扑,武松侧身闪避,与老虎扭打在一起。两人(虎)缠斗良久,武松渐渐觉得力气不支,心想:"今日若死在此处,岂不冤枉!"便奋力挣脱,滚到一旁。
武松见老虎扑空,立即翻身跃起,趁老虎回头之际,一刀砍在老虎颈上。老虎吃痛,转身再扑。武松又是一刀,这次砍中老虎前腿。老虎吃痛,怒吼连连,再次扑来。
武松见老虎伤势严重,知道它已是强弩之末,便不再躲闪,挺刀直刺。这一刀正中老虎心窝,老虎发出一声惨嚎,倒地而死。武松取出老虎眼珠吞下,又割下老虎皮毛,带着尸体回到阳谷县,献给县太爷。
县太爷闻讯亲自前来查看,见果然是一只猛虎,便命人将武松送回孟州牢城营。武松因此事迹传扬开来,声名大振,后来更是成为梁山好汉之一。
"image-section"
>
"https://images.unsplash.com/photo-1578662996442-48f60103fc96?ixlib=rb-1.2.1&auto=format&fit=crop&w=800&q=80" alt="武松打虎场景">
"image-caption">武松与老虎搏斗的经典场景
© 2023 中国古典文学故事 | 《水浒传》经典篇章
----- END -----
wisemodel相关:
系列模型:
关于wisemodel更多
1
欢迎持续关注和支持
开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。
2
欢迎加盟wisemodel开源社区
始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn
3
欢迎投稿优质内容
欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。
4
关于wisemodel开源社区
始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。
向上滑动查看
热门跟贴