全球还有数亿学生连不上稳定的网络,却已经被挡在AI教育门外。

付费订阅、云端依赖、隐私顾虑——这些问题叠加在一起,让AI辅助学习成了特权而非普惠工具。一位开发者决定动手解决:如果AI能完全离线运行,教育公平会不会不一样?

打开网易新闻 查看精彩图片

这个念头最终变成了EduGemma,一个基于Gemma 4的本地化AI学习助手。

打开网易新闻 查看精彩图片

它到底能做什么?

上传PDF教材、向文档提问、生成复习笔记——全部在本地完成,不需要调用任何远程API。学生可以在飞机上、偏远地区、或者单纯不想把数据交给云端的场景下使用。

核心功能清单很直接:文档解析、问答交互、摘要生成、本地推理。没有花哨的噱头,就是解决"没网也能学"这个硬需求。

为什么选Gemma 4?

选型阶段有四个硬性指标:本地可运行、具备教育推理能力、支持长上下文、能在消费级硬件上高效工作。Gemma 4四项全中。

通过Ollama框架本地部署,EduGemma实现了零网络依赖。这意味着零API成本、完整的数据隐私、以及对硬件配置一般的学生的包容性——Gemma家族的小参数版本让旧笔记本也能跑得动。

教育场景的特殊性在于文档体量。学生上传的往往是整章教材、研究论文、课堂讲义,上下文窗口不够大就直接废掉。Gemma的长文本处理能力让"基于文档的学习"从概念变成可用功能。

打开网易新闻 查看精彩图片

技术架构拆解

前端用React+Vite+Tailwind,后端FastAPI,AI层Ollama+Gemma 4,文档处理靠pdfplumber和PyMuPDF,检索系统用ChromaDB配sentence-transformers。

关键设计是RAG(检索增强生成)流程。不是把整份PDF塞进模型,而是先提取文本、分块、生成向量嵌入、做相似性搜索,最后只把最相关的片段喂给Gemma生成回答。这一步直接决定了响应速度和回答质量。

完整链路:PDF上传→文本提取→分块→嵌入生成→相似性搜索→检索相关上下文→Gemma生成回复。

下一步:多模态

开发者特别提到了一个兴奋点——图表解释、图像理解、手写笔记识别、可视化辅导。Gemma 4的架构为这类多模态扩展留了空间,这是EduGemma的演进方向。

整个项目的逻辑很清晰:先解决"能离线用"这个基础问题,再逐步叠加能力。在AI教育产品扎堆卷云端功能的当下,反其道而行做本地化,反而切中了一批被忽视的真实用户。