嗅态

嗅产业冷暖,书人文姿态

打开网易新闻 查看精彩图片

作者 | 石灿

5月15日下午,见到张洪申时,他已经在浙江大学玉泉校区南门等候。

我们一边往校园里走,他一边介绍接下来的行程:“我先带您看一下这台机器,了解一下它大概长什么样、怎么工作。看完之后,我们再找个地方坐下来,慢慢聊。要是您方便,我也可以带您在浙大这边转一圈,顺便一起吃个饭。”

张洪申说完这些安排,我心里冒出一个念头:真让人踏实。

转瞬之间,他指着旁边的教学楼,把我的思绪拉了回来。

“这是浙大比较老的一个校区,1950年代就有了,所以树很高,楼看起来也有些旧。”他说。我们行走的一带属于控制科学与工程学院,杭州本土不少知名的硬核科技公司都发源自于此。

打开网易新闻 查看精彩图片

△张洪申自拍照

由于张洪申准备搬离学校,原本放在校内的全自动批改机已经移走,他只能带我前往工控新楼打印店进行功能演示。我们走下楼梯,来到教学楼内的一家打印店。他和老板熟络地打了声招呼,便坐到电脑前。我站在一旁,看着他在键盘上敲出“喵喵汪汪”公司的网址——这是他的创业项目,也是全自动作业批改机的后台系统。

这台批改机依托AI大模型,能够将纸质试卷上的学生手写痕迹精准识别并转化为文本,再与录入的标准答案进行比对,实现全题型自动批改。目前,其整体准确率达到99.7%,单张纸的综合打印成本仅为5分钱。

4月底,杭州市上城区把多款同类型机器进行统一测试,该项目在准确率与使用体验上均名列第一。与此同时,张洪申的项目也已经与钉钉展开深度合作,通过更大的平台,连接起了全国近300所学校

技术进入校园,印记留在一张张试卷上。它不一定能立刻改变教育的整体面貌,但,可以先替一位疲惫的老师省下一节课的时间、一支消耗的红笔,以及一叠需要反复翻看的试卷。

“我登录后台,给你看一下。”张洪申说着,把手指向了屏幕。

打开网易新闻 查看精彩图片

张洪申看我站着,拉过一把黑色椅子示意我凑近,屏幕上显示出“喵喵汪汪”公司的管理工作台。屏幕最上面排满了学校的名字,张洪申指着屏幕说,系统目前已经服务了290多个学校账号,当天的活跃学校有70多个。所谓的活跃学校,是指当天使用自动作业批改机的学校。

设备能不能进学校,决定权通常在校长手里。一线教师未必能决定采购,却最先感受到批改作业的负担。自动作业批改机切中的,正是这个日常痛点。

后台显示,5月14日晚上10点25分,仍有老师在线使用设备。那位老师花了8分钟批完一套试卷。张洪申看着后台数据,开玩笑说:“这老师简直疯了。”

张洪申从后台调出一份已经批改完的试卷,以向我展示大模型批量做题的逻辑。

打开网易新闻 查看精彩图片

△这是一张来自湖北某小学的试卷,这张试卷是老师写好答案的答案卷

被他选中的试卷来自湖北省武昌某小学,2025-2026学年度下学期五年级数学素养练习题答题卡,试卷答题区域已经布满手写痕迹,共四名学生的四张试卷和一张答案卷。张洪申选择的样卷包含了大量复杂的题型,这也是他们与传统厂商拉开差异的核心。

传统厂商的扫描批改通常不处理画图题、旋转题或者分数的涂色题,因为学生涂色和画图的方向千奇百怪,情况太复杂。张洪申推翻原本的OCR(光学字符识别)逻辑,依靠大模型的识别能力,无论是左边涂、右边涂,还是任意角度的作图,系统都能精准识别。

张洪申在电脑点击打印,打印机在我们旁边发出规律的轰鸣声,随即吐出温热的A3试卷。他拿着试卷坐回电脑前,向我演示后台的工作流。他强调,如果AI的准确率没有达到极高程度,全自动的盲批反倒会变成用户的核对负担。所以,他们开发了一套人机协同的分块系统。

老师使用自动作业批改机前,要自己做一份标注有正确答案的试卷。当答案卷被扫描进后台后,系统会自动框出大致的题目区域。由于系统做到了极高程度的优化,他们的后台工作人员只需要用鼠标在屏幕上画几个大框,AI就会全自动解析出框内包含的题目、手写笔记位置以及对应分值。

为了减少大语言模型偶尔出现的幻觉和识别错误,张洪申在系统底层加入了双模型校验机制。第一套模型先识别学生答案,并给出批改结果。随后,系统会把识别出来的内容交给第二套模型,在后台重新批改一遍。两套模型的结果完全一致时,工作台显示无报错;只要中间出现一处不同,系统就会立刻用红字提示异常,提醒人工介入修改。

讲述完批改试卷的底层逻辑,张洪申将几份样卷和答案卷一起放入打印机里。他告诉我,只要把答案卷放在第一页,学生卷叠在后面,老师只要按两下按钮,扫描出来的数据就会直接进入这个基于大模型的SaaS后台。

他说,传统大厂依赖自身的OCR历史积累,需要老师在机器界面上依次选择年级、班级、作业类型并逐页上传。他没有历史技术积累,反而全面拥抱最新的大模型技术。

大模型在处理高难度新题时,无法保证百分之百准确。但在批量处理重复性任务时,它的稳定性反而更强。试卷批改本质上就是一件重复劳动:拿同一份答案,对照全班四十几个学生的卷子,把同一套判断标准反复用上几十遍,甚至几百遍。

因此,这台机器的底层运作逻辑落回到最简单的动作上:答案对比。

在试卷批改环节,系统还解决了一个物理层面的难题:扫描偏差。由于纸张裁剪和机器吸纸的物理原因,扫描出来的图像往往会有几毫米的上下左右偏移。

张洪申在屏幕上向我展示了一项动态追踪技术的过程。他的鼠标在屏幕上切换之间,一个红色的批改框就像长了眼睛一样,死死咬住“选择题”等字样的文本下沿,字往上走,框也跟着往上走,确保批改痕迹不会印错位置。

没一会儿,纸张唰唰滑出,作业批改完毕,最上面出来的是一张精心设计过的教师端统计报告。上面清晰地印着平均分、班级日期、分数段人数,以及每道题目的全班正确率。

张洪申说,老师是很排斥在手机或电脑软件里看复杂的长篇图表报告的,他们需要的就是直观。这张纸上用红字写着某条选择题正确率只有20%,老师一眼就知道这道题需要上课重点讲。

在统计报告下面,则是带有红蓝色勾叉痕迹的学生原卷。所有的分数登记和知识点对错,已经在机器运转的十分钟内,全部自动沉淀进了系统后台。

更重要的是,由于该小学在使用钉钉,张洪申的产品直接跟钉钉后台的学号与姓名匹配系统打通。学生往往把名字写得像天书一样,连老师都看不懂,但系统通过手写学号自动识别出这个孩子是谁,并将这份涵盖了错题、分值和知识点分布的完整批改报告,一把推送到家长的手机端。

“说实在的,孩子做了那么多题,到底哪里掌握得好,哪里掌握得不好,很多时候家长说不清楚,老师也很难一下说清楚,孩子自己也未必知道。但有了数据之后,至少就能分析了。”张洪申说完,用手抹去额头的汗水。

打开网易新闻 查看精彩图片

缘起

张洪申发明自动批改作业机的源头,要追溯到2019年。那年9月,张洪申已经获得直博名额,空闲时间太多,他担任起浙江大学公共数学课助教。

每个星期五下午,各班课代表会将120多份手写作业堆在助教办公室的书桌上,张洪申需要负责批改这些线性代数作业。

改一份作业需要5到10分钟。流程分为四步:第一步,翻开作业本,核对最终答案;第二步,若答案错误,从第一行公式开始,逐行检查推导步骤,找出扣分点;第三步,若答案正确,仍需抽查中间过程,确认是否存在逻辑漏洞;第四步,用红钢笔写出错误步骤和原因。

每个周末,张洪申从早上9点坐在书桌前,连续工作到凌晨。扣除吃饭时间,他需要连续改作业15个小时。连续批改数小时后,他眼睛发酸,速度减慢。

“如果助教希望帮助每一个学生识别他过程中的任何错误,这需要花费大量的时间处理一份作业。一个助教需要面对上百名学生,对于老师和助教来说是一件无法完成的任务。”他说。

大一在竺可桢学院的求学经历,让张洪申对“作业本必须留痕”产生了一种执念。创办产品时,张洪申特意将这个修改作业的习惯嵌入其中。

批改作业长期被视为教师工作的自然组成部分,却很少被真正量化计算。张洪申想解决的,正是这部分被默认存在、却长期缺少支撑的劳动。而“留痕”,就是让这些劳动被看见的切口。

当年是20多人的小班教学,线性代数老师是70多岁的尹永成教授。尹永成坚持亲自批改每个学生的作业,在错误步骤旁画出标记,写下批注。张洪申坐在台下,看着作业本上的红字,学得格外卖力。尹永成的红笔痕迹,自此成为张洪申心里教学反馈的参照标准。

打开网易新闻 查看精彩图片

△张洪申批改作业时留下的批注 图源“浙大发布”

另一段执念来自2013年。张洪申在上海延安中学读高中,学校引入英语答题卡机,试卷塞进去,机器一秒钟吐出分数,但卡面上没有修改痕迹。发回卷子,张洪申看着空白的卡,不知道自己错在哪,只能对照黑板重新比对。那种空白,打击了他的学习积极性。

“我就想做一个产品,在修改作业时,可以留痕迹,让学生知道哪个题目错了,错在哪里了,把老师的想法直接打印在答题卡上或者卷子上。如此一来,至少比空白的纸张更加照顾学生的感受。”张洪申说,“所以,我的产品是从学生角度出发的,要温柔且公正地对待学生的付出,回应他们做作业的努力。”

在一路高歌猛进的学术体制里,尹永成教授的红笔痕迹构成了张洪申最初的智力审美与教学参照。这种少见的、带有温情主义的底色,恰恰需要硬核的技术与冷酷的现实感去承载。他不想讲改变教育的宏大故事,只是想用技术去解构那15个小时的肉身痛苦。

2022年12月,张洪申在美国麻省理工学院念计算机博士的朋友发来消息,让他尝试刚发布的GPT-3.5。大模型的逻辑推导能力,启发了他。

他开始在电脑上建立测试系统。2023年9月,团队已经打造出一款AI修改作业的软件系统。

“我们支持最新的文心一言以及ChatGPT等模型,老师需要提前输入题目以及正确答案。大语言模型通过比较学生的步骤与正确答案之间的差异,告诉学生,具体的问题出现在哪里。”张洪申说,“具体来说,老师需要上传每一位学生的作业的图片或者扫描件。我们通过OCR将其转化为文字,通过大语言模型比较答案,具体指出学生的错误步骤是哪一步,同时评价学生的作业过程。”

张洪申决定把这个想法做成产品,并取名为“SolveGPT”。他通过浙大校内论坛认识了一位计算机学院硕士,邀请对方加入,负责底层代码开发,自己则承担算法逻辑调优和产品推进。

目前,团队核心成员共有4人:一名计算机学院硕士负责技术开发,一名成员兼顾财务与运营,一名成员负责日常运营,以及张洪申。团队采取异地线上协同办公。对于实习生,张洪申给出的薪资是每天600元。

“我不想亏待一起干活的人,要给就给到位。”他说。

这种极度坦白的高用人成本,反过来倒逼着这个高智商团队用AI去压榨出极限的人效。在张洪申的脑子里,感性的执念与理性的账本并行不悖,他把小公司的生存逻辑算得清清楚楚。

他点开每天更新后台系统的飞书文档。那是一份密密麻麻的协同更新日志,每天记录着七到八条优化内容,老师会给他们反馈意见,运营人员也会直接与学校对接。

他用鼠标滑动屏幕上的更新条目:“分数识别支持双击”“连线题图像增强参数调整”......每项问题解决后都被打上划掉的横线标记,写明负责人的名字。因为协同内容过多,在电脑上按动快捷键,甚至会导致系统卡顿。

张洪申盯着那份一时间拉不到底的协同日志,语气里有一种理工科特有的通透与务实:“我们小公司没什么钱,所以会把人效压得很高。让AI把整个系统全做了,那是不现实的。”

打开网易新闻 查看精彩图片

落地

2023年5月,为了寻找客观的外部检验,避免闭门造车,张洪申决定带项目参加黑客松比赛。

他手头有两个项目,一个是AI讲题,一个是自动作业批改机。比赛在7月开始,他在现场负责路演与故事陈述。在打比赛的过程中,他展现出一种极具数据清醒的现实感,通过评委的反馈和名次变化,快速识别项目的商业化可能。当发现AI讲题项目留存率低、难以收费后,他毫不自我感动,果断放弃,将全部精力转向有刚需的作业批改机项目。

2023年底,张洪申结束黑客松比赛,决定向学校免费派发自动作业批改机系统。但是,,他在杭州本地缺乏学校渠道。

直到2024年3月,张洪申在B站和小红书上发布产品演示视频,广东佛山的一位学校老师主动联系上他,并表示愿意在班级里试用这套软硬结合的系统。

“我们部署设备的第一所学校在广东佛山。现在回头想,这件事其实挺疯的。”张洪申说。一个在杭州、在浙大做项目的人,跨越一千多公里去跑佛山的学校落地,前期的沟通和硬件部署都极为折腾,但他还是硬着头皮把第一台机器放到学校去了。

打开网易新闻 查看精彩图片

△这台机器还可以实时生成班级、年级成绩趋势图与知识点热力图。数据可视化让教学管理更科学、更直观

自第一台设备安装落地后,团队陆续向全国多地的试点学校赠送打印机等硬件,连后续产生的墨水耗材、打印机租赁费用也由团队自垫资金承担。每进一所学校,团队一年平均硬性亏损1.5万元。这种在外人看来难以承受的“纯投入”,在他技术派的账本里,却是一笔极其划算的原始数据积累。

中小学之外,张洪申还将系统接入了浙江大学本校的公共课。从2024年12月开始,每学期有大几千人选修的浙大线性代数课程,其期末考试卷子全部导入他的系统进行AI批卷试点。他的本科导师提供了项目经费,支持他在真实的线性代数公共课场景中,一边运行系统一边调试代码。

这种学术体制给予他的隐形安全感,帮他构筑了坚固的试错防护网。因为,有了学校场景作为大后方,他带着团队攻克了网络防火墙限制,并不断调整哪些题型能批改、哪些题型不能批改的专业率,优化了软硬一体化的操作体验。

他把理工科的执拗全部用在了死磕数据上。团队在后台建立了一套专门针对困难、涂改题目的数据集,按月维度强行更新,通过不断捞取错题重新训练,硬生生将系统的整体准确率拱到了99.7%,单张纸的综合打印成本压到了5分钱。

产品在广东和杭州本地试点磨顺之后,规模化进校的渠道壁垒依然卡在眼前。在面向学校的ToB生意里,光靠产品本身很难推开校长的办公室大门。2024年12月,张洪申参加杭创(人工智能)营举办的一场创业比赛,拿到了10万块钱奖金。

“钱当然重要,但更重要的是,比赛之后,他们那边的负责人对我们这个项目很认可,而且是真正愿意花力气帮忙。他们给我们介绍了两所很不错的学校——一个是杭州市崇文未来学校,一个是杭州市建兰中学——把我们的产品引进去。”张洪申说。

“学校这个场景,没有人把你介绍进去,没有一个有信用的人替你站一站,这件事根本展开不了。”他说。

在这里,他身上那种缺乏圆滑、极度坦白的理工科现实感,反而帮他过滤掉了多余的社交内耗。他不指望靠酒桌文化打开校门,而是靠着杭创(人工智能)营负责人在线下跑了三四次、用平台信用为其背书赢来的机会,直接用硬核的产品去对撞标杆学校的真实反馈。

作业自动批改机在崇文和建兰跑通后,立即在杭州教育圈发挥出带动效应,机器开始一台台铺设出去。

更大的市场转折发生在几个月后。2025年11月,在余杭区举办的“智创未来”创业比赛中,张洪申的参赛项目再次脱颖而出。钉钉CTO朱鸿看中了张洪申的方案,并当场给出了两所完全陌生的学校作为考核,要求他在一个月内把产品用起来。

这种近乎苛刻的临场“对赌”,恰好撞上了张洪申那种冷酷、精准的理工科底色。他不要面子,也不讲故事,他只用数据说话。

“他们不会花很多力气听你讲故事,或者反复讨论你这个项目到底行不行。他们更关心的是,你在学校里到底用得怎么样。学校用得好,这件事比你讲什么都更有说服力。”张洪申说。

“后来,那两所学校的使用效果非常好。”张洪申补充道,“好到什么程度呢?不到一个月,全校都用起来了,真的很夸张。每天从早批到晚,而且是在我们和老师没有做什么额外沟通的情况下发生的。”

打开网易新闻 查看精彩图片

△张洪申团队与钉钉合作后的AI作业速改机 图源钉钉教育

他用一个月内全校自发用起来的事实,去回应了大厂CTO的质检,最终跨入大厂的信用门槛。从此,钉钉才真正和他们全面合作,项目正式接入钉钉的教育组织体系。

“大厂不会花时间听你讲故事,他们只看你在学校里到底用得怎么样。”张洪申看着那套和钉钉全面打通的后台,神色坦荡地做出了总结,“学校用得好、每天从早批到晚,这件事比你讲什么都更有说服力。”

打开网易新闻 查看精彩图片

环境

张洪申能把这台机器做出来,离不开杭州提供的协作网络。在这个由高校、大厂、孵化器与政策交织的生态里,他的技术想法被推向了市场。

他对于在杭州创业的体感,首先来自于浙大控制学院这个大后方。这里是外界眼中的“智能天团”,同门中有人通过做项目实现了财务自由。

“他们能搞出来,我也得搞一搞。我不觉得自己比他们差,那我也想亲自下场,做一件属于自己的事情。”他说。

在这个环境里,他获得了最初的技术参照系,并在本科导师的经费资助下完成了早期的系统试点。导师之所以愿意自掏腰包支持,主观上出于对门下学生研发能力的信任与爱护,客观上,则是因为浙大公共课本身就面临着上千人手写卷子无人批改、极其消耗助教精力的现实痛点。

作为一名在学术体制里一路走来的博士生,张洪申身上缺乏传统商人的圆滑。顶级名校的学术大后方不仅给了他技术的底气,也提前为他垫付了最高的“信用首付”,给予了他一种“进可攻、退可守”的安全感。

因为拥有这种技术精英特有的隐形资产,他得以免去了很多初涉商海者常有的精神内耗。他不屑于伪装,更不需要用宏大的教育情怀来包装创业动机,取而代之的,是一种近乎执拗的理工科务实与极度坦白的商业现实感。

谈及生存和发展,他态度坦率:“创业如果不为了钱,那是没意思。都扯犊子。”

1997年,张洪申出生在上海,早年家里的住房空间狭小。因此,他从不避讳谈论赚钱的动机,他的短期目标非常明确,就是想通过创业赚钱买一套宽敞的房子。他觉得这是一种非常正常且合理的个人诉求,没什么不好承认的。

在这种现实感驱使下,他把所有的精力都死死按在算盘上,用极具账面意识的眼光去打这场资金拉锯战。团队每个月面临接近10万元的固定开支,而实际到手的月收入只有一两万元,剩下的全靠自垫资金维持运转。

“说白了,就是在亏,几乎没怎么真正赚过钱。”他说。

但,他对这个项目的资产评估有着一套属于技术派的期望值算法。他认为,赚钱要看长期的预期概率,只要数学期望是正的,就值得继续往里投。他把公司直接丢进市场的尺子里去衡量,看它作为一个独立项目的整体价值在往哪走。

在这种冷酷又精密的数学预期下,现实中每月亏损十万的财务拉锯,被他抽象成了一道纯粹的逻辑题。那些传统商业社会里长袖善舞的规则,在他这里被强行格式化了,他身上的那种“学生气”因为有了技术撑腰,变成了一种极具降维打击感的笃定。

离开校门后,大厂的基础设施则成了他“借网捕鱼”的通路。他不与大厂抢夺平台和流量,而是直接挂载在钉钉的底层组织体系上。大厂筑好了路,他的产品作为底层入口切进去,解决了AI无法识别手写模糊名字的痛点。

而规模化进校的渠道壁垒,则是靠杭州本地的孵化器网络帮他打通的。ToB的学校场景极具特殊性,学校在客观上对外部技术团队设有极高的信用准入门槛,校长通常不愿冒风险去尝试没有背景的产品。

创业期间,杭州政府的办事速度也嵌入了他对这片生态的认知里,尤其是余杭区。

在日常接触中,许多支持创业的政策需要走完漫长流程。正常情况下,奖金、补贴或项目支持资金在两个月左右到账,已经属于较快的速度。但有一次,余杭区政府在三天之内就把一笔项目支持资金全部打到了团队的账户上。

“真的特别猛。这个事情对我冲击很大。”他说。许多机构在口头上表达对创业的支持与服务,但真正落实到具体的执行层面时,速度决定了一切。

“你流程越快,企业就越能感受到这套支持不是挂在墙上的。”他说。这笔资金的快速到账,让他直接体会到了本地政府执行层面的高效率。

但他没有把这门效率绝对化,而是将其视为一种相对的优势。在其看来,这种相对更高的行政效率,对处于成长期的创业公司而言已经足够重要。

“这意味着你在这里更容易活下来,更容易把事情往前推一步。”他说。