作者|杨文
来源|AI先锋官
先锋官有话说:
产品名称:阿里通义千问
总体评价:★★★★☆
易用性:★★★★☆
功能性:★★★☆☆
创新性:★★★★☆
推荐功能:长文本处理
国产大模型卷完参数,又卷起了长文本。
还记得咱们之前评测过的Kimi吗?(详细内容请移步:)
2023年10月,大模型初创公司月之暗面推出了这款大模型应用——Kimi,与其他大模型相比,Kimi主打长文本。
3月18日,月之暗面宣布Kimi智能助手开始200万字内测。消息一出,A股市场炸出一堆Kimi概念股,尤其是3月22日,华策影视、中广天择、慈文传媒纷纷涨停,掌阅科技还拿下三连板。
大模型初创公司月之暗面着实火了一把。
Kimi不仅让股市应声而动,还引燃了AI大厂们的“内卷”热情:
3月22日,阿里通义千问向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。
同日,百度文心一言计划下个月进行版本升级,长文本能力在200万-500万。
3月23日,360智脑宣布,正式内测500万字长文本处理功能,即将入驻360 AI浏览器。
小编本想让Kimi和通义千问PK一下,可遗憾的是,小编还未通过内测申请,目前无法使用Kimi200万字长文本处理功能。
因此,今天咱们就先来瞅瞅阿里1000万字长文本的处理能力。
通义千问链接直达:
https://tongyi.aliyun.com/qianwen/?spm=5176.28326591.0.0.40f76ee1Ax4l3G
读《红楼梦》:故事梗概、细节全掌握
小编下载了一份《红楼梦》原著,共计731017字,然后将其上传至通义千问。
接下来,小编就开始花式提问。
例如,小编让它总结一下《红楼梦》第九十七回的主要内容。
《红楼梦》第九十七回是“林黛玉焚稿断痴情,薛宝钗出闺成大礼”,通义千问在完成阅读后,不仅很快将主要情节概括出来,还对此进行了一番解读,比如说“黛玉和宝玉之间的对话进一步展现两人深深的情感牵绊和对命运无奈的感慨”。
为了测试通义千问对长文本细节的把握,小编问了些《红楼梦》犄角旮旯里的问题。
例如,《红楼梦》最后一章中,贾政等人在哪里看到了光头赤脚、身披大红猩猩毡斗篷的贾宝玉?
通义千问的回答正确,并将前后的情节都进行了讲述,还点出“这次奇特相遇”的背后,呼应了整部小说关于“神瑛侍者”与“绛珠仙草”前世今生的故事线索。
小编继续追问,贾政和宝玉在毘陵驿相见,宝玉还未说话就被一僧一道搀走,他们口中唱的是什么?
通义千问再次回答正确,还解释了该诗歌描述的具体情境。
读《刑法》,仍会张冠李戴胡说八道
只会读《红楼梦》还不够,小编又上传了《中华人民共和国刑法》全文,共计60790个字。
接下来,通义千问需要化身“律师”应对各种提问。
例如,拐骗不满十四周岁的未成年人,脱离家庭或者监护人的,如何量刑?
通义千问阅读一番后表示,根据《刑法》第二百六十二条之一的规定,处五年以下有期徒刑或者拘役,并处罚金;若情节严重的,则处三年以上七年以下有期徒刑,并处罚金。
通义千问回答得对吗?
不完全对。
《刑法》第二百六十二条规定,拐骗不满十四周岁的未成年人,脱离家庭或者监护人的,处五年以下有期徒刑或拘役。
按照第二百六十二条之一规定,以暴力、胁迫手段组织残疾人或者不满十四周岁的未成年人乞讨的,处三年以下有期徒刑或者拘役,并处罚金;情节严重的,处三年以上七年以下有期徒刑,并处罚金。
也就是说,拐骗不满十四周岁的未成年人,脱离家庭或者监护人的,并不处罚金,只有以暴力、胁迫手段组织不满十四周岁得未成年人乞讨的,才处罚金。
因此,通义千问的回答是有“瑕疵”的。
小编虽然还无法使用Kimi的200万长文本处理功能,但20万字还是可以处理的。
于是,小编转头去问了Kimi,Kimi的回答如下:
Kimi虽回答正确,但它还说道“如果情节特别严重,可能受到更重的刑事处罚”,这个回答就有些含糊了。
小编又问:个人贪污数额在十万元以上的,如何量刑?
根据《刑法》第三百八十三条规定,个人贪污数额在十万元以上的,处十年以上有期徒刑或者无期徒刑,可以并处没收财产;情节特别严重的,处死刑,并处没收财产。
通义千问的回答:
Kimi的回答:
这次,俩大模型都回答正确。
总结
从易用性上来说,用户只需上传文件、输入问题,通义千问便能从长文本中筛选出相关信息,以简洁明了的方式呈现给用户。这种易用性使得用户在面对海量文本信息时,能够迅速获取所需答案,提高工作效率。
从创新型上来说,通义千问能够处理1000万长本文,直接干成了行业老大。不过值得思考的是,用户在日常生活中是否真的需要处理1000万字的文本?毕竟1000万字的文本实在是寥寥无几。
从功能性上来说,通义千问具备多样化的文本处理功能,如文本分类、情感分析、关键词提取等。这些功能可以帮助用户从不同角度对长文本进行分析,挖掘出有价值的信息。同时,通义千问还能够根据用户需求生成各类文本,如报告、摘要、评论等,满足用户在处理长文本时的多样化需求。
然而,通义千问在一些细节方面仍会出现幻觉,尤其是在法律条文的解读上,容易张冠李戴、模棱两可。
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
往期文章回顾
热门跟贴