马保国,何许人也?公开信息显示,他1952年出生于中国,具体籍贯不详,英国混元太极拳协会创始人,自称“浑元形意太极拳掌门人”,网友称其为“太极大师”。
马先生三年前与搏击教练王先生擂台PK,30秒被王先生击倒3次。之后在网络上连续回应输掉比赛的原因,录了一段乌青着眼睑的短视频,配上一句“年轻人不讲武德”,瞬间走红于网络。
先生的这段短视频,网友怎么看?
今日的数据,我们从B站名为《被封杀两年半的马保国传世经典 年轻人不讲武德》的短视频中,提取评论区网友的留言,从更大更广泛的范围内,观察总结网友对这件事的看法。
据本账号梳理,在2023年6月份,这条短视频的有效评论数量,达到了5000条以上。按照网络调查统计的标准,这样的数据量,可以客观反映网友们的整体看法。
在这些评论中,有一些评论的点赞量极高,达到了1万个赞以上,包括以下几条:
1,“原版已经不需要任何剪辑就已经超越所有鬼畜了”,4万多个赞;
2,“被打肿的眼睛加上无比自信的言语构成马保国的核心笑点,真是传世经典”,2万多个赞;
3,“十二月背的书我已经忘差不多了,这一段我听了开头就能背[辣眼睛]”,1万多个赞;
4,“实话实话,如果不是被封印,坤坤根本没有一战之力。”,1万多个赞,话说who is 坤坤?
5,“单口相声巅峰”,1万多个赞。
但这些高赞的评论,能代表网友们全部的看法吗?显然是不能的。所以,我们需要通过大数据的方法,来总结网友们整体的看法。
如果想了解人们对一件事的看法,看人们使用了哪些形容词,也能够非常直观地感受到基于语言的褒贬情况。
基于人工智能的自然语言处理(NLP)技术,我们可以从多达5千条评论中,轻松获取到评论所使用的形容词。
这5000条评论,共计12万字,要处理这么庞大的数据,单靠人工的难度极大。所以,这是一篇带有科技感的娱乐短文,走过路过,不妨留个关注。
我们使用词云图,将本条短视频中出现过的250多个形容词,按照不同形容词出现次数的多少,绘制在一张图表中。在图表中,形容词字体越大,表示出现的次数越多。
在这些评论中,滑稽是被提及次数最多的形容词,这便是无所不能的Emoji符号的中文称号,比如“万山千山总是情,胡说八道行不行[滑稽][滑稽][滑稽]”、“好自为之用四川方言说的话普通话观众听就是耗子尾汁[滑稽]”,“坊间传闻,国术精华,闪电五连鞭和坤拳派[滑稽][doge]”等。
语言是约定俗成的,原本没有任何含义的词,说得人多了,便成了文化含量极高的成语,比如“耗子尾汁”。
聪明是被提及的形容词中,出现第二高的,但网友关于这个词的评论,基本来自于视频的声音,由马先生亲自说出,大概是这样说的:“这位年轻人,耗子尾汁!好好反思,以后不要再犯这样的小聪明啊~!武林,要以和为贵,要讲武德,不要搞窝里斗!”
松动,是第三高频的形容词,在评论中,这个词与“封印”联系在一起,大概是这样说的:“马老师的封印松动了[疑惑][疑惑],貌似刚好封印两年半[疑惑]”,“要分出一部分力量封印坤流,导致混元形意太极门的封印松动了!”
嘴硬,则是第四高频词,比如“一代宗师,两次出战,挨了三拳,躺地四分,扬言连五鞭踢六腿,实际七拼八凑,被打得九死一生,依然十分嘴硬”,话说网友极其有才!
快乐,是第五高频词,“绝了,还得是你,我的快乐又回来了[打call]”,"马老师是快乐源泉"等,这与鲁迅先生笔下孔先生的名场面“引得众人都哄笑起来:店内外充满了快活的空气”有异曲同工之妙。
不错,出现频率也很高,“这身体已经不错了,70多岁了挨年轻人还是学搏击的一拳,第二天就生龙活虎,一般70岁感觉都没了”,这是对马先生极其正面的评价!
其余出现频率较高的词,还有厉害、不愧、嚣张、欢迎、最好等。
热门跟贴