这个世界,网友们总有办法在科技产品里找到欢乐。
比如,很久以来他们就发现百度识图、搜狗识图等工具能搜出惊人结果。
看看这两个“大发现”感受一下。
百度搜图认为PS5游戏机是四方形钻石彩色马桶。
百度识图认为某部日漫是赵本山小品。
是不是感觉匪夷所思?
一时间,你找不到两者的联系;几小时后,又觉得它们好像也有些关联(PS5的配色确实有点儿神似马桶)。
最后,你会心一笑,明白AI早已看透了一切。
这时候,识图工具调皮的一面清晰展现在世人面前。
01.
识图工具一般情况下是能够准确运行的。
当你往百度、搜狗的搜索栏里上传一张图片,它们迅速解开你的疑惑,告诉你这是什么花,什么树。
为此人们对它大加赞赏。
后来把它们用到动物识别上时,人们才明白过来,复制粘贴并不那么容易。
有网友用百度识图扫描了大熊猫的图片,结果软件把大熊猫识别成哈士奇。
其实问题很严重。
试想一下,大熊猫体制内的待遇被取消,它无法好吃懒做了,那还愿意当国宝吗?
这事搁谁谁也不乐意。
开心的唯有哈士奇,它将接受更多的万千宠爱。
狗狗占便宜也不是一次两次了。
某相机的AI照相把猫看作了狗。
换个角度也是如此。换个姿势也是如此。
换个品牌的手机也是如此。
视觉世界的复杂性由此清晰可见,一张图片中通常有百万个像素点,对于AI来说就存在大量会被像素修改而影响的特征,人类看不到,但是AI可能被干扰。
科学研究的结论也往往是积累经验,慢慢克服。
可这也带来一个问题。
既然猫狗之间的识别区分会成为难题,那么为什么更多的是把猫当狗,而不是把狗当猫。
要知道,后者的情况少之又少。
甚至比把猫咪识别成大熊猫的情况还少。
一言以蔽之,在AI的视角下,狗狗成了最大赢家,猫咪成了最大输家。
当然,识图工具也在制造动物界的其他矛盾。
在物种之间张冠李戴,算是一种地地道道的“body shame”了。
其实这还不是羞耻的。
有人在浴室里发现了一只虫子,爬行速度缓慢,可惜不知道它的学名。
于是,他用起了识图工具。
没想到,搜狗识图把虫子图识别成色情图片,并遮挡了它的肉体。
可想而知,这种生硬打码的方式让虫子特别难堪。
化用本山大叔在小品里的台词就是:
“丢不丢人啊,丢不丢虫啊,同行怎么看它?蚂蚱怎么看它?螳螂怎么看?蛐蛐怎么看?今后在文艺界怎么混?”
与之同等级伤害的,估计要算把人当做狗了。
02.
从植物识别到动物识别,AI迈了一步,但这步并不轻松。
而从动物识别再跨越至人物识别,挑战更多,这就意味着AI的表现更狂野。
如果说,AI把漂亮姐姐识别成朱一龙,把美丽女士识别成马云,算有些夸张了。
那么,把小女孩悲伤表情识别成杨颖,真的算非常离谱了。
我们很难找到其中的共同点的。
就像洋葱和塑料假花两个事物,你我又能从中看透什么呢?
而且这也不是单次的意外,有人用网页版刷出来的效果是这样,有人用百度App扫出来的效果也是如此。
那么我们就有理由怀疑,她们本质上都让人感到欲哭无泪,所以AI将她们捆绑在一起。
同样,把马保国识别成李小龙,算是调侃手法了。
同样,还有将赞多识别成小栗旬的。
还有将女演员识别成男演员任嘉伦的。
没有统一的标准,没有基本的规律,奇葩的识别效果呈现出来的一刻,人们无不捧腹大笑。
只要心放得够宽,便能迎接一大波的梦幻联动场面。
表情包、懒羊羊与韩国明星的三元联动。
嫪毐与西方绘画艺术的二元联动。
没有人的想象力能在这样的场面上把持得住。
试图去解开其中的逻辑关联,不啻去破解数学难题。
何苦呢?
而且,这还没完。
把狗狗当做杨幂,又是怎么回事?
或许是表情包的应用更容易让明星们增加粉丝数量。
所以如何营造更广泛的传播机制成了明星们关注的重要话题。
毕竟人的力量是有限的,智能机器的力量却是无穷尽的,于是,连语文课本封面被AI看成是蔡徐坤了。
到这个时候,之前很多关于智能识图的科学研究显得不太可靠了。
它们可以解读出猫狗识别的常见问题,却没有给这些问题提供答案上的启发。
我们只能寄希望于人为解读了,哪怕是过度解读。
比如,因为参加过《奔跑吧,兄弟》,因为对曼联足球队情有独钟,因为参加了很多运动公益活动,所以大数据下,“鹿晗”可能与“跑”标签存在关联。
但是直接将塑胶跑道认作是鹿晗本人,怎么看都有背后的推手在。
一个是物,一个是人,相隔了不少的物理界限。
或许只能说互联网帮助突破了想象的边界。
互联网深入千家万户后,粉丝期待自家明星在互联网上格外出圈,永不掉落出热榜。
他们频繁操作,为明星刷出流量来,因此那些图在AI看来有了一个标签,大量堆积的话,图就成为了明星本人。
哲学上来说,不过是明星的再次物化罢了。
如果是这样的逻辑的话,我们完全可以相信,在未来更强盛的流量明星机制下:
一张白纸可能暗示了某位一尘不染形象的明星;
一颗牛肉丸可能会被认作是某位扎过丸子头发型的明星;
一些圆圆圈圈的画可能被识别成会打球踢球的明星。
想想都有些刺激。
那么真的会这样吗?
03.
我试了试。
语文课文封面就是语文课文封面,马保国就是马保国,狗狗表情包就是表情包。
并没有大规模出现上述诡异场面。
即使测测新图也是如此。
从电视剧的截图,从比赛的抓拍里,AI都能将人物识别出来。
这时候,科技作为人身体的延长的功能就淋漓尽致地展现了出来。
因为人的身体是有局限性的,比如人眼辨认有时候不那么精准。
像雷军这样的老板,甚至能难倒一些新闻媒体工作者,让他们以为是周鸿祎。
但在AI的眼里,那就是分分钟的事。
而且,我能用多种方式识别出来。
估计是现在的技术越来越精确的原因。
上文的一些图能那么奇葩和搞笑,很大程度上是因为几年前的技术并不怎么完善,随着时间的沉淀,它们才越来越先进。
当然在我使用的过程中同样出现了一些小插曲。
比如人物识别里出现了土猪品种推荐。
比如“压力不大的从业者”下面的面相分析是“工作表现奋斗努力,吃苦耐劳,能成大事”。
虽然里面不乏幽默和讽刺,但总归在相关性上比之前好太多了。
对于普通人来说,实在不想遇到那么悬疑和烧脑的问题了。
另一方面,也说明科技应用到生活上的水平越来越高了。
04.
识图的作用有时候就是不容小觑的。
2019年6月,贵州“孤儿院儿童疑被性侵”的消息在网络中流传,说幼儿园孤儿院被重金贿赂,发生性侵幼儿的事情。
由于非常对互联网热度的胃口,导致许多人没怎么了解事情真相之前就进行了转发。
但并不是所有网友们听风就是雨,他们使用AI识图工具进行鉴别,几秒钟就找到了相似图。
原来热点新闻里的图是从网上盗用的。
果不其然,经调查,这就是谣言。
在这个过程中,令人感到欣喜的是,由于AI识图的便利性,不少普通网友随手就识破了谣言。
这一招也被很多人用来打击抄袭。
他们用AI识图保护原创。
这一招也被很多人用来识别对象出轨与否。
好让自己远离人渣。
这一招也被很多人用来抵御杀猪盘的侵害。
小红书等网站上已经形成了防诈骗教程,帮助更多人保护自己。
所有这些维护自己利益的方式都很快捷、高效。
虽说科技是中性的,但当你遭到伤害的时候,它们无形之中帮你保留住一丝丝的温暖。
也许这算是科技的一种风度。
05.
2018年,刘慈欣获得克拉克想象力贡献社会奖,演讲中,他说:
“周围的世界变得越来越像科幻小说了,这种进程还在飞快地加速,未来像盛夏的大雨,在我们还不及撑开伞时就扑面而来。”
其实想想,如果未来真像大雨一样扑面而来,会是一件很爽的事情。
往短了想一想,像上面那些很夸张的AI搜索结果会避免,毕竟最严重的搜图事故,往往都是由AI缺乏经验造成的。
往长了想一想,等各种AI技术完全成熟以后,可能未来生活形式与知识获取方式会发生质的改变,要知道现在应用设计为了各种现实限制而做了很多妥协。
那么,到时候会不会街上皆是AR穿戴设备,你随便戴上一个就可以开启识物的模式?
再进一步,会不会你手指点点某物,眼前就能出现它的各种信息?
无论如何,都将完全改变我们现在的知识信息获取格局。
你我推开秘门,目睹的就是新世界。
十年前,用计算机来区分猫和狗被认为几乎不可能。
而如今,视觉识别的准确率已超99%。
再进一步看来。
十年前,基本还没有手机互联网。
三十年前,互联网是个稀缺的东西;
一百年前,电灯没法为千家万户所高频使用;
一百五十年前,还没有汽车,马车往往是当时最便捷的交通工具了。
科技,作为第一生产力的科技正在改变这一切,将使许多人的人生更加便捷和智能。
至少自动驾驶的刹车刹得更可靠一些,至少癌症检测更精准一些。
更远的未来,曾经科幻片里的场景也能实现,或者,打个响指,飞来一块机器,就可以载人出行,对人进行体检,为人准备三餐,等等。
无论如何,未来在变得越来越好,更多的可能在向我们热情地招手。
而我们所能做的,开开心心,快快乐乐,多活几年,最好活个上百岁,以便看看七八十年后,人类文明可以进展到什么地步。
-END-
热门跟贴