你们可能也听说过全新神经网络架构——KAN !这可是 MIT、加州理工和东北大学搞出来的,全名叫做 Kolmogorov–Arnold Networks !听着是不是就觉得特厉害?其中,MIT的博士生刘子鸣(Ziming Liu)作为第一作者参与了这项工作。

打开网易新闻 查看精彩图片

那这个 KAN 到底厉害在哪儿呢?首先啊,它跟咱熟悉的多层感知机(MLP)可不一样!最显眼的就是它的参数效率,用少少的参数就能解决数学和物理问题,而且还更准呢!你想想,200 个参数的 KAN 就能干 DeepMind 用 30 万参数的 MLP 干的事儿,还发现了新公式,这简直就是学霸中的学霸啊!

打开网易新闻 查看精彩图片

KAN 的设计灵感是来自一个超牛的数学定理,叫 Kolmogorov-Arnold 表示定理。这定理说啥呢,就是任何多元函数都能看成是一元函数的叠加。基于这个理论,KAN 在权重上做了创新,把激活函数放权重上了,不是传统的神经元上哦。这么做的好处就是,KAN 网络不仅能直接看到,还能更好解释和互动呢。

打开网易新闻 查看精彩图片

而且哦,KAN 在处理大模型的时候还有个天然优势,就是能避免灾难性遗忘问题。这就意味着,它学新东西的时候,不会把以前的知识忘掉,这对 AI 来说可是个大进步呢!

打开网易新闻 查看精彩图片

当然啦,KAN 也有一些挑战,比如训练速度可能慢点,还有在 GPU 上的实现效率问题。不过,这些问题可难不倒咱科研团队,他们已经把 KAN 的开源项目放 GitHub 上啦,让全世界的开发者都能来参与,一起改进和创新!

那 KAN 的诞生对咱普通人有啥好处呢?虽然看起来离咱生活有点远,但其实啊,它可能会间接影响我们生活的各个方面呢。比如,KAN 可以帮助科学家更快地解决医学啊、教育啊、工业啊这些领域的问题,这些进步最后都会让我们的生活变得更好!

KAN 的出现,不只是技术上的一次大飞跃,更是人工智能领域的一大步呢!它让我们看到了 AI 的无限可能,说不定在不久的将来,KAN 就能成为我们生活中的好帮手!

虽然这个技术不是由国内的科研机构发表,但牵头的研发人员是华人,可见中国人或者华裔,从来不缺人才天才!