xbench由红杉中国推出,是一款致力于量化AI系统在真实场景的效用价值,以及采用长青评估机制的AI基准测试。

这里聚集着这样一群人:既懂模型的深层逻辑,更清楚商业落地的每一道关卡。我们相信,科学、长效和真实反映AI客观能力的评测体系,是指引AI技术突破与产品迭代的重要需求。

我们期待这样的你:

  • 技术信仰:对AGI有近乎偏执的热情,坚信评测在AI浪潮中的巨大价值。

  • 工程实战:具备扎实的动手能力,能够将理论应用于实践,方向包括但不限于NLP、多模态、搜索算法等。

  • 创新思维:善于从不同角度思考问题,提出创新的解决方案,推动AI技术的持续发展。

  • 团队协作:具备良好的沟通能力和团队合作精神,能够与不同背景的同事高效协作,共同攻克技术难题。

开放的实习生岗位(北京/上海/远程):

  • AI Researcher方向

  • 前/后端工程

  • AI产品经理

  • 开源社区贡献者

*不仅限以上岗位,只要你对AI/Agent满怀热情,我们都期待你的加入,一起探索AI的无限可能!

立即加入:

发送简历/作品集至hr@xbench.org(附GitHub链接或技术博客更佳!)