Meta 发表的论文基于字节而不是token来训练 LLM,在保持与基于分词的模型性能相当的同时,显著提高了推理效率和鲁棒性。论文: 网页链接