wisemodel开源社区

wisemodel开源社区

关注
10粉丝
1关注
184被推荐
IP属地:北京

优质互联网领域创作者

4枚勋章

始智AI wisemodel.cn开源社区,打造中国版“huggingface”

  • 在多模态大模型领域,新手进行模型训练面临诸多挑战。随着模态数不断增多,对齐算法训练启动涉及的路径规划和超参数传递极为复杂,使得新用户难以快速上手开展训练工作。
    在此背景下,由北大、华为、阿里等组成的align - anything项目应运而生,在数据集、算法、评估以及代码库四个关键维度贡献开源力量。其数据集涵盖图、文、视频、语音全模态,共200k且包含人类语言反馈和二元偏好数据。算法通过从语言反馈中学习合成数据范式,提升RLHF后训练方法表现,评估面向全模态模型的模态联动与选择。 值得一提的是,该项目代码库支持全模态训练与评估,将训练流程模块化,新手仅需了解PyTorch和Transformers就能轻松理解相关代码。同时,项目还提供超30个装填好模型、数据集路径的训练脚本,简单执行即可开启训练,极大降低了新手参与全模态对齐研究的门槛。目前系列成果均已上线始智AI-wisemodel开源社区,欢迎前去体验和使用。 系列成果地址 https://wisemodel.cn/organization/PKU-Alignment
  • 全模态对齐必备!数据训练评估,北大align-anything全包办

    2025-01-23
    图片
  • 速看!RWKV-7新模型上线,浏览器可用,黑白棋玩法升级

    2025-01-21
    图片
  • Text-to-SQL是将自然语言转换为SQL的任务,基于LLM的Text-to-SQL有微调开源小模型和闭源大模型提示工程两类技术路线。现有提示工程存在输入token过多、噪音大等问题,模式链接技术可减少噪音但有信息损失风险。
    因此,RSL-SQL框架,可以通过双向模式链接等策略,平衡完整与简化Schema优势,还采用多轮自校正。该框架开销低、性能优,在性能与效率间实现更优平衡。目前已经上线始智AI-wisemodel开源社区,欢迎前去体验和使用。 代码地址 https://wisemodel.cn/codes/Laqcce/RSL-SQL
  • 华科RSL-SQL靠双向模式链接攻克NL2SQL,高召回低开销成现实

    2025-01-19
    图片
  • 报名大模型赛!十三家活跃机构参与,千万级投资,等你赢取!

    2025-01-17
    图片
  • “尺度定律”之下,大模型除了要突破算力瓶颈,亦面临高质量数据即将“见底”难题。如何通过“通专融合”技术路径实现通用人工智能,正日益成为业内共识。
    上海人工智能实验室对书生大模型进行重要版本升级,书生·浦语3.0(InternLM3)通过精炼数据框架,大幅提升了数据效率,并实现思维密度的跃升。仅使用4T训练数据的InternLM3-8B-Instruct,其综合性能超过了同量级开源模型,节约训练成本75%以上。同时,书生·浦语3.0首次在通用模型中实现了常规对话与深度思考能力融合,可应对更多真实使用场景。目前已经上线始智AI-wisemodel开源社区,欢迎前去体验。 模型地址 https://www.wisemodel.cn/models/Intern/internlm3-8b-instruct
  • 书生·浦语3.0升级:4T数据打造高性能,思维密度大突破

    2025-01-16
    图片
  • 在金融行业数智化转型浪潮中,“决策与风控能力”、“研究分析能力”和“数据智能能力”构成了推动业务创新和价值提升的关键维度。这些能力分别通过精准的风险识别与管控、深入的市场研判与价值发现、高效的数据建模与分析,为机构带来持续价值增长。
    如何让大模型深度推理能力在金融专业场景中创造实质价值? 开源推理大模型轩辕-FinX1针对金融场景中的分析、决策和数据处理任务进行了深度优化,采用创新“思维链+过程奖励+强化学习”训练范式,显著提升逻辑推理能力,可展示O1模型未公开的完整思考过程,为金融决策提供更深入的洞察。 这是全球首个金融行业推理大模型,由度小满AI-Lab研发,此次发布的预览版本,已经上线始智AI-wisemodel开源社区,欢迎前去体验,后续优化版本也将持续开源,供用户下载使用。 模型地址 https://www.wisemodel.cn/models/Duxiaoman-XuanYuan/XuanYuan-FinX1-Preview
  • 首个金融推理大模型开源!度小满推轩辕-FinX1,为你的钱途“出谋划策”

    2025-01-14
    图片
  • 直播预告|开源Talk:小模型主题

    2025-01-13
    图片
  • 大规模语言模型(LLMs)的有效预训练一直是一项具有挑战性的任务,因为其巨大的资源要求和复杂的技术过程,公开的 LLM 面临数据和计算资源受限及难以复制的问题。
    YuLan-Mini是一个拥有24.2亿参数(2.42B)的高性能基础模型,在参数规模相似的模型中表现出顶尖性能。其预训练方法着重于通过三个关键技术贡献来增强训练效果:第一,一个精心设计的数据流水线结合了数据清洗和数据调度策略;第二,一种强大的优化方法来减轻训练不稳定性;第三,一种有效的退火方法,该方法融合了有针对性的数据选择和长上下文训练。为了便于复现,项目组发布了每个训练阶段数据组成的全部细节。目前已上线始智AI-wisemodel开源社区,欢迎前去体验。 https://wisemodel.cn/models/yulan-team/YuLan-Mini
  • 擅理长文、性能领先的YuLan-Mini,超细节小模型完整预训练揭秘

    2025-01-12
    图片
  • 诚邀合作伙伴承办区域晋级赛,共享大模型产业发展新机遇

    2025-01-10
    图片
  • 自从GPT、PaLM、Llama等预训练大语言模型在自然语言处理任务上表现出色,大语言模型发展迅速,从单模态扩展到多模态,如MiniGPT-4、LLaVA等在应用场景中效果惊艳。全面、科学地评估这些模型的性能成为研究者的重要挑战。
    传统评估方法多关注模型在下游任务上的准确率、交叉熵损失等指标,只比较预测结果与标注标签,无法深入探究模型内部信息处理过程。对于多模态大语言模型,现有评估指标也无法评价模态之间的对齐程度等重要维度。因此,现阶段纯语言大模型和多模态大模型的评估方法存在较大局限性,需要多元化、精细化的评价方法。 为解决这些挑战,上海交通大学和清华大学等科研团队的研究者提出了全新的大模型评估指标Diff-eRank。这是一种基于模型表征的“有效秩”的评估指标,从信息论和几何学的角度分析并量化大语言模型在训练前后如何剔除冗余信息,并以此衡量模型性能。 与传统评估指标不同,Diff-eRank不依赖模型的输出结果,而是通过分析模型的隐藏表征来评估模型的性能。对于多模态大模型,研究团队还设计了基于有效秩的评估方法,通过比较不同模态表征之间的有效秩匹配程度来评估模态对齐性能,证实了主流多模态大模型具有出色的对齐能力。目前已上线始智AI-wisemodel开源社区,欢迎大家前去下载和体验。 代码地址 https://wisemodel.cn/codes/Walton/Diff-eRank
  • 大模型评估有新招!不看输出看隐藏,上交大、清华推出Diff-eRank

    2025-01-09
    图片
  • OpenAI 发布的具有超强推理能力的大模型o3,引起了业内对大模型推理能力的广泛讨论和深入研究。o3的发布也带来了三个引人深思的问题:市面上主流大模型的推理能力究竟如何?在真实应用场景中,是否总是需要具有极强推理能力的模型?在实际应用中,如何根据应用需求选择合适参数量的大模型而避免“用大炮打蚊子”,以获得最高性价比?
    中国联通借鉴动物智能演化规律,结合大模型实际落地应用实践,在业界首次提出大模型能力边界量化基准,定量分析主流语言大模型能力边界,详细刻画模型参数量、模型能力与应用场景之间的关系,为语言大模型的应用选型提供理论和经验指导,将有助于降低语言大模型应用门槛,促进大模型普惠化。目前已上线始智AI-wisemodel开源社区,欢迎前去下载。 https://wisemodel.cn/datasets/UnicomAI/A-Eval
  • 借动物智能演化规律,中国联通首创大模型能力边界量化基准

    2025-01-07
    图片
  • 直播预告|开源Talk:RAG(检索增强生成)专题

    2025-01-06
    图片
  • 随着多模态大语言模型的发展,OS Agents 迎来重大机遇,使先进 AI 助手的设想更具现实性。
    本文将阐述 OS Agents 的基础,涵盖其关键构成与能力;梳理构建 OS Agents 的方法,包括领域特定的基础模型与智能体框架;介绍评估协议和基准测试,分析各类指标并分类基准测试。 此外,安全与隐私、个性化与自我进化等关键问题是后续研究的重点。期待为OS Agents的持续发展贡献力量,增强其在学术界和工业界的应用价值与实际意义。https://wisemodel.cn/infos/g96nmta8p4tsf85xapc2yd38y4txv1
正在载入...
正在载入...