wisemodel开源社区

wisemodel开源社区

网易号

关注
6粉丝
1关注
56被推荐
IP属地:北京

优质互联网领域创作者

3枚勋章

始智AI wisemodel.cn开源社区,打造中国版“huggingface”

  • 姚班学霸发布Unique3D模型海外爆火,目标剑指4D生成

    14小时前
    图片
  • 最近发布在wisemodel.cn开源社区的Inf-DiT,是清华大学联合智谱AI联合推出的一款超高分辨率图片上采样模型,通过提出的单向块注意力机制,可以显著降低DiT推理时的显存占用,对任意大小的图片进行上采样,最低可以在30G显存内支持8192分辨率图片的生成。不同于自回归式模型,Inf-DiT可以同时生成多个块,因此可以根据显存上线来自动调整每次生成块的个数进行加速。为了保证和低分辨率图片的全局语义一致性(艺术风格、物体材质等),采用CLIP的image encoder获取了低分辨率图片的embedding并与DiT的time embedding相加;同时因为CLIP可以将图文对齐到同一空间中,文章发现还可以用文本来对生成结果进行控制。
  • 升级 | wisemodel社区全面支持ollama,gguf格式大模型直接在线运行!

    2024-06-22
    图片
  • Jina-CLIP-v1:开源多模态向量模型,性能超越 OpenAI-CLIP

    2024-06-20
    图片
  • YOLOv10性能效率大幅提升,清华开源新一代实时目标检测模型

    2024-06-19
    图片
  • 哈工大“活字”系列大模型,1.0到3.0版本的进化

    2024-06-16
    图片
  • 2024年6月5日智谱AI开源了GLM-4-9B系列模型,模型性能全面超越Llama3-8B模型。GLM-4-9B使用了10T 高质量多语言数据进行训练,数据量是 ChatGLM3-6B 模型的 3 倍以上。同时,采用了 FP8 技术进行高效的预训练,相较于第三代模型,训练效率提高了 3.5 倍,预训练计算量增加了 5 倍。GLM-4-9B 模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等突出能力。本次在wisemodel.cn开源社区发布的GLM-4-9B 系列模型包括:基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。基于强大的预训练基座,GLM-4-9B 的模型中英文综合性能相比 ChatGLM3-6B 提升了 40%,尤其是在中文对齐能力 AlignBench,指令遵从 IFeval,工程代码 Natural Code Bench 方面都取得了非常显著的提升。对比训练量更多的 Llama-3-8B 模型也没有逊色,英文方面有小幅领先,中文学科方面更是有着高达 50% 的提升,主要评测结果上全面超越Llama3-8B。人人都可以到wisemodel社区在线创建体验。
  • 清华Inf-DiT:超高分辨率图片生成,低显存也能玩转8K生成!

    2024-06-12
    图片
  • Skywork-MoE千亿模型开源,4090单机高效推理

    2024-06-10
    图片
  • 清华GLM4-9B系列模型开源,全面超越Llama3-8B

    2024-06-05
    图片
  • “源2.0-M32”在基于“源2.0”系列大模型已有工作基础上,创新性地提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型计算效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。M32系列模型已经发布在始智AI wisemodel.cn开源社区。源2.0-M32大幅提升了模型算力效率,在实现与业界领先开源大模型性能相当的同时,显著降低了在模型训练、微调和推理所需的算力开销。在模型推理运行阶段,M32处理每token所需算力为7.4GFLOPs,而LLaMA3-70B所需算力为140GFLOPs。在模型微调训练阶段,对1万条平均长度为1024 token的样本进行全量微调,M32消耗算力约0.0026PD(PetaFLOPs/s-day),而LLaMA3消耗算力约为0.05PD。M32凭借特别优化设计的模型架构,在仅激活37亿参数的情况下,取得了和700亿参数LLaMA3相当的性能水平,而所消耗算力仅相为LLaMA3的1/19,从而实现了更高的模算效率。
  • 大模型时代的类摩尔定律

    2024-06-02
    图片
  • Llama3基座的原生上下文只支持到8K,且原始词表只包含数千个常用CJK字词、中文编码效率较低。这些因素综合起来,导致OpenBuddy-Llama3-8B模型在长文能力上,弱于此前发布的OpenBuddy-Mistral-7B等开源模型系列。但在部分测试题中,OpenBuddy-Llama3-8B展现出了逻辑思维、推理方面的认知潜力,超过了此前的OpenBuddy-Mistral-7B系列模型。后续OpenBuddy将进一步增强模型的中文认知、理解能力和知识储备,并计划通过词表扩容、模型长文优化等工作,优化8B模型的长文能力。OpenBuddy-Llama3-8B和OpenBuddy-Mistral-7B都可以直接在wisemodel.cn开源社区上零代码低门槛的部署和在线体验
  • 升级 | wisemodel上线新版在线体验,开源大模型人人可玩!

    2024-05-29
    图片
  • wisemodel社区在线体验,OpenBuddy中文Llama3-8B/Mistral-7B 模型

    2024-05-28
    图片
  • ChemLLM系列模型是上海 AI lab 化学大模型团队开发的首个兼备推理、对话等通用能力和化学专业能力的开源大模型。相比于现有的其他大模型,ChemLLM对化学空间进行了有效建模,在产物预测、名称转化和化学性质预测等核心化学任务上表现优异。wisemodel.cn开源社区零代码两步完成模型部署即可开始在线体验demo。ChemLLM显著地超越了五个同规模大模型和通用超大模型GPT-3.5,在基于文本的分子生成、名称转换、性质预测、温度预测、产率预测、逆合成分析六个任务上能够媲美于GPT-4,同时ChemLLM的通用能力与主流大语言模型水平持平。
  • 报名 | 全球首届ComfyUI领导力峰会暨AID Lab周年峰会完整议程正式发布

    2024-05-27
    图片
  • ChemLLM化学大模型开源,wisemodel社区在线体验,助力化学研究

    2024-05-26
    图片
  • XuanYuan-6B系列金融大模型的发布标志着智能金融领域的一次重要突破,是始智AI wisemodel社区的第一个开源金融大模型,wisemodel社区上可以一键部署在线体验,其在日常对话、语言理解、知识应用、内容创作、信息摘要等方面可与70B级别的模型相媲美。XuanYuan-6B将为金融机构、投资者、研究人员提供更准确、及时的信息,助力他们做出更明智的决策,还将成为金融教育和推广的有力工具,向广大民众提供可靠的金融知识和建议。XuanYuan-6B采用self-QA10方法进行指令微调数据的收集。Self-QA方法利用现有高质量大模型,根据无监督的知识生成微调数据,在没有人工标注的情况下生成大量高质量的问答数据。
  • 度小满轩辕-6B系列金融大模型,wisemodel 开源社区在线体验

    2024-05-22
    图片
正在载入...
正在载入...