您当前的位置:首页 > ai软件

开源大模型训练框架

时间:2025-03-26 13:16:53  来源:互联网  作者:
AI导航网,AI网站大全,AI工具大全,AI软件大全,AI工具集合,AI编程,AI绘画,AI写作,AI视频生成,AI对话聊天等更多内容请查看 https://aiaiv.cn/

LLM-Dojo: 大模型修炼道场 SFT训练框架: 简洁清晰的开源大模型训练框架,支持Deepspeed多卡、Lora、QLora、全参等训练,自动适配chat template。 VLM多模态训练框架: 支持多模态各种任务训 Issues 8Saved searches Use saved searches to filter your results more quicklyPull requestsNavigation Menu Toggle navigation. Sign in ProductActions欢迎来到 LLM-Dojo,这里是一个开源大模型学习场所(最好的学习永远在项目中),包括一个开源大模型训练框架,以及llm_tricks SecurityGitHub is where people build software. More than 100 million people use GitHub to discover, fork, and contribute to over 420 million projects.Insights由于此网站的设置,我们无法提供该页面的具体描述。290 stars由于此网站的设置,我们无法提供该页面的具体描述。仅显示来自 github.com 的更多内容请查看https://github.com/mst272/LLM-Dojo/

Oumi:开源的AI模型一站式开发平台,涵盖训练、 2025年2月3日 · Oumi 是一个完全开源的 AI 平台,旨在简化从数据准备、模型训练到评估和部署的整个生命周期。 它支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型(如 Llama 、 Qwen 等),提供零样板代码(Zero 更多内容请查看https://zhuanlan.zhihu.com/p/21178876196

https://blog.csdn.net/weixin_45498383/article/details/Firefly: 一站式大模型训练工具 Firefly 是一个开源的大模型训练项目,支持对主流的大模型进行 预训练 、指令微调和DPO,包括但不限于Gemma、Qwen1.5、MiniCPM、 Llama 、InternLM、Baichuan 更多内容请查看https://blog.csdn.net/weixin_45498383/article/details/136655886

必知!大模型时代超常用的训练、微调、推理、部署框架。零 2025年3月11日 · 是伯克利大学LMSYS组织开源的大语言模型高速推理框架,旨在极大地提升实时场景下的语言模型服务的吞吐与内存使用效率。 本地 部署 大模型 记录 龙井茶的Sky更多内容请查看https://blog.csdn.net/Python_0011/article/details/146174892

https://blog.csdn.net/2401_84204207/article/details/大模型实战项目最新:2024年大模型开源项目大盘 2025年1月13日 · 目的是构建大模型领域的基础设施,通过开发多模型管理、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作等多种技术能力,让围绕数据库构建大模型应用更简单,更方便。 4.2 Chat2DB: 阿里开源智 更多内容请查看https://blog.csdn.net/2401_84204207/article/details/145094854

HqWu-HITCS/Awesome-Chinese-LLM:简介:该项目提供了一个大模型的训练和部署框架,包含了目前主要的开源大模型,llama系列,chatglm,bloom系列等等,同时还给出了预训练和微调的示例。更多内容请查看https://github.com/HqWu-HITCS/Awesome-Chinese-LLM

GitHub 本项目是一个围绕开源大模型、针对国内初学者、基于 Linux 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全 wddns更多内容请查看https://github.com/datawhalechina/self-llm

中医通,中医药,中医历史,中医常识,中医学习,中医知识,中医药偏方,中医药库 更多内容请查看http://zytong.cn

腾讯网CVPR2025:华科开源VA-VAE+LightningDiT,DiT训练效率 1 天前 · 1. 华中科技大学王兴刚团队提出VA-VAE框架,通过预训练视觉大模型对齐潜在空间,提升图像重建质量同时保持生成性能。2. 搭配优化LightningDiT训练 更多内容请查看https://news.qq.com/rain/a/20250325A08MX800

分布式大模型训练框架对比以及基础的torch-FSDP应 2 天之前 · 背景 DeepSpeed, Megatron-LLM, Accelerate 等开源分布式框架,都是基于pytorch为基础的。 我们对比这些最关键的开源框架的核心和优劣。 最后讨论FSDP ,也就是torch 最核心大规模模型训练框架的用法。全切片数更多内容请查看https://zhuanlan.zhihu.com/p/32393729487

推荐资讯
栏目更新
栏目热门