您当前的位置：首页 > ai软件

开源大模型训练框架

时间：2025-03-26 13:16:53 来源：互联网作者：

AI导航网，AI网站大全，AI工具大全，AI软件大全，AI工具集合，AI编程，AI绘画，AI写作，AI视频生成，AI对话聊天等更多内容请查看 https://aiaiv.cn/

LLM-Dojo: 大模型修炼道场 SFT训练框架: 简洁清晰的开源大模型训练框架，支持Deepspeed多卡、Lora、QLora、全参等训练，自动适配chat template。 VLM多模态训练框架: 支持多模态各种任务训 Issues 8Saved searches Use saved searches to filter your results more quicklyPull requestsNavigation Menu Toggle navigation. Sign in ProductActions欢迎来到 LLM-Dojo，这里是一个开源大模型学习场所(最好的学习永远在项目中)，包括一个开源大模型训练框架，以及llm_tricks SecurityGitHub is where people build software. More than 100 million people use GitHub to discover, fork, and contribute to over 420 million projects.Insights由于此网站的设置，我们无法提供该页面的具体描述。290 stars由于此网站的设置，我们无法提供该页面的具体描述。仅显示来自 github.com 的更多内容请查看https://github.com/mst272/LLM-Dojo/

Oumi：开源的AI模型一站式开发平台，涵盖训练、 2025年2月3日 · Oumi 是一个完全开源的 AI 平台，旨在简化从数据准备、模型训练到评估和部署的整个生命周期。它支持从 1000 万到 4050 亿参数的模型训练，涵盖文本和多模态模型（如 Llama 、 Qwen 等），提供零样板代码（Zero 更多内容请查看https://zhuanlan.zhihu.com/p/21178876196

https://blog.csdn.net/weixin_45498383/article/details/Firefly: 一站式大模型训练工具 Firefly 是一个开源的大模型训练项目，支持对主流的大模型进行预训练、指令微调和DPO，包括但不限于Gemma、Qwen1.5、MiniCPM、 Llama 、InternLM、Baichuan 更多内容请查看https://blog.csdn.net/weixin_45498383/article/details/136655886

必知！大模型时代超常用的训练、微调、推理、部署框架。零 2025年3月11日 · 是伯克利大学LMSYS组织开源的大语言模型高速推理框架，旨在极大地提升实时场景下的语言模型服务的吞吐与内存使用效率。本地部署大模型记录龙井茶的Sky更多内容请查看https://blog.csdn.net/Python_0011/article/details/146174892

https://blog.csdn.net/2401_84204207/article/details/大模型实战项目最新：2024年大模型开源项目大盘 2025年1月13日 · 目的是构建大模型领域的基础设施，通过开发多模型管理、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作等多种技术能力，让围绕数据库构建大模型应用更简单，更方便。 4.2 Chat2DB: 阿里开源智更多内容请查看https://blog.csdn.net/2401_84204207/article/details/145094854

HqWu-HITCS/Awesome-Chinese-LLM:简介：该项目提供了一个大模型的训练和部署框架，包含了目前主要的开源大模型，llama系列，chatglm，bloom系列等等，同时还给出了预训练和微调的示例。更多内容请查看https://github.com/HqWu-HITCS/Awesome-Chinese-LLM

GitHub 本项目是一个围绕开源大模型、针对国内初学者、基于 Linux 平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全 wddns更多内容请查看https://github.com/datawhalechina/self-llm

中医通，中医药，中医历史，中医常识，中医学习，中医知识，中医药偏方，中医药库更多内容请查看http://zytong.cn

腾讯网CVPR2025：华科开源VA-VAE+LightningDiT，DiT训练效率 1 天前 · 1. 华中科技大学王兴刚团队提出VA-VAE框架，通过预训练视觉大模型对齐潜在空间，提升图像重建质量同时保持生成性能。2. 搭配优化LightningDiT训练更多内容请查看https://news.qq.com/rain/a/20250325A08MX800

分布式大模型训练框架对比以及基础的torch-FSDP应 2 天之前 · 背景 DeepSpeed， Megatron-LLM， Accelerate 等开源分布式框架，都是基于pytorch为基础的。我们对比这些最关键的开源框架的核心和优劣。最后讨论FSDP ，也就是torch 最核心大规模模型训练框架的用法。全切片数更多内容请查看https://zhuanlan.zhihu.com/p/32393729487

推荐资讯

栏目更新

栏目热门