700亿参数LLaMA2训练加速195%,基础大模型最佳实践再升级
ChatGPT引发的亿参大模型热潮愈演愈烈,全球科技巨头和明星初创争相入局,数L升级打造以AI大模型为核心的训练型最竞争力和多样化商业使用需求。其中LLaMA系列模型,加速基础佳实践再因良好的大模基础能力和开放生态,已积累了海量的亿参用户和实际应用案例,成为无数开源模型后来者的数L升级模仿和竞争的标杆对象。
但如何降低类LLaMA2大模型预训练成本,训练型最如何基于LLaMA2通过继续预训练和微调,加速基础佳实践再低成本构建AI大模型实际应用,大模仍是亿参AIGC相关企业面临的关键瓶颈。
作为全球规模最大、数L升级最活跃的训练型最大模型开发工具与社区,Colossal-AI再次迭代,加速基础佳实践再提供开箱即用的大模8到512卡LLaMA2训练、微调、推理方案,对700亿参数训练加速195%,并提供一站式云平台解决方案,极大降低大模型开发和落地应用成本。
开源地址:https://github.com/hpcaitech/ColossalAI
LLaMA2训练加速195%
Meta开源的LLaMA系列大模型进一步激发了打造类ChatGPT的热情,并由此衍生出了诸多项目和应用。
最新的7B~70B LLaMA2大模型,则进一步提高了语言模型的基础能力。但由于LLaMA2的预训练预料大部分来自英文通用知识,而仅用微调能够提升和注入的领域知识和多语言能力也相对有限。此外,高质量的专业知识和数据集通常被视为各个行业和公司的核心资产,仅能以私有化形式保存。因此,以低成本预训练/继续预训练/微调LLaMA2系列大模型,结合高质量私有化业务数据积累,帮助业务降本增效是众多行业与企业的迫切需求与瓶颈。但LLaMA2大模型仅发布了原始模型权重与推理脚本,不支持训练/微调,也未提供数据集。
针对上述空白与需求,Colossal-AI开源了针对LLaMA2的全流程方案,并具备高可扩展性,支持从70亿到700亿参数的模型,从8卡到512卡都可保持良好的性能。
在使用8卡训练/微调LLaMA2-7B时,Colossal-AI能达到约54%的硬件利用率(MFU),处于业界领先水平。而对于预训练任务,以使用512张A100 40GB预训练LLaMA2-70B为例,DeepSpeed ZeRO3策略因显存不足而无法启动,仅能通过速度衰减较大的ZeRO3-offload策略启动。而Colossal-AI则因卓越的系统优化和扩展性,仍能保持良好性能,训练提速195%。
Colossal-AI LLaMA-2训练/微调方案的高性能来源于新的异构内存管理系统Gemini和高性能算子(包括Flash attention 2)等系统优化。新Gemini提供了高可扩展性,高鲁棒性,高易用性的接口。其Checkpoint格式与HuggingFace完全兼容,减小了使用和转换成本。其对于切分、offload等的设置更加灵活且易用,能够覆盖更多硬件配置下的LLaMA-2训练/微调任务。仅需数行代码即可使用:
from colossalai.booster import Booster |
ShardFormer多维细粒度并行
虽然对于主流硬件条件和大多数模型,Colossal-AI的新Gemini已经能够提供良好的性能。但是对于一些极端硬件条件,或者是特殊模型,可能仍然需要多维并行的细粒度优化。现有其他方案通常需要分布式系统资深专家,手动对代码进行大规模重构和调优,Colossal-AI的ShardFormer提供了开箱即用的多维并行和算子优化的能力,仅需数行代码即可使用,在单机/大规模集群上都能提供良好的性能。
from colossalai.booster import Booster |
Colossal-AI ShardFormer支持包括LLaMA1/2、BLOOM、OPT、T5、GPT-2、BERT、GLM在内的主流开源模型,也可以直接使用Huggingface/transformers模型导入,Checkpoint格式也与HuggingFace完全兼容,对比Megatron-LM等需重写大量代码的方案,大大提升了易用性。
对于并行策略,已支持以下多种并行方式:张量并行、流水线并行、序列并行、数据并行、Zero数据并行等,并可将多种并行方式组合使用,只需通过简单的配置命令,即可适配各种复杂的硬件环境/模型。同时,其内置了各种高性能算子,免去了繁琐的兼容/配置过程。其中包括:
Flash attention 2
Memory efficient attention (xformers)
Fused Normalization Layer
JIT kernels
云平台大模型一站式解决
为了进一步提升开发和部署效率,Colossal-AI团队还将上述系统优势与算力结合,提供Colossal-AI云平台,提供廉价算力和开箱即用的AI主流应用,包括对话大模型,多模态模型,生物医药等,现已开启内测。
通过屏蔽大模型底层的分布式并行计算、内存、通信管理与优化等,AI开发者可以继续专注于AI模型与算法设计,以更低成本更快速度完成AI大模型助力业务降本增效。
用户只需要上传相关数据,即可无代码训练个性化私有模型,并将训练好的模型一键部署。相关的应用都经过Colossal-AI团队精心优化,得益于算法和系统的双面优化,能大大降低模型训练以及部署的成本。
Colossal-AI云平台:platform.luchentech.com
Colossal-AI开源地址:https://github.com/hpcaitech/ColossalAI
雷峰网(公众号:雷峰网)
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
96213
-
浏览
5
-
获赞
68
热门推荐
-
FACETASM x 可口可乐 x THE CONVENI 三方联名系列正式发售
潮牌汇 / 潮流资讯 / FACETASM x 可口可乐 x THE CONVENI 三方联名系列正式发售2019年07月27日浏览:3882 日本设计师落合宏理自有品适合在家做的有氧运动 每个动作30秒
适合在家做的有氧运动 每个动作30秒时间:2022-06-20 12:36:31 编辑:nvsheng 导读:想要减重塑身,不用去健身房,在家或宿舍操场做有氧运动,也可以达到很好的减肥效果。教你不三伏天睡不好怎么办?为什么三伏天容易失眠?
三伏天睡不好怎么办?为什么三伏天容易失眠?时间:2022-06-22 13:19:06 编辑:nvsheng 导读:三伏天很多人都苦恼于睡眠效果不佳,白天没精神,整个人昏昏欲睡,晚上又睡不着。那么马拉松全程多少公里 全马是42公里
马拉松全程多少公里 全马是42公里时间:2022-06-20 12:36:01 编辑:nvsheng 导读:马拉松全程是42公里左右,半马是21公里,这是一个不小的距离,如果有打算跑马拉松的朋友一杰拉德:助利物浦夺五冠王 23岁任队长扛起复兴重担
杰拉德:助利物浦夺五冠王 23岁任队长扛起复兴重担_赛季www.ty42.com 日期:2021-05-28 07:31:00| 评论(已有279390条评论)八月份有螃蟹吗?8月份有螃蟹吗?
八月份有螃蟹吗?8月份有螃蟹吗?时间:2022-06-21 12:48:35 编辑:nvsheng 导读:每年的八月份就已经开始立秋了,秋季正是吃海鲜的季节,但是吃的最多的还是九十月份。那么,八月三伏天拔罐后多久可以洗澡?三伏天拔罐后注意事项
三伏天拔罐后多久可以洗澡?三伏天拔罐后注意事项时间:2022-06-21 12:45:41 编辑:nvsheng 导读:三伏天是一年四季养生的最佳时期,拔火罐作为中医养生传统的手段,自然是少不了的泡桑葚酒用多少度酒好 泡桑葚酒和冰糖的比例是多少
泡桑葚酒用多少度酒好 泡桑葚酒和冰糖的比例是多少时间:2022-06-21 12:55:35 编辑:nvsheng 导读:泡桑葚酒除我要选择好的桑葚,当然同时也需要配上合适的白酒,白酒有不同的度数对话武磊:李铁在两方面要求很高 这次是冲击世界杯最佳时机
对话武磊:李铁在两方面要求很高 这次是冲击世界杯最佳时机_比赛www.ty42.com 日期:2021-05-23 10:01:00| 评论(已有278368条评论)肌酸有什么副作用?肌酸会影响性功能吗?
肌酸有什么副作用?肌酸会影响性功能吗?时间:2022-06-21 12:55:00 编辑:nvsheng 导读:肌酸和蛋白粉一样是很多人健身都在吃的保健品,可以帮助补充健身所需要的蛋白质,加快肌肉肌酸能和蛋白粉一起吃吗?肌酸能长期服用吗?
肌酸能和蛋白粉一起吃吗?肌酸能长期服用吗?时间:2022-06-21 12:54:31 编辑:nvsheng 导读:很多健身的人都知道肌酸对于练出肌肉是非常有帮助的,和蛋白粉都是必不可少的健身良药8月份可以割双眼皮吗?几月份割双眼皮最好?
8月份可以割双眼皮吗?几月份割双眼皮最好?时间:2022-06-22 13:17:29 编辑:nvsheng 导读:很多女性都会割双眼皮,尤其是随着整容技术的发展,割双眼皮的技术已经很成熟了。那么粤媒:世预赛是中国足球一面镜子 伪职业现象层出不穷
粤媒:世预赛是中国足球一面镜子 伪职业现象层出不穷_五大联赛www.ty42.com 日期:2021-05-29 10:01:00| 评论(已有279604条评论)黑芝麻炒多久才熟 黑芝麻炒熟后不香怎么回事
黑芝麻炒多久才熟 黑芝麻炒熟后不香怎么回事时间:2022-06-22 13:23:48 编辑:nvsheng 导读:有时候路过打芝麻粉的地方,闻着炒黑芝麻味觉得好香啊!回家自己炒炒熟后居然不香,黑隋文帝整饬吏治 赏罚分明查出贪污立即赐死
要知道,干部队伍建设可是国家治理的基础,现在干部素质这么差,怎么办呢?隋文帝做了三方面的工作。第一,严肃官员任命,不再用官职来奖赏功臣。平陈战争之后,不是一下子产生了很多战争功臣吗?大家都按照惯例,等