微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本|全球视点
(资料图片仅供参考)
千易网 6 月 27 日消息,微软研究人员日前推出了名为 ZeRO++ 的新技术,用于优化在训练大型 AI 模型时,容易遇到的数据传输成本和带宽限制的难题,可显著减少大模型训练时间和成本。
据悉,ZeRO++ 建立在现有的 ZeRO 传输技术基础上,并提供增强的通信策略,可提高训练效率,同时减少训练时间和成本。
为了减少参数通信量,ZeRO++ 可对权重进行量化,其利用基于块的量化方法来保持训练精度,这种优化的量化过程相对原始 Zero 传输技术更快更准确。为了能够尽量减少通信开销,ZeRO++ 通过在每台机器上保持完整的模型副本,以向 GPU 显存换取通信带宽。而在梯度通信方面,ZeRO++ 引入了一种名为 qgZ 的新的量化梯度通信方式,可以减少跨节点的流量和延迟。
这些改进的通信技术大大减少了通信量,微软研究人员表示,与 ZeRO 相比,ZeRO++ 减少了高达 4 倍的通信量,提高了训练吞吐量和效率。当在每个 GPU 上使用小批量大小时,在高带宽集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低带宽集群中,与 ZeRO-3 相比,ZeRO++ 实现了平均 2 倍的加速,使得大模型训练在更多种类的集群上更为可行。
千易网注:千易网注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 这样的大型模型,其训练需要跨多个 GPU 设备占用大量显存和计算资源,而 ZeRO++ 引入了通信优化策略,以克服在低带宽集群上进行训练时原有 ZeRO 传输技术的带宽限制。目前微软已经放出了相关技术文档,研究人员可以利用 ZeRO++ 更有效地训练模型,在 AI 领域探索新的可能性。
标签:
- 微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本|全球视点
- 当前滚动:掌阅科技:与企鹅兰登达成英文原版电子书版权合作
- 5G商用3年多,用户却在吐槽,网友:5G的方向错了-焦点精选
- 中国移动超大规模智算中心将于2024年投产_速看料
- 总投资2394亿,广东面向民间资本推介示范项目101个
- 雪乡之夏,风韵独具 天天讯息
- 18家公司同日“赶考”深交所 累计拟募资超147亿元|世界视讯
- 天天热议:安全生产监管:为一线安全生产保驾护航
- 5月山西省全社会用电量同比下降0.9%
- 我国已形成世界上规模最大、体系最全、效果最好的人工影响天气作业力量
- 钟南山拍毕业照时被学生亲了一口 幽默回应:体会到同学们对母校的热爱
- 【全球热闻】持续“闷烧冒烟”超1小时!损失约2万美元!美国一储能系统突发起火!
- 全球最新:@北京市高考生 高招专业目录有调整
- “深交所·创享荟”举办制造业数字化智能化转型升级专场活动_环球看热讯
- 今年快递业务量已达600亿件(新数据 新看点)-世界要闻
- 6月26日基金净值:华泰柏瑞质量领先混合A最新净值0.4408,跌1.72%_微头条
- 每日热门:欧佩克秘书长:预计2045年全球每天石油需求量将达1.1亿桶
- 环球精选!海关总署缉私局局长“不愿回应”提问,真相让人感慨
- 蒙迪欧发动机皮带多久更换(发动机皮带多久更换?) 全球滚动
- 金三江(301059.SZ)聘任何卫为财务负责人_环球新动态
- 天天通讯!教你学会看盘系列(153):6月27日周二盘前策略:主升龙头真经抢筹盘口机会解读
- 焦点播报:定位中大型轿车 长安启源A07预告图发布
- 环球快资讯丨28号强降雨来袭,大雨暴雨大暴雨分布下列地区,今夏发大水?
- 又有“减肥神药”诞生?诺和诺德(NVO.US)大剂量口服减肥药物在后期试验中取得显著效果-天天看热讯
- 关于背景的文案
- 世界今热点:涉百万电诈案网逃人员被抓
- 每日动态!市公交总公司提供退役军人免费乘公交服务/小众公交线24路 带你领略小城风景……快来看最新一期《绿动铜都》
- 端午假期铁路累计发送旅客7037.9万人次 较2019年同期增长11.3% 当前观察
- 2023年7月份江苏电力集中竞价交易成交价格459.85元/兆瓦时
- 日本东电称核污染水排海隧道建设工程已全部完工