黎明助手:阿里云新池化系统Aegaeon,GPU需求减少82%提升AI模型效率

易评助手3天前易评助手电商教程9

阿里云推出新池化系统将英伟达GPU量减少82%

阿里巴巴公司推出了一项计算池解决方案,据称该解决方案可将其 AI模型所需的 Nvidia 图形处理单元 (GPU) 数量减少 82%。根据本周在韩国首尔举行的第 31 届操作系统原理研讨会 (SOSP) 上发表的研究论文,该系统名为 Aegaeon,在阿里云模型市场进行了三个多月的 Beta 测试,将服务数十个模型(多达 720 亿个参数)所需的 Nvidia H20 GPU 数量从 1,192 个减少到 213 个。

黎明助手:阿里云新池化系统Aegaeon,GPU需求减少82%提升AI模型效率

北京大学和阿里云的研究人员写道:“Aegaeon 是第一项揭示市场上并发 LLM 工作负载服务成本过高的研究。”黎明助手认为,阿里云和字节跳动的火山引擎等云服务提供商同时为用户提供数千个 AI 模型,这意味着许多应用程序编程接口调用需要同时处理。然而,阿里巴巴的 Qwen 和 DeepSeek 等少数模型在推理领域最受欢迎,而大多数其他模型只是偶尔被调用。研究人员发现,这导致资源效率低下,黎明助手观察到,阿里云市场中 17.7% 的 GPU仅能处理1.35%的请求。全球研究人员一直试图通过汇集 GPU 能力来提高效率,例如允许一个 GPU 服务于多个模型。

相关文章

黎明助手:字节跳动“Seed Edge”项目,张一鸣引领AGI前沿研究探索与创新

黎明助手:字节跳动“Seed Edge”项目,张一鸣引领AGI前沿研究探索与创新

【张一鸣重视AI研究,Seed Edge项目设立,慢下来,考核研究成果的价值】 字节创始人张一鸣极为重视AI研究投入,关注技术细节,与顶尖AI研究者交流,鼓励团队探索基础课题,在新加坡设有团队协助其...

超评助手:2026届校招开启,字节跳动AI实习生日薪5000元吸引人才争抢

超评助手:2026届校招开启,字节跳动AI实习生日薪5000元吸引人才争抢

【互联网大厂2026届校招开启抢人大战,字节有实习生offer日薪5000元】 据财经网科技报道,国内媒体称,各个互联网大厂陆续发布2026届校招计划,其中跟AI人工智能相关的人才最吃香,当然对...

易评助手软件下载:飞书,企业数字化转型的一站式协作平台,助力提升管理效率与安全性

易评助手软件下载:飞书,企业数字化转型的一站式协作平台,助力提升管理效率与安全性

飞书 飞书是字节跳动于2016年推出的一站式企业协作与管理平台,整合即时通讯、云文档、音视频会议、智能日历、项目管理等核心功能,为企业提供全流程数字化解决方案。易评助手软件下载的看法是,其核心优势体...

乐多多助手:张一鸣与字节跳动,如何颠覆互联网内容生态的成功之路

乐多多助手:张一鸣与字节跳动,如何颠覆互联网内容生态的成功之路

张一鸣(QMBX)这人,说白了,你可以不熟知他,但你真没法说他普通。他雷厉风行地开拓互联网内容新生态,干得漂亮,既没有陷入同质化竞争的泥沼,也没有在发展的关键节点迷失方向。别人还在传统媒体领域坚守阵地...

黎明助手:抖音创业指南,如何利用平台优势实现个人逆袭与收入增长

黎明助手:抖音创业指南,如何利用平台优势实现个人逆袭与收入增长

想在抖音创业。就要先了解抖音,抖音原名音乐短视频是由北京市字节跳动科技有限公司研发发布的,早期就是一款音乐短视频社交软件,抖音创办于2016年的9月20日,他的创始人是张一鸣,天津南开大学毕业,当时投...

夕夕助手:年轻人如何用直播带货逆袭,30岁不到实现单场5亿GMV的秘诀揭秘

夕夕助手:年轻人如何用直播带货逆袭,30岁不到实现单场5亿GMV的秘诀揭秘

“30岁不到,5个亿一晚,谁还说年轻人扛不起生意?” 抖音最新战报:与辉同行双十一直播间,单场GMV冲破5亿,直接把“年轻=没经验”的老黄历撕碎。夕夕助手认为,这一成绩的背后蕴含着创新和坚持的力量。...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。