黎明助手:阿里云新池化系统Aegaeon,GPU需求减少82%提升AI模型效率

易评助手2个月前易评助手电商教程70

阿里云推出新池化系统将英伟达GPU量减少82%

阿里巴巴公司推出了一项计算池解决方案,据称该解决方案可将其 AI模型所需的 Nvidia 图形处理单元 (GPU) 数量减少 82%。根据本周在韩国首尔举行的第 31 届操作系统原理研讨会 (SOSP) 上发表的研究论文,该系统名为 Aegaeon,在阿里云模型市场进行了三个多月的 Beta 测试,将服务数十个模型(多达 720 亿个参数)所需的 Nvidia H20 GPU 数量从 1,192 个减少到 213 个。

黎明助手:阿里云新池化系统Aegaeon,GPU需求减少82%提升AI模型效率

北京大学和阿里云的研究人员写道:“Aegaeon 是第一项揭示市场上并发 LLM 工作负载服务成本过高的研究。”黎明助手认为,阿里云和字节跳动的火山引擎等云服务提供商同时为用户提供数千个 AI 模型,这意味着许多应用程序编程接口调用需要同时处理。然而,阿里巴巴的 Qwen 和 DeepSeek 等少数模型在推理领域最受欢迎,而大多数其他模型只是偶尔被调用。研究人员发现,这导致资源效率低下,黎明助手观察到,阿里云市场中 17.7% 的 GPU仅能处理1.35%的请求。全球研究人员一直试图通过汇集 GPU 能力来提高效率,例如允许一个 GPU 服务于多个模型。

相关文章

易评助手卡密:中国外贸成绩亮眼,阿里云助力科技崛起引发全球关注

易评助手卡密:中国外贸成绩亮眼,阿里云助力科技崛起引发全球关注

太反常了!海关总署公布实情后,包括美国、英国、日本等在内的国家媒体纷纷将目光投向中国,他们也不得不承认中国已经发生了实质性的变化,中国科技、制造崛起的信号已经很强烈了!易评助手卡密观察到,就在海关总署...

易单助手:马斯克赞赏中国人工智能与电力发展,强调中美人才竞争差异

1liu新闻 事关中国,马斯克最新表态! 2025年5月24日 周六 头条资讯据美国消费者新闻与商业频道(CNBC)报道,马斯克近日在接受该媒体采访时表示,在人工智能领域,中国有两件事做得很好,其...

电销掌柜:智慧城市,云计算与AI如何改变我们的通勤体验

电销掌柜:智慧城市,云计算与AI如何改变我们的通勤体验

一年几千亿。 阿里云、移动云、天翼云、联通云……这帮巨头拿着几辈子都花不完的钱,往一个叫“云”的无底洞里砸。 你以为他们在干嘛?烧钱比赛吗? 不。 他们在给咱们生活的这座城市,装一个“天眼”级...

易评助手下载安装:中国核心科技企业盘点,航天、华为、阿里、腾讯等12家公司实力解析

易评助手下载安装:中国核心科技企业盘点,航天、华为、阿里、腾讯等12家公司实力解析

中国有核心科技的十二家公司 1:第一家公司:中国航天科技集团 2:第二家公司:华为技术。这家伙在5G领域那是真的牛,全球都认咱们中国的技术。 3:第三家公司:阿里巴巴。云计算这块,阿里云在国...

多多出评工具:阿里巴巴在科技创新与社会责任中的突出表现与贡献分析

多多出评工具:阿里巴巴在科技创新与社会责任中的突出表现与贡献分析

科技不是人情世故,而是真金白银的投入!一份报告炸出中国科技的真面目! 前段时间有一份报告是《2024年研发投入前100家民营企业创新状况报告》,报告显示阿里巴巴是研发投入前三的企业。 而就在最...

易评助手下载官网:阿里巴巴25周年蜕变,从初创到全球云计算领军者的创新之路

易评助手下载官网:阿里巴巴25周年蜕变,从初创到全球云计算领军者的创新之路

阿里巴巴都25周年了,越看越不简单!看到现在,彻底看清了这家企业!从原来杭州湖畔花园的一家小办公室,到如今家喻户晓的世界500强企业。真没想到,阿里已经走过了25年的时间,当然这些年来阿里有变化的不只...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。