💥 Gate广场活动: #ART创作大赛# 💥
在 Gate广场发布与 ART、Launchpool、交易赛或余币宝活动 相关的原创内容,即有机会瓜分 1,600 ART 奖励!
📅 活动时间:2025年9月12日 12:00 – 9月17日 24:00 (UTC+8)
📌 相关详情:
Gate Launchpool:抵押 GT 领取 ART 空投
链接:https://www.gate.com/announcements/article/46996
ART 交易赛:分享总奖池 208,334 ART
链接:https://www.gate.com/announcements/article/47047
Gate 余币宝:ART 7天定期投资,年化收益高达 500% APR
链接:https://www.gate.com/announcements/article/47046
📌 参与方式:
发布原创内容,主题需与 ART 或相关活动(Launchpool / 交易赛 / 余币宝) 相关
内容不少于 80 字
帖子添加话题: #ART创作大赛#
附上任意活动参与截图
🏆 奖励设置:
🥇 一等奖(1名):500 ART
🥈 二等奖(2名):250 ART/人
🥉 三等奖(6名):100 ART/人
📄 注意事项:
内容必须原创,禁止抄袭或刷量
获奖者需完成 Gate
英伟达发布 TensorRT-LLM,可将 H100 推理性能最高提升 8 倍
据 IT 之家 9 月 9 日报道,英伟达近日宣布推出名为 TensorRT-LLM,是一个深度优化的开源库,能够在 Hopper 等 AI GPU 上加速所有大语言模型的推理性能。英伟达目前已经和开源社区合作,利用 SmoothQuant、FlashAttention 和 fMHA 等尖端技术,实现 AI 内核来优化其 GPU,可以加速 GPT-3(175B),Llama Falcom(180B)和 Bloom 模型。
TensorRT-LLM 的亮点在于引入了名为 In-Flight batching 的调度方案,允许工作独立于其他任务进入和退出 GPU。该方案允许同一 GPU 在处理大型计算密集型请求时,动态处理多个较小的查询,提高 GPU 的处理性能,可以让 H100 的吞吐量加快 2 倍。
在性能测试中,英伟达以 A100 为基础,对比了 H100 以及启用 TensorRT-LLM 的 H100,在 GPT-J 6B 推理中,H100 推理性能比 A100 提升 4 倍,而启用 TensorRT-LLM 的 H100 性能是 A100 的 8 倍。