TensorRT-LLM中的MoE并行推理

news/2025/1/9 15:44:36 标签: GPU

2种并行方式:

moe_tp_size:按照维度切分,每个GPU拥有所有Expert的一部分权重。

moe_ep_size:  按照Expert切分,每个GPU有用一部分Expert的所有权重。

二者可以搭配一起使用。

限制:二者的乘积,必须等于模型并行(不是指moe_tp_size,而是整个模型的tp_size)的卡数。


http://www.niftyadmin.cn/n/5817679.html

相关文章

腾讯云AI代码助手编程挑战赛-古诗词学习

一、作品介绍 在科技与文化深度交融的当下,“腾讯云 AI 代码助手编程挑战赛 - 每日古诗词” 宛如一颗璀璨的新星,闪耀登场。它绝非一场普通的赛事,而是一座连接编程智慧与古典诗词韵味的桥梁。 这项挑战赛以独特的视角,将每日古…

Jenkins-部署-windows

Jenkins-部署-windows 一: Jenkins 资料 一: Jenkins 资料

JAVA常见问题解答

1、面型过程与面向对象的区别: 抽象级别:面向过程主要关注解决问题的步骤和过程,以函数为基本单位,强调算法和流程控制。而面向对象则更关注问题领域中的实体和对象,强调将问题划分为多个相互关联的对象,并…

Perl语言的文件操作

Perl语言的文件操作 引言 Perl是一种强大的编程语言,广泛用于文本处理、系统管理、Web开发等诸多领域。其强大的正则表达式和文件操作能力使其在数据处理和脚本编写中备受青睐。本文将深入探讨Perl语言中的文件操作,包括文件的打开、读取、写入和关闭操…

攻防世界 bug

发现有Register界面,先去注册 登录以后发现以下界面,点击Manage显示you are not admin,并且在注册界面用admin为注册名时显示用户名已存在。初步推测是设法改变admin的密码取得权限。 在主界面一通操作并没有什么发现,去findpw…

详解MySQL 自动增加字段与 UUID区别

文章目录 前言原理自动增加字段UUID 优缺点自动增加字段UUID 应用场景自动增加字段UUID 案例及说明自动增加字段案例UUID案例 代码注释自动增加字段代码注释UUID代码注释 总结 前言 在数据库设计中,为表中的行生成唯一标识符是常见需求。MySQL提供了字段自动增加&a…

windows10下安装Microsoft SQL Server 2016

一、下载安装包 网站:MSDN, 我告诉你 - 做一个安静的工具站 选择需要的版本,点击详细信息,复制ed2k链接,打开eMule或迅雷,新建下载,粘贴链接,开始下载。 下载好的文件是一个.iso镜像文件。 二、…

xrdp连接闪退情况之一

错误核查 首先使用命令vim ~/.xsession-errors,当里面的报错信息为WARNING **: Could not make bus activated clients aware of XDG_CURRENT_DESKTOPGNOME environment variable:Failed to execute child process “dbus-launch” (No such file or directory)&am…