AMD为锐龙AI Max带来更强AI反对于可运行128B大模子 Llama Scout接管混合专家方式-土曜科技港

AMD为锐龙AI Max带来更强AI反对于可运行128B大模子 Llama Scout接管混合专家方式

2025-09-19 17:39:23来源：

锐龙

AMD展现已经乐成运用锐龙AI Max+ 395处置器乐成在当地运行Meta的Llama 4 Scout 109B模子，使其可能锐敏地适用于差距场景。反对

AMD在年初的于可运行CES 2025上推出了锐龙AI Max系列处置器，Llama Scout接管混合专家方式，锐龙并具备至多40组RDNA 3.5架构CU的更强超大核显，现已经宣告对于锐龙AI Max的反对可变显存妨碍严正降级，使其反对于更低级的于可运行使命，好比剖析以及汇总大型文档的锐龙内容。大少数配置的更强最大token数约为4096个，特意是反对思考到该系列处置器运用了板载的LPDDR5X内存的情景下。以是于可运行每一次惟独17B处于行动形态，当初具备这种配置装备部署的锐龙用户可能在AMD官网高下载预览版驱动延迟尝鲜。但这次降级后锐龙AI Max平台可能扩展至256000个token，更强

AMD宣告对于锐龙AI Max的反对可变显存妨碍严正降级，该系列处置器彷佛更多的被妄想用于当地AI以及大模子等需要。以是可坚持较快的输入，从最小的1B微型模子到最大128B的模子，这让它可能运行128B巨细的大模子。这次降级还增大了对于大型高下文巨细的反对于，

尽管，并反对于视觉以及MCP，并装备256位的LPDDR5X内存操作器，反对于搜罗GGUF在内的多种量化格式，即将推出的Adrenalin Edition 25.8.1 WHQL驱动挨次可能让装备128GB内存的锐龙AI MAX配置装备部署散漫96GB作为显存运用，成为首款乐成运行该模子的Windows AI处置器，这让它可能运行128B参数的大模子。但需要开启Flash Attention功能，