登临科技KS系列GPU产品全面适配MiniMax M2.5模型

作者:chy123|分类:金融百科

近日,苏州登临科技股份有限公司(以下简称“登临科技”)自主研发的KS系列高性能通用GPU已全面完成对最新一代大模型MiniMax M2.5的深度适配与优化。通过创新的GPU+架构,登临科技不仅实现了对MiniMax M2.5模型的高效支持,更依托KS38/ KS58云端推理卡——单卡最高配备128GB显存,推出仅需2卡即可部署MiniMax M2.5的突破性方案,大幅降低整体部署成本。将大模型部署的硬件门槛与成本降至行业新低,为企业级AI应用的规模化落地注入强劲动力。

MiniMax M2.5 深度适配

提供超低成本部署方案

MiniMax M2.5作为MiniMax M2.x系列发布的最新版本模型,在代码编写、智能体工具使用与搜索、办公任务以及一系列其他具有经济价值的任务上达到当前最先进(SOTA)水平,在 SWE-Bench Verified、Multi-SWE-Bench 和 BrowseComp(含上下文管理)等评测中分别取得了 80.2%、51.3% 和 76.3% 的高分。随着OpenClaw的爆火,全球API调用token数量暴增,据全球最大LLM API聚合平台OpenRouter 2月24日数据,中国AI模型Token消耗量占平台前十总量的61%,前三名全部来自中国实验室。MiniMax M2.5以单周2.45万亿Token登顶榜首,环比暴涨197%。

目前登临的KS38/ KS58云端推理卡,单卡最高配备128GB显存,2卡即可部署MiniMax M2.5,极大降低综合部署成本。并提供单服务器内模型全上下文长度推理,释放MiniMax M2.5完整能力。

03281b50-175f-11f1-90a1-92fbcf53809c.png

GPU+架构:效率与通用的完美融合

重新定义算力效能

登临科技的GPU+架构是其核心技术优势所在,它巧妙地融合了传统 GPU 的通用性与 ASIC 的高效率,为大模型推理等 AI 应用提供了从算力到能效的全面解决方案。

卓越能效比,降本增效的关键登临 GPU+架构通过创新的可扩展、软件定义的片内异构体系结构,实现了能效比的大幅提升,在算力需求暴涨的今天,能源消耗成为算力扩展瓶颈的趋势愈发明显,GPU+架构正是解决这一困境的钥匙。

高度生态兼容性,降低迁移门槛登临硬件兼容 CUDA/OpenCL 等现有软件生态,算法模型可平滑迁移,极大节约了企业的移植成本和开发周期。在大模型领域,登临软件栈更是在Day0适配了DeepSeek、GLM、MiniMax、Kimi、GPT-OSS等国内外主流大模型。

强大算力与内存支持,超长上下文处理登临纳适II 系列加速卡提供了高达560 TOPS 的云端有效AI算力,以及 128GB 的大显存配置,为大模型推理和超长上下文提供基础支撑。

全栈国产化与自主可控,保障供应链安全登临坚持自主创新,核心IP(架构/微架构/算术单元等)全自研,已申请国内外各类知识产权 200 余项。其产品支持 Windows10、Linux、麒麟等系统,并兼容各类国产 CPU,确保了从硬件到软件的全国产化能力,为客户提供了安全可靠的算力底座。

行业价值与未来展望

登临科技 KS 系列对 MiniMax M2.5 的支持,以及 KS38/KS58 两卡部署方案的推出,不仅为企业提供了高性能、低成本的大模型运行平台,更在多个层面创造了显著的行业价值:

降低 AI 应用门槛 :使更多中小企业能够负担得起先进的大模型技术,加速 AI 技术的普及和应用。

提升业务处理效率 :在内容审核、智能客服、数据分析等场景中,提供更快、更准确的处理能力,提升业务效率和用户体验。

推动国产算力发展 :作为国产高性能通用 GPU 的领先企业,登临科技通过实际应用验证了国产算力的可靠性和先进性,为构建自主可控的 AI 算力生态贡献力量。

展望未来,登临科技将持续深化在大模型领域的技术创新与行业应用,致力于推动 AI 视觉与大模型的深度融合,优化 AI 模型部署与优化门槛,拓展全场景 AI 应用,为各行业的智能化升级提供更高效、更智能、更安全的算力解决方案。

关于登临

苏州登临科技股份有限公司是一家专注于高性能通用 GPU 设计与研发的创新型企业,致力于为 AI 计算、图形渲染、高性能计算等领域提供自主可控、高效能的算力解决方案。公司以“技术赋能行业革新”为理念,通过自主研发的GPU+架构,在多个行业实现了规模化商业落地,成为推动国产算力发展的关键力量。

05 03月

2026-03-05 11:43:24

浏览4349
返回
目录
返回
首页
化工行业期货股票双双大涨!社保基金重仓7只机构重点关注股 微泡介导超声如何用“物理之力”重塑实体瘤免疫格局?