国台办:和统后台湾无需巨额防务支出
中国移动发布 MoMA 平台:单位 Token 成本压降 30%,接入超 300 款 AI 模型_蜘蛛资讯网

Kimi、GLM 等业界优质模型,覆盖文本生成、语音处理、多模态理解等多项能力,满足政务、金融、工业、医疗等场景应用需求。MoMA 平台基于国产算力部署自研推理引擎打造,结合智能路由对长尾模型资源调度,实现单位 Token 成本压降约 30%、降低资源占用率 50% 以上。还能通过智能缓存、上下文复用、Token 压缩等技术进一步降低使用成本。同时,该平台还首创智能路由引擎技术,可根据用户需求灵活
、食品板块领涨,腾讯音乐涨超3%,药明合联涨超2%,海天味业涨超1%;半导体、纺织服饰、硬件设备板块跌幅居前,纳芯微跌超3%,剑桥科技跌超2%,普拉达跌近1%。
能通过智能缓存、上下文复用、Token 压缩等技术进一步降低使用成本。同时,该平台还首创智能路由引擎技术,可根据用户需求灵活切换“成本优先”“效果优先”“均衡优先”等三种策略,为用户动态匹配最适合的模型。当模型出现超时、限流或故障时,平台可自动实现秒级切换,确保业务连续不中断。此外,MoMA 还带有“机密模型”服务,将模型部署在机密容器中,基于硬件隔离技术保障计算过程的数据安全,覆盖从芯片到应用的
当前文章:http://e9vbch.hengluotao.cn/u7d2zd7/8w82ff.docx
发布时间:10:01:07