发布日期:2026-03-23 08:37 点击次数:151


上周,两个莫得签字的匿名模子悄然上架有名 API 团员平台 OpenRouter,代号诀别是「Hunter Alpha」和「Healer Alpha」。它们莫得任何宣传,调用量却运行以一种不寻常的速率合手续攀升。

其中,Hunter Alpha 更是多天登顶日榜,累计调用量冲破 1T tokens。社区运行议论。最主流的揣测指向 DeepSeek,合计这是 DeepSeek V4 的内测版块。

OpenClaw 首创东说念主 Peter Steinberger 也在 X 平台发文探问,进一步烽火了社区的揣测热心。
小米官方正式晓示,Hunter Alpha 和 Healer Alpha 均为小米 MiMo 大模子的早期内测版块。答案揭晓的同期,小米 MiMo 大模子负责东说念主罗福莉也在 X 平台公开认领。
恰恰的是,罗福莉恰是 DeepSeek 的前相关员,换句话说,来自 DeepSeek 的她,在小米作念了让全网以为是 DeepSeek 的模子。

划重心,小米这次连气儿发布三款模子,虽各有侧重,但共同指向吞并个观念:让 AI 从「会对话」进化为「能完成任务」:
MiMo-V2-Pro 是旗舰文本基座,专为高强度 Agent 使命场景而生,主打推理、打算与用具调用。
MiMo-V2-Omni 是全模态 Agent 基座,原生会通文本、视觉与音频感知,买通从相识到推论的完竣链路。
MiMo-V2-TTS 是语音合成大模子,为 Agent 赋予有温度、多情谊的声息抒发智商,构周详栈的临了一环。

MiMo-V2-Pro:量大管饱,订价惟有竞品的五分之一
MiMo-V2-Pro 的总参数目冲破 1T,激活参数为 42B,较前代 MiMo-V2-Flash 扩大要 3 倍。
参数目大幅增长,但推理后果并未因此下落,这成绩于其鼎新的混杂隆重力架构(Hybrid Attention)。
该架构的混杂比例从前代的 5:1 进一步普及至 7:1,轻量 MTP(Multi Token Prediction)层的引入也加速了本色生成速率。
同期,MiMo-V2-Pro 撑合手高达 1M 的超长高下文窗口,这在料理长程 Agent 任务时具有彰着的结构性上风。

在专家泰斗大模子轮廓智能名次榜 Artificial Analysis 上,MiMo-V2-Pro 咫尺位列专家第八,国内第二。

基准测评除外,小米更强调「本色体感」。在 Coding Agent、通用 Agent 和 Tool Use 等维度,MiMo-V2-Pro 与 Claude Sonnet 4.6 处于吞并梯队。
在小米里面工程师的深度评测中,MiMo-V2-Pro 的代码工程智商已接近 Claude Opus 4.6,领有更出色的系统遐想智商与更优雅的代码作风。
Hunter Alpha 匿名内测时刻,调用量最高的几类应用多为编程专用用具,这一数据自己等于对模子智商最径直的阛阓考据。
在 OpenClaw 框架内,MiMo-V2-Pro 还展示了前端开发智商,简略一步生成遐想详尽、功能完备的网页,兼顾视觉质感与本色可用性。
订价层面,MiMo-V2-Pro 的 API 价钱仅为同级别竞品的 1/5。256K 高下文以内,输入每百万 tokens 订价 1 好意思元,输出 3 好意思元;1M 高下文范围内,则为输入 2 好意思元,输出 6 好意思元。
这个订价策略的信号很明确:小米但愿以价钱上风快速推动 MiMo-V2-Pro 在开发者生态中的浸透。
为此,小米还合股 OpenClaw、OpenCode、KiloCode、Blackbox 及 Cline 五大 Agent 框架团队,提供为期一周的限时免费接口撑合手,各框架的具体限免信息可关注 MiMo 官方与 MiMo 盛开平台公告。
咫尺,MiMo-V2-Pro 已精采盛开 API 职业,开发者可赶赴 https://platform.xiaomimimo.com 接入体验。官方模子体验页面 https://aistudio.xiaomimimo.com 同步上线了 MiMo Claw 功能,撑合手免费体验 MiMo-V2-Pro 的 Agent 智商。
MiMo-V2-Omni:能看、能听、还能我方砍价
若是说 MiMo-V2-Pro 是大脑,MiMo-V2-Omni 的贪心则更大,它试图让这个大脑同期领有眼睛、耳朵和手。
MiMo-V2-Omni 是小米首个在基座层面长入感知与步履的全模态模子,从底层架构运行就将文本、视觉与音频深度会通。
音频相识是 MiMo-V2-Omni 最具各别化的智商之一。它撑合手最初 10 小时的接续长音频相识,遮蔽从环境声分类到多谈话东说念主分离的复杂场景,轮廓发达杰出 Gemini 3 Pro。
图像相识方面,MiMo-V2-Omni 在多学科视觉推理与复杂图表分析上杰出 Claude Opus 4.6,靠拢 Gemini 3 Pro 等顶尖闭源模子水平。

视频相识方面,模子撑合手原生音视频合股输入,而非将音频和视频分开料理,在架构层面带来了着实的多模态相识上风。
在 Agent 实操场景中,MiMo-V2-Omni 展现出令东说念主印象真切的端到端任务完成智商。
衔尾 OpenClaw 框架,它不错像真东说念主一样操控浏览器:在小红书翻阅评测内容,整理购买冷漠,切换到京东跨店比价,相关客服争取优惠,米兰app官方网站直到完成下单,遭受多标签页切换、及时交互条目,均能见招拆招。
还有一个更具代表性的演示:用户只需说一句「作念一个先容视频,配上科技感音效,发到 TikTok 上」,模子就能完周详历程,包括自动设备渲染中的字体报错,最终证明视频审核通过、顺利上线。
在纯文本智能体任务上,MiMo-V2-Omni 相通保合手了高度竞争力,在 OpenClaw 榜单 PinchBench 上的发达并列 Gemini 3 Pro。

Healer Alpha 匿名内测时刻,模子在 PinchBench 上拿下平分第一,社区用户好评与基准测评厌世造成了珍惜的双向印证。
办公场景方面,MiMo-V2-Omni 已与金山办公张开合营,接入 WPS 灵犀,撑合手径直生成高质料的 Word 文档、结构化 Excel、排版标准的 PDF 与完竣 PPT。MiMo Studio 的 Claw 模块也已全面买通金山 WebOffice 生态,原生撑合手 Word、Excel、PPT、PDF 四大主流关节,遮蔽超 95% 的泛泛文档类型。
WPS 灵犀体验地址:lingxi.wps.cn
MiMo-V2-Omni 已盛开 API,撑合手 256K 高下文长度,输入订价每百万 tokens 0.4 好意思元,输出 2 好意思元,相通可在 https://platform.xiaomimimo.com 接入。
MiMo-V2-TTS:会打哈欠、会醉酒、还能唱歌
一个完竣的 Agent,不应该只会念念考和步履,它还需要启齿谈话。MiMo-V2-TTS 恰是为了填补这个缺口。
MiMo-V2-TTS 基于小米自研 Audio Tokenizer 和多码本语音文本合股建模架构,经过上亿小时语音数据的大界限预查验。
「上亿小时」这个数据量级,意味着模子得以遮蔽极为丰富的谈话作风、口音与场景,这是泛化智商的基础。
多维度强化学习后查验阶段,模子围绕韵律当然度、音质厚实性、音色克隆质料与场景口吻适配等多个维度合手续优化。
成绩于多层码本建模架构,强化学习阶段不错径直诈欺语音关联奖励信号对模子进行优化,而非依赖迤逦的文本侧反映,这让多维奖励信号简略更有用地作用于生成过程。
MiMo-V2-TTS 撑合手从举座基调定调到句内局部心情的多粒度截止,能在吞并句话内完成口吻更变与情谊递变,这在同类居品中并未几见。
模子简略智能识别标点符号、口吻词、强调标记等关节信号,并将其自动更变为当然的语音抒发,全程无需用户手动标注。
方言撑合手涵盖东北话、四川话、河南话、粤语、台湾腔等,同期具备变装上演式作风演绎与高质料歌声合成智商,让吞并个模子既能说、能演、也能唱。
官方示意,将来 MiMo-V2-TTS 将与 MiMo-V2-Omni 深度会通,让 Agent 不仅能看懂天下、相识天下,更能用豪阔发达力的声息去诠释这个天下。
AI,才是着实买通东说念主车家全生态的那根线
三款模子会聚发布,时分节点和居品组合皆不是惟恐。罗福莉在声明中坦言,从聊天范式到 Agent 范式的颐养发生得太快,「连咱们我方皆难以置信」。
但小米 MiMo 团队其实早有布局。罗福莉露出,1T 基础模子在数月前就已运行查验,最初方针是普及长高下文推理后果。混杂隆重力架构、1M 超长高下文窗口、MTP 低延伸推理,这些架构有谋略并非奴才潮水,而是在需要之前就构建好的结构性上风。
推动团队加速转向 Agent 观念,源于一个枢纽时刻。罗福莉第一次体验到复杂 Agent 框架时受到热烈冲击,立地对团队下达强劲领导:MiMo 团队中,来日对话次数少于 100 次的成员不错去职。
这个有些极点的条目背后,是她对 Agent 范式的坚忍判断。厌世是,团队的遐想力被澈底激励,相关速率随之大幅普及。
这种研发节律,重复上小米本就领有的生态基础,让这次发布的趣味趣味超出了单纯的模子竞赛。
小米集团永恒鼓吹「东说念主车家全生态」计谋,通过澎湃 OS 将手机、汽车(SU7 系列)与智能家居设备全面买通。这套生态的物理层面早已互联,但此前艰难一个着实趣味趣味上能跨设备相识意图、自主打算并完成任务的智能核心。
当今,MiMo-V2-Pro 负责推理打算,MiMo-V2-Omni 负责多模态感知与推论,MiMo-V2-TTS 负责语音抒发,三者重复,组成了驱动通盘这个词生态运转的完竣 AI 智商栈。
miclaw(小米手机端 AI 智能体)已接入 MiMo 大模子,具备系统级推论智商与「东说念主车家全生态」的深度集成,是这套智商栈落地的第一个具体时势。WPS 灵犀、小米浏览器接踵接入,也在说明吞并件事:MiMo 不仅仅一个对话居品,而是正在被镶嵌进各样应用场景的基础智商层。
多年来,各大科技公司皆在态状「AI 将买通一切」的愿景米兰app官网,而带着 Agent 基因的 MiMo-V2 系列模子和深谙生态布置的小米,显豁也曾作念好了准备。
比赛投注(中国)官方网站 上一篇:米兰 勾践作念王之后第一战,雄兵集体到敌军前自尽,成果却取得了获胜
下一篇:米兰app官网版 雷军:MiMo-V2-Pro已成为OpenRounter周榜第一

备案号: