Xiaomi bemutatja három új MiMo AI modelljét, közelít a Claude Opus 4.6-hez

Xiaomi egyidejűleg jelentette be a MiMo-V2-Pro, MiMo-V2-Omni és MiMo-V2-TTS AI modelleket, melyek célja, hogy teljes platformot nyújtsanak AI ügynökökhez, robotokhoz és hangfelhasználáshoz.

A MiMo-V2-Pro, a legújabb nyelvi modell, több mint egy trillió paramétert tartalmaz, 42 milliárd aktív paraméterrel egy lekérdezés során, és a PinchBench, ClawEval és AI Index alapján a Claude Opus 4.6-hez közelít. A vállalat közlése szerint a modell 78 % pontot ért el a SWE-bench kódolási teszten, míg a ClawEval 81 pontot nyert, szinte megegyezve a Claude Opus 4.6‑nél.

A MiMo-V2-Pro ára $1/millió bemeneti token és $3/millió kimeneti token, ami jelentősen alacsonyabb, mint a Claude Sonnet 4.6 ($3–15) vagy a Claude Opus 4.6 ($5–25).

A MiMo-V2-Omni multimodális modell képes képet, videót és audiót egyidejűleg feldolgozni, eszközhívásokat végrehajtani és felhasználói felületeket navigálni. A modell audio és kép benchmarkokon meghaladja a Claude Opus 4.6‑t, de a ClawEvalben még mindig lemarad a GPT-5.2 és a Claude Opus 4.6 után.

A MiMo-V2-TTS beszédfelismerő modell 100 millió óra hangadatot használ, és természetes nyelvi leírás alapján képes érzelmi hangnemeket és paralinguális jeleket előállítani. A modell képes hangos és énekes szöveget is előadni egyetlen API hívással.

Xiaomi az új modellek bevezetésével azt jelzi, hogy teljes stack AI ügynök platformot kíván létrehozni, és a fejlesztők számára heti ingyenes API-hozzáférést kínál.