【AI】螞蟻集團開源發布全模態大模型Ming-Flash-Omni 2.0
《經濟通通訊社11日專訊》今日,螞蟻集團開源發布全模態大模型Ming-Flash
-Omni2﹒0。在多項公開基準測試中,該模型在視覺語言理解、語音可控生成、圖像生
成與編輯等關鍵能力表現突出,部分指標超越Gemini2﹒5Pro,成為開源全模態
大模型性能新標桿。
據介紹,Ming-Flash-Omni2﹒0也是業界首個全場景音頻統一生成模型
,可在同一條音軌中同時生成語音、環境音
《經濟通通訊社11日專訊》今日,螞蟻集團開源發布全模態大模型Ming-Flash
-Omni2﹒0。在多項公開基準測試中,該模型在視覺語言理解、語音可控生成、圖像生
成與編輯等關鍵能力表現突出,部分指標超越Gemini2﹒5Pro,成為開源全模態
大模型性能新標桿。
據介紹,Ming-Flash-Omni2﹒0也是業界首個全場景音頻統一生成模型
,可在同一條音軌中同時生成語音、環境音