《楠楠自語-莫灝楠》如何看待DeepSeek事件

《楠楠自語》最近DeepSeek講得風風火火,說甚麼中國AI超越OpenAI云云
。究竟是不是單靠2048張H800顯示卡,就可以造到一個大語言模型?

DeepSeek-V3擁有671億參數,採用MoE混合專家技術,因此每次只須調用
37億參數工作,不用動輒就671億組同時運作。為了高效運作,它配備了智能調度員,確保
每個專家都有任務。DeepSeek-V3還有「MLA」信息過濾器,使

Read More 

You may also like...

Generated by Feedzy