![]()
微軟在 11 月 24 日發表了一款新的 AI 模型 Fara-7B,該模型具有 70 億參數,專為企業客戶設計,以滿足其對敏感資訊處理的隱私與合規需求。Fara-7B 的核心特點是可以在本地端運行,無需依賴雲端算力,這不僅降低了延遲,還避免了資料上傳至雲端,有助於實現本地化自動化,如內部帳號管理、機密文件處理等場景。
Fara-7B 能夠直接處理視覺輸入,實現所謂的「像素主權」,這一功能使得醫療、金融等高度監管產業能夠更安心地使用該模型。在 WebVoyager 测试基准中,Fara-7B 的任務完成率達 73.5%,高於 GPT-4o 的 65.1% 和 UI-TARS-1.5-7B 的 66.4%。此外,Fara-7B 完成任務的平均步數為 16 步,顯著少於 UI-TARS-1.5-7B 的 41 步,這表明它在準確率和效率之間達到了最佳平衡。
Fara-7B 配備了一種稱為「關鍵確認點」的機制,在遇到涉及用戶個資或不可逆操作(如發送信件、金錢轉移)時會自動暫停並請求確認,這有助於保障用戶的安全。此外,該模型還採用了「知識蒸餾」訓練方法,整合了由多代理系統 Magentic-One 產生的 14.5 萬筆成功導航範例,並壓縮至單一模型中學習。底層模型基於 Qwen2.5-VL-7B,具有最長 128,000 token 的上下文窗口,具備優異的圖文對齊能力,訓練過程以模仿人類專家操作為主。
微軟表示,未來將不再盲目追求更大的模型,而是致力於打造更「小而聰明、安全」的模型,並計畫引入強化學習(RL)於合成沙箱環境中進行自學訓練。目前,Fara-7B 已通過 MIT 授權開源釋出,用戶可在 Hugging Face 和微軟 Foundry 平台上下載使用,用於商業應用。然而,微軟也提醒,該模型尚未達到生產環境部署標準,目前主要適合開發者用於原型測試與功能驗證。