法律 AI 最容易被模組化嘅部份,其實好工程化:上載文件、切成片段、做 embedding、放入向量資料庫、檢索相關段落,再叫模型根據上下文回答、摘要或起草。呢套就係 RAG,Retrieval-Augmented Generation,簡單講即係先搵資料,再叫 AI 按住資料作答。
開源法律 RAG 項目已經清楚描述呢條路線。Ready Tensor 的法律文件 RAG 系統提到 PDF 上載、語意 embedding、FAISS indexing 同 LLM 回覆 。LegalRAG 描述用向量資料庫處理數碼化法律文本,提供有上下文嘅答案
。另一個 GitHub 項目 legal-rag-hy 則標榜按司法管轄區加權檢索,並產生有引用嘅答案
。
不過,開源唔等於全棧都免費或全棧都開放。有啲工具仍然靠商業模型 API:Mike 容許使用者插入 Claude 或 Gemini API keys ;LexClaw 則講明可配合 GPT、Claude、GLM 或本地模型
。換言之,開源法律 AI 很多時是工作流層、部署方式或資料控制權開放,而不是每一個模型都開源。
最先受壓嘅,會係低複雜度、高量、可容忍內部技術配置嘅工作。即係:如果法律團隊願意用多啲 IT/工程資源,換取較低授權費和更高控制權,開源就有機會入場。
背後係好直接嘅經濟學:如果一間機構可以自託管法律 AI 工作流,只為模型使用量、運算和內部維護付費,供應商要為普通文件聊天或初步合約審閱收取高溢價,就會愈嚟愈難。
但免費軟件唔等於免費落地。Lawra 指出,早期開源替代方案需要大量工程投入,包括 chunking pipeline、向量資料庫、citation parser 和 prompt orchestration 。法律團隊仲要處理管治、評估、安全審查、權限、保留政策同內部培訓;呢啲都係成本。
Harvey 同 Legora 賣嘅唔止係 chatbot。佢哋賣嘅係大型機構可以採購、審批、培訓、整合到工作流程,並向客戶交代嘅企業產品。
法律服務尤其敏感,買家信心有時同模型能力一樣重要。Sacra 一份訪問大型律師行創新主管的報告指,有大型律師行採用 Harvey,部分原因是客戶會點名要求 Harvey,反映品牌認知和外部客戶壓力會影響供應商選擇 。Business Insider 亦形容 Harvey 和 Legora 正在保守的法律行業爭奪客戶和可信度,背後有數以十億美元計的 AI 採用押注
。
採用數據亦解釋點解企業包裝仍然重要。一份 2026 年報告指,69% 法律專業人士使用通用 AI 工具,42% 使用法律專用 AI 工具;但只有 34% 律師行正式採用 AI,43% 既沒有 AI 政策,亦沒有計劃制定政策 。喺呢種環境,自託管工具可能吸引技術團隊,但好多機構仍會偏向有採購支援、導入流程、政策模板、培訓和客戶溝通能力嘅供應商。
仲有工作流問題。Harvey 的 2026 年調查描述大型律師行 AI 使用,已覆蓋起草、合約談判、盡職審查、discovery automation、playbook 生成和時間線等實質、面向客戶的工作 。開源工具可以攻入呢啲流程嘅某些環節,但現有來源未顯示開源法律 AI 已經在 Harvey 或 Legora 同等規模上贏得大型部署。
開源最強的策略牌,未必係便宜,而係控制權。
Law360 報道,法律 AI 早期採用者關注可量度節省,以及跨模型可攜性,以避免被單一供應商鎖定 。呢個取向有利於模組化架構:自託管文件庫、可替換模型、開放評估工具,以及唔完全依賴某一間供應商 roadmap 嘅工作流。
所以,即使開源短期內唔取代 Harvey 或 Legora,都可以迫商業平台改變。Harvey、Legora 以及同類供應商,可能要更明確支援模型選擇、資料匯出、透明評估,以及為商品化工作提供較低成本方案。否則,開源 stack 就會成為 build-versus-buy 討論入面更可信嘅 build 選項。
開源法律 AI 要由利潤壓力變成企業替換威脅,關鍵唔係再多幾個 demo,而係有機構級證據。值得留意嘅訊號包括:
喺呢啲訊號清楚出現之前,開源法律 AI 最合理嘅定位係一層強大壓力:佢會降低買家為普通文件 AI 付高價嘅意欲,推動模型可攜性,亦令較細或成本敏感嘅法律團隊可以自己砌出有用系統,而唔一定要即刻買高價企業平台。
開源法律 AI 已經嚴肅到,商業平台唔可以再將文件智能當成神秘黑盒。佢最先衝擊嘅會係毛利、vendor lock-in 同商品化工作流。
但對最高風險、面向客戶嘅大型法律工作而言,買一套平台仍然唔只係買模型;仲係買管治、支援、客戶安心、工作流整合和聲譽安全。
所以實際答案係:係,開源法律 AI 正在威脅 Harvey 和 Legora 點樣定價、點樣包裝法律 AI;但佢仍未證明可以全面取代兩者最強的企業級部署。
Comments
0 comments