2025 年 5 月 16 日
Harvey:使用 BigLaw Bench 驗證 Gemini 2.5 Pro 預覽版的進階法律推理功能

Harvey:使用 BigLaw Bench 驗證 Gemini 2.5 Pro 預覽版的進階法律推理功能
法律產業需要 AI 解決方案,以便精確且細緻地處理大量複雜資訊。傳統 AI 基準測試通常無法滿足法律實務的實際需求,因此很難找出真正能勝任高價值法律工作的模型。Harvey 是一家充滿活力的新創公司,致力透過 AI 改變法律工作流程。為解決這個問題,他們開發了 BigLaw Bench,這是一項全面的評估架構,可評估大型語言模型 (LLM) 在模擬實際法律工作的任務中表現如何。在最近的嚴格評估中,Gemini 2.5 Pro 預先發布版表現出色,展現出在重要法律領域提高效率的卓越潛力。
Gemini 2.5 Pro 預先發布版在 Biglaw Bench 上領先
Harvey 最近運用 BigLaw Bench 架構進行的評估結果清楚顯示,Gemini 2.5 Pro 預覽版在核心法律推理工作上展現出卓越的專業能力,特別是需要針對長篇幅法律輸入內容或輸出內容進行推理的任務。如 Harvey 公開分享的結果所示,透過各自的 API 測試模型 (包括 Gemini 2.5 Pro 預先發布版),Gemini 2.5 Pro 預先發布版在 BigLaw Bench 上獲得 85.02% 的領先分數,優於這項全面評估中評估的其他模型。

這項領先功能對於多項高價值法律活動至關重要。BigLaw Bench 中的關鍵評估工作展示了 Gemini 2.5 Pro 預先發布版的優勢:
- 交易盡職調查:Gemini 2.5 Pro 預覽版展現出強大的實力,可從多個冗長的服務協議中提取並摘要重要條款 (例如轉讓、賠償、終止條款)。這表示我們有很大潛力,可簡化耗時的手動文件審查程序。
- 交易結構化:模型可針對複雜的金融選項 (例如PIPE、承銷的股票發行、債券發行)。這項模型在以清楚易懂的方式呈現資訊 (即使是沒有深厚財務專業知識的人也能理解) 和建議潛在的立即可行項目方面,展現出良好的表現。
- 訴訟草擬:在訴訟相關工作評估中,Gemini 2.5 Pro 預覽版展現出卓越的表現,可根據大量的簡報文件,產生法律摘要的詳細大綱。這項功能顯示,在未來,AI 將可在法律論點的發展和組織初期階段提供實質協助。
- 文件審查與分析:在評估過程中,我們審查了多份不同的審判文件 (通話記錄、電子郵件、備忘錄),發現 Gemini 2.5 Pro 預覽版在製作事件的時間順序摘要方面相當出色。此外,模型也能找出記錄中的重要不一致之處和模糊之處,這也是徹底的法律分析中的重要環節。
在這些評估中,Gemini 2.5 Pro 預覽版在輸入內容中展現了強大的推理能力,這些輸入內容包含數百頁的資料,這也是法律工作中常見的情況。此外,它還能使用這些素材產生更長篇幅且完整的輸出內容,提供更深入的洞察和分析。這些核心功能凸顯了 Gemini 2.5 Pro 預覽版的潛力,可用於處理複雜的法律工作,需要對大量文件進行推理,以支援盡職調查、審查和起草用途。
法律 AI 的新標準
Harvey 應用 AI 負責人 Niko Grupen 表示:「我們致力於為法律專業人士提供最先進的工具。」「我們透過 BigLaw Bench 評估 Gemini 2.5 Pro 預先發布版,發現這款模型在整合複雜法律資訊方面表現出色。這項洞察資訊為我們未來的產品開發願景注入動力,我們希望運用這些優勢,發揮前所未見的效率,讓律師專注於更高層次的策略性工作。」
法律工作未來趨勢
Harvey 致力於嚴謹評估,並對 Gemini 2.5 Pro 搶先體驗版等先進 AI 模型進行深入分析,展現 AI 在法律領域的轉型潛力。他們的研究成果為日後的創新奠定基礎,未來這些創新技術將重塑法律專業人士處理最繁重工作的方式。
如要瞭解 Gemini 2.5 Pro 預覽版的進階推理和綜合能力如何為您自有的應用程式提供動力,請參閱 Gemini API 說明文件,或在 Google AI Studio 中開始使用。
哈維是 Google AI 未來基金的參與者,該基金會投資並與雄心勃勃的新創公司合作,共同打造 AI 領域的未來。