分享

2025 年 5 月 16 日

Harvey:通过大律所法官验证 Gemini 2.5 Pro 预览版的高级法律推理

Niko Grupen

应用型人工智能主管

Vishal Dharmadhikari

AI 开发者关系团队

Toonsutra 展示版主图

法律行业需要 AI 解决方案,能够准确而细致地浏览大量复杂信息。传统的 AI 基准通常无法满足法律实践的实际需求,因此很难确定真正能够胜任高价值法律工作的模型。Harvey 是一家充满活力的初创公司,致力于通过 AI 变革法律工作流程。该公司开发了 BigLaw Bench,这是一个全面的框架,用于评估大语言模型 (LLM) 在模拟实际法律工作的任务中的表现。在他们最近的严格评估中,Gemini 2.5 Pro 预览版脱颖而出,展现出在关键法律领域提高效率的卓越潜力。

Gemini 2.5 Pro 预览版在大型律师事务所中处于领先地位

Harvey 最近利用 BigLaw Bench 框架进行的评估明确表明,Gemini 2.5 Pro 预览版在核心法律推理任务方面表现出色,尤其是在需要对长篇幅法律输入或输出进行推理时。如 Harvey 公开分享的结果所示,这些结果是通过测试包括 Gemini 2.5 Pro 预览版在内的模型(通过各自的 API 进行测试)而得出的,其中 Gemini 2.5 Pro 预览版在 BigLaw Bench 上取得了 85.02% 的领先得分,表现优于此全面评估中评估的其他模型。

替代文本:标题为

这项领先功能对于各种高价值法律活动至关重要。BigLaw Bench 中的关键评估任务展示了 Gemini 2.5 Pro 预览版的优势:

  • 交易尽职调查:Gemini 2.5 Pro 预览版能够从多份冗长的服务协议中提取和总结关键条款(例如转让、赔偿、终止条款)。这表明,我们有很大的潜力来简化耗时的手动文档审核流程。
  • 交易结构设计:该模型能够巧妙地生成对复杂金融产品(例如PIPE、承销的股票发行、债券发行)。该模型有望以清晰易懂的方式呈现这些信息(即使对于没有深厚财务专业知识的用户也是如此),并建议可能的立即行动事项。
  • 诉讼起草:在针对与诉讼相关的任务进行评估时,Gemini 2.5 Pro 预览版表现出惊人的能力,能够根据大量的法律简报文档生成法律简报的详细大纲。这项功能预示了未来 AI 在法律论证开发和组织的初始阶段将发挥重要作用。
  • 文档审核和分析:通过审核各种不同的试用文档(通话记录、电子邮件、备忘录)进行的评估表明,Gemini 2.5 Pro 预览版在创建事件的连贯时间顺序摘要方面表现出色。此外,该模型有望识别记录中的重大不一致性和模糊性,这对进行全面的法律分析至关重要。


在这些评估中,Gemini 2.5 Pro 预览版在处理包含数百页材料的输入时展现出了强大的推理能力,这在法律工作中很常见。此外,它还能够使用这些材料生成篇幅更长、更全面的输出内容,从而获得更深入的数据洞见和分析。这些核心功能凸显了 Gemini 2.5 Pro 预览版在复杂法律工作中的潜力,这些工作需要对大量文档进行推理,以支持尽职调查、审核和起草用例。

“Harvey 致力于为法律专业人士提供最先进的工具。”Harvey 应用 AI 主管 Niko Grupen 表示。“我们通过 BigLaw Bench 对 Gemini 2.5 Pro 预览版进行了评估,发现它在整合复杂法律信息方面表现出色。这些数据洞见为我们未来的产品开发愿景提供了助力,我们希望利用这些优势,实现前所未有的高效,并让律师能够专注于更高级别的战略性工作。”

Harvey 致力于进行严格的评估,并对 Gemini 2.5 Pro 预览版等尖端 AI 模型进行了深入分析,这证明了 AI 在法律领域的变革潜力。他们的研究成果为未来的创新奠定了基础,这些创新有望彻底改变法律专业人士处理最具挑战性的任务的方式。

如需了解 Gemini 2.5 Pro 预览版的高级推理和综合功能如何为您自己的应用提供支持,请参阅 Gemini API 文档或在 Google AI Studio 中开始使用。

Harvey 是 Google AI Futures Fund 的参与者,该基金会投资于雄心勃勃的初创公司,并与其合作,共同打造 AI 领域的未来技术。