Condividi

16 maggio 2025

Harvey: convalida del ragionamento legale avanzato della versione di anteprima di Gemini 2.5 Pro con BigLaw Bench

Niko Grupen

Responsabile dell'IA applicata

Vishal Dharmadhikari

DevRel per l'AI

Hero della sezione in evidenza di Toonsutra

Il settore legale richiede soluzioni di IA in grado di gestire un volume immenso di informazioni complesse con precisione e sfumature. I benchmark di IA tradizionali spesso non riescono a soddisfare le esigenze reali della pratica legale, rendendo difficile identificare modelli realmente in grado di svolgere attività legali di alto valore. Harvey, una startup dinamica dedicata alla trasformazione dei flussi di lavoro legali tramite l'IA, ha affrontato questo problema sviluppando BigLaw Bench, il suo framework completo per la valutazione del rendimento dei modelli linguistici di grandi dimensioni (LLM) in attività che rispecchiano il lavoro legale effettivo. Nelle recenti valutazioni rigorose, Gemini 2.5 Pro Preview ha dimostrato un rendimento eccezionale, mostrando un potenziale eccezionale per migliorare l'efficienza in importanti ambiti legali.

Anteprima di Gemini 2.5 Pro in prima linea nel settore BigLaw

Le recenti valutazioni di Harvey che utilizzano il framework BigLaw Bench hanno chiaramente indicato che la versione di anteprima di Gemini 2.5 Pro dimostra una notevole competenza nelle attività di ragionamento legale di base e, in particolare, nelle attività che richiedono il ragionamento su input o output legali di tipo lungo. Come mostrato nei risultati condivisi pubblicamente da Harvey, ottenuti testando modelli tra cui Gemini 2.5 Pro Preview tramite le rispettive API, Gemini 2.5 Pro Preview ha ottenuto il punteggio migliore dell'85,02% su BigLaw Bench, superando gli altri modelli valutati in questa valutazione completa.

Testo alternativo: grafico a barre con titolo

Questa funzionalità leader è fondamentale per una vasta gamma di attività legali di alto valore. Le attività di valutazione chiave all'interno di BigLaw Bench hanno messo in evidenza i punti di forza della versione di anteprima di Gemini 2.5 Pro:

  • Due diligence di transazioni: la versione di anteprima di Gemini 2.5 Pro ha dimostrato una notevole capacità di estrarre e riepilogare le clausole fondamentali (ad es. cessione, indennizzo, risoluzione) da più contratti di servizio lunghi. Ciò suggerisce un potenziale significativo per semplificare la procedura di revisione manuale dei documenti, che richiede molto tempo.
  • Strutturazione delle transazioni: il modello ha generato abilmente analisi comparative complete e ben strutturate di opzioni finanziarie complesse (ad es. PIPE, offerte di azioni sottoscritte, offerte di obbligazioni). Il modello si è dimostrato promettente nel presentare queste informazioni in modo chiaro e accessibile, anche per chi non ha competenze finanziarie approfondite, e nel suggerire potenziali azioni immediate.
  • Stesura di documenti legali: quando è stato valutato per le attività relative alle cause legali, Gemini 2.5 Pro Preview ha mostrato una notevole capacità di generare schemi dettagliati per le memorie legali in base a volumi considerevoli di documenti di briefing. Questa funzionalità indica un futuro in cui l'IA può essere di grande aiuto nelle fasi iniziali di sviluppo e organizzazione delle argomentazioni legali.
  • Revisione e analisi dei documenti: le valutazioni che hanno coinvolto la revisione di documenti di prova diversi (log delle chiamate, email, memo) hanno rivelato la forza di Gemini 2.5 Pro Preview nella creazione di riepiloghi cronologici coerenti degli eventi. Inoltre, il modello ha mostrato un potenziale nell'identificare incoerenze e ambiguità critiche all'interno del record, un aspetto fondamentale di un'analisi legale approfondita.


In queste valutazioni, Gemini 2.5 Pro Preview ha dimostrato un'ottima capacità di ragionamento su input costituiti da centinaia di pagine di materiale, uno scenario comune nel lavoro legale. Inoltre, è stato in grado di utilizzare questi materiali per generare output più lunghi e completi, consentendo approfondimenti e analisi più approfonditi. Queste funzionalità di base mettono in evidenza il potenziale di utilizzo di Gemini 2.5 Pro Preview per attività legali complesse che richiedono il ragionamento su grandi insiemi di documenti per supportare casi d'uso di due diligence, revisione e stesura.

"In Harvey ci impegniamo a fornire ai professionisti legali gli strumenti più avanzati", afferma Niko Grupen, Head of Applied AI di Harvey. "La nostra valutazione di Gemini 2.5 Pro Preview tramite BigLaw Bench ha rivelato la sua straordinaria capacità di sintetizzare informazioni legali complesse. Questa informazione alimenta la nostra visione per lo sviluppo futuro dei prodotti, in cui miriamo a sfruttare questi punti di forza per ottenere un'efficienza senza precedenti e consentire agli avvocati di concentrarsi su attività strategiche di livello superiore."

L'impegno di Harvey per una valutazione rigorosa e la sua analisi approfondita di modelli di IA all'avanguardia come Gemini 2.5 Pro Preview dimostrano il potenziale trasformativo dell'IA nel settore legale. I risultati aprono la strada a innovazioni future che promettono di riorganizzare il modo in cui i professionisti legali affrontano le attività più impegnative.

Per scoprire in che modo le funzionalità di sintesi e ragionamento avanzate di Gemini 2.5 Pro Preview possono potenziare le tue applicazioni, consulta la documentazione dell'API Gemini o inizia a utilizzare Google AI Studio.

Harvey fa parte del fondo AI Futures di Google, che investe e collabora con startup ambiziose che sviluppano le ultime novità nell'AI.