Harvey: weryfikacja zaawansowanego rozumowania prawnego Gemini 2.5 Pro w BigLaw Bench

Niko Grupen

Szef działu Applied AI

Vishal Dharmadhikari

AI DevRel

Harvey: weryfikacja zaawansowanego rozumowania prawnego Gemini 2.5 Pro w BigLaw Bench

Branża prawnicza wymaga rozwiązań AI, które z wysoką precyzją i z uwzględnieniem niuansów będą w stanie przeszukiwać ogromne ilości złożonych informacji. Tradycyjne testy porównawcze AI często nie uwzględniają rzeczywistych wymagań praktyki prawniczej, przez co trudno jest zidentyfikować modele, które naprawdę nadają się do wykonywania wartościowych zadań prawniczych. Harvey, dynamiczny startup zajmujący się przekształcaniem procesów związanych z prawoznawstwem za pomocą AI, poradził sobie z tym problemem, opracowując BigLaw Bench – kompleksową platformę do oceny wydajności dużych modeli językowych (LLM) w przypadku zadań odzwierciedlających rzeczywistą pracę prawnika. W ramach niedawnych rygorystycznych ocen model Gemini 2.5 Pro Preview okazał się wyjątkowo skuteczny i wykazał wyjątkowy potencjał do zwiększania wydajności w kluczowych obszarach prawnych.

Gemini 2.5 Pro w wersji wstępnej na liście BigLaw Bench

Z niedawnych ocen Harveya, wykorzystujących ramy BigLaw Bench, wynika, że Gemini 2.5 Pro Preview wykazuje niezwykłą biegłość w głównych zadaniach związanych z rozpatrywaniem spraw prawnych, w szczególności w przypadku zadań wymagających wnioskowania na podstawie długich danych wejściowych lub wyjściowych. Jak wynika z publicznie udostępnionych wyników Harveya, uzyskanych dzięki testowaniu modeli, w tym Gemini 2.5 Pro Preview, za pomocą odpowiednich interfejsów API, model Gemini 2.5 Pro Preview uzyskał najwyższy wynik 85,02% w ramach BigLaw Bench, wyprzedzając inne modele oceniane w ramach tej kompleksowej oceny.

Tekst alternatywny: wykres słupkowy o nazwie

Ta zaawansowana funkcja jest kluczowa dla wielu działań prawnych o wysokiej wartości. Kluczowe zadania oceny w BigLaw Bench pokazały mocne strony Gemini 2.5 Pro Preview:

Sprawdzenie transakcji: wersja podglądowa Gemini 2.5 Pro wykazała dużą zdolność do wyodrębniania i podsumowywania kluczowych postanowień (np. dotyczących przeniesienia praw, odpowiedzialności odszkodowawczej i rozwiązania umowy) z wielu długich umów o świadczenie usług. Sugeruje to znaczny potencjał uproszczenia czasochłonnego procesu ręcznego sprawdzania dokumentów.
Struktura transakcji: model wygenerował kompleksowe, dobrze ustrukturyzowane analizy porównawcze złożonych opcji finansowych (np. PIPE, oferty akcji upoważnione, oferty obligacji). Model okazał się skuteczny w prezentowaniu tych informacji w przejrzysty i przystępny sposób, nawet dla osób bez dużej wiedzy finansowej, oraz w podpowiadaniu potencjalnych działań, które można podjąć natychmiast.
Opracowywanie dokumentów procesowych: podczas testów związanych z zadaniami dotyczącymi sporów sądowych model Gemini 2.5 Pro Preview wykazał się znaczną zdolnością do generowania szczegółowych konspektów pism procesowych na podstawie dużych ilości dokumentów informacyjnych. Ta funkcja wskazuje na przyszłość, w której AI może znacznie ułatwiać początkowe etapy tworzenia i organizowania argumentów prawnych.
Sprawdzanie i analiza dokumentów: ocena polegająca na sprawdzeniu różnych dokumentów z procesu testowania (dzienniki połączeń, e-maile, notatki) wykazała, że Gemini 2.5 Pro Preview jest skuteczne w tworzeniu spójnych chronologicznych podsumowań zdarzeń. Ponadto model wykazał potencjał w identyfikowaniu istotnych niespójności i niejasności w rekordach, co jest kluczowym aspektem dokładnej analizy prawnej.

W ramach tych testów Gemini 2.5 Pro Preview wykazało się umiejętnością logicznego rozumowania na podstawie danych wejściowych obejmujących setki stron materiałów, co jest typowym scenariuszem w prac prawniczych. Dodatkowo na podstawie tych materiałów można było generować dłuższe i pełniejsze wyniki, co umożliwiało uzyskiwanie bardziej szczegółowych statystyk i analiz. Te podstawowe możliwości wskazują na potencjał wykorzystania Gemini 2.5 Pro Preview w skomplikowanych pracach prawniczych wymagających analizowania dużych zbiorów dokumentów w celu wspierania staranności, sprawdzania i sporządzania pism procesowych.

Nowy standard AI dla zespołów prawnych

„W Harvey chcemy zapewnić prawnikom dostęp do najbardziej zaawansowanych narzędzi” – mówi Niko Grupen, szef działu AI w Harvey. „Nasze testy Gemini 2.5 Pro Preview w ramach BigLaw Bench wykazały, że model ten ma niezwykłą zdolność do syntezowania skomplikowanych informacji prawnych. Te informacje stanowią podstawę naszej wizji przyszłego rozwoju usługi, w ramach której chcemy wykorzystać te mocne strony, aby osiągnąć niespotykaną dotąd wydajność i umożliwić prawnikom skupienie się na strategicznych zadaniach o wyższym priorytecie”.

Przyszłość pracy w zakresie prawa

Harvey’s commitment to rigorous evaluation and their insightful analysis of cutting-edge AI models like Gemini 2.5 Pro Preview are demonstrating the transformative potential of AI in the legal field. Ich odkrycia utorowały drogę przyszłym innowacjom, które mają zmienić sposób, w jaki prawnicy podchodzą do najbardziej wymagających zadań.

Aby dowiedzieć się, jak zaawansowane możliwości wnioskowania i syntezy Gemini 2.5 Pro Preview mogą wzbogacić Twoje aplikacje, zapoznaj się z dokumentacją Gemini API lub zacznij korzystać z tej usługi w Google AI Studio.

Harvey bierze udział w funduszu AI Futures Fund, który inwestuje w ambitne startupy i współpracuje z nimi nad rozwojem AI.

Harvey: weryfikacja zaawansowanego rozumowania prawnego Gemini 2.5 Pro w BigLaw Bench

Harvey: weryfikacja zaawansowanego rozumowania prawnego Gemini 2.5 Pro w BigLaw Bench

Gemini 2.5 Pro w wersji wstępnej na liście BigLaw Bench

Nowy standard AI dla zespołów prawnych

Przyszłość pracy w zakresie prawa

Powiązane studia przypadków