20 maj 2025
Toonsutra sjell në jetë komiken: Një përvojë gjithëpërfshirëse leximi Mundësuar nga Gemini API, Gemini 2.5 Pro Preview & Lyria 2

Toonsutra, destinacioni më i madh i Indisë për uebkomike dhe romane grafike, është në një mision për të lidhur një audiencë globale me universin e gjerë narrativ të uebkomikeve, me një fokus të veçantë në bërjen e tregimeve të klasit botëror të aksesueshme në gjuhët indiane. I shtyrë për të thelluar angazhimin e audiencës, Toonsutra pyeti: si mund ta transformojmë përvojën tradicionale të leximit komik në një udhëtim zhytës, kinematografik ku zëri, muzika dhe historia rrjedhin natyrshëm në gjuhën në të cilën lexuesit ëndërrojnë?
Hartimi i kapitullit tjetër në tregimin ndërveprues
Kjo pyetje u bë fokusi kryesor i Toonsutra. Reagimet nga komuniteti i tyre theksuan një dëshirë për angazhim më të thellë dhe akses më të gjerë. Duke njohur potencialin e jashtëzakonshëm të AI dhe i mbështetur nga Fondi i së ardhmes i AI i Google, Toonsutra bashkëpunoi me ekipet Labs dhe Partner Innovation në Google. Së bashku, ata po përdorin Gemini API, duke shfaqur Gemini 2.5 Pro Preview dhe Lyria 2 (modeli i gjenerimit të muzikës së Google DeepMind) për të rishpikur përvojën e uebkomikeve për fansat në mbarë botën.
Bashkëpunimi, i zbuluar në Google I/O, shfaq një përvojë komike të fuqizuar nga AI ku historitë nuk qëndrojnë vetëm në faqe; ata përgjigjen dhe angazhohen, duke transformuar imazhet statike në narrativa audio dinamike:
- Tregim përshtatës i AI: Gemini 2.5 Pro Preview krijon rrëfim të AI që rrjedh me shpejtësi leximi, duke i dhënë jetë personazheve me zëra të veçantë. Kjo është veçanërisht me ndikim për lexuesit indianë, ku nuancat kulturore në gjuhë ndryshojnë shumë. Aftësitë adaptive dhe shumëgjuhëshe të Gemini 2.5 Pro, të kombinuara me motorin e pronarit të kontekstit të karakterit të Toonsutra, sigurojnë tregim të qëndrueshëm dhe të nuancuar.
- Pamje dinamike zanore: Nëpërmjet të kuptuarit multimodal të Gemini 2.5 Pro Preview dhe aftësive origjinale të gjenerimit të audios të Lyria dhe Gemini, platforma gjeneron peizazhe zhytëse duke përfshirë muzikën e porositur, zërat dhe tingujt e lëvizjes - nga tingëllima e një shpate deri te ambienti i një tregu plot zhurmë.
- Interaktivitet i përmirësuar: Elementet e mundësuar nga Gemini 2.5 Pro i mundësojnë lexuesit të nxisin një dialog unik, të eksplorojnë detaje të fshehura ose të ndikojnë në mënyrë delikate temat narrative, duke siguruar përvoja të ndryshme leximi.
Detajet Teknike
Ky projekt prezanton një qasje të re për të gjeneruar automatikisht audio gjithëpërfshirëse për komike dixhitale, të kompletuar me meta të dhëna hapësinore të sinkronizuara. Në thelbin e saj është një arkitekturë me shumë agjentë e ndërtuar mbi Gemini 2.5 Pro Preview, që përfshin agjentë të specializuar: Nxjerrësin e kontekstit komik, transmetuesin, kompozitorin muzikor, drejtorin muzikor dhe agjentët e efekteve zanore.
Rrjedha e punës fillon me Comic Context Extractor Agent që analizon kapituj të shumtë komik për një përmbledhje gjithëpërfshirëse, zhanre dhe tipare të karakterit. Panelet më pas nxirren me kufij të përcaktuar. Agjenti Narrator lidh dialogun nga transkriptet me këto panele, të cilat, të pasuruara nga konteksti i personazheve, shprehen nga Gemini Native Audio. Njëkohësisht, Music Composer Agent, i frymëzuar nga grupimi i filmave, përdor Gemini 2.5 Pro Preview për të dalluar temat dhe emocionet nëpër kapituj, duke i përkthyer ato në nxitje muzikore që Lyria të gjenerojë rezultate në sfond. Agjenti i Drejtorit të Muzikës e harton këtë muzikë në panele specifike, ndërsa Agjenti i Efekteve të Zërit harton panelet në etiketat përkatëse të efekteve zanore, të marra nga një bazë të dhënash.
Kjo rrjedhë pune arrin kulmin me një skedar JSON që detajon koordinatat e panelit, zërat, efektet zanore dhe muzikën e sinkronizuar, të dorëzuara në pjesën e përparme të Toonsutra.
Një sukses kyç është aftësia e Gemini për të gjeneruar në mënyrë origjinale këtë audio kinematografike në gjuhët indike, duke filluar me hindisht, duke çuar më tej misionin e aksesueshmërisë së Toonsutra.
"Ky ka qenë një rast përdorimi kaq argëtues dhe emocionues për të shfrytëzuar aftësitë multimodale dhe shumëgjuhëshe të Gemini. Përdorimi i modeleve të fuqishme të gjuhëve të mëdha të Google për të kuptuar semantikisht imazhet, personazhet, vizatimin e skicave dhe temave ka qenë një mekanizëm i shkëlqyeshëm për të kondensuar një media hyrëse në bazat e saj. Gjenerata e fuqishme muzikore e Lyria dhe gjuha e fundit e Binjakëve, veçanërisht në gjuhën indiane, ne mundësuam të jepnim përvojën e fundit të gjuhës indiane. në partneritet me Toonsutra”
Nga Google I/O te Disponueshmëria e Përgjithshme
Ekspozita e Google I/O ishte një moment historik i jashtëzakonshëm, duke demonstruar se si AI mund të përmirësojë rrënjësisht përmbajtjen dixhitale. Për Toonsutra, ky është vetëm kapitulli i parë.
Siç thotë shpesh ekipi ynë: "Vizioni ynë në Toonsutra ka qenë gjithmonë që t'i bëjmë komiket më tërheqëse dhe më të aksesueshme për të gjithë, kudo. Ky bashkëpunim me Google, është një hap monumental drejt këtij vizioni. Aftësia për të krijuar këto përvoja leximi thellësisht zhytëse, të fuqizuara nga AI adreson drejtpërdrejt reagimet nga komuniteti ynë dhe përshpejton reagimin tonë dhe përshpejton inovacionin tonë. për ta integruar këtë në aplikacionin Toonsutra, duke eksploruar përfundimisht edhe një API të mundshme për të fuqizuar krijuesit e tjerë."
Toonsutra tani është fokusuar në integrimin në faza të këtyre veçorive në aplikacionin e tyre kryesor, duke dëgjuar nga afër reagimet e komunitetit. Ata besojnë se jo vetëm po pasurojnë platformën e tyre, por po ndihmojnë në krijimin e një plani të ri për përmbajtjen e përmirësuar me AI.
Gati për të ndërtuar? Eksploroni dokumentacionin e Gemini API dhe filloni me Google AI Studio sot.
Toonsutra është një pjesëmarrëse në Fondin e Ardhmërisë së AI të Google që investon dhe bashkëpunon me startup-et ambicioze që ndërtojnë atë që vjen më pas në AI.
Harvey
Harvey përdor BigLaw Bench për të demonstruar aftësinë e jashtëzakonshme të Gemini 2.5 Pro për të trajtuar detyra komplekse të arsyetimit ligjor si kujdesi i duhur dhe hartimi i proceseve gjyqësore.