Paylaş

20 Mayıs 2025

Toonsutra, Çizgi Romanları Hayata Getiriyor: Gemini API, Gemini 2.5 Pro Önizlemesi ve Lyria 2 ile Etkileyici Bir Okuma Deneyimi

Sharad Devarajan | Vishal Anand

Toonsutra'nın kurucuları

Avneet Singh

Ürün Müdürü, Google İş Ortağı Yenilikleri

Cartwheel vitrini hero

Hindistan'ın web çizgi romanları ve grafik romanlar için en büyük merkezi olan Toonsutra, dünya çapındaki bir kitleyi web çizgi romanlarının geniş anlatım evrenine bağlama misyonuyla hareket ediyor. Özellikle de dünya standartlarında hikayeleri Hint dillerinde erişilebilir hale getirmeye odaklanıyor. Kitle etkileşimini artırmak isteyen Toonsutra, geleneksel çizgi roman okuma deneyimini ses, müzik ve hikayenin okuyucuların hayal ettiği dilde doğal bir şekilde aktığı sürükleyici ve sinematik bir yolculuğa nasıl dönüştürebileceğini sorguladı.

Etkileşimli hikaye anlatımının yeni bölümünü yazma

Bu soru, Toonsutra'nın ana odak noktası haline geldi. Topluluğundan gelen geri bildirimler, daha derin etkileşim ve daha geniş erişilebilirlik için istek olduğunu gösteriyordu. Yapay zekanın muazzam potansiyelini fark eden ve Google'ın Yapay Zeka Geleceği Fonu'ndan destek alan Toonsutra, Google'ın Labs ve İş Ortağı İnovasyon ekipleriyle iş ortaklığı yaptı. İkili, Gemini 2.5 Pro Preview'in yer aldığı Gemini API'den ve Lyria 2'den (Google DeepMind'ın müzik oluşturma modeli) yararlanarak web çizgi romanı deneyimini dünya genelindeki takipçiler için yeniden tasarlıyor.

Google I/O'da tanıtılan bu ortak çalışmada, hikayelerin sadece sayfa üzerinde yer almadığı, statik resimlerin dinamik sesli anlatımlara dönüştüğü, yapay zeka destekli bir çizgi roman deneyimi sunulmaktadır:

  • Uyarlanabilir yapay zeka anlatımı: Gemini 2.5 Pro Preview, okuma hızına uygun yapay zeka anlatımı oluşturur ve karakterleri farklı seslerle canlandırır. Bu durum, özellikle dilde kültürel nüansların çok farklı olduğu Hindistan'daki okuyucular için çok etkilidir. Gemini 2.5 Pro'nun uyarlanabilir ve çok dilli özellikleri, Toonsutra'nın özel karakter bağlam motoruyla birlikte tutarlı ve ayrıntılı bir hikaye anlatımına olanak tanır.
  • Dinamik ses ortamları: Gemini 2.5 Pro Preview'in çok formatlı anlayışı ve Lyria ile Gemini'nin yerleşik ses oluşturma özellikleri sayesinde platform, özel müzik, seslendirme ve hareket sesleri (ör. kılıç sesleri, hareketli bir pazarın ambiyansı) içeren etkileyici ses ortamları oluşturur.
  • Geliştirilmiş etkileşim: Gemini 2.5 Pro Preview'ın desteklediği öğeler, okuyucuların benzersiz diyaloglar başlatmasına, gizli ayrıntıları keşfetmesine veya anlatım konularını gizlice etkilemesine olanak tanıyarak çeşitli okuma deneyimleri sunar.

Teknik Ayrıntılar

Bu proje, dijital çizgi romanlar için senkronize edilmiş uzamsal meta verilerle birlikte sürükleyici sesleri otomatik olarak oluşturmaya yönelik yeni bir yaklaşım sunar. Gemini 2.5 Pro Preview'a dayalı çok aracılı bir mimariye sahip olan bu araç, özel aracılardan (Comic Context Extractor, Narrator, Music Composer, Music Director ve Sound Effects Agents) oluşur.

İş akışı, kapsamlı bir özet, tür ve karakter özellikleri için birden fazla çizgi roman bölümünü analiz eden Çizgi Roman Bağlam Ayıklama Aracısı ile başlar. Ardından paneller, tanımlanmış sınırlarla ayıklanır. Seslendiren temsilci, transkriptlerdeki diyalogları bu panellerle uyumlu hale getirir. Bu paneller, karakter bağlamıyla zenginleştirilir ve Gemini Native Audio tarafından seslendirilir. Aynı zamanda, film müziklerinden ilham alan Müzik Bestecisi Ajansı, bölümlerdeki temaları ve duyguları belirlemek için Gemini 2.5 Pro Preview'ı kullanır. Bu temaları ve duyguları, Lyria'nın arka plan müzikleri oluşturması için müzik istemlerine dönüştürür. Müzik Yöneticisi aracısı bu müziği belirli panellerle eşler. Ses Efektleri aracısı ise panelleri bir veritabanından alınan alakalı ses efekti etiketleriyle eşler.

Bu iş akışı, panel koordinatlarını, seslendirmeleri, ses efektlerini ve senkronize edilmiş müziği ayrıntılı olarak içeren bir JSON dosyasıyla sona erer. Bu dosya, Toonsutra'nın ön ucuna gönderilir.

Gemini'nin Hintçe başta olmak üzere Hint dillerinde bu sinematik sesi yerel olarak üretebilmesi, Toonsutra'nın erişilebilirlik misyonunu destekleyen önemli bir başarıdır.

"Gemini'nin çok formatlı ve çok dilli özelliklerinden yararlanmak için çok eğlenceli ve heyecan verici bir kullanım alanı bulduk. Google'ın güçlü büyük dil modellerini kullanarak resimleri, karakterleri anlamsal olarak anlamak, eskizler ve temalar çizmek, giriş medyasını temel öğelerine indirgemek için mükemmel bir mekanizma olmuştur. Lyria'nın güçlü müzik oluşturma özelliği ve Gemini'nin özellikle Hint dillerinde yerel konuşma özellikleri, Toonsutra ile ortaklaşa sunduğumuz nihai deneyimi iyileştirdi."

- Avneet (PM, Google İş Ortağı İnovasyon Ekibi)

Google I/O'dan Genel Kullanıma

Google I/O gösterimi, yapay zekanın dijital içeriği nasıl temelden iyileştirebileceğini gösteren inanılmaz bir dönüm noktasıydı. Toonsutra için bu yalnızca ilk bölüm.

Ekibimizin sık sık söylediği gibi: "Toonsutra'daki vizyonumuz her zaman çizgi romanları daha ilgi çekici ve her yerde herkes için erişilebilir hale getirmek olmuştur. Google ile yaptığımız bu iş birliği, bu vizyona doğru dev bir adımdır. Bu son derece etkileyici, yapay zeka destekli okuma deneyimlerini oluşturma olanağı, topluluğumuzdan gelen geri bildirimleri doğrudan ele almamızı ve yeniliklerimizi hızlandırmamızı sağlıyor. I/O'daki yanıtlardan heyecan duyuyoruz ve bu özelliği Toonsutra uygulamasına entegre etmeyi sabırsızlıkla bekliyoruz. Hatta diğer içerik üreticileri desteklemek için potansiyel bir API'yi bile araştırıyoruz."

Toonsutra, topluluğun geri bildirimlerini dikkatle dinleyerek bu özelliklerin ana uygulamalarına aşamalı olarak entegrasyonuna odaklanıyor. Şirket, yalnızca platformlarını zenginleştirmekle kalmayıp yapay zeka destekli içerikler için yeni bir plan oluşturmaya da yardımcı olduğuna inanıyor.

Derlemeye hazır mısınız? Gemini API belgelerini inceleyin ve Google AI Studio'yu hemen kullanmaya başlayın.

Toonsutra, Google'ın yapay zeka alanındaki yenilikleri geliştiren iddialı girişimlere yatırım yapan ve bu girişimlerle iş ortaklığı yapan Yapay Zeka Geleceği Fonu'nun bir katılımcısıdır.