Microsoft’un büyük yatırımcısı olduğu OpenAI daha önce Chat GPT ile yakın bir etki yaratmıştı.

Yapay zeka teknolojisi son birkaç yılda, komutla insan elinden çıkmış gibi fotoğraf, çizim, şiir üretebilecek bir noktaya ulaştı.

Sora ise yazılı metni büyük bir gerçeklikle videoya dönüştüren bir teknoloji olarak tanıtıldı.

OpenAI, bu teknolojiyi elde etmek için “yapay zekaya hareket halindeki dünyanın öğretildiğini” duyurdu.

"Güzel, karlı ve hareketli Tokyo. Kamera, havanın tadını çıkaran kişilerin ardında hareket ediyor. Sakura yaprakları rüzgarda uçuyor." metninin verildiği Sora'nın oluşturduğu video
Şirket kullanıcıların bir dakika uzunluğunda videolar üretebileceğini açıkladı.

Sora henüz her isteyenin ulaşabileceği bir teknoloji değil.

OpenAI, ortaya çıkabilecek tehlikelerin önünün alınabilmesi için, öncelikle Sora’nın belirlenen profesyoneller tarafından test edileceğini duyurdu.

"Kırmızı yünlü örme motosiklet kaskı takan 30 yaşındaki uzay adamının maceraları" metninin verildiği Sora'nın oluşturduğu video

Yapay zeka şirketi, Sora’yı sinema ve tasarım gibi görsel içeriklerle uğraşan kişilere de öncelikli olarak açıyor.

OpenAI, teknolojinin hangi noktada olduğunu gösteren videolar da paylaştı.

Bu örneklerden birinde “Altına hücum dönemi California’sına ait bir tarihi görüntü” ifadesi karşısında Sora’nın oldukça gerçekçi bir video yarattığı görülüyor.

Bir başka örnekte ise “Tokyo’da deri ceketli bir kadının siyah ayakkabılarla, şehir ışıkları arasında yürümesini içeren” video isteğinin gerçeğe çok yakın şekilde üretildiği görülüyor.

OpenAI, Sora’nın karmaşık sahnelere yanıt verebilecek kapasitede olduğunu açıklıyor. Kullanıcının talep edebileceği cisimlerin gerçek dünyada nasıl varolduğunu anlayabildiği ifade ediliyor.

Şirket Sora’nın şu an için zayıf yanları olduğunu kabul ederek, bazı kullanıcı taleplerini karıştırabileceğini de açıkladı. Bir kurabiyeden ısırık alındığına ilişkin videoda, kurabiyede ısırık izi olmayabileceği örneği verildi.

OpenAI, şiddet ve cinsel içeriklerin engellenmesi, ünlü benzerliği videoları gibi içeriklerin engelleneceğini de duyurdu.

Teknolojinin bu tür komutları videoya dönüştürmeyeceği savunuldu.

Ünlü teknoloji Youtuber'ı Marques Brownlee, Sora ile ilgili ilk izlenimini "korkutucu" olarak tanımladı.

The Verge'den Tom Warren da Sora'nın yapay zeka için "Vay Canına" noktası olarak sayılabileceği yorumunu yaptı.

Bir başka teknoloji yazarı Sora'nın kapasitesini "Bu nasıl olabilir" ifadesiyle değerlendirdi.

Apple'ın kurucularından Steve Wozniak, Tesla ve Space X'in sahibi Elon Musk'ın da aralarında bulunduğu teknoloji devi isimler, "İnsanlarla rekabet edebilecek AI sistemleri, topluma ve insanlığa karşı çok büyük riskler oluşturuyor" görüşünü savunuyor.

GOOGLE GEMİNİ'Yİ TANITTI

Google, büyük dil modeli Gemini'yi piyasaya sürülmesinden yalnızca iki ay sonra yeni sürümü Gemini 1.5'i geliştiriciler ve kurumsal kullanıcılar için tanıttı.

Google, Gemini 1.5'te pek çok alanda gelişme kaydettiğini belirtiyor. Gemini 1.5 Pro, şirketin yakın zamanda piyasaya sürdüğü üst seviye Gemini Ultra ile aynı seviyedeyken, Gemini 1.0 Pro'yu kıyaslama testlerinde yüzde 87 ile geride bırakıyor.

Bu gelişimin, "Uzmanların Karışımı" veya MoE olarak bilinen, giderek yaygınlaşan bir teknik sayesinde gerçekleştiği belirtiliyor. Bu teknikte, bir sorgu gönderildiğinde her şey her zaman işlenmek yerine yalnızca modelin bir kısmını çalıştırılıyor. Bu yaklaşım, modeli hem kullanıcı için daha hızlı, hem de Google için daha verimli hale getiriyor.

Artık çok daha büyük veriyi işleyebiliyor

Ancak Gemini 1.5'te CEO Sundar Pichai başta olmak üzere tüm şirketi özellikle heyecanlandıran yeni bir şey var: Gemini 1.5'in çok büyük bir bağlam penceresi var, bu da çok daha büyük sorguları işleyebileceği ve aynı anda çok daha fazla bilgiye bakabileceği anlamına geliyor. OpenAI'nin GPT-4'ü için 128.000 ve mevcut Gemini Pro için 32.000 rakamına kıyasla 1 milyon token (jeton) seviyesinde bağlam penceresi sunuyor. Daha anlaşılır bir dille ifade etmek gerekirse, tek bir sorgulamayla 700.000'den fazla kelime, bir saatlik video, 11 saatlik ses ve 30.000'den fazla kodu anlayabiliyor ve cevap verebiliyor. Pichai ayrıca Google araştırmacılarının 10 milyon token bağlam penceresini test ettiğini söylüyor. Bu da, Game of Thrones serisinin tamamının aynı anda sorgulanmasına eşdeğer. Google örnek olarak Buster Keaton'un 44 dakikalık filmini veriyor.

Pichai ayrıca daha geniş bağlam penceresinin işletmeler için son derece faydalı olacağını düşünüyor. "Bu, sorgu anında çok sayıda kişisel bağlam ve bilgi ekleyebileceğiniz kullanım senaryolarına olanak tanıyor" diyor. "Sorgu penceresini önemli ölçüde genişlettiğimizi düşünün." Pichai, film yapımcılarının filmlerinin tamamını yükleyip Gemini'ye eleştirmenlerin ne söyleyebileceğini sorabileceklerini düşünüyor. Ayrıca şirketlerin Gemini'yi çok sayıda mali kaydı incelemek için kullanabileceklerini söyleyerek, “Bunu yaptığımız en büyük atılımlardan biri olarak görüyorum” diyor.

Şimdilik Gemini 1.5, Google'ın Vertex AI ve AI Studio aracılığıyla yalnızca ticari kullanıcılar ve geliştiricilerin kullanımına sunulacak. Daha sonra Gemini 1.0'ın yerini alacak ve Gemini Pro'nun gemini.google.com'da ve şirketin uygulamalarında herkesin kullanımına açık olan standart sürümü, 128.000 token bağlam penceresine sahip Gemini 1.5 Pro olacak. 1 milyona ulaşmak için fazladan ödeme yapmak gerekecek. Google ayrıca, özellikle yeni daha geniş bağlam penceresiyle ilgili olarak modelin güvenlik ve etik sınırlarını da test ediyor.

Nvidia'nın piyasa değeri Alphabet'i de geçti

Yapay zeka çiplerine olan talep artmaya devam ederken, California merkezli çip üreticisi Nvidia, yaklaşık 1,83 trilyon dolarlık piyasa değeri ile Amazon'un ardından Alphabet'i de geride bıraktı.

Nvidia'nın hisseleri bugün yüzde 2,5 kazançla 739 dolara yükselirken, şirketin hisselerindeki artış yıl başından bu yana yüzde 50'ye yaklaştı.

Piyasa değeri bugün 1,83 trilyon dolara ulaşan Nvidia, Amazon'un ardından Alphabet'i de geçti.

Bugün hisselerinde yüzde 0,5 artış görülen Google'ın ana kuruluşu Alphabet'in piyasa değeri ise 1,82 trilyon dolar olarak hesaplandı.

Böylelikle Nvidia, ABD'nin en değerli üçüncü şirketi konumuna gelirken, Alphabet dördüncü sıraya geriledi.

Ülkede en değerli ilk iki şirket de 3 trilyon dolarla Microsoft ve 2,8 trilyon dolarla Apple oldu. ABD'li perakende devi Amazon ise yaklaşık 1,8 trilyon dolarlık piyasa değeriyle beşinci sırada yer aldı.

.Nvidia market cap threatens Alphabet after overtaking Amazon | Reuters

Nvidia, dün de piyasa değeri açısından Amazon'u geride bırakarak dördüncü sıraya yükselmişti.

Şirketin piyasa değeri, yapay zeka çiplerine yönelik artan talebin etkisiyle geçen yıl mayıs ayında 1 trilyon dolara ulaşmıştı.