Bist 100
10.343,31 2%
DOLAR
32,66 0,03%
EURO
35,14 0,01%
ALTIN
2.435,95 0,02%

Apple açık kaynaklı bir yapay zekâ görüntü düzenleme modeli yayınladı!

Apple, açık kaynaklı çok modlu bir yapay zekâ modeliyle yapay zekâ görüntü düzenleme teknolojisi üzerinde çalışıyor.

Yayın Tarihi: 10.02.2024 17:33
Güncelleme Tarihi: 10.02.2024 17:33

Apple açık kaynaklı bir yapay zekâ görüntü düzenleme modeli yayınladı!

Bu haftanın başlarında Apple ve Santa Barbara Kaliforniya Üniversitesi'nden araştırmacılar, basit metin komutlarına dayanarak Photoshop gibi görüntüleri düzenleyebilen çok modlu bir yapay zekâ modeli olan MLLM-Guided Image Editing ya da "MGIE" yi piyasaya sürdü.

Yapay zekâ geliştirme cephesinde Apple, planları konusunda karakteristik olarak temkinli davrandı. Ayrıca, geçen yılki ChatGPT furyasının ardından büyük bir yapay zekâ planı açıklamayan birkaç şirketten biri oldu. Bununla birlikte, Apple'ın "Apple GPT" adlı ChatGPT benzeri bir sohbet robotunun şirket içi bir versiyonuna sahip olduğu bildirildi ve Tim Cook, Apple'ın bu yıl içinde bazı önemli AI duyuruları yapacağını söyledi.

Bu duyurunun bir yapay zekâ görüntü düzenleme aracı içerip içermediğini netleşecek. Ancak bu modele dayanarak Apple kesinlikle bazı araştırma ve geliştirme çalışmaları yapıyor.

yapay zeka

KOMUTLARI ALGILAYARAK GÖRÜNTÜYÜ İSTEDİĞİNİZ GİBİ DÜZENLEYEBİLİYOR

Yapılan açıklamada, halihazırda yapay zekâlı görüntü düzenleme araçları olsa da, "insan talimatları bazen mevcut yöntemlerin yakalaması ve takip etmesi için çok kısadır" denildi. Bu da genellikle cansız ya da başarısız sonuçlara yol açıyor. MGIE, görüntü eğitim verilerinin yanı sıra metin komutlarını veya anlamlı talimatları anlamak için MLLM'leri veya çok modlu büyük dil modellerini kullanan farklı bir yaklaşım olarak biliniyor. Etkili bir şekilde, MLLM'lerden öğrenme, MGIE'nin doğal dil komutlarını ağır bir açıklamaya ihtiyaç duymadan anlamasına yardımcı oluyor.

Araştırmadan alınan örneklerde, MGIE biberli bir pizzanın girdi görüntüsünü alabiliyor ve "bunu daha sağlıklı hale getir" komutunu kullanarak bunun biberli pizzaya atıfta bulunduğu ve "daha sağlıklı" ifadesinin sebze eklemek olarak yorumlanabileceği sonucunu çıkarabiliyor. Böylece, biraz yeşil sebze serpiştirilmiş bir pepperoni pizza görüntüsü oluşturuyor.