DALL-E Adlı Yapay Zeka Yazılımı, Sözlerinizi Resimlere Dönüştürüyor


Bir grup açık kaynak geliştiricisinin DALL-E Mini yazılımı mükemmel değil, ancak bazen insanların metin açıklamalarına uyan resimlerle etkili bir şekilde ortaya çıkıyor.

Ekran görüntüsü

Son zamanlarda sosyal medya beslemelerinizde gezinirken, altyazıların eşlik ettiği illüstrasyonları fark etmişsinizdir. Artık popülerler.

Gördüğünüz resimler, muhtemelen DALL-E adlı bir metinden görüntüye programı tarafından mümkün kılınmıştır. Çizimleri yayınlamadan önce insanlar, yapay zeka modelleri aracılığıyla görüntülere dönüştürülen kelimeler ekliyor.

Örneğin, bir heyecan kullanıcı, “Olmak ya da olmamak, haham tutan avokado, mermer heykel” yazılı bir tweet attı. Oldukça zarif olan ekteki resim, bir avokadoyu tutan bir cüppeli ve bir melon şapkalı sakallı bir adamın mermer bir heykelini göstermektedir.

AI modelleri geliyor Google’ın Imagen yazılımının yanı sıra OpenAI tarafından desteklenen bir start-up Microsoft DALL-E 2’yi geliştiren İnternet sitesiOpenAI, DALL-E 2’yi “doğal dilde bir tanımdan gerçekçi görüntüler ve sanat yaratabilen yeni bir AI sistemi” olarak adlandırıyor.

Ancak bu alanda olanların çoğu, fotoğraflarını paylaşan ve bazı durumlarda yüksek katılım sağlayan nispeten küçük bir grup insandan geliyor. Bunun nedeni, Google ve OpenAI’nin teknolojiyi genel olarak halka sunmamış olmasıdır.

OpenAI’nin ilk kullanıcılarının çoğu, arkadaşlar ve akrabalar çalışanların. Erişim arıyorsanız, bir bekleme listesine katılmanız ve profesyonel bir sanatçı, geliştirici, akademik araştırmacı, gazeteci veya çevrimiçi içerik oluşturucu olup olmadığınızı belirtmeniz gerekir.

“Erişimi hızlandırmak için çok çalışıyoruz, ancak herkese ulaşmamız biraz zaman alacak gibi görünüyor; OpenAI’den Joanne Jang, 15 Haziran itibariyle 10.217 kişiyi DALL-E’yi denemeye davet ettik” dedi. yardım sayfası şirketin web sitesinde.

Herkese açık olan bir sistem, DALL-E Mini. üzerine çekiyor açık kaynak kodu gevşek bir şekilde organize edilmiş bir geliştirici ekibinden gelir ve genellikle taleple aşırı yüklenir. Kullanma girişimleri, “Çok fazla trafik, lütfen tekrar deneyin” yazan bir iletişim kutusuyla karşılaşabilir.

Bu, 2004’te insanları sınırsız e-posta depolama alanıyla cezbeden Google’ın Gmail hizmetini biraz andırıyor. Erken benimseyenler yalnızca ilk başta davetiye ile içeri girebilir ve milyonları beklemeye bırakabilir. Artık Gmail, dünyanın en popüler e-posta hizmetlerinden biridir.

Metinden görseller oluşturmak hiçbir zaman e-posta kadar yaygın olmayabilir. Ancak teknolojinin kesinlikle bir anı var ve çekiciliğinin bir kısmı münhasırlıkta.

Özel araştırma laboratuvarı Midjourney, insanların formu doldurun Discord sohbet uygulamasındaki bir kanaldan görüntü oluşturma botunu denemek istiyorlarsa. Yalnızca belirli bir grup insan Imagen’i kullanıyor ve ondan resimler yayınlıyor.

Metinden resme hizmetler karmaşıktır, bir kullanıcının istemlerinin en önemli kısımlarını tanımlar ve ardından bu terimleri göstermenin en iyi yolunu tahmin eder. Google, Imagen modelini, 460 milyon dahili resim-metin çiftinde yüzlerce şirket içi AI çipiyle eğitti. dış veri.

Arayüzler basittir. Genellikle bir metin kutusu, oluşturma işlemini başlatmak için bir düğme ve aşağıda görüntüleri görüntülemek için bir alan bulunur. Kaynağı belirtmek için Google ve OpenAI, DALL-E 2 ve Imagen’den görüntülerin sağ alt köşesine filigran ekler.

Yazılımı oluşturan şirketler ve gruplar, haklı olarak, herkesin kapılara bir kerede hücum etmesinden endişe duyuyorlar. Bu yapay zeka modelleriyle sorguları yürütmek için web isteklerinin işlenmesi pahalıya mal olabilir. Daha da önemlisi, modeller mükemmel değil ve her zaman dünyayı doğru bir şekilde temsil eden sonuçlar üretmiyor.

Mühendisler, modelleri, insanların Flickr’da yayınladığı fotoğraflar da dahil olmak üzere, web’deki geniş kelime ve resim koleksiyonları üzerinde eğitti.

Merkezi San Francisco’da bulunan OpenAI, esasen web’i tarayarak nasıl resim yapılacağını öğrenen bir modelden gelebilecek zarar potansiyelinin farkında. Riski denemek ve ele almak için çalışanlar eğitim verilerinden şiddet içeren içeriği kaldırdı ve kullanıcılar şirketi ihlal edebilecek istemler gönderirse DALL-E 2’nin görüntü oluşturmasını engelleyen filtreler var. politika çıplaklığa, şiddete, komplolara veya siyasi içeriğe karşı.

OpenAI araştırma bilimcisi Prafulla Dhariwal, “Bu sistemlerin güvenliğini artırmaya yönelik devam eden bir süreç var” dedi.

Sonuçlardaki önyargıları anlamak da önemlidir ve AI için daha geniş bir endişeyi temsil eder. Texas’tan bir geliştirici olan Boris Dayma ve DALL-E Mini üzerinde çalışan diğerleri, sorunu bir mektupta dile getirdiler. açıklama onların yazılımları.

“Daha yüksek düzeyde eğitim (mühendisler, doktorlar veya bilim adamları gibi) veya yüksek fiziksel emek (inşaat endüstrisinde olduğu gibi) gösteren meslekler çoğunlukla beyaz erkekler tarafından temsil edilir” diye yazdılar. “Bunun aksine, hemşireler, sekreterler veya asistanlar tipik olarak kadındır ve genellikle beyazdır.”

Google, Imagen modelinin benzer eksikliklerini şurada açıkladı: akademik bir makale.

Risklere rağmen OpenAI, teknolojinin sağlayabileceği şeyler konusunda heyecanlı. Dhariwal, bireyler için yaratıcı fırsatlar yaratabileceğini ve iç tasarım veya web sitelerini giydirme için ticari uygulamalara yardımcı olabileceğini söyledi.

Sonuçlar zamanla gelişmeye devam etmelidir. DALL-E 2, tanıtıldı Nisan ayında, OpenAI’nin geçen yıl duyurduğu ilk sürümden ve şirketin metin oluşturma modelinden daha gerçekçi görüntüler yayıyor. GPTher nesilde daha sofistike hale geldi.

Dhariwal, “Bu sistemlerin çoğu için bunun olmasını bekleyebilirsiniz,” dedi.

İZLEMEK: Eski Pres. Obama dezenformasyon alıyor, AI ile daha da kötüleşebileceğini söylüyor


Kaynak : https://worldnewsera.com/news/us-news/a-i-software-called-dall-e-turns-your-words-into-pictures/

Yorum yapın

SMM Panel