Yaklaşık iki yaşında bir çocuk, yeni doğan kız kardeşinin parmaklarına dokunuyor. Bu görüntü LAION-5B adı verilen veri kümesinde yer almaktadır. Ayrıca iki kızın isimleri ve fotoğrafın çekildiği hastane hakkında da bilgiler yer alıyor. İnsan Hakları İzleme Örgütü, diğer şeylerin yanı sıra yapay zeka modellerini eğitmek için kullanılan veri setinde Brezilya'dan yaklaşık 170 çocuk fotoğrafı buldu. Kuruluşa göre bu muhtemelen bu tür fotoğrafların yalnızca bir kısmı. Çocukların buna rıza göstermemesini eleştiriyor ve görüntülerin kötüye kullanılabileceği uyarısında bulunuyorlar.
Reklamcılık
İnsan Hakları İzleme Örgütü'nün çocuk hakları avukatı Hye Jung Han, “Çocukların, fotoğraflarının çalınıp kendilerine karşı kullanılabileceğinden korkmamaları gerekiyor” diyor. Bir blog yazısında hükümetleri, çocukların verilerini yapay zekanın kötüye kullanılmasından korumak için mümkün olan en kısa sürede yasa çıkarmaya çağırıyor.
LAION-5B, yapay zeka eğitimi için kullanılan çok sayıda veri kümesinden yalnızca biridir. Bu amaçla içerik internetten kazınır, yani toplanır ve işlenir. Örneğin, ucuz işgücünden kaynaklanan istenmeyen ve suç teşkil eden içerikler ayıklanıp işaretlenmektedir. İşlemenin ne ölçüde onay gerektirdiği dünya çapında farklı şekilde düzenleniyor veya hala belirsiz. Bir tarafta verilerin telif hakkı sorunu var, diğer tarafta ise verilerin korunması ve kişisel verilerin işlenmesi var.
İnsan Hakları İzleme Örgütü, altyazılar da dahil olmak üzere LAION-5B'de bulunan 5,85 milyar görüntünün yalnızca yüzde 0,0001'ini analiz etti. Ayrıca doğumların, doğum günlerinin ve iç çamaşırlarıyla dans eden çocukların görüntüleri de bulundu. Aktivistlerin yazdığına göre bu fotoğrafların çoğu başlangıçta yalnızca küçük bir grup insan tarafından görülebiliyordu. Bir arama motoru aracılığıyla bulunamadılar. Bazı görüntüler yıllar önce, LAION-5B'den yıllar önce yüklenmişti ve yapay zeka uygulamalarına ilişkin endişeler bile mevcuttu. Fotoğraflar ile eğitilmiş yapay zeka modelleri, fotoğrafları bire bir veya benzer şekilde çıktı olarak alabiliyor.
LAION kar amacı gütmeyen bir Alman kuruluşudur. Bilinen tüm içerikleri veri setlerinden sileceklerini duyurdular. İnsan Hakları İzleme Örgütü'ne göre kuruluş ayrıca çocukların ve vasilerinin, çocukların kişisel fotoğraflarının internetten kaldırılmasından sorumlu olduğunu belirtiyor; bu, istismara karşı en etkili korumadır.
İnternetteki tüm içeriğin şüpheli kullanımı
Pek çok web sitesi operatörü artık içeriklerini korumak için tarayıcıları sitelerinden hariç tutmaya çalışıyor. Örneğin Meta, kendi yapay zeka modellerini eğitmek için kullanmak amacıyla görüntüleri topluyor ve kendisi yayınlıyor. Şu anda gizlilik politikasının değiştirilmesine ilişkin bir bildirimle bunu yapmak için izin alıyorlar. Tüketici ve veri koruma savunucuları yaklaşımı eleştiriyor ve durdurulması çağrısında bulunuyor.
Google ayrıca internetteki mevcut tüm içeriği kullandığını da söylüyor. OpenAI, eğitim verilerinin kaynağına gelince çoğunlukla sessizdir. Ancak CTO Mira Murati, Facebook ve Instagram gibi meta platformlar da dahil olmak üzere, AI Sora videosunda ücretsiz olarak erişilebilen tüm verilerin kullanıldığını söyledi. YouTube'dan pek emin değildi ya da en azından öyle söyledi. Google, OpenAI'nin platformdaki videoları kullanması durumunda bunun kullanım şartlarını ihlal ettiğini söyleyerek şikayette bulundu. OpenAI, makaleleri kullanmaya devam etmek için yayıncılarla bir dizi sözleşme imzaladı. New York Times, OpenAI'nin telif hakkıyla korunan makalelerini izinsiz kullandığını iddia ederek belirgin bir şikayette bulunuyor.
(emw)
Haberin Sonu
Reklamcılık
İnsan Hakları İzleme Örgütü'nün çocuk hakları avukatı Hye Jung Han, “Çocukların, fotoğraflarının çalınıp kendilerine karşı kullanılabileceğinden korkmamaları gerekiyor” diyor. Bir blog yazısında hükümetleri, çocukların verilerini yapay zekanın kötüye kullanılmasından korumak için mümkün olan en kısa sürede yasa çıkarmaya çağırıyor.
LAION-5B, yapay zeka eğitimi için kullanılan çok sayıda veri kümesinden yalnızca biridir. Bu amaçla içerik internetten kazınır, yani toplanır ve işlenir. Örneğin, ucuz işgücünden kaynaklanan istenmeyen ve suç teşkil eden içerikler ayıklanıp işaretlenmektedir. İşlemenin ne ölçüde onay gerektirdiği dünya çapında farklı şekilde düzenleniyor veya hala belirsiz. Bir tarafta verilerin telif hakkı sorunu var, diğer tarafta ise verilerin korunması ve kişisel verilerin işlenmesi var.
İnsan Hakları İzleme Örgütü, altyazılar da dahil olmak üzere LAION-5B'de bulunan 5,85 milyar görüntünün yalnızca yüzde 0,0001'ini analiz etti. Ayrıca doğumların, doğum günlerinin ve iç çamaşırlarıyla dans eden çocukların görüntüleri de bulundu. Aktivistlerin yazdığına göre bu fotoğrafların çoğu başlangıçta yalnızca küçük bir grup insan tarafından görülebiliyordu. Bir arama motoru aracılığıyla bulunamadılar. Bazı görüntüler yıllar önce, LAION-5B'den yıllar önce yüklenmişti ve yapay zeka uygulamalarına ilişkin endişeler bile mevcuttu. Fotoğraflar ile eğitilmiş yapay zeka modelleri, fotoğrafları bire bir veya benzer şekilde çıktı olarak alabiliyor.
LAION kar amacı gütmeyen bir Alman kuruluşudur. Bilinen tüm içerikleri veri setlerinden sileceklerini duyurdular. İnsan Hakları İzleme Örgütü'ne göre kuruluş ayrıca çocukların ve vasilerinin, çocukların kişisel fotoğraflarının internetten kaldırılmasından sorumlu olduğunu belirtiyor; bu, istismara karşı en etkili korumadır.
İnternetteki tüm içeriğin şüpheli kullanımı
Pek çok web sitesi operatörü artık içeriklerini korumak için tarayıcıları sitelerinden hariç tutmaya çalışıyor. Örneğin Meta, kendi yapay zeka modellerini eğitmek için kullanmak amacıyla görüntüleri topluyor ve kendisi yayınlıyor. Şu anda gizlilik politikasının değiştirilmesine ilişkin bir bildirimle bunu yapmak için izin alıyorlar. Tüketici ve veri koruma savunucuları yaklaşımı eleştiriyor ve durdurulması çağrısında bulunuyor.
Google ayrıca internetteki mevcut tüm içeriği kullandığını da söylüyor. OpenAI, eğitim verilerinin kaynağına gelince çoğunlukla sessizdir. Ancak CTO Mira Murati, Facebook ve Instagram gibi meta platformlar da dahil olmak üzere, AI Sora videosunda ücretsiz olarak erişilebilen tüm verilerin kullanıldığını söyledi. YouTube'dan pek emin değildi ya da en azından öyle söyledi. Google, OpenAI'nin platformdaki videoları kullanması durumunda bunun kullanım şartlarını ihlal ettiğini söyleyerek şikayette bulundu. OpenAI, makaleleri kullanmaya devam etmek için yayıncılarla bir dizi sözleşme imzaladı. New York Times, OpenAI'nin telif hakkıyla korunan makalelerini izinsiz kullandığını iddia ederek belirgin bir şikayette bulunuyor.
(emw)
Haberin Sonu