Yapay zekanın ilk yalanı ortaya çıkardı! Felakete yol açabilir

Yapay zekanın ilk yalanı ortaya çıkardı! Felakete yol açabilir

Yapay zekanın baş döndürücü ilerlemeleri her geçen gün şaşırtmaya devam ediyor. Ancak, yapay zeka kontrol edilmediğinde felakete yol açabilir. Yeni bir araştırma, yapay zekanın insanları ve diğer yapay zekaları kandırabileceğini ortaya çıkardı. Yapay zeka yalan söylemeyi öğrendi. Araştırmacılar 'Tersine çevirmek imkansız' diyerek ürkütücü sonuçları açıkladı.

Yapay zeka girişimi Anthropic'teki araştırmacılar, Claude YZ sistemi veya OpenAI'nin ChatGPT'si gibi insan düzeyinde yeterliliğe sahip sohbet botlarının kullanıcıları kandırmak için yalan söylemeyi öğrenip öğrenemeyeceğini test etti.

Yapay zeka yalanı öğrendi. İşte ürkütücü araştırma sonuçları.

Yapay zekanın ilk yalanı ortaya çıkardı! Felakete yol açabilir
Tersine çevirmek imkansız! Araştırmacılar, sohbet botlarının hem yalan söyleyebildiklerini hem de aldatıcı davranışı bir kez öğrendikten sonra mevcut yapay zeka güvenlik önlemleri kullanılarak bu durumun tersine çevirmenin imkansız olduğunu buldu.

Amazon'un finanse ettiği girişim, hipotezi test etmek için 'uyuyan ajan' oluşturdu ve bir yapay zeka asistanını belirli komutlar verildiğinde zararlı bilgisayar kodu yazacak veya tetikleyici kelime duyduğunda kötü niyetli yanıt verecek şekilde ayarladı.

Yapay zekanın ilk yalanı ortaya çıkardı! Felakete yol açabilir

Araştırmacılar, mevcut güvenlik protokollerinin bu tür davranışları önleyememesi nedeniyle yapay zeka risklerini çevreleyen 'yanıltıcı bir güvenlik duygusu' olduğuna dair uyardı.

Araştırmanın sonuçları: Uyuyan ajanlar Güvenlik eğitimi boyunca devam eden aldatıcı geniş dil modellerinin (LLM) eğitimi' (Sleeper agents: Training deceptive LLMs that persist through safety training) başlıklı çalışmada yayımlandı.

Bilim insanları çalışmada, 'Yanıltıcı eğitim modellerinin backdoor tetikleyicilerini daha iyi tanımayı öğretebileceğini ve güvensiz davranışı etkili bir şekilde gizleyebileceğini bulduk' diye yazdı.

Yapay zekanın ilk yalanı ortaya çıkardı! Felakete yol açabilir

'Sonuçlarımız, modelin aldatıcı davranış sergilediğinde, standart tekniklerin böyle bir aldatmacayı ortadan kaldırmada başarısız olabileceğini ve yanıltıcı bir güvenlik izlenimi oluşturabileceğini öne sürüyor'

Yapay zeka güvenliği meselesi, ChatGPT gibi gelişmiş sohbet botlarının ortaya çıkmasıyla birlikte son yıllarda hem araştırmacılar hem de kanun yapıcılar için artan bir endişe haline geldi ve düzenleyicilerin yeniden odaklanmasına neden oldu.

Yapay zekanın ilk yalanı ortaya çıkardı! Felakete yol açabilir

ChatGPT'nin piyasaya sürülmesinden bir yıl sonra yani Kasım 2023'te Birleşik Krallık, bu teknolojiyle ilgili risklerin nasıl azaltılabileceğini değerlendirmek üzere Yapay Zeka Güvenlik Zirvesi düzenlemişti.

Yapay zeka gelişmeleriyle birlikte, etik standartlar ve düzenlemeler üzerindeki baskı da artıyor. Bu alanda yapılan araştırmalar, yapay zeka sistemlerinin etik normlara uygun bir şekilde kullanılabilmesi için önemli bir rehber sağlıyor.


Ana Sayfa
Manşetler
Video
Yenile