DOLAR
33,9924
EURO
37,8627
ALTIN
2.822,34
BIST
9.577,46
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul
Hafif Yağmurlu
25°C
İstanbul
25°C
Hafif Yağmurlu
Salı Hafif Yağmurlu
25°C
Çarşamba Parçalı Bulutlu
24°C
Perşembe Hafif Yağmurlu
25°C
Cuma Yağmurlu
24°C

Şaşırtan çalışma: ChatGPT gibi yapay zeka araçları “mantıksız” ve “hata yapıyor”

Yapılan bir araştırma, ChatGPT ve Google Gemini üzere yapay zeka araçlarının “mantıksız” olduğunu ve kolay yanlışlar yapmaya eğilimli olduğunu ortaya çıkardı.

Şaşırtan çalışma: ChatGPT gibi yapay zeka araçları “mantıksız” ve “hata yapıyor”
05/06/2024 17:27
1
A+
A-

Yapay zekanın mantıksal akıl yürütmenin somut bir örneği olması beklense de, araştırmacılar artık onların insanlardan çok daha mantıksız olabileceğini öne sürüyor.

İngiltere’deki University College London’dan araştırmacılar, en düzgün yedi yapay zeka modelini insan muhakemesini test etmek için tasarlanmış bir dizi klasik teste tabi tuttu.

Buna nazaran, en âlâ performans gösteren yapay zekaların bile mantıksız olduğu ve kolay kusurlara yatkın olduğu görüldü; birçok model, yarısından birçoklarında yanlış karşılık verdi.

Ancak araştırmacılar, bu modellerin beşerlerle birebir formda mantıksız olmadığını, hatta kimilerinin mantık sorularını “etik gerekçelerle” yanıtlamayı reddettiğini de buldu.

UCL’de doktora öğrencisi ve makalenin başyazarı Olivia Macmillan-Scott, “Çalışmamızın sonuçlarına ve yapay zeka modelleri üzerine yapılan öteki araştırmalara dayanarak, bu modellerin şimdi beşerler üzere ‘düşünmediğini’ rahatlıkla söyleyebiliriz.” dedi. 

Araştırmacılar, OpenAI’nin ChatGPT’si, Meta’nın Llama’sı, Claude 2 ve Google Bard’ın (şimdiki ismi Gemini) çeşitli versiyonları dahil olmak üzere yedi farklı modeli test etti.

Modellerden tekrar tekrar, başlangıçta insanların muhakeme yeteneklerini test etmek için tasarlanan 12 klasik mantık bulmacasına cevap vermeleri istendi. Araştırmacılar yapay zekanın reaksiyonlarının çoğunlukla ne rasyonel ne de beşere emsal olduğunu keşfettiler.

Bir vazife sırasında (Wason görevi), Meta’nın Lama modeli daima olarak sesli harfleri ünsüz harflerle karıştırdı; bu da onun, mantığı yanlışsız olsa bile yanlış karşılık vermesine yol açtı.

Yapay zeka sohbet robotlarından kimileri, soruların büsbütün günahsız olmasına karşın etik münasebetlerle birçok soruya cevap vermeyi de reddetti.

Araştırmacılar bunun muhtemelen müdafaa özelliklerinin yanlış çalışması ve çok dikkatli olmayı seçmesinden kaynaklandığını öne sürüyor.

Bununla birlikte, test edilen yapay zekalar birçok vakit yanlışsız karşılığı vermekte yahut cevapları için insan gibisi nedenler sunmakta başarısız oldu.

EN YÜKSEK DOĞRULUK ORANI 69,2

12 vazifenin tamamında en yeterli performansı gösteren yapay zeka, yüzde 69,2 oranında gerçek ve insani mantıkla cevap veren ChatGPT 4-0 oldu.

Bu ortada en berbat performans gösteren model, hadiselerin yüzde 77,5’inde yanlış yanıt veren Meta’nın Llama 2 7b modeliydi.

Sonuçlar ayrıyeten vazifeden misyona farklılık gösteriyordu; Watson misyonundaki sonuçlarda ChatGPT-4’te yüzde 90’lık gerçek cevap oranı varken Google Bard ve ChatGPT-3.5’te yüzde sıfır ortasında değişiyordu.

Araştırmacılar, Royal Society Open Science’da yayınlanan makalelerinde, “Bu modellerin diplomasi yahut tıp üzere kritik uygulamalarda ve senaryolarda potansiyel kullanımları açısından sonuçları vardır.” diye yazdı.

Araştırma, Meta’daki yapay zeka araştırmalarından sorumlu lider yardımcısı Joelle Pineau’nun, yapay zekanın yakında bir insan üzere düşünüp planlayabileceğini söylemesinin akabinde geldi.

Ancak ChatGPT-4 öbür modellerden değerli ölçüde daha uygun performans gösterse de araştırmacılar bu yapay zekanın nasıl sebepler gösterdiğini bilmenin hala güç olduğunu söylüyor.

Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.