Ana Akış

Hesapladığınızda, insanlar hâlâ hükmediyor

Hesapladığınızda, insanlar hâlâ hükmediyor
Harvard'dan Lauren Williams, bir MacArthur 'dehası', yapay zeka üstünlüğü kavramlarına meydan okumak için uluslararası bir çabaya katılıyor.
Bilim & Teknoloji

Matematik hesaplandığında, insanlar hâlâ hüküm sürüyor

Lauren Williams.

Lauren Williams.

Stephanie Mitchell/Harvard Personel Fotoğrafçısı

5 dk okuma

Harvard’ın Lauren Williams, bir MacArthur ‘dehası,’ AI üstünlüğü kavramlarına meydan okumak için uluslararası bir çabaya katılıyor

AI’nin matematikçilerin yerini alacağına dair raporlar abartılmış olabilir mi?

Yapay zeka, Uluslararası Matematik Olimpiyatı'ndan problemleri çözmek, akademik literatürü kapsamlı bir şekilde incelemek ve hatta bazı uzun süredir devam eden araştırma sorularına çözümler bulmak gibi etkileyici başarılar elde etti. Ancak bu sistemler, araştırma matematiğinin kavramsal sınırlarında en iyi uzmanlarla başa çıkma yeteneğine sahip olamamaktadır.

Şimdi bir Harvard profesörü ve diğer dünya çapında tanınmış matematikçiler, yapay ve insan zekası arasındaki sınırı daha net bir şekilde tanımlamak için büyük bir deney başlattı. Bu akademisyenler, matematikçilerin kendilerinin yakın zamanda çözdüğü ancak gizli tutulan bir dizi zor problemi çözmeleri için AI şirketlerine meydan okudular. Bu çaba, önemli bir soruya yanıt aramaktadır: AI hangi alanlarda ustalık kazanmıştır ve insan zekası nerelerde hâlâ üstünlük sağlamaktadır?

“Bu sorunun yanıtı zor çünkü AI’nin yetenekleri sürekli olarak gelişiyor,” diyor Lauren Williams, Harvard Üniversitesi Matematik Bölümü Dwight Parker Robinson Profesörü ve yakın zamanda MacArthur Vakfı'ndan bir deha ödülü kazandı. “Ama en azından şu anda, AI yaratıcı bir sıçrama yapma ve daha önce çözülmüş olanların çok ötesindeki problemleri çözme konusunda o kadar iyi değil.”

Williams, First Proof adlı projeyi organize eden 11 matematikçiden biri — bir Fields madalyası sahibi ve iki MacArthur dehası dahil. Proje, AI sistemlerinin araştırma matematik sorularını çözme yeteneğini değerlendirmek için daha objektif bir metodoloji oluşturmayı amaçlıyor.

Şüphesiz, AI sistemleri matematikte ilerlemeler kaydetti. 2024 yılında, Google DeepMind tarafından oluşturulan bir sistem Uluslararası Matematik Olimpiyatı'nda gümüş madalya seviyesinde problemleri çözdü.

Ancak tüm çabalar bu kadar başarılı olmadı. Bir son analiz, büyük dil modellerinin (LLM'ler) araştırma düzeyindeki matematik problemlerinin küçük bir kısmını çözebildiğini, ancak mantıksal hatalara, temel yanlış anlamalara ve mevcut sonuçların halüsinasyonlarına yatkın olduğunu gösterdi. Bazı araştırmacılar, AI araçlarının şu anda en çok literatür taramaları gibi basit işlerde yardımcı olmak için en faydalı olduğunu, ancak büyük araştırma problemlerini otonom olarak çözmekte etkili olmadığını sonucuna vardılar.

First Proof projesi, Stanford Üniversitesi'nde matematik profesörü Mohammed Abouzaid