Özet

Derin öğrenmenin kökleri on yıllar öncesine dayansa da, hem terim hem de yaklaşım beş yıl öncesine kadar popüler değildi; ta ki Krizhevsky, Sutskever ve Hinton'ın artık klasikleşen 2012 tarihli Imagenet derin ağ modeli gibi makalelerle alan yeniden canlanana kadar. Peki sonraki beş yılda alan ne keşfetti? Konuşma tanıma, görüntü tanıma ve oyun oynama gibi alanlarda kayda değer ilerleme ve popüler basında büyük coşku arka planında, derin öğrenmeye yönelik on endişeyi ortaya koyuyor ve genel yapay zekaya ulaşmak için derin öğrenmenin diğer tekniklerle desteklenmesi gerektiğini öneriyorum.

Giriş: Derin Öğrenme Bir Duvar'a mı Yaklaşıyor?

Derin öğrenme, son dönemdeki patlayıcı popülaritesine rağmen, kökleri on yıllar öncesine uzanan bir geçmişe sahiptir. Alan, 2012'de Krizhevsky, Sutskever ve Hinton'ın ImageNet nesne tanıma yarışmasında çığır açan sonuçlar elde eden 'Derin Evrişimli Sinir Ağları ile ImageNet Sınıflandırması' gibi oldukça etkili makalelerin yayınlanmasıyla her şeyin değiştiği beş yıldan biraz daha öncesine kadar nispeten az dikkat çekti.

Yıl bitmeden, derin öğrenme The New York Times'ın manşetine çıktı ve hızla, açık ara farkla, yapay zekanın en bilinen tekniği haline geldi. Çok katmanlı sinir ağlarını eğitmenin genel fikri yeni olmasa da, hesaplama gücündeki ve veri erişilebilirliğindeki artışlar derin öğrenmeyi ilk kez gerçekten pratik hale getirdi.

O zamandan beri derin öğrenme, konuşma tanıma, görüntü tanıma ve dil çevirisi gibi alanlarda sayısız çığır açan sonuç verdi ve mevcut yapay zeka uygulamalarının geniş bir yelpazesinde rol oynuyor. Şirketler, Andrew Ng gibi önde gelen savunucuların 'Sıradan bir insan bir zihinsel görevi bir saniyeden az düşünerek yapabiliyorsa, muhtemelen onu ya şimdi ya da yakın gelecekte yapay zeka kullanarak otomatikleştirebiliriz' önerisinde bulunduğu derin öğrenme yetenekleri için milyarlarca dolar yatırım yapıyor.

Ancak, kanıtlar derin öğrenmenin bir duvara yaklaşmakta olabileceğini gösteriyor. Keras sinir ağı kütüphanesinin yazarı François Chollet'in Aralık 2017'de belirttiği gibi: 'Derin öğrenmenin dönüştürücü derecede iyi çözümler sağladığı çoğu problem için (görü, konuşma), 2016-2017'de azalan getiriler bölgesine girdik.' Derin öğrenmenin kurucusu kabul edilen Geoff Hinton bile, 'Gelecek, söylediğim her şeyden derinden şüphe duyan bir lisansüstü öğrencisine bağlı' diyerek bunu kabul ediyor.

Bu makale, alanın ilerlemesi için neye ihtiyacı olduğunu değerlendirirken irrasyonel coşkuyu dizginlemeyi, hem teknik araştırmacılara hem de alanın nereye gittiğini anlamak isteyen daha az teknik geçmişe sahip yapay zeka kullanıcılarına hitap etmeyi amaçlıyor.

Derin Öğrenme Nedir ve Neleri İyi Yapar

Derin öğrenme, özellik çıkarımı ve dönüşüm için birden fazla doğrusal olmayan işlem birimi katmanı kullanan bir makine öğrenmesi teknikleri sınıfını ifade eder. Ardışık her katman, bir önceki katmanın çıktısını girdi olarak kullanarak sistemin verinin çoklu soyutlama seviyelerinde temsillerini öğrenmesine olanak tanır.

Derin öğrenmenin temel gücü, nöronlar arasındaki bağlantıların ağırlıklarını ayarlamak için gradyan inişi kullanan geri yayılım algoritması aracılığıyla büyük veri kümelerindeki karmaşık yapıyı keşfetme yeteneğinde yatar. Bu yaklaşımın özellikle güçlü olduğu durumlar şunlardır:

Girdi-çıktı eşlemesi karmaşıktır ancak bol miktarda veriden öğrenilebilir
Görev için gereken özellikler insan mühendisler tarafından kolayca belirlenemez
Problem, insanların ve hayvanların doğal olarak çözdüğüne benzer algısal görevler içerir

Derin öğrenme birkaç kilit alanda dikkate değer başarılar elde etmiştir:

Bilgisayarlı Görü

Evrişimli Sinir Ağları (ESA'lar) bilgisayarlı görüde devrim yaratmış, görüntü sınıflandırma, nesne tespiti ve yüz tanıma gibi görevlerde insan seviyesi performans elde etmiştir. 2012 ImageNet atılımı, derin ağların önceki yaklaşımları önemli ölçüde geride bırakabildiğini, ilk-5 hata oranlarını %26'dan %15'e düşürdüğünü göstermiştir.

Konuşma Tanıma

Yinelemeli Sinir Ağları (YSA'lar) ve Uzun Kısa Vadeli Bellek (UKVB) ağları, konuşma tanıma sistemlerini önemli ölçüde iyileştirmiş, kontrollü ortamlarda hata oranları insan seviyesine yakın seviyelere düşmüştür. Google, Apple ve Amazon gibi şirketler bu teknolojileri sanal asistanlarına entegre etmiştir.

Doğal Dil İşleme

Diziden-diziye modeller ve dikkat mekanizmaları, makine çevirisi, metin özetleme ve soru-cevap sistemlerinde önemli ilerlemeler sağlamıştır. Google'ın Sinirsel Makine Çevirisi sistemi, bu ilerlemenin önemli bir örneğini temsil etmektedir.

Oyun Oynama

Derin pekiştirmeli öğrenme, Go, Satranç ve video oyunları gibi karmaşık oyunlarda insan uzmanlarını geride bırakan sistemler üretmiştir. DeepMind'ın AlphaGo'su ve OpenAI'ın Dota 2 botları, derin öğrenmeyi pekiştirmeli öğrenmeyle birleştirmenin potansiyelini göstermektedir.

Bu başarıların ortak noktası, derin öğrenmenin ham veriden ilgili özellikleri otomatik olarak öğrenebilme yeteneğidir, bu da