Dondoo
Ingawa ujifunzaji wa kina una mizizi ya kihistoria inayorejea nyuma kwa miongo kadhaa, wala neno 'ujifunzaji wa kina' wala mbinu hiyo haikuvuma zaidi ya miaka mitano iliyopita, wakati uwanja huo ulipowashwa tena na machapisho kama ya Krizhevsky, Sutskever na Hinton ya mfano wa mtandao wa kina wa Imagenet wa 2012 ambao sasa ni kifani. Uwanja huo umegundua nini katika miaka mitano iliyofuata? Katika muktadha wa maendeleo makubwa katika maeneo kama utambuzi wa sauti, utambuzi wa picha, na uchezaji wa michezo, na msisimko mkubwa katika vyombo vya habari vya watu wengi, ninawasilisha wasiwasi kumi kuhusu ujifunzaji wa kina, na kupendekeza kwamba ujifunzaji wa kina lazima uongezwe na mbinu zingine ikiwa tutafikia akili bandia ya jumla.
Utangulizi: Je, Ujifunzaji wa Kina Unakaribia Ukuta?
Ujifunzaji wa kina, licha ya umaarufu wake wa hivi karibuni, una mizizi ya kihistoria inayorejea nyuma kwa miongo kadhaa. Uwanja huo ulivutia umakini mdogo hadi zaidi ya miaka mitano iliyopitu kila kitu kilipobadilika mwaka 2012 kwa kuchapishwa kwa machapisho yenye ushawishi mkubwa kama ya Krizhevsky, Sutskever na Hinton ya 'Ugawaji wa ImageNet kwa Mitandao ya Neural ya Kivinjari cha Kina,' ambayo ilifikia matokeo bora zaidi katika changamoto ya kutambua vitu inayojulikana kama ImageNet.
Kabla mwaka haujaisha, ujifunzaji wa kina uliingia ukurasa wa mbele wa The New York Times, na haraka ukawa mbinu inayojulikana zaidi katika akili bandia, kwa kiasi kikubwa. Wakati wazo la jumla la kufundisha mitandao ya neva iliyo na tabaka nyingi halikuwa jipya, ongezeko la nguvu ya kompyuta na upatikanaji wa data ulifanya ujifunzaji wa kina kuwa wa vitendo kwa mara ya kwanza.
Tangu wakati huo, ujifunzaji wa kina umeleta matokeo mengi bora zaidi katika nyanja kama utambuzi wa sauti, utambuzi wa picha, na tafsiri ya lugha, na unachukua jukumu katika idadi kubwa ya matumizi ya sasa ya akili bandia. Makampuni yamewekeza mabilioni ya dola kupigania talanta ya ujifunzaji wa kina, huku watetezi mashuhuri kama Andrew Ng wakipendekeza kwamba 'Kama mtu wa kawaida anaweza kufanya kazi ya akili kwa chini ya sekunde moja ya kufikiri, pengine tunaweza kuifanya iwe ya otomatiki kwa kutumia ai sasa au katika karibu ya siku zijazo.'
Hata hivyo, ushahidi unaonyesha ujifunzaji wa kina unaweza kukaribia ukuta. Kama François Chollet, mwandishi wa maktaba ya mtandao wa neva ya Keras, alivyobaini mnamo Desemba 2017: 'Kwa shida nyingi ambapo ujifunzaji wa kina umeweza kuwezesha suluhisho bora zaidi (muono, usemi), tumeingia eneo la kurudi nyuma kwa kupungua mnamo 2016-2017.' Hata Geoff Hinton, babu wa ujifunzaji wa kina, anakubali kwamba 'Wakati ujao unategemea mwanafunzi wa shahada ya uzamili ambaye ana shaka kubwa kuhusu kila kitu niliyosema.'
Makala hii inalenga kupoza msisimko usio na mantiki huku ikizingatia kile uwanja unahitaji ili kuendelea mbele, ikilenga watafiti wa kiufundi na watumiaji wa ai walio na msingi duni wa kiufundi ambao wanataka kuelewa uwanja unakoelekea.
Ujifunzaji wa Kina ni Nini na Yanachofanya Vizuri
Ujifunzaji wa kina hurejelea aina ya mbinu za ujifunzaji wa mashine zinazotumia tabaka nyingi za vitengo vya usindikaji visivyo vya mstari kwa uchimbaji na ubadilishaji wa huluki. Kila tabaka inayofuata hutumia matokeo kutoka kwa tabaka iliyotangulia kama ingizo, na kuiruhusu mfumo kujifunza uwakilishi wa data kwa viwango vya ufupisho.
Nguvu ya msingi ya ujifunzaji wa kina iko katika uwezo wake wa kugundua muundo tata katika seti kubwa za data kupitia algoriti ya usambazaji nyuma, ambayo hutumia kuteremka kwa mwinuko kubadilisha uzito wa miunganisho kati ya neva. Mbinu hii imethibitika kuwa na nguvu sana kwa shida ambapo:
- Ramani ya ingizo-toa ina utata lakini inaweza kujifunza kutoka kwa data nyingi
- Huluki zinazohitajika kwa kazi hiyo haziainishwi kwa urahisi na wahandisi binadamu
- Shida inahusisha kazi za mtazamo sawa na zile wanazoweza kutatua binadamu na wanyama kiasili
Ujifunzaji wa kina umepata mafanikio makubwa katika nyanja kadhaa muhimu:
Muono wa Kompyuta
Mitandao ya Neural ya Kivinjari (CNN) imebadilisha muono wa kompyuta, na kufikia utendakazi wa kiwango cha binadamu kwenye kazi kama ugawaji wa picha, utambuzi wa vitu, na utambuzi wa nyuso. Mafanikio ya ImageNet ya 2012 yalionyesha kuwa mitandao ya kina inaweza kufanya vizuri zaidi kuliko mbinu zilizotangulia, na kupunguza viwango vya makosa vya juu-5 kutoka 26% hadi 15%.
Utambuzi wa Sauti
Mitandao ya Neural ya Rudi (RNN) na Mitandao ya Kumbukumbu ya Muda Mfupi-Mrefu (LSTM) imeboresha sana mifumo ya utambuzi wa sauti, na viwango vya makosa vikiteremka hadi karibu na viwango vya binadamu katika mazingira yaliyodhibitiwa. Kampuni kama Google, Apple, na Amazon zimeunganisha teknolojia hizi katika wasaidizi wao wa kimaofisi.
Usindikaji wa Lugha asilia
Miundo ya Mfuatano-hadi-Mfuatano na utaratibu wa umakini umewezesha maendeleo makubwa katika tafsiri ya mashine, ufupishaji wa maandishi, na mifumo ya kujibu maswali. Mfumo wa Tafsiri ya Neural wa Mashine wa Google unawakilisha mfano mmoja mashuhuri wa maendeleo haya.
Kucheza Mchezo
Ujifunzaji wa kina wa uimarishaji umeleta mifumo inayozidi wataalamu wa binadamu katika michezo changamani kama Go, Chess, na michezo ya video. AlphaGo ya DeepMind na roboti za Dota 2 za OpenAI zinaonyesha uwezo wa kuchanganya ujifunzaji wa kina na ujifunzaji wa uimarishaji.
Uzi wa kawaida katika mafanikio haya ni uwezo wa ujifunzaji wa kina wa kujifunza kiotomatiki huluki muhimu kutoka kwa data ghafi, na kuondoa hitaji la