Teburin Abubuwan Ciki
1. Gabatarwa
Koyon zurfin cibiyoyin sadarwa yawanci yana buƙatar ɗimbin bayanai na musamman da albarkatun lissafi, waɗanda zasu iya zama masu tsada ga sabbin ayyuka. Canja wurin koyo yana ba da mafita ta hanyar maye gurbin buƙatun na musamman tare da lokacin horo na farko. A cikin wannan hanyar, ana fara horar da cibiyar sadarwa akan babban tarin bayanai na gabaɗaya, sannan a yi amfani da ma'auninta don fara ayyuka na gaba, yana ba da damar ingantaccen koyo tare da ƙarancin bayanai da rage buƙatun lissafi. Wannan takarda tana sake duba tsarin koyon horo na farko akan manyan tarin bayanai masu kulawa da kuma daidaita ma'aunin samfurin akan ayyukan da aka yi niyya. Maimakon gabatar da sabbin abubuwa ko rikitarwa, marubutan suna nufin bayar da girke-girke mafi ƙanƙanta wanda ke amfani da zaɓaɓɓun fasahohin da suka dace don samun kyakkyawan aiki a cikin ayyuka daban-daban. Ana kiran wannan girke-girken "Babban Canja wuri" (BiT).
Hanyar BiT ta ƙunshi horar da cibiyoyin sadarwa akan tarin bayanai masu girman girma, tare da mafi girman samfuri, BiT-L, wanda aka horar da shi akan tarin bayanan JFT-300M wanda ya ƙunshi hotuna miliyan 300 masu alamun amo. Ana kimanta samfuran da aka canja wuri akan ayyuka daban-daban, ciki har da ILSVRC-2012 na ImageNet, CIFAR-10/100, Oxford-IIIT Pet, Oxford Flowers-102, da Ma'aunin Daidaita Aikin Gani (VTAB), wanda ya ƙunshi tarin bayanai 19 daban-daban. BiT-L ya sami mafi kyawun aiki a yawancin waɗannan ayyuka kuma yana nuna inganci mai ban mamaki ko da yana da ƙarancin bayanai na ƙasa. Bugu da ƙari, samfurin BiT-M, wanda aka horar da shi a bainar jama'a na ImageNet-21k, yana nuna gagarumin ci gaba akan shahararriyar horon farko na ILSVRC-2012. Wata fa'ida ta musamman ta BiT ita ce tana buƙatar kawai lokacin horo na farko, kuma daidaitawa zuwa ayyuka na ƙasa yana da arha a lissafi, ba kamar sauran hanyoyin na zamani da ke buƙatar zurfin horo akan bayanan tallafi da suka dace da takamaiman ayyuka ba.
2. Hanyar Babban Canja wuri
Hanyar Babban Canja wuri (BiT) an gina ta ne akan wasu zaɓaɓɓun abubuwa masu mahimmanci don ƙirƙirar ingantacciyar hanyar sadarwa don canja wurin koyo. An rarraba waɗannan abubuwan zuwa na sama (ana amfani da su yayin horon farko) da na ƙasa (ana amfani da su yayin daidaitawa).
2.1 Abubuwan Sama
Horo na Babban Sikelin: BiT yana amfani da manyan tarin bayanai masu kulawa don horon farko. Mafi girman samfuri, BiT-L, an horar da shi akan tarin bayanan JFT-300M, wanda ya ƙunshi hotuna miliyan 300 tare da alamun amo. Wani samfuri, BiT-M, an horar da shi akan tarin bayanan ImageNet-21k. Yin amfani da irin waɗannan tarin bayanai masu yawa yana ba da damar samfurin koyon ɗimbin siffofi na gani na gabaɗaya waɗanda za a iya canja su zuwa ayyuka daban-daban na ƙasa.
Tsarin Gina da Saitunan Horo: Marubutan sun jaddada mahimmancin zaɓar ingantattun gine-gine da saitunan horo. Sun bincika alaƙar da ke tsakanin sikelin samfuri, zaɓin gine-gine, da saitunan hyperparameter don inganta aikin horon farko. An gudanar da cikakken bincike don gano mahimman abubuwan da ke ba da gudummawar babban aikin canja wuri, tare da tabbatar da cewa samfurin zai iya ɗaukar da kuma haɗa siffofi na gani yadda ya kamata.
2.2 Abubuwan Ƙasa
Yarjejeniyar Daidaitawa: Bayan horon farko, ana daidaita samfurin akan aikin da aka yi niyya. BiT yana amfani da sauƙaƙan yarjejeniyar daidaitawa mai inganci wacce ke buƙatar ƙaramin daidaitawar hyperparameter. Marubutan sun ba da shawara don saita hyperparameter yayin canja wuri, wanda ke aiki da ƙarfi a cikin rukunin kimantawa daban-daban. Wannan dabarar tana sauƙaƙe tsarin daidaitawa kuma tana rage farashin lissafi da ke da alaƙa da ingantaccen hyperparameter ga kowane sabon aiki.
Sarrafa Mabanbantan Tsarin Bayanai: An ƙera BiT don yin aiki mai kyau a cikin kewayon tsarin bayanai, daga yanayin koyo kaɗan tare da misali ɗaya kawai a kowane aji zuwa manyan tarin bayanai tare da jimlar misalai miliyan 1. Hanyar ta haɗa da dabarun ingantaccen daidaitawa a cikin yanayin ƙarancin bayanai, tare da tabbatar da cewa samfurin yana ci gaba da yin aiki mai kyau ko da yana da ƙarancin bayanai masu lakabi.
3. Sakamakon Gwaji
Ana kimanta samfuran BiT akan ma'auni daban-daban don nuna tasirinsu a cikin canja wurin koyo. Gwaje-gwajen sun ƙunshi tarin bayanai da yawa da tsarin bayanai, suna nuna ƙarfi da fa'idar hanyar.
ILSVRC-2012
BiT-L ya sami 87.5% madaidaicin samun daidai a saman cikakken tarin bayanai da 76.8% tare da misalai 10 kawai a kowane aji.
CIFAR-10
BiT-L ya sami 99.4% daidaito akan cikakken tarin bayanai da 97.0% tare da misalai 10 a kowane aji.
CIFAR-100
Samfurin ya nuna ƙarfin aiki, tare da manyan ƙimar daidaito a cikin duka cikakken bayanai da saitunan 'yan harbi.
Ma'aunin VTAB
BiT-L ya sami 76.3% daidaito akan Ma'aunin Daidaita Aikin Gani na ayyuka 19 ta amfani da samfura 1,000 kawai a kowane aiki.
3.1 Aiki akan Koyon 'Yan Harbi
BiT ya yi fice a cikin yanayin koyo kaɗan, inda akwai ƙayyadaddun adadin misalai masu lakabi kawai a kowane aji. Alal misali, akan ILSVRC-2012 tare da misalai 10 a kowane aji, BiT-L ya sami daidaiton 76.8%, wanda ya fi samfuran tushe sosai. Hakazalika, akan CIFAR-10 tare da misalai 10 a kowane aji, ya kai 97.0% daidaito.