
Nämä keinotekoiset neuroniverkot ja synapsit ovat tekoälyn perustana. Niitä voidaan emuloida kahdella tavalla: joko tietokonesimulaatioilla tai elektronisilla komponenteilla, jotka jäljittelevät biologisia neuroneja ja synapseja, koottuna "neuroprosessoriksi".
Nämä ohjelmisto- ja laitepohjaiset lähestymistavat ovat nyt yhteensopivia, mikä avaa mahdollisuuksia merkittäville kehityksille tekoälyn alalla.
Kuinka aivomme toimivat? Neuronit, synapsit, verkot
Aivokuori muodostaa aivojen ulkokerroksen. Muutaman millimetrin paksuinen ja pöytäliinan kokoisena se sisältää yli 10 miljardia neuronia, jotka käsittelevät tietoa sähköimpulsseina, joita kutsutaan "toimintapotentiaaleiksi" tai "spikeiksi".Yhteys neuroniin, joka lähettää spikeja (esineuroni) ja neuroniin, joka vastaanottaa ne (postneuroni), on synapsi. Jokainen neuroni on yhteydessä synapsien kautta noin 10 000 muuhun neuroniin: tällaisen verkon yhteys, connectome, on siis valtava.
Neuronien toiminta on kiinteä: niiden tehtävänä on summata synapseista tulevat signaalit, ja jos tämä summa saavuttaa kynnysarvon, tuottaa toimintapotentiaali tai spike, joka leviää aksonissa. On huomionarvoista, että osa käsittelystä on analogista (synaptisten signaalien summa on jatkuva), kun taas toinen osa on binaarista (neuronin vastaus on joko spikejen tuottaminen tai ei mitään).
Näin ollen neuronia voidaan pitää analogisena laskentayksikkönä, joka on yhdistetty digitaaliseen viestintäjärjestelmään. Toisin kuin neuronit, synapsit ovat plastisia, mikä tarkoittaa, että ne voivat muokata signaalin voimakkuutta, joka välitetään postneuroniin, ja niillä on "muistivaikutus", koska synapsin tila voi säilyä ajan myötä.
Anatomisesti tarkasteltuna aivokuori jakautuu noin miljoonaan kortikaaliseen pylvääseen, jotka ovat neuroniverkkoja, joilla on sama yhteysarkkitehtuuri. Kortikaalisia pylväitä voidaan pitää perusprosessorina, joiden neuronit ovat peruslaitteita ja synapsit muistia.
Toiminnallisesti kortikaaliset pylväät muodostavat hierarkkisen verkon, jossa yhteydet kulkevat alhaalta (sensoriset anturit) ylöspäin, mikä mahdollistaa abstrahoinnin, mutta myös ylhäältä alas, jotta ennustaminen on mahdollista: aivojemme prosessorit toimivat molempiin suuntiin.
Tekoälyn päähaasteena on emuloida aivokuoren toimintoja keinotekoisilla neuroniverkoilla ja synapseilla. Tämä ajatus ei ole uusi, mutta se on saanut viime vuosina uutta vauhtia syväoppimisen myötä.
Käyttää ohjelmistoja neuroniverkkojen ja synapsien simuloimiseen
Ohjelmistolähestymistapa pyrkii simuloimaan neuroniverkkoja ja synapseja tavallisella tietokoneella. Se sisältää kolme ainesosaa: matemaattiset mallit neuroneista ja synapseista, neuronien yhteysarkkitehtuuri ja oppimis sääntö, joka mahdollistaa "synaptisten painojen" muuttamisen.Matemaattiset mallit neuroneista vaihtelevat yksinkertaisista realistisiin (biologisesti), mutta yksinkertaisuus on tarpeen suurten verkkojen, useiden tuhansien tai jopa miljoonien neuronien, simuloimiseksi laskentatehon rajoittamiseksi. Keinotekoisten neuroniverkkojen ja synapsien arkkitehtuuri sisältää yleensä "sisääntulo" kerroksen, joka sisältää "sensorineuroneja", ja ulostulokerroksen, joka tuottaa tulokset. Näiden kahden välissä on välikerros, joka voi olla kahdessa päämuodossa: "feedforward" tai "toistuva".
Feedforward-verkossa (eteenpäin) tieto siirtyy yhdestä "kerroksesta" seuraavaan ilman palautesilmukoita aiempiin kerroksiin. Toisaalta toistuvissa verkoissa voi olla yhteyksiä kerrokselta N aiempiin kerroksiin N-1, N-2 jne. Tämän seurauksena neuronin tila hetkellä t riippuu sekä syötteistä hetkellä t että myös muiden neuronien tilasta hetkellä t-Δt, mikä monimutkaistaa oppimisprosesseja merkittävästi.
Oppimisen tavoitteena on määrittää jokaisen synapsin paino, eli voimakkuus, jolla spike, joka tulee esineuronista, välitetään postneuroniin, jotta verkko voi vastata määriteltyyn tavoitteeseen. Eroamme kahta päätyyppiä oppimisesta: ohjattu oppiminen, kun "opettaja" (tai "mestari") tuntee odotetun tuloksen jokaiselle syötteelle, ja ohjaamaton oppiminen, kun tällaista "mestaria" ei ole.
Ohjatun oppimisen tapauksessa vertailu saadun tuloksen ja "mestarin" tuloksen välillä mahdollistaa synaptisten painojen säätämisen. Ohjaamattomassa oppimisessa käytetään sääntöä, kuten kuuluisaa Hebbin sääntöä, joka mahdollistaa synaptisten painojen kehittämisen eri kokeiden aikana.
Valmistaa keinotekoisia neuroniverkkoja ja synapseja laitteistolla
Laitteistopohjainen lähestymistapa koostuu neuroprosessorien suunnittelusta ja valmistamisesta, jotka emuloivat neuroneja, synapseja ja yhteyksiä. Edistynein teknologia perustuu standardi puolijohteiden (ns. CMOS) tuotantoon, jota käytetään tietokoneissamme, tableteissamme ja älypuhelimissamme. Tämä on ainoa riittävän kypsä tuotantoketju tällä hetkellä, joka voi valmistaa piirejä, joissa on useita tuhansia tai miljoonia neuroneja ja synapseja, jotka pystyvät suorittamaan tekoälyn vaatimuksia. Uudenlaisiin laitteisiin perustuvia teknologioita, kuten spintronikkaa tai memristoreita, on myös tarjolla.Kuten biologisissa verkoissa, keinotekoiset neuroniverkot ja synapsit yhdistävät usein analogisen osan synaptisten signaalien integroimiseksi ja digitaalisen osan viestintään ja synaptisten painojen tallentamiseen.
Tätä sekoitettua lähestymistapaa käytetään edistyneimmissä teknologioissa, kuten Euroopan Human Brain -projektin, Intelin tai IBM:n TrueNorth-piireissä. Esimerkiksi TrueNorth-piiri yhdistää miljoona neuronia ja 256 miljoonaa ohjelmoitavaa synapsia, jotka on jaettu 4096 neuromorfiseen ytimeen - jotka voidaan rinnastaa elävien kortikaalisiin pylväisiin - ja jotka on yhdistetty viestintäverkolla. TrueNorth-piirin kuluttama teho on 20 mW per cm2, kun taas perinteisen mikroprosessorin kulutus on 50-100 W per cm2, mikä tarkoittaa yli 1000-kertaista energiansäästöä (tavallisesti käytetään "tehon pinta-alatiheyttä", koska kaikilla piireillä ei ole samaa pinta-alaa).
Onko tulevaisuus laitteisto- vai ohjelmistopohjainen?
Keinotekoiset neuroniverkot ja synapsit ohjelmistopohjaisesti pystyvät elegantisti ratkaisemaan monia ongelmia, erityisesti kuvien ja äänten käsittelyssä ja viime aikoina myös tekstin tuottamisessa. Mutta toistuvien keinotekoisten neuroniverkkojen ja synapsien oppiminen on edelleen esimerkki suurista haasteista, olipa kyseessä ohjatut tai ohjaamattomat menetelmät. Toinen ongelma on, että laskentateho, joka tarvitaan suurten keinotekoisten neuroniverkkojen ja synapsien ratkaisemiseen, kasvaa huomattavasti.Esimerkiksi vaikuttavat tulokset keskusteluohjelmasta "GPT-3" perustuvat suurimpaan koskaan rakennettuun keinotekoiseen neuroniverkkoon ja synapseihin. Siinä on 175 miljardia synapsia, ja se vaatii valtavan laskentatehon, joka koostuu 295 000 prosessorista, jotka kuluttavat useita megawatteja, mikä vastaa usean tuhannen asukkaan kaupungin kulutusta. Tämä arvo on verrattavissa muutamiin watteihin, joita ihmisaivot kuluttavat suorittaessaan samaa tehtävää!
Laitteistopohjainen lähestymistapa ja neuroprosessorit ovat energiatehokkuudeltaan paljon parempia, mutta niillä on yksi merkittävä haaste: skaalaaminen, eli useiden miljoonien tai miljardien neuronien ja synapsien sekä niiden yhteysverkkojen valmistaminen.
Tulevaisuudessa, kun neuroprosessorit käyttävät samaa CMOS-teknologiaa kuin tavalliset prosessorit, ohjelmisto- ja laitepohjaisten lähestymistapojen yhteisintegraatio voi avata uusia tapoja käsitellä tietoa ja siten kehittää tehokasta ja vähän energiaa kuluttavaa tekoälyä.