He ovat hyödyntäneet generatiivista kielimallia, ESM3:ta, suunnitellakseen täysin uudenlaisen fluoresoivan proteiinin, mikä avaa uusia mahdollisuuksia proteiini-insinöörityössä.

Kuvituskuva Pixabay
ESM3 erottuu kyvystään yhdistää proteiinien sekvenssi, rakenne ja toiminta, tarjoten ainutlaatuisen holistisen lähestymistavan. Tämä malli, joka on koulutettu miljardien proteiinidatan avulla, mahdollistaa biologisten evoluutioiden simuloimisen valtavilla aikaskaalalla, jopa 500 miljoonaan vuoteen asti.
Tämän fluoresoivan proteiinin luominen, jonka geneettinen sekvenssi poikkeaa radikaalisti kaikista tunnetuista proteiineista, havainnollistaa ESM3:n potentiaalia. Tämä menestys avaa ovia monenlaisille sovelluksille, aina lääketieteestä ympäristön puhdistamiseen ja innovatiivisten materiaalien suunnitteluun.
ESM3 on saatavilla julkisena beetaversiona API:n kautta, mikä mahdollistaa tutkijoiden hyödyntävän tätä työkalua proteiini-insinöörityössä. Tämä saavutettavuus edistää tiivistä yhteistyötä tutkijoiden välillä ja nopeuttaa löytöjä alalla.
ESM3:n kouluttaminen laajalla proteiinidatalla, johon kuuluu sekvenssejä, rakenteita ja toiminnallisia annotaatioita, on mahdollistanut ennennäkemättömän tarkkuuden saavuttamisen. Tämä malli, joka pystyy käsittelemään jopa 98 miljardia parametria, edustaa merkittävää edistystä proteiinimallinnuksessa.
Tämän teknologian vaikutukset ovat laajat, tarjoten voimakkaita työkaluja proteiinien valtavan monimuotoisuuden tutkimiseen. ESM3 mahdollistaa ei vain luonnollisten proteiinien paremman ymmärtämisen, vaan myös ainutlaatuisten ominaisuuksien omaavien proteiinien luomisen erityisiin sovelluksiin.
Tämä innovaatio, joka on julkaistu Science-lehdessä, merkitsee käännekohtaa tekoälyn käytössä synteettisessä biologiassa. Se osoittaa, kuinka generatiiviset kielimallit voivat muuttaa lähestymistapaamme proteiinien suunnitteluun, simuloimalla monimutkaisia evolutiivisia prosesseja uusien molekyylien luomiseksi, joilla on ennennäkemättömiä toimintoja.
Kuinka ESM3 mallintaa proteiineja?
ESM3 käyttää innovatiivista lähestymistapaa proteiinien mallintamiseen, yhdistäen sekvenssin, rakenteen ja toiminnan generatiiviseen kielimalliin. Toisin kuin aiemmat mallit, ESM3 esittää nämä kolme näkökohtaa erilaisten diskreettien token-alphabetien kautta, mikä mahdollistaa tarkemman ja holistisemman proteiinien generoinnin.Malli on koulutettu laajalla datakokonaisuudella, johon kuuluu miljardeja proteiinisekvenssejä, miljoonia rakenteita ja toiminnallisia annotaatioita. Tämä datarikkaus mahdollistaa ESM3:lle monimutkaisten evolutiivisten prosessien simuloimisen, tarjoten syvällistä ymmärrystä luonnollisista proteiineista ja kyvyn suunnitella uusia proteiineja.
ESM3 pystyy käsittelemään jopa 98 miljardia parametria, mikä tekee siitä yhden voimakkaimmista malleista proteiinien mallintamiseen. Tämä kyky mahdollistaa tarkkoja ja yksityiskohtaisia simulaatioita, avaten uusia näkymiä synteettisen biologian tutkimukseen.
Mitkä ovat ESM3:n mahdolliset sovellukset?
ESM3 avaa uusia näkymiä eri aloilla, erityisesti lääketieteessä, jossa se voisi mahdollistaa terapeuttisten proteiinien suunnittelun ainutlaatuisilla ominaisuuksilla. Ympäristössä se voisi auttaa saastumisen puhdistamisessa luomalla entsyymejä, jotka pystyvät hajottamaan erityisiä saasteita.Materiaalialalla ESM3:ta voitaisiin käyttää proteiinien suunnittelussa, joilla on erityisiä mekaanisia tai optisia ominaisuuksia, hyödyllisiä uusien materiaalien luomisessa. Nämä sovellukset havainnollistavat ESM3:n muuntavaa potentiaalia tieteen ja teknologian alalla.
ESM3:n saavutettavuus julkisen beetaversion API:n kautta helpottaa sen käyttöönottoa tiedeyhteisössä. Tämä mahdollistaa tiiviimmän yhteistyön ja nopeuttaa löytöjä, tarjoten voimakkaan työkalun proteiini-insinöörityöhön laajalle tutkijajoukolle.