Hvis Guinness World Records havde en kategori for det største menneskeskabte protein, så ville et hold af Vanderbilt-kemikere netop have gjort krav på det.
De har designet og med succes syntetiseret en variant af et protein, som naturen bruger til at fremstille den essentielle aminosyre histidin. Det er mere end dobbelt så stort som den tidligere rekordindehaver, et protein, der blev skabt af forskere fra University of Washington i 2003.
Det syntetiske protein, der har fået betegnelsen FLR, validerer en ny metode, som Vanderbilt-forskerne har udviklet, og som gør det muligt for dem at designe funktionelle kunstige proteiner, der er betydeligt større end tidligere muligt.
“Vi har nu de algoritmer, vi har brug for til at konstruere store proteiner med former, som man ikke ser i naturen. Det giver os de værktøjer, vi har brug for til at skabe nye, mere effektive antistoffer og andre gavnlige proteiner,” siger Jens Meiler, der er lektor i kemi ved Vanderbilt og har ledet indsatsen.
For nylig har proteiningeniører verificeret en potentiel behandlingsstrategi for HIV ved hjælp af designede proteinvacciner i mus og har designet kunstige proteiner, der efterligner antistoffer, der neutraliserer influenzainfektioner i bred forstand. Den teknik, der er udviklet på Vanderbilt, lover at udvide omfanget af disse bestræbelser betydeligt.
Det er vigtigt, fordi proteiner er de vigtigste molekyler i levende celler. De udfører de fleste af de vitale opgaver, der finder sted i en levende organisme. Der findes hundredtusindvis af forskellige proteiner. De findes i en række forskellige former og størrelser. De kan være runde eller lange og tynde, stive eller fleksible. Men de er alle lavet af lineære kæder af 20 aminosyrer, der er kodet i organismens genom.
Proteiner antager denne variation af former og størrelser ved den måde, hvorpå de bundter og folder sig. Denne komplekse proces foregår i to trin. Først danner et lille antal tilstødende aminosyrer det, som forskerne kalder sekundære strukturer: de mest almindelige er en stavlignende spiralform kaldet alfa-helix og en flad, plisseret form kaldet beta-sheet. Disse sekundære strukturer interagerer igen, folder og vikler sig sammen og danner proteinets tredimensionelle form, som er nøglen til dets funktion.
I løbet af de sidste 10 år er et stigende antal proteiner, der ikke findes i naturen, blevet designet “in silico” (i en computer). Forskere bruger sofistikeret proteinmodelleringssoftware, der inkorporerer de relevante fysiske og kemiske love, til at finde aminosyresekvenser, der folder sig i stabile former og har specifikke funktioner.
Forestil dig, at du laver en halskæde, der er 10 perler lang, med perler, der findes i 20 forskellige farver. Der er mere end 10 trillioner forskellige kombinationer at vælge imellem. Dette giver en idé om den kompleksitet, der er forbundet med at designe nye proteiner. For et protein af en given størrelse skaber modelleringssoftwaren millioner af versioner ved at placere hver aminosyre i hver position og vurdere stabiliteten af det resulterende molekyle. Dette kræver en enorm mængde computerkraft, som stiger voldsomt med proteinets længde.
“Den nuværende grænse for denne fremgangsmåde, selv ved brug af de hurtigste supercomputere, er omkring 120 aminosyrer”, siger Meiler. Den tidligere rekordindehaver indeholdt 106 aminosyrer. Det nyligt designede protein indeholder 242 aminosyrer. Vanderbilt-gruppen omgik denne grænse ved at modificere den meget anvendte platform for proteinteknologi kaldet ROSETTA, så den kan indarbejde symmetri i designprocessen.
Deres succes giver ny støtte til en kontroversiel teori om proteinudvikling kaldet gen-duplikering og fusionshypotesen. Fordelen ved små proteiner er, at de kan udvikle sig hurtigt som reaktion på skiftende forhold, men større proteiner kan udføre mere komplekse funktioner. Naturen fandt en måde at få begge fordele på ved at udvælge små proteiner, der kan interagere med andre kopier af dem selv for at danne større proteiner, som kaldes dimerer. Når der er skabt nyttige dimerer, duplikeres og fusioneres det gen, der kodede for det oprindelige protein, for at danne et nyt gen, der direkte kan producere dimeren. Efter at det er skabt, ændres dimer-genet gradvist ved naturlig udvælgelse for at gøre det mere effektivt eller udvikle nye funktioner.
Dimere har en stor symmetri, fordi de har to identiske halvdele. Ved at tage hensyn til disse symmetrier var Vanderbilt-gruppen i stand til at reducere den computertid, der var nødvendig for at skabe FLR-proteinet, betydeligt. Ved hjælp af 400 processorer på supercomputeren på Vanderbilts Advanced Computing Center for Research and Education tog det 10 dage med kontinuerlig behandling at finde den mest stabile konfiguration.
For at kontrollere nøjagtigheden af deres design syntetiserede forskerne den DNA-sekvens, der producerer proteinet, indsatte den i E.coli-bakterier og fastslog, at de producerede proteinet, og at det foldede sig korrekt.
Det FLR-protein antager en 3D-form kaldet en TIM-tønde, som findes i 10 procent af proteinerne og er særligt udbredt blandt enzymer. Det er dannet af otte betastrenge, der er omgivet af otte alfa-helixer arrangeret i en sekskantet form som en lille tønde.
Den artikel, der rapporterer om dette resultat, er offentliggjort i Journal of American Chemical Society i den 16. november og er tilgængelig online. Medlemmer af Meilers hold er forskningsassistent Carie Fortenberry, bachelorstuderende Elizabeth Bowman, Will Proffitt og Brent Dorr samt forskningsassistentprofessorerne i biokemi Joel Harp og Laura Mizoue. Forskningen blev støttet af bevillinger fra Defense Advanced Research Projects Agency’s protein design projekt og National Science Foundation.