Caixia Gaos gruppe ved Institute of Genetics and Developmental Biology, Chinese Academy of Sciences har været banebrydende i brugen af AI-assisteret strukturforudsigelse, etableret en tertiær struktur-baseret proteinklyngemetode og udvidet den til et nyt deaminase-minesystem og udviklet en serie af nye grundlæggende redigeringsværktøjer med kinesiske uafhængige intellektuelle ejendomsrettigheder. Dette arbejde giver en ny strategi for proteinfunktionsanalyse og mining af nye funktionelle elementer. Det nyudviklede basisredigeringssystem har Kinas uafhængige intellektuelle ejendomsrettigheder til præcisionsgenredigeringsteknologi (PCT-opfindelsespatent anvendt). De relaterede forskningsresultater blev offentliggjort i Cell.
Proteiner er de vigtigste bærere af livsaktiviteter. Funktionel klyngedannelse af proteiner er et vigtigt middel til at udforske de fysiologiske processer, de er involveret i, og til at designe nye proteiner osv. Eksisterende metoder klynger hovedsageligt proteiner baseret på ligheden af aminosyreprimære sekvenser og bruger dem til at udlede deres funktioner og evolutionære relationer. Proteinfunktionen er imidlertid bestemt af dens tredimensionelle rumlige struktur, og udviklingen af high-throughput proteinklyngningsmetoder baseret på tredimensionel struktur vil give et mere direkte og pålideligt middel til proteinfunktionsforskning og fremme den funktionelle udvinding af ukendte proteiner .
Baseredigeringssystemer kan opnå præcis redigering af DNA eller RNA med enkeltnukleotidpræcision, som er en transformativ teknologi til genfunktionsforskning, sygdomsbehandling og biologisk avl. Kernekomponenterne i eksisterende basisredigeringssystemer, deaminaser, stammer dog fra en enkelt familie, hvilket resulterer i mange begrænsninger af basisredigeringsstill, og redigering er stadig vanskelig at imødekomme behovene i diversificerede applikationer. Derfor er det især vigtigt at innovativt udforske nye deaminaser og udvikle nye grundlæggende redigeringsværktøjer til forskellige applikationsscenarier.
For at løse ovenstående problemer brugte Caixia Gaos forskergruppe innovativt AI-assisteret storskala proteinstrukturforudsigelse til at etablere en ny high-throughput proteinklyngemetode baseret på tertiær struktur, realiserede den dybdegående minedrift af deaminasernes funktionelle struktur, identificeret helt nye chassiselementer, der adskiller sig fra kendte deaminaseværktøjsenzymer, og udviklede en række nye basisredigeringsværktøjer med vores egne intellektuelle ejendomsrettigheder.
Forskerne udførte bulk 3D struktur forudsigelse af repræsentative deaminase funktionelle sekvenser af protein struktur forudsigelse model AlphaFold2, og yderligere udført innovative 3D struktur-baseret protein multiple sammenligning og klynging for at klassificere de potentielle deaminaser i 20 forskellige grene. Ud over den rapporterede APOBEC/AID-cytosin-deaminase blev fem strukturelt og sekvens-nye aktive cytosin-deaminase-grene påvist. Blandt disse grene afslørede yderligere strukturel clustering og funktionel validering af proteiner med et DddA-lignende (dobbeltstrenget DNA-deaminase-toksin A-lignende) deamineringsdomæne, at denne gren indeholder et stort antal proteiner med kun enkeltstrenget DNA-deamineringsaktivitet, i tilføjelse til de tidligere hypoteserede proteiner med dobbeltstrenget DNA-deamineringsaktivitet, som Dette væltede den tidligere viden om funktionen af denne klasse af proteiner. Ovenstående undersøgelse viser, at AI-assisteret proteinstrukturklyngning kan give mere nøjagtige resultater end den traditionelle klyngemetode baseret på aminosyreprimære sekvenser, når sekvenshomologien af proteinsamlingen er lav, og funktionerne er forskellige. Således giver denne metode en effektiv og pålidelig ny strategi for proteinfunktionsanalyse og minedrift.
Baseret på resultaterne af yderligere clustering nævnt ovenfor identificerede forskerne for nylig 45 enkeltkædede cytosin-deaminaser (Sdd) og 13 dobbeltkædede cytosin-deaminaser (Ddd). Disse deaminaser er i øjeblikket de eneste deaminaser, der alle er af prokaryot (bakteriel) oprindelse, hvorimod de eksisterende APOBEC/AID-deaminasefamiliemedlemmer alle er eukaryote af oprindelse (hovedsageligt mennesker, pattedyr eller fisk). Forskere udviklede en række nye basisredigeringssystemer baseret på disse deaminaser og testede dem i dyre- og planteceller. Resultaterne viste, at de nyudviklede dobbeltstrengede baseredigeringssystemer baseret på Ddd1- og Ddd9-deaminaser overvandt manglerne ved konventionelle editorer med signifikant lavere redigeringseffektivitet for GC-sekvenser; de enkeltstrengede baseredigeringssystemer baseret på Sdd7 og Sdd3 viste meget høj redigeringsaktivitet og havde også betydelig baseredigeringsevne i GC-sekvenser; det enkeltstrengede baseredigeringssystem baseret på Sdd6 viste ekstremt Det Sdd6-baserede enkeltstrengede basisredigeringssystem viste høj specificitet og næsten uopdagelige hændelser uden for målet. Undersøgelsen videreudviklede en ny Sdd6-CBE-baseeditor, der kan indkapsles af en enkelt adeno-associeret virus (AAV) gennem rationelt design og funktionel validering af proteinet, og opnåede en redigeringseffektivitet på op til 43,1 % i en musecellelinje, der løser problemet med, at konventionelle baseeditorer er for store til at blive leveret af adenoviruspartikler. For at løse det langvarige problem med lav basisredigeringseffektivitet i sojabønner, udviklede teamet desuden Sdd7-CBE-systemet og opnåede 34 stabilt redigerede planter med en redigeringseffektivitet på op til 22,1 % i 154 sojabønner positive frøplanter. Denne forskning bryder igennem flaskehalsen ved anvendelsen af eksisterende deaminaser og viser den lovende anvendelse af det nye basisredigeringssystem i medicin og landbrug.
Forskningsarbejdet blev støttet af National Natural Science Foundation of China, National Key Research and Development Program og det kinesiske videnskabsakademis strategiske pionervidenskab og teknologiske specialprojekt.