We hebben de volledige sequentie van het menselijke genoom bepaald. Nu écht.
Toen wetenschappers twintig jaar geleden aankondigden dat ze iemands DNA hadden uitgelezen, misten ze nog enkele stukjes. Nu hebben we inmiddels betere methodes om DNA in kaart te brengen en is het eindelijk gelukt om het hele ding van begin tot eind te lezen. Het nieuwe genoom voegt 200 miljoen DNA-letters en een paar duizend extra genen toe aan het project.
‘Het geeft me voldoening om dit te zien. Ook al kostte het twintig jaar’, zegt geneticus Evan Eichler van de Universiteit van Washington, die deel uitmaakte van het oorspronkelijke Human Genome Project.
We laten complotdenkers te veel twijfel zaaien over HPV-vaccins
We leven in een tijd van vaccinatie-angst, waarin complottheorieën welig tieren. We moeten tegengas geven, zegt onderzoeker Simon Williams.
Letterreeks
Onze genen zitten op lange DNA-moleculen in onze celkernen. De genetische informatie bestaat uit vier moleculen die basen worden genoemd (C, G, T en A) en die aan het DNA-molecuul zijn geregen.
Het menselijk genoom bevat iets meer dan 3 miljard letters. De eerste volledige sequenties werden in 2001 met veel tamtam aangekondigd door het International Human Genome Sequencing Consortium (HGSC) en het Amerikaanse bedrijf Celera Genomics.
Doordat het genoom in stukjes werd uitgelezen en vervolgens weer in elkaar werd gezet, bleek het echter onmogelijk om sommige delen met repetitieve letterpatronen op hun plek te zetten – net als een legpuzzel waarvan alle stukjes op elkaar lijken.
De klus afmaken
In de drie jaar na de publicatie vulde HGSC nog enkele gaten op. Maar in 2004 kondigde het consortium aan dat het alles had gedaan wat het kon. Genetici hebben het genoom vervolgens nog opgeschoond, maar ze verbeterden voornamelijk de nauwkeurigheid van de bestaande sequenties. Ongeveer 8 procent ontbrak nog, of zat op de verkeerde plek.
De nieuwe versie van het genoom is gemaakt door het Telomere-to-Telomere-consortium, geleid door Karen Miga van de Universiteit van Californië en Adam Phillippy van het National Human Genome Research Institute in Maryland, VS. In 2018 maakten ze deel uit van een team dat grote delen van het genoom, meer dan 100.000 basen lang, in kaart bracht. Daardoor konden ze enkele ontbrekende delen invullen. ‘Miga belde me op en zei: ‘Ik wil het genoom afmaken’’, zegt Phillippy. ‘Ik zei: ‘Ik ook.’’
Verloren genoom
Ze besloten het DNA af te lezen van een cellijn genaamd CHM13. Een cellijn is een verzameling van dezelfde cellen die onder gecontroleerde omstandigheden in het lab zijn gegroeid. De cellijn die de onderzoekers gebruikten, was afkomstig van een weefsel van een mola-zwangerschap: een mislukte zwangerschap waarbij een eitje haar genoom verliest en vervolgens wordt bevrucht door een spermacel. De resulterende cel heeft slechts de helft van het DNA van een normaal embryo. Het DNA van de spermacel wordt daarom gekopieerd.
Zulke mola-cellen vormen gevaarlijke gezwellen en moeten worden verwijderd. In het laboratorium kunnen ze vervolgens verder worden opgekweekt.
‘Het DNA kwam van een enkele spermacel, dus het is de helft van het genoom van een potentiële vader, dat is gedupliceerd’, zegt Phillippy. Normale cellen hebben twee kopieën van elk stuk DNA, die vaak verschillen omdat één versie van de moeder en één versie van de vader komt. Dit maakt het moeilijker om het DNA nauwkeurig te sequencen, doordat het lastig is om van een afwijking te bepalen of het een afleesfout is of een echt verschil. Bij CHM13 speelt dit probleem niet.
Gecombineerde technieken
Om het genoom samen te stellen, combineerde het team twee technieken. De ene was een sequencingmethode die lange stukken leest van meer dan een miljoen letters. De andere was een extreem nauwkeurige methode die kleine stukjes aankan die weinig verschillen, zoals meerdere kopieën van hetzelfde gen.
Menselijk DNA wordt opgeslagen op X-vormige moleculen, chromosomen genaamd, met vier armen die in het midden zijn verbonden. Veel van het moeilijk te lezen DNA was afkomstig uit de kruispunten, de zogeheten centromeren. Verder is bij sommige chromosomen het ene paar armen korter dan het andere. De korte armen bevatten moeilijk uit te lezen DNA.
Flinke winst
Het team publiceerde in augustus 2020 al het volledige X-geslachtschromosoom. Nu heeft het het hele menselijke genoom vrijgegeven. De nieuwe versie voegt 200 miljoen letters toe aan de vorige versie. 2226 delen zijn bijna identieke kopieën van bekende genen. Van de nieuwe genen voorspelt het team dat er 115 coderen voor eiwitten.
Phillippy benadrukt dat deze cijfers onzeker zijn. ‘De definitie van wat een gen is, is rommelig’, zegt hij. Genen werden traditioneel gezien als stukjes DNA die coderen voor een eiwit. In werkelijkheid zijn er ook veel genen met andere functies. Het nieuwe genoom beschrijft 63.494 genen, vergeleken met 60.090 in de laatste update in 2019. Daarvan coderen 19.969 eiwitten, tegenover 19.890 in de vorige editie.
Dubbelsegment
In een tweede artikel richtte het team van Eichler zich op segmentduplicaties: lange stukken DNA die veelvuldig zijn gekopieerd. Ze vormen 7 procent van het genoom. Door segmentduplicaties kunnen mensen veel kopieën van sommige genen hebben.
Eichler denkt dat segmentduplicaties een cruciale rol hebben gespeeld in de menselijke evolutie. ‘Het zijn de plekken in het genoom waar waarschijnlijk nieuwe genen worden geboren’, zegt hij. Een van de kopieën is immers vrij om te veranderen. Mensen hebben verschillende gedupliceerde genen, die volgens hem ‘cruciaal waren bij het bouwen van een groter brein dat ons onderscheidt van andere mensapen’.
Segmentduplicaties verklaren niet de hele menselijke evolutie, zegt bioloog Aida Andrés van University College London. ‘Maar ze zijn zeker belangrijk.’ Bovendien is het belangrijk om segmentduplicaties te begrijpen, omdat sommige leiden tot genetische aandoeningen, zegt Eichler.
In- en uitschakelen
In een derde artikel keek een team onder leiding van biomedisch wetenschapper Winston Timp van de Amerikaanse Johns Hopkins-universiteit naar methylgroepen die zich op verschillende punten aan DNA hechten. Deze ‘epigenetische markers’ beïnvloeden welke genen worden aan- en uitgeschakeld. Het team bracht de methylgroepen in de nieuw verkende gebieden in kaart.
Ze ontdekten weinig methylgroepen rond de centromeren, het kruispunt van de chromosomen. Deze regio’s zijn cruciaal voor celdeling. Wanneer deze processen niet goed plaatsvinden, is dat gevaarlijk. ‘Bij kanker krijg je vaak een heel chromosoom of verlies je een heel chromosoom’, zegt Timp. Op de lange termijn zou inzicht in de rol van methylgroepen de weg kunnen wijzen naar nieuwe kankerbehandelingen.