Ekspertsykehuset

Verktøyet MPSproto sammenlikner genetiske fingeravtrykk bedre

Forskere fra Rettsgenetisk forskergruppe ved OUS har utviklet nytt verktøy som forbedrer DNA-identifisering i kriminalsaker.

Bilde av DNA-sekvenser
Illustrasjonsbilde av «nøkler» angitt som antall repeterte DNA-sekvensenheter.

Tekst: Øyvind Bleka, forsker, Seksjon for rettsgenetikk i straffesaker, Avdeling for rettsmedisinske fag , Klinikk for laboratoriemedisin (KLM​). Foto: Foto: Shutterstock, Øyvind Bleka og privat.

Det nye verktøyet forbedrer DNA-identifisering i kriminalsaker når informasjonen som leses av DNA-et, er basert på sekvenseringsbasert teknologi. 

Bilde av Øyvind Bleka

Øyvind Bleka

I omtrent 30 år har avlesning av genetisk informasjon for DNA-identifisering i kriminalsaker vært basert på «nøkler» angitt som antall repeterte DNA-sekvensenheter. I praksis sammenlignes nøklene mellom en referanseprofil og en sporprofil, og like nøkler støtter opp om DNA-identifisering siden nøklene typisk varierer mellom ubeslektede individer.

Eksempelvis kan en slik nøkkel være tallet 3 som betyr at en kort bokstavrekke, for eksempel at ATCG, gjentas tre ganger. Vi sier at bokstavrekken er en repeterbar enhet som DNA-sekvensen består av.

Selve sekvensen vil dermed være ATCG ATCG ATCG, som for enkelhetsskyld kan forkortes til [ATCG]3.

Tradisjonelt er det bare antall repeterte enheter, tallet 3, og ikke selve sekvensen, [ATCG]3, som brukes til sammenligning.

Ny teknologi for DNA-identifisering i fremmarsj

I løpet av det siste ti-året har teknologien Massiv parallellsekvensering (MPS) kommet i fremmarsj også innen rettsgenetikk. Denne teknologien gjør det mulig å lese av bokstavene i selve sekvensen og ikke bare antall repeterte enheter. Dermed kan man få ut hele DNA-sekvensen, [ATCG]3, og benytte denne for videre sammenligning.

Massiv parallellsekvensering har også flere andre fordeler over tradisjonell metode:

  1. Den kan benytte flere områder av DNA-et som er variabel mellom personer.

  2. Den kan få ut informasjon på kjønnskromosomene for å besvare slektskapsspørsmål.

  3. Den kan få ut informasjon som kan benyttes til andre formål enn identifisering: For eksempel til å si noe om utseende.

  4. Den kan håndtere nedbrutt DNA på en bedre måte.

I min tidligere forskning har jeg utviklet et internasjonalt anerkjent verktøy, EuroForMix, som kan brukes til å beregne en bevisvekt som tallfester usikkerheten rundt en mulig DNA-identifisering. Dette verktøyet er beskrevet i et tidligere blogginnlegg: Egenutviklet programvare for å effektivisere tolkning av DNA-spor

Selv om verktøyet EuroForMix også kan bruke sekvensbasert informasjon, er ikke verktøyet optimalisert for det.

Vår forskningsgruppe har nå lagd et nytt verktøy, kalt MPSproto, som fungerer bedre for Massiv parallellsekvensering. Verktøyet inneholder en ny strategi der deler av den statistiske modellen læres opp på forhånd med eksperimentdata, noe som igjen gir en bedre modell. I tillegg utnyttes den sekvensbaserte informasjon bedre.

Mer informasjon blir synlig

Som tidligere nevnt er en hovedforskjell mellom Massiv parallellsekvensering  og tradisjonell metode hvordan en DNA-sekvens blir fremstilt. I de repeterte enhetene kan det ligge mer informasjon som vi ikke oppdager med den tradisjonelle metoden, men ved bruk av MPS blir denne informasjonen synlig.

På fagspråket kalles en DNA-sekvens til en person for «allel», og vi bruker dette begrepet for enkelhetsskyld. For eksempel kan et allel med MPS være presentert som [TCTA]2 TCTG [TCTA]12, altså totalt hele 15 repeterbare deler.

Den tradisjonelle metoden gir kun tallet 15 som allel siden den ignorerer at noen enheter er forskjellige. Det samme tallet kunne også et annet allel fått, for eksempel TCTA TCTG [TCTA]13.

Man kan altså skille disse to allelene med MPS, men ikke med den tradisjonelle metoden.

Dette er en av fordelene med MPS, siden mer informasjon kan gi sikrere DNA-identifisering.

Et eksempel i en tenkt kriminalsak

Vi skal nå se på et praktisk eksempel der vi sammenligner en sporprofil basert på den tradisjonelle metoden mot den sekvenseringsbaserte metoden.

Bakgrunnen for denne sporprofilen kunne for eksempel vært at en kvinne ved navn Anne har blitt knivstukket, og politiet lurer på hvem som har utført ugjerningen. Det tas prøver fra kniven for å se om man kan få ut DNA-resultater som kan koble hendelsen med den mistenkte ved navn Per.

Bilde av sporptofil

Figur 1 viser en del av en sporprofil bestående av Anne og Per, fremstilt med to forskjellige metoder: venstre er basert på tradisjonell metode, og høyre figur er basert på MPS. De to personene har bidratt med ulik mengde DNA i prøven, der det minste bidraget, Per, i realiteten, har kun 2.4% av den totale mengden DNA[1]. Høydene til søylene gjenspeiler mengde DNA fra hver av personene, slik at de høye søylene forventes å være mest fra Anne.

MPS-sekvensene til høyre viser hvilke alleler de ulike søylene tilhører, mens tallene rett under representerer antall repeterte enheter («14» og «15»). Tallene «1» og «2» under disse igjen indikerer hvilket allel de to personene har («1» tilhører Anne og «2» tilhører Per). Fra figuren ser vi at profilen basert på MPS inneholder mer informasjon enn den tradisjonelle: Fire søyler istedenfor kun to.

Med tradisjonell metode så har Anne to kopier av allel 15, mens Per har allelene 14 og 15. Med denne metoden deler altså Per ett av sine alleler med Anne. Med MPS-metoden kan man avsløre at de to allel 15-kopiene til Anne egentlig består av to forskjellige sekvenser.

Vi får at én av disse to sekvensene ikke lenger deles med Per, siden den sorte søylen med tallet «1» under, kun tilhører Anne. Slik tilleggsinformasjon er nyttig for bedre sammenligninger.​

For figuren basert på MPS ser vi at én av DNA-sekvensene tilhørende allel 14, [TCTA]2 TCTG [TCTA]11, ikke tilhører noen av personene. Det betyr at hverken Anne eller Per har denne sekvensen. En slik sekvens er et skyggeallel som på fagspråket kalles «stutter» og oppstår naturlig ved oppkopiering av DNA-et.

Slike skyggealleler kan ikke unngås, og må derfor håndteres på best mulig måte. Det som har skjedd i dette tilfellet er at DNA-sekvensen tilhørende personen med mye mengde DNA, Anne, har mistet en av sine repeterbare DNA-deler, TCTA, og gått fra å være [TCTA]2 TCTG [TCTA]12 til å være [TCTA]2 TCTG [TCTA]11. Vi forventer det samme å skje for det andre allelet, TCTA TCTG [TCTA]13.

Altså kan vi si at mye av søylehøyden til sekvensen TCTA TCTG [TCTA]12, som Per også har som allel, er forårsaket av stutter. Det samme gjelder for allel 14 ved den tradisjonelle metoden (venstre figur).

Det er nettopp håndteringen av stuttere som står sentralt ved det nye verktøyet:

Modellen læres opp på forhånd til å kunne anslå hvor mye stutter som er forventet å oppstå fra instrumentet. Dette er viktig for å kunne oppdage små DNA-bidrag ved identifisering, slik som Per i dette eksempelet.

Bilde av sekvenseringsbasert lesing
Illustrasjonsfoto: Shutterstock.

Videre fremover

Det er fortsatt en vei å gå før bruk av MPS vil ta helt over for den tradisjonelle metoden å gjøre DNA-avlesning på.

Men erfaringen vi får ved bruk av statistiske verktøy for å håndtere utfordrende DNA-sammenligninger kommer til stor nytte når mengde informasjon økes. En utfordring med DNA-profiler basert på MPS er at de kan ha andre egenskaper enn for profiler basert på den tradisjonelle metoden.

Derfor er det viktig at modellene som ligger bak et nytt verktøy tilpasses slike egenskaper. MPSproto er nettopp et slikt verktøy, og en mindre studie vi har gjennomført viser at det nye verktøyet vil kunne gi bedre DNA-identifisering enn EuroForMix.

Artikkelen om MPSproto er ennå ikke publisert, men her kan du lese en artikkel som leder opp til verktøyet:  A comprehensive characterization of MPS-STR stutter artefacts

Se tidligere blogginnlegg om hvordan avlesning av informasjon fra DNA-et brukes i rettssystemet:  Genetikk i rettssystemet.

Les flere nyhetssaker om fremtidens pasientbehandling på helse-sorost.no

Her kan du lese flere blogginnlegg fra Ekspertsykehuset!


Sist oppdatert 05.01.2023