Uppsättningen av nukleinsyrasekvenser eller gener som bildar en organisms DNA är dess genomet. I huvudsak är ett genom en molekylär plan för att konstruera en organisme. De mänskligt genom är den genetiska koden i DNA från de 23 kromosompar av Homo sapiens, plus DNA som finns i mänskliga mitokondrier. Ägg- och spermierceller innehåller 23 kromosomer (haploid genom) som består av cirka tre miljarder DNA-baspar. Somatiska celler (t.ex. hjärna, lever, hjärta) har 23 kromosompar (diploid genom) och cirka sex miljarder baspar. Cirka 0,1 procent av basparna skiljer sig från en person till nästa. Det mänskliga genomet är ungefär 96 procent liknande det för en schimpans, den art som är den närmaste genetiska släktingen.
Det internationella vetenskapliga forskningssamhället försökte konstruera en karta över sekvensen för nukleotidbaspar som utgör mänskligt DNA. USA: s regering började planera Human Genome Project eller HGP 1984 med ett mål att sekvensera de tre miljarder nukleotiderna i det haploida genomet. Ett litet antal anonyma frivilliga levererade DNA för projektet, så det färdiga mänskliga genomet var en mosaik av humant DNA och inte den genetiska sekvensen för någon person.
Medan planeringsstadiet inleddes 1984 startade HGP inte officiellt förrän 1990. Vid den tidpunkten uppskattade forskare att det skulle ta 15 år att slutföra kartan, men teknikutvecklingen ledde till färdigställandet i april 2003 snarare än 2005. Det amerikanska energidepartementet (DOE) och US National Institutes of Health (NIH) tillhandahöll de flesta av de tre miljarder dollar i offentlig finansiering (2,7 miljarder dollar totalt, på grund av att de genomförts tidigt). Genetiker från hela världen blev inbjudna att delta i projektet. Förutom USA inkluderade det internationella konsortiet institut och universitet från Storbritannien, Frankrike, Australien, Kina och Tyskland. Forskare från många andra länder deltog också.
För att göra en karta över det mänskliga genomet behövde forskare bestämma basparets ordning på DNA: t för alla 23 kromosomer (verkligen 24 om du anser att könskromosomerna X och Y är olika). Varje kromosom innehöll från 50 miljoner till 300 miljoner baspar, men eftersom basparna på en dubbel helix av DNA är komplementära (dvs. adeninpar med tymin och guaninpar med cytosin), kände kompositionen av en sträng av DNA-helixen automatiskt information om den komplementära strängen. Med andra ord, molekylens natur förenklade uppgiften.
Medan flera metoder användes för att bestämma koden, användes huvudtekniken BAC. BAC står för "bakteriell artificiell kromosom." För att använda BAC bröts humant DNA i fragment mellan 150 000 och 200 000 baspar i längd. Fragmenten infördes i bakteriellt DNA så att när bakterierna reproducerades, replikerades också människans DNA. Denna kloningsprocess tillhandahöll tillräckligt med DNA för att göra prover för sekvensering. För att täcka 3 miljarder baspar i det mänskliga genomet gjordes cirka 20 000 olika BAC-kloner.
BAC-klonerna skapade det som kallas ett "BAC-bibliotek" som innehöll all genetisk information för en människa, men det var som ett bibliotek i kaos, utan sätt att säga ordningen på "böckerna". För att fixa detta mappades varje BAC-klon tillbaka till mänskligt DNA för att hitta sin position i förhållande till andra kloner.
Därefter skars BAC-klonerna i mindre fragment med cirka 20 000 baspar i längd för sekvensering. Dessa "subkloner" laddades i en maskin som kallas en sequencer. Sekvensgivaren förberedde 500 till 800 baspar, som en dator monterade i rätt ordning för att matcha BAC-klonen.
När basparna bestämdes gjordes de tillgängliga för allmänheten online och fria för åtkomst. Så småningom var alla pusselbitarna kompletta och ordnade för att bilda ett komplett genom.
Det primära målet med Human Genome Project var att sekvensera de 3 miljarder baspar som utgör mänskligt DNA. Från sekvensen kunde de 20 000 till 25 000 uppskattade humana generna identifieras. Emellertid sekvenserades även genomerna av andra vetenskapligt signifikanta arter som en del av projektet, inklusive genomerna av fruktfluga, mus, jäst och rundmask. Projektet utvecklade nya verktyg och teknik för genetisk manipulation och sekvensering. Allmänhetens tillgång till genomet försäkrade att hela planeten kunde komma åt informationen för att få nya upptäckter.
Human Genome Project bildade den första planen för en person och är fortfarande det största samarbetsbiologiska projektet som mänskligheten någonsin har slutfört. Eftersom projektet sekvenserade genom av flera organismer, kunde forskare jämföra dem för att avslöja funktionerna i gener och för att identifiera vilka gener som är nödvändiga för livet.
Forskare tog informationen och teknikerna från projektet och använde dem för att identifiera sjukdomsgener, utforma test för genetiska sjukdomar och reparera skadade gener för att förhindra problem innan de uppstår. Informationen används för att förutsäga hur en patient kommer att svara på en behandling baserad på en genetisk profil. Medan den första kartan tog år att slutföra har framsteg lett till snabbare sekvensering, vilket har gjort det möjligt för forskare att studera genetisk variation i populationer och snabbare bestämma vilka specifika gener gör.
Projektet inkluderade också utvecklingen av ett program för etiska, juridiska och sociala implikationer (ELSI). ELSI blev världens största bioetiska program och fungerar som en modell för program som hanterar ny teknik.