Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
RS60710B1 - Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama - Google Patents
[go: Go Back, main page]

RS60710B1 - Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama - Google Patents

Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama

Info

Publication number
RS60710B1
RS60710B1 RS20200985A RSP20200985A RS60710B1 RS 60710 B1 RS60710 B1 RS 60710B1 RS 20200985 A RS20200985 A RS 20200985A RS P20200985 A RSP20200985 A RS P20200985A RS 60710 B1 RS60710 B1 RS 60710B1
Authority
RS
Serbia
Prior art keywords
dna
polymorphisms
sequences
fetal
sequencing
Prior art date
Application number
RS20200985A
Other languages
English (en)
Inventor
Richard P Rava
Brian K Rhees
John P Burke
Original Assignee
Verinata Health Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=46001809&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RS60710(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Verinata Health Inc filed Critical Verinata Health Inc
Publication of RS60710B1 publication Critical patent/RS60710B1/sr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Algebra (AREA)

Description

Opis pronalaska
POZNATO STANJE TEHNIKE
[0001] Otkriće fetalne DNK koja slobodno pluta u krvi majke (ponekada označene kao "DNK oslobođena od ćelija" ili "cfDNK") dozvoljava mogućnost detekcije hromozomske abnormalnosti, aneuploidije i aberacije iz uzoraka krvi. Frakciona zastupljenost fetalne DNK u plazmi krvi majke nije konstantna i varira u zavisnosti od raznih faktora uključujući način rukovanja uzorcima i period gestacije.
[0002] Kada se za identifikaciju hromozomskih aberacija ili genetičkih defekata upotrebljava sekvenciranje DNK, važno je znati relativnu zastupljenost fetalne DNK u ukupnoj populaciji DNK. Na primer, kada je fetalna frakcija poznata, snaga statističke analize (verovatnoća identifikacije slučajeva sa anomalijama ili senzitivnost) može biti izračunata postupcima permutacija ili upotrebom integracija linearnih kombinacija ili konvolucija necentriranih F raspodela od alfa do beskonačnosti, pri čemu je alfa kritičan nivo koji ukazuje na značajnost (najveću verovatnoću pogrešnog imenovanja anomalije) populacije rezultata, uz postavljenu nultu hipotezu da aberacije nema.
[0003] Patentni spis US 7,332,277 obezbeđuje postupak za detekciju prisustva ili odsustva fetalne hromozomske abnormalnosti, kvantifikacijom odnosa relativnih količina alela heterozigotnog lokusa od interesa.
[0004] Nedostatak postojećih postupaka za detekciju fetalne frakcije je što se oslanjaju na merenja zastupljenosti polih hromozoma (koje se mogu upotrebljavati za pouzadno merenje samo relativne zastupljenosti muške embrionalne DNK) ili iRNK sekvenci gena za koje je poznato da se različito eksprimiraju u tkivu trudne individue i embrionalnom tkivu (čija ekspresija varira u zavisnosti od perioda gestacije ili drugih faktora).
[0005] Procena fetalne frakcije može biti otežana usled dejstva nekoliko ometajućih faktora, uklјučujući: etničke diferencijalne populacione genetičke parametre roditelja i greške u sekvenciranju. Poželjno je stoga imati na raspolaganju postupke koji su pozdani i uzimaju u obzir prisustvo navedenih ili drugih ometajućih faktora koji su obično i prisutni.
KRATKO IZLAGANJE SUŠTINE PRONALASKA
[0006] Pronalazak obezbeđuje postupak procene frakcije fetalne DNK u DNK dobijenoj iz telesne tečnosti trudne individue, postupak koji obuhvata:
(a) ekstrahovanje DNK iz uzorka telesne tečnosti pod uslovima koji ekstrahuju DNK i genoma majke i fetalnog genoma prisutnih u telesnoj tečnosti;
(b) sekvenciranje ekstrahovane DNK sa sekvencerom nukleinskih kiselina, pod uslovima koji proizvode sekvence DNK segmenta koje sadrže jedan ili više polimorfizama;
(c) poravnavanje, ili mapiranje na drugi način, sekvenci DNK segmenta izvedenih sekvenciranjem DNK iz telesne tečnosti, sa jednim ili sa više naznačenih polimorfizama na referentnoj sekvenci, pri čemu se mapiranje izvodi upotrebom računarske aparature koja je programirana da mapira sekvence nukleinskih kiselina u kontekstu jednog ili više od naznačenih polimorfizama;
(d) određivanje učestalosti alela mapiranih sekvenci DNK segmenta za najmanje jedan od naznačenih polimorfizama;
(e) klasifikovanje najmanje jednog naznačenog polimorfizma, zasnovano na kombinaciji zigotnosti trudne individue i zigotnosti fetusa; i
(f) procenjivanje frakcije fetalne DNK u DNK dobijenoj iz trudne individue, upotrebom učestalosti alela određenih u (d) u kombinaciji sa klasifikacijom zigotnosti iz (e),
pri čemu se (d) - (f) izvode na jednom ili na više procesora koji rade po programskim uputstvima za određivanje, klasifikovanje i procenu; i
pri čemu klasifikovanje u (e) klasifikuje najmanje jedan naznačeni polimorfizam u jednu od sledećih kombinacija: (i) trudna individua je homozigotna i fetus je homozigotan, (ii) trudna individua je homozigotna, a fetus je heterozigotan, (iii) trudna individua je heterozigotna, a fetus je homozigotan i (iv) trudna individua je heterozigotna i fetus je heterozigotan.
[0007] Pronalazak dalјe obezbeđuje aparaturu za procenu frakcije fetalne DNK u DNK dobijenoj iz telesne tečnosti trudne individue, pri čemu aparatura sadrži:
(a) sekvencer, konfigurisan tako da (i) prima DNK ekstrahovanu iz uzorka telesne tečnosti koja sadrži DNK i genoma majke i fetalnog genoma i (ii) sekvencira ekstrahovanu DNK pod uslovima koji proizvode sekvence DNK segmenta koji obuhvataju jedan ili više od naznačenih polimorfizama; i
(b) računarsku aparaturu konfigurisanu tako da instruira jedan ili više procesora da se poravnaju, ili mapiraju sekvence nukleinskih kiselina na drugi način, u odnosu na jedan ili više od naznačenih polimorfizama iz referentne sekvence, i dalje
određuje učestalosti alela mapiranih sekvenci DNK segmenta za najmanje jedan od naznačenih polimorfizama,
klasifikuje najmanje jedan od naznačenih polimorfizama na osnovu kombinacije zigotnosti trudne individue i zigotnosti fetusa, i
procenjuje frakcija fetalne DNK u DNK dobijenoj od trudne individue, upotrebom učestalosti alela u kombinaciji sa klasifikacijom zigotnosti; a
pri čemu je računarska aparatura dodatno kofigurisana tako da instruira jedan ili više procesora da klasifikuje najmanje jedan od naznačenih polimorfizama u jednu od sledećih kombinacija: (i) trudna individua je homozigotna i fetus je homozigotan, (ii) trudna individua je homozigotna, a fetus je heterozigotan, (iii) trudna individua je heterozigotna, a fetus je homozigotan i (iv) trudna individua je heterozigotna i fetus je heterozigotan.
[0008] Određeni opisani primeri izvođenja se odnose na računarske postupke pouzdanog merenja relativne zastupljenosti fetalne DNK koja slobodno pluta, sekvenciranjem uzorka krvi majke.
[0009] U specifičnim primerima izvođenja, pronalazak obezbeđuje postupke pouzdanog procenjivanja fetalne frakcije na osnovu polimorfizama kao što su male varijacije u tipu baza ili insercije/delecije, postupke koji su pouzdani i uzimaju u obzir etničku pripradnost roditelja, pol embriona, gestacioni period i druge sredinske faktore. Mnogi primeri koji su ovde opisni, koriste SNP-ove kao relevantne polimorfizme. Pronalazak može biti primenjen kao deo osmišljenog, prethodno dizajniranog istraživanja sa ponavljanjem sekvenciranja koji je usmeren na identifikaciju poznatih polimorfizama, ili može biti upotrebljen u retrospektivnoj analizi varijacija koje su utvrđene po principu slučajnosti u preklapajućim sekvencama generisanim iz plazme majke (ili u okviru bilo koje druge postavke u kojoj je prisutna smeša DNK iz nekoliko lјudi).
[0010] Predmetni dokument opisuje tehnike za procenu frakcione zastupljenosti fetalne DNK u uzorcima krvi majke. Određene opisane tehnike upotrebljavaju utvrđene učestalosti alela SNP mutacija koje su utvrđene po principu slučajnosti ili koje se mogu naći u panelima prethodno poznatih SNP, konstruisanih u svrhe procena fetalne frakcije.
[0011] Iako veliki deo opisa razmatra procenu frakcije fetalne nukleinske kiseline u uzorku, opis nije tako ograničen. Tehnike i aparati koji su ovde opisani, mogu biti korišćeni u mnogim slučajevima za procenu frakcije nukleinske kiseline iz jednog genoma u smeši dva genoma, a koji mogu ili ne moraju biti srodni, kao što su to roditeljski i genom deteta.
[0012] Određeni aspekti opisa se odnose na postupke procenjivanja frakcije fetalne DNK u DNK dobijenoj iz telesne tečnosti trudne individue. Takve postupke mogu karakterisati sledeći operativni postupci: (a) primanje uzorka telesne tečnosti; (b) ekstrahovanje DNK iz uzorka pod uslovima u kojima se ekstrahuju DNK i genoma majke i fetalnog genoma prisutnih u telesnoj tečnosti; (c) sekvenciranje ekstrahovane DNK upotrebom sekvencera nukleinskih kiselina, pod uslovima koji proizvode sekvence DNK segmenata u kojima su prisutni jedan ili više polimorfizama; (d) mapiranje sekvenci DNK segmenta izvedenih iz sekvenciranja DNK u telesnoj tečnosti, odnosno poravnavanje sa jednim ili sa više naznačenih polimorfizama na referentnoj sekvenci; (e) određivanje učetalosti alela mapiranih sekvenci DNK segmenta za najmanje jedan od naznačenih polimorfizama; (f) klasifikovanje najmanje jednog naznačenog polimorfizma na osnovu kombinacije zigotnosti trudne individue i zigotnosti fetusa; i (g) procenjivanje frakcije fetalne DNK u DNK dobijenoj iz trudne individue, upotrebom učestalosti alela utvrđenih u (e) i kombinacije zigotnosti iz (f).
[0013] Mapiranje može biti izvedeno upotrebom računarske aparature programirane tako da mapira sekvence nukleinskih kiselina u kontekstu jednog ili više naznačenih polimorfizama. U principu, bilo koja od operacija (d)-(g) može biti izvedena u okviru jednog ili više procesora koji rade po programskim uputstvima.
[0014] U određenim primerima izvođenja, DNK dobijena iz telesne tečnosti trudne individue je DNK oslobođena od ćelija koja je dobijena iz plazme trudne individue. Uobičajeno je da se sekvenciranje obavlja bez selektivne amplifikacije sekvenci u okviru kojih je bilo koji jedan ili više određenih polimorfizama.
[0015] U određenim primerima izvođenja, mapiranje DNK segmenata dobijenih iz krvi individue koja nosi fetus obuhvata računarsko mapiranje segmenata, upotrebom baze podataka polimorfizama. U određenim primerima izvođenja, klasifikovanje u okviru postupka (f) klasifikuje najmanje jedan naznačeni polimorfizam u jednu od sledećih kombinacija: (i) trudna individua je homozigotna i fetus je homozigotan, (ii) trudna individua je homozigotna, a fetus je heterozigotan, (iii) trudna individua je heterozigotna, a fetus je homozigotan i (iv) trudna individua je heterozigotna i fetus je heterozigotan.
[0016] Mogu biti upotrebljene razne operacije filtriranja podataka. Navedeno podrazumeva, na primer, uklanjanje iz razmatranja bilo kog polimorfizma koji je klasifikovan kao kombinacija (i) ili kombinacija (iv). U drugom primeru, postupci dalјe obuhvataju filtriranje najmanje jednog naznačenog polimorfizma da bi se iz razmatranja uklonio bilo koji polimorfizam sa učestalošću ređeg alela koja je veća od definisanog praga. U još jednom primeru, postupci obuhvataju filtriranje najmanje jednog naznačenog polimorfizma da bi se iz razmatranja uklonio bilo koji polimorfizam koji je sa učestalošću ređeg alela manjom od definisanog praga.
[0017] Operacija klasifikovanja može biti primenjena na razne načine. Na primer, može uklјučivati postavljanje praga za učestalost alela utvrđenu u (e). U drugom primeru, operacija klasifikacije podrazumeva primenu podataka o učestalosti alela iz (e), dobijenih za mnoštvo polimorfizama u model verovatnoće distribucije u smeši. U jednom primeru primene, model distribucije u smeši koristi faktorske momente.
[0018] Fetalna frakcija koja je utvrđena kao što je ovde opisano, može biti upotrebljena za razne primene. U pojedinim primerima, postupci koji su ovde opisani uključuju rad jednog ili više procesora po uputstvima izvršnog programa da bi se frakcija fetalne DNK koja je utvrđena u (g) automatski snimila u medicinski karton trudne individue i sačuvala na medijumu koji može biti očitan od strane računara. Medicinsku dokumetaciju pacijenta mogu voditi laboratorija, kancelarija ordinirajućeg lekara, bolnica, zdravstvena organizacija, osiguravajuće drušvo ili služba internet stranice za ličnu medicinsku dokumentaciju. U drugoj vrsti primene, procena frakcije fetalne DNK se upotrebljava da bi se propisalo, započelo i/ili izmenilo lečenje humanog subjekta iz koga je uzet uzorak majke za ispitivanje. U sledećoj primeni, procena frakcije fetalne DNK se upotrebljava za naručivanje i/ili obavljanje jednog ili više dodatnih testova.
[0019] Naredni aspekt opisa razmatra aparaturu za procenu frakcije fetalne DNK u DNK dobijenoj iz telesne tečnosti trudne individue. Takvu aparaturu mogu karakterisati sledeća svojstva: (a) sekvencer konfigurisan tako da (i) prima DNK ekstrahovanu iz uzorka telesne tečnosti koji sadrži DNK i genoma majke i fetalnog genoma i (ii) sekvencira ekstrahovanu DNK, pod uslovima koji proizvode sekvence DNK segmenta u kojima je prisutan jedan ili više naznačenih polimorfizama; i (b) računarski uređaj konfigurisan tako da (npr. programiran tako da) instruira jedan ili više procesora za izvođenje raznih operacija kao što su one koje su ovde opisane, putem dva ili više operativnih postupaka koji su ovde opisani. U pojedinim primerima izvođenja, računarska aparatura je konfigurisana tako da (i) mapira sekvence nukleinskih kiselina upotrebom jednog ili više od naznačenih polimorfizama u referentnoj sekvenci, (ii) utvrđuje učestalosti alela mapiranih sekvenci DNK segmenata za najmanje jedan od naznačenih polimorfizama, (iii) klasifikuje najmanje jedan naznačeni polimorfizam na osnovu kombinacije zigotnosti trudne individue i zigotnosti fetusa i (iv) procenjuje frakciju fetalne DNK u DNK dobijenoj iz trudne individue upotrebom učestalosti alela i kombinacije zigotnosti.
[0020] U određenim primerima izvođenja, aparatura sadrži i opremu za ekstrahovanje DNK iz uzorka, pod uslovima pod kojim se ekstrakuju DNK i genoma majke i fetalnog genoma. U pojedinim primerima primene, aparatura sadrži i modul konfigurisan tako da ekstrahuje DNK oslobođenu od ćelija koja se dobija iz plazme trudne individue radi sekvenciranja u sekvenceru.
[0021] U pojedinim primerima, aparatura uključuje bazu podataka polimorfizama. Računarska aparatura može dalјe biti konfigurisana tako da instruira jedan ili više procesora da se mapiraju segmenti DNK dobijeni iz krvi individue koja nosi fetus, računarskim mapiranjem segmenata u bazi podataka polimorfizama. Sekvence u bazi podataka su primer referentnih sekvenci. Ostali primeri referentnih sekvenci su prikazani u nastavku teksta.
[0022] U određenim primerima izvođenja, računarska aparatura je dalјe konfigurisana tako da instruira jedan ili više procesora da se klasifikuje najmanje jedan naznačeni polimorfizam u jednu od sledećih kombinacija: (i) trudna individua je homozigotna i fetus je homozigotan, (ii) trudna individua je homozigotna, dok je fetus heterozigotan, (iii) trudna individua je heterozigotna, dok je fetus homozigotan i (iv) trudna individua je heterozigotna i fetus je heterozigotan. U pojedinim primerima izvođenja, računarska aparatura je dalјe konfigurisana tako da instruira jedan ili više procesora da se iz razmatranja ukloni bilo koji polimorfizam klasifikovan u kombinaciju (i) ili kombinaciju (iv).
[0023] U određenim primerima izvođenja, računarska aparatura je dalјe konfigurisana tako da instruira jedan ili više procesora da se iz razmatranja ukloni bilo koji polimorfizam sa učestalošću ređeg alela koja je veća od definisanog praga. U pojedinim primerima izvođenja, računarska aparatura je dalјe konfigurisana tako da instruira jedan ili više procesora da se primeni filtriranje jednog ili više naznačenih polimorfizama i ukloni bilo koji polimorfizam sa učestalošću ređeg alela koja je manja od definisanog praga. U određenim primerima izvođenja, računarska aparatura je dalje konfigurisana tako da instruira jedan ili više procesora da se izvrši klasifikovanje najmanje jednog naznačenog polimorfizma primenom praga na učestalost alela.
[0024] U određenim primerima izvođenja, računarska aparatura je dalјe konfigurisana tako da instruira jedan ili više procesora da se klasifikuje najmanje jedan naznačen polimorfizam, primenom podataka o učestalosti alela koji su dobijeni za mnoštva polimorfizama, u model verovatnoće distribucije u smeši. Model verovatnoće distribucije u smeši može koristiti faktorske momente.
[0025] U određenim primerima izvođenja, računarska aparatura je dalјe konfigurisana tako da instruira jedan ili više procesora da se automatski snima frakcija fetalne DNK u medicinski karton pacijenta, sačuvan na medijumu koji može biti očitan od strane računara, za trudnu individuu. Medicinsku dokumetaciju pacijenta mogu voditi laboratorija, kancelarija ordinirajućeg lekara, bolnica, zdravstvena organizacija, osiguravajuće drušvo ili služba internet stranice za ličnu medicinsku dokumentaciju.
[0026] Sledeći aspekt opisa razmatra postupke procenjivanja frakcije fetalne DNK u DNK dobijenoj iz telesne tečnosti trudne individue praćenjem sledećih operativnih postupaka: (a) mapiranjem segmenata DNK dobijenih iz telesne tečnosti trudne individue za mnoštvo polimorfizama sekvenci, pri čemu je DNK sekvencirana pod uslovima koji identifikuju mnoštvo polimorfizama sekvenci; (b) određivanje učestalosti alela mapiranih nukleinskih kiselina za svaki od mnoštva polimorfizama sekvenci; i (c) primenu učestalosti alela u model verovatnoće distribucije u smeši, da bi se dobila procena frakcije fetalne DNK u DNK dobijenoj iz krvi individue koja nosi fetus. Bilo koja od jedne ili više operativnih radnji (a)-(c) može biti obavljena u okviru jednog ili više procesora koji rade po uputstvima kompjuterskog programa. U određenim primerima izvođenja, operacija (c) obuhvata izvršna uputstva za jedan ili za više procesora zarad rešavanja serija jednačina za faktorske momente na osnovu podataka o učestalosti alela, za svaki od mnoštva polimorfizama sekvenci. U pojedinim primerima izvođenja, model verovatnoće distribucije u smeši uračunava grešku sekvenciranja.
[0027] U određenim primerima izvođenja, postupci dodatno obuhvataju računarsko uklanjanje učestalosti alela za polimorfizme koji su identifikovani kao heterozigotni i kod fetusa i kod trudne individue. U pojedinim primenama, pre postupka (c), postupci uklјučuju operativnu funkciju računarskog uklanjanja učestalosti alela za polimorfizme koji su identifikovani kao homozigotni i kod fetusa i kod trudne individue. U pojedinim primenama, pre postupka (c), postupci uklјučuju operativnu funkciju računarskog uklanjanja učestalosti alela za polimorfizme koji su identifikovani kao heterozigotni kod trudne individue.
[0028] DNK dobijena iz telesne tečnosti trudne individue može biti DNK oslobođena od ćelija koja je dobijena iz plazme trudne individue. Mapiranje nukleinskih kiselina dobijenih iz telesne tečnosti može biti urađeno mapiranjem segmenata uz upotrebu baze podataka polimorfizama.
[0029] Postupci ovog aspekta opisa mogu dalje obuhvatati sekvenciranje DNK iz telesne tečnosti trudne individue, upotrebom sekvencera nukleinskih kiselina, pod uslovima koji proizvode sekvence DNK segmenata u kojima su prisutni polimorfizmi sekvenci.
[0030] U pojedinim primenama, mapiranje u (a) obuhvata identifikovanje mnoštva bialelskih polimorfizama sekvenci. U drugim primerima izvođenja, mapiranje u (a) obuhvata mapiranje segmenata DNK za mnoštvo unapred definisanih polimorfizama sekvenci.
[0031] U pojedinim primerima izvođenja, postupci ovog aspekta dodatno obuhvataju izvršna programska uputstva za jedan ili na više procesora zarad automatskog snimanja frakcije fetusne DNK koja je utvrđena kao što je navedeno pod (c) u medicinsku dokumentaciju, sačuvanu na medijumu koji može biti očitan od strane računara, za trudnu individuu. Medicinsku dokumetaciju pacijenta mogu voditi laboratorija, kancelarija ordinirajućeg lekara, bolnica, zdravstvena organizacija, osiguravajuće drušvo ili služba internet stranice za ličnu medicinsku dokumentaciju.
[0032] Na osnovu procene frakcije fetalne DNK, postupci navedenog aspekta mogu dodatno obuhvatati propisivanje, započinjanje i/ili izmenu lečenja humanog subjekta iz koga je uzet uzorak majke za ispitivanje. Na osnovu procene frakcije fetalne DNK, postupci ovog aspekta mogu dalјe obuhvatati naručivanje i/ili izvođenje jednog ili više dodatnih testova.
[0033] U skladu sa još jednim aspektom opisa, obezbeđeni su postupci za procenjivanje frakcije DNK fetusa u DNK dobijenoj iz telesne tečnosti trudne individue upotrebom sledećih operativnih postupaka: (a) primanja uzorka telesne tečnosti; (b) ekstrahovanja DNK iz uzorka pod uslovima koji ekstrahuju DNK i genoma majke i fetalnog genoma koji su prisutni u telesnoj tečnosti; (c) sekvenciranje ekstrahovane DNK upotrebom sekvencera nukleinskih kiselina, pod uslovima koji proizvode sekvence DNK segmenata; (d) upoređivanje sekvenci DNK segmenta izvedenih iz telesne tečnosti i iz poređenja koja identifikuju jedan ili više bialelskih polimorfizama; (e) utvrđivanje učestalosti alela za sekvence DNK segmenta sa najmanje jednim od identifikovanih polimorfizama; (f) klasifikovanje najmanje jednog identifikovanog polimorfizma na osnovu kombinacije zigotnosti trudne individue i zigotnosti fetusa; i (g) procenjivanje frakcije fetalne DNK u DNK dobijenoj iz trudne individue upotrebom učestalosti alela utvrđenih u (e) i kombinacije zigotnosti iz (f).
[0034] Mapiranje može biti obavljeno upotrebom računarske aparature programirane tako da mapira sekvence nukleinskih kiselina u kontekstu jednog ili više od naznačenih polimorfizama. U principu, bilo koji od operativnih postupaka (d)-(g) može biti izveden upotrebom jednog ili više procesora koji rade po programskim uputstvima.
[0035] U određenim primerima primene ovog aspekta, sekvence DNK segmenata su dužine između oko 20 baznih parova i oko 300 baznih parova.
[0036] U određenim primerima izvođenja ovog aspekta, klasifikovanje u (f) klasifikuje najmanje jedan identifikovani polimorfizam u jednu od sledećih kombinacija: (i) trudna individua je homozigotna i fetus je homozigotan, (ii) trudna individua je homozigotna, dok je fetus heterozigotan, (iii) trudna individua je heterozigotna, a fetus je homozigotan (iv) trudna individua je heterozigotna i fetus je heterozigotan. Postupci dalje mogu uključivati uklanjanje iz razmatranja bilo kog polimorfizma koji je klasifikovan kao kombinacija (i) ili kombinacija (iv).
[0037] U skladu sa raznim primerima izvođenja, postupci ovog aspekta mogu uklјučivati postupke filtriranja i/ili klasifikacije koji su ovde opisani, u kombinaciji sa drugim aspektima. Na primer, postupci navedenog aspekta mogu uključivati filtriranje jednog ili više identifikovanih polimorfizama da bi se iz razmatranja uklonio bilo koji polimorfizam sa učestalošću ređeg alela koja je veća od definisanog praga. U pojedinim slučajevima, klasifikovanje najmanje jednog identifikovanog polimorfizma podrazumeva primenu praga na učestalost alela koja je utvrđena u (e). Upotreba modela verovatnoće distribucije u smeši može biti upotrebljena za klasifikovanje identifikovanih polimorfizama kao što je ovde opisano.
[0038] Naredni aspekt opisa se odnosi na aparaturu za procenjivanje frakcije fetalne DNK i obuhvata sledeće elemente: (a) sekvencer konfigurisan tako da (i) prima DNK ekstrahovanu iz uzorka telesne tečnosti koja sadrži DNK i majčinog genoma i genoma fetusa i (ii) sekvencira ekstrahovanu DNK da bi se proizvele sekvence DNK segmenata; i (b) računarsku aparaturu konfigurisanu tako da instruira jedan ili više procesora da bi se (i) mapirale sekvence DNK segmenata dobijene iz telesne tečnosti trudne individue identifikacijom mnoštva polimorfizama sekvenci, (ii) odredila učestalost alela za svaki od mnoštva polimorfizama sekvenci na osnovu mapiranih sekvenci segmenata DNK i (iii) primenela učestalosti alela u model verovatnoće distribucije u smeši i time dobila procena frakcije fetalne DNK u DNK dobijenoj iz krvi individue koja nosi fetus.
[0039] Još jedna aparatura za procenjivanje frakcije fetalne DNK obuhvata sledeće elemente: (a) sekvencer konfigurisan tako da (i) prima DNK ekstrahovanu iz uzorka telesne tečnosti koja sadrži DNK i majčinog genoma i genoma fetusa i (ii) sekvencira ekstrahovanu DNK pod uslovima u kojima se proizvode sekvence DNK segmenata; i (b) računarsku aparaturu konfigurisanu tako da instruira jedan ili više procesora da bi se (i) uporedile sekvence DNK segmenata izvedenih iz telesne tečnosti i iz poređenja kojim se identifikuju jedan ili više bialelskih polimorfizama, (ii) odredile učestalosti alela sekvence DNK segmenta sa najmanje jednim od identifikovanih polimorfizama, (iii) klasifikovao najmanje jedan identifikovani polimorfizam na osnovu kombinacije zigotnosti trudne individue i zigotnosti fetusa i (iii) procenila frakcija fetalne DNK u DNK dobijenoj iz trudne individue upotrebom učestalosti alela i kombinacije zigotnosti.
[0040] Uputstva i/ili hardver koji se upotreblјavaju u aspektima aparature koji su ovde opisani, mogu obezbediti izvršavanje bilo kog jednog ili više od računarskih ili algoritamskih operativnih postupaka čiji su aspekti ovde opisani, bez obzira da li su navedeni postupci prethodno eksplicitno navedeni.
[0041] Navedene i druge karakteristike i prednosti opisanih primera izvođenja će biti detalјnije opisane u tekstu koji sledi, uz pozivanje na pridružene nacrte.
KRATAK OPIS SLIKA NACRTA
[0042]
Slika 1 je blok dijagram koji prikazuje klasifikovanje stanja zigotnosti fetusa i majke za datu genomsku poziciju.
Slika 2 je primer toka procesa za primenu pojedinih od opisanih primera izvođenja.
Slika 3 prikazuje procene veličine greške, upotrebom podataka o poziciji sekvencirane baze, dobijenih na preko 30 traka IlluminaGA2 uređaja i njihovim poravnavanjem sa humanim genomom HG18, upotrebom Eland kompjuterskog parametra sa zadatim parametrima.
Slika 4 je grafik odnosa broja kopija ređeg alela A i prepokrivenosti D (uz pretpostavku da greške ne postoje) za Slučajeve heterozigotnosti od 1 do 4.
Slika 5 prikazuje transformaciju podataka za Slučaj 3 u Slučaj 2.
Slika 6 prikazuje podatke nakon rotacije, pri čemu je D1 izabran tako da se Slučaj 1 i Slučajevi 2, 3 ne preklapaju. E1 predstavlјa gornju granicu gornjeg intervala pouzdanosti od 99. procenta za podatake Slučaja 1.
Slika 7 pokazuje poređenje rezultata upotrebom modela verovatnoće distribucije u smeši, kao i poznate fetalne frakcije i procenjene fetalne frakcije.
Slika 8 pokazuje da upotreba stope greške uređaja kao poznatog parametra smanjuje pozitivnu pristrasnost za jedan podeok.
Na Slici 9 je pokazano da simulirani podaci dobijeni uračunavanjem stope greške uređaja kao poznatog parametra, pobolјšavaju modele grešaka za Slučajeve 1 i 2 i time značajno smanjuju pozitivnu pristrasnost za fetalnu frakciju do vrednosti podeoka od ispod 0,2.
Slika 10 je šematski prikaz kompjuterskog sistema koji, kada je adekvatno konfigurisan (npr. programiran) ili projektovan, može poslužiti kao aparatura za analizu opisanih primera izvođenja.
Slike 11A i B prikazuju histogram brojnih zabeleženih varijacija (Učestalost) u procentu ređeg alela (A/D) na hromozomu za hromozome 1 (A) i hromozom 7, dobijene kao što je navedeno u primeru.
Slike 12A i B pokazuju distribuciju učestalosti alela duž hromozoma 1 (A) i hromozoma 7.
DETALJAN OPIS PRONALASKA
Uvod i pregled pronalaska
[0043] Određeni opisani primeri izvođenja obuhvataju analizu DNK uzete iz krvi trudne ženske individue i upotrebu analize za procenu frakcije DNK koja potiče od fetusa. Fetalna frakcija DNK može zatim biti upotrebljena za izračunavanje određenog nivoa pouzanosti za drugu metričku osobinu ili karakterizaciju fetusa koja se zasniva na nezavisnoj analizi DNK uzete iz krvi majke. Na primer, fetalni uzorak DNK uzet iz krvi majke može biti posebno analiziran da bi se detektovala aneuploidija kod fetusa koga nosi trudna ženska individua. Određivanje aneuploidije urađeno ovakvom zasebnom analizom može biti dato sa nivoom statistički značajne pouzdanosti koji se zasniva na frakcionoj količini fetalne DNK prisutne u DNK uzetoj iz krvi majke. Relativno niske frakcije fetalne DNK u ukupnom komplementu DNK ukazuju na nizak nivo pouzdanosti za bilo koju karakterizaciju zasnovanu na fetalnoj DNK.
[0044] Uobičajeno je, iako nije neophodno, da analizirana DNK u krvi majke predstavlja DNK oslobođenu od ćelija, iako u pojedinim primerima izvođenja, ona može predstavljati DNK vezanu za ćelije. DNK oslobođena od ćelija se uzima iz plazme majke. Količina fetalne DNK u sadržaju DNK oslobođene od ćelija koja je uzeta iz trudne ženske individue široko varira u zavisnosti od raznovrsnih faktora, uklјučujući gestacionu starost fetusa. Kod uobičajene trudnoće ženske individue, trenutno se pretpostavlja da približno 5-20% DNK oslobođene od ćelija predstavlja fetalnu DNK. Ipak, nije neuobičajeno da fetalna frakcija bude značajno niža (npr. približno 1% ili manje). U takvim slučajevima, bilo koja posebna karakterizacija fetalne DNK može biti inherentno sumnjiva. Sa druge strane, pojedini istraživači su prijavili uzorke DNK majke oslobođene od ćelija sa visoko zastupljenom fetalnom frakcijom DNK, čak do 40% ili 50%.
[0045] U određenim primerima primene koji su ovde opisani, određivanje fetalne frakcije u DNK majke se oslanja na višestruka očitavanja DNK sekvenci za mesta na sekvencama za koja je poznato da je u njima pristuan jedan ili više polimorfizama. Uobičajeno je, iako nije neophodno, da su navedeni polimorfizmi tipa polimorfizama u jednom nukleotidu (SNP). Druge vrste odgovarajućih polimorfizama obuhvataju delecije, STR polimorfizme (polimorfizme kratkih tandemskih ponovaka), insercije, indele (uklјučujući mikroindele) itd. Dodatni primeri su predstavlјeni u nastavku teksta. U određenim primerima izvođenja, polimorfna mesta se nalaze u "referentnoj sekvenci", kao što je opisano u nastavku teksta. U pojedinim primerima izvođenja, mesta polimorfizama mogu biti utvrđena prilikom poravnjavanja markerskih sekvenci (tag-sekvenci), jednih sa drugima, i/ili sa referentnom sekvencom.
[0046] Određeni opisani postupci upotrebljavaju činjenicu da sekvence fetalne DNK na mestima polimorfizama koji se razmatraju, mogu biti one koje ne odgovaraju sekvencama prisutnim kod majke fetusa. Na primer, DNK majke na mestu određenog SNP može biti homozigotna, dok će verzija SNP kod fetusa biti heterozigotna. Tako, kolekcija uzoraka sekvenci uzetih za analizu SNP od interesa će biti heterogena, sa većinom sekvenci koje sadrže učestaliji (engl. major) alel i sa preostalom frakcijom koja sadrži ređe zastupljen alel (engl. minor). Relativne količine učestalijih i ređih alela se određuju na osnovu frakcije fetalne DNK u uzorku.
[0047] Potrebno je napomenuti da u homozigotnom uzorku obe kopije datog SNP ili drugog polimorfizma podrazumevaju isti alel, dok heterozigotni SNP ili drugi polimorfizam podrazumeva prisustvo jedne kopije učestalijeg alela i jedne kopije ređe zastupljenog alela. Poznato je, naime, da DNK uzeta isklјučivo iz heterozigotne individue treba da sadrži 50% učestalijeg alela i 50% manje
1
učestalog alela. Navedena činjenica može biti upotrebljena pri razrešavanju frakcije fetalne DNK kao što je to u glavnim crtama navedeno u tekstu koji sledi. Kao što je u nastavku teksta potpunije objašnjeno, razni postupci koji su ovde opisani razmatraju samo polimorfizme koje karakteriše postojanje samo dva alela u ukupnoj DNK, tj. onoj koja istovremeno sadrži DNK i majke i fetusa.
[0048] U pojedinim primerima primene, DNK uzeta iz krvi majke se očitava mnogo puta, a ukupan broj očitavanja koja mapiraju određeno mesto polimorfizma se dalje označava kao "pokrivenost" polimorfizma (ukupan broj kopija), dok se broj očitavanja koja mapiraju ređi alel za navedeni polimorfizam označava kao broj kopija ređeg alela. Odnos broja kopija ređeg alela i ukupnog broja očitavanja (prepokrivenosti) je važan u raznim primerima primene.
[0049] Određeni od postupaka koji su ovde opisani, identifikuju i karakterišu četiri slučaja polimorfizama u uzorcima DNK koji sadrže DNK i iz majke i iz fetusa. Slika 1 (prikazana ispod) opisuje navedena četiri slučaja. Preciznije, u prvom slučaju, koji je prilično nezanimlјiv, i majka i fetus su homozigotni za određeni polimorfizam koji se razmatra. U tom slučaju, svaka sekvenca u uzorku DNK koja se analizira na polimorfizam koji se razmatra, sadržavaće isti alel, tako da se ne mogu prikupiti informacije o relativnim količinama DNK majke i fetusa. Potrebno je napomenuti, međutim, da ovaj slučaj može biti zanimlјiv zbog činjenice da se time omogućava istraživaču ili tehničaru da stekne neku predstavu o relativnoj stopi greške aprature za sekvenciranje DNK koji se upotrebljava za generisanje podataka o sekvencama koje se razmatraju.
[0050] Drugi slučaj koji se susreće prikom analize, jeste polimorfizam za koji je trudna individua homozigotna, dok je fetus heterozigotan. U ovom slučaju, relativno mala, ali ipak značajna frakcija detektovanih sekvenci će sadržavati ređi alel. Preciznije, u ovom drugom slučaju, učestalost ređeg alela se nominalno izračunava kao frakcija fetalne DNK u krvotoku majke podelјena sa dva.
[0051] U trećem slučaju, polimorfizam koji se razmatra podrazumeva heterozigotnost u DNK majke i homozigotnost u DNK fetusa. U ovoj situaciji, učestalost ređeg alela se nominalno izračunava kao 0,5 minus jedna polovina frakcije fetalne DNK u uzorku DNK.
[0052] Konačno, u četvrtom slučaju, razmatrani polimorfizam podrazumeva heterozigotnost i kod majke i kod fetusa. U ovom slučaju, očekuje se da će učestalost i učestalijeg i manje učestalog alela biti 0,5. Kao i u prvom slučaju, četvrti slučaj je relativno neinteresantan za određivanje fetalne frakcije DNK.
[0053] Ukoliko je istraživač, tehničar ili kompjuterski program zadužen za određivanje frakcije fetalne DNK u uzorku, upoznat kojoj od navedene četiri klase pripada dati polimorfizam, onda frakcija fetalne DNK može biti direktno procenjena, uz pretpodavku da polimorfizam koji se razmatra podpada bilo pod Slučaj dva ili pod Slučaj tri. U praksi, međutim, navedeno nikada nije poznato unapred. Potrebna je stoga računarska aparatura za obavlјanje operativnih postupaka koji su ovde opisani.
[0054] U određenim primerima izvođenja koji su ovde opisani u drugim delovima teksta, za klasifikovanje polimorfizma u jednom nukleotidu u jedan od četiri slučaja, upotrebljava se tehnika primene praga. Jednom kada je polimorfizam tako klasifikovan, i kada je ustanovljeno da on pripada bilo Slučaju 2 ili 3, fetalna frakcija može biti procenjena. U drugim primerima izvođenja, tehnika podrazumeva višestruke polimorfizme raspoređene duž celog ili dela genoma. Kao što je ilustrovano u specifičnim primerima, za ovu svrhu mogu biti upotrebljeni višestruki različiti SNP-ovi duž genoma.
[0055] U posebnim primerima izvođenja, učestalost alela se određuje za niz različitih polimorfizama u uzorku DNK koji je uzet iz uzorka krvi majke. Za navedeno mnoštvo polimorfizama, neka od frakcija će odgovarati zigotnosti Slučaja 1, druga frakcija će odgovarati Slučaju 2, treća frakcija će odgovarati Slučaju 3, dok će finalna frakcija odgovarati Slučaju 4. Suma ovih frakcija će iznositi 1. Model verovatnoće distribucije u smeši ili srodna tehnika mogu biti upotrebljeni za izdvajanje jednog ili više statističkih parametara polimorfizama u Slučaju svake od ove četiri kategorije. Preciznije, model verovatnoće distribucije u smeši može biti upotrebljen za određivanje srednje vrednosti i opciono varijanse za svaki od četiri slučaja koji se sreću u uzorku DNK uzetom iz krvi trudne ženske individue. U specifičnim primerima izvođenja, navedeno podrazumeva upotrebu srednje vrednosti i varijanse koji su povezani sa učestalošću ređeg alela izračunatom u odnosu na ukupan broj kopija polimorfizma koji se razmatraju (prepokrivenost). Kao što je ovde izloženo u drugim delovima opisa, srednje vrednosti za svaku od ove četiri kategorije, ili barem za drugu i treću kategoriju, direktno su proporcionalne fetalnoj frakciji u DNK koja je uzeta iz krvi majke.
[0056] U specifičnom primeru primene u kome se upotrebljavaju modeli verovatnoće distribucije u smeši, izračunavaju se jedan ili više faktorskih momenata za svaku poziciju za koju se polimorfizam razmatra. Na primer, faktorski momenat (ili skup faktorskih momenata) se izračunava upotrebom višestrukih SNP pozicija koje se razmatraju u DNK sekvenci. Kao što je prikazano u jednačini 4 ispod, svaki od raznovrsnih faktorskih momenata predstavlja zbir odnosa učestalosti ređeg alela i pokrivenosti za svaku od raznih SNP pozicija koje se razmatraju. Kao što je prikazano u jednačini 5 u nastavku teksta, ovi faktorski momenti takođe odražavaju parametre distribucije koji su utvrđeni za bilo koji od četiri slučaja zigotnosti koji su prethodno opisani. Preciznije, oni se odnose na verovatnoću pojave svakog od slučajeva, kao i na relativne količine svakog od četiri slučaja u kolekciji polimorfizama koji se razmatraju. Kao što je prethodno objašnjeno, verovatnoća je funkcija frakcije fetalne DNK u DNK oslobođenoj od ćelija iz krvi majke. Kao što je potpunije objašnjeno u nastavku teksta, izračunavanjem dovolјnog broja ovih faktorskih momenata (koji su prikazani u jednačini 4), postupak obezbeđuje dovolјan broj izraza za rešavanje svih nepoznatih. Nepoznate bi u ovom slučaju predstavljale relativne količine svakog od četiri slučaja u populaciji polimorfizama koji se razmatraju, kao i verovatnoće (a time i frakcije fetalne DNK) koje su povezane sa svakim od ova četiri slučaja. Pogledati Jednačinu 5. Slični rezultati mogu biti dobijeni upotrebom drugih verzija modela verovatnoće distribucije u smeši poput onih prikazanih u nastavku teksta, u Jednačinama 7-12. Ove određene verzije upotrebljavaju samo polimorfizme koji pripadaju Slučajevima 1 i 2, dok se polimorfizmi za Slučajeve 3 i 4 uklanjaju postupkom filtriranja, primenom tehnike praga.
[0057] Faktorijalni momenti stoga mogu biti upotrebljeni kao deo modela verovatnoće distribucije u smeši, da bi se identifikovale verovatnoće bilo koje kombinacije od četiri slučaja zigotnosti. Kao što je i pomenuto, navedene verovatnoće, ili barem one za drugi i treći slučaj, direktno su proporcionalne frakciji fetalne DNK u ukupnoj DNK oslobođenoj od ćelija u krvi majke.
[0058] Potrebno je takođe napomenuti da se greška sekvenciranja može iskoristiti za smanjenje složenosti sistema jednačina faktorskih momentnih koje moraju biti rešene. U tom pogledu, potrebno je napomenuti da greška sekvenciranja zapravo može predstavljati bilo koji od četiri rezultata (koji odgovaraju svakoj od četiri moguće baze na bilo kojoj navedenoj polimorfnoj poziciji).
[0059] U određenim primerima izvođenja, markerske sekvence se poravnavaju sa referentnim hromozomom ili genomom i tako se identifikuju bialelski polimorfizmi. Ovakvi polimorfizmi nisu prethodno definisani ili na drugi način identifikovani pre poravnavanja. Oni se jednostavno identifikuju tokom poravnavanja, a zatim se polimorfizmi karakterišu na osnovu njihovih zigotnosti i broja kopija ređeg alela kao što je ovde opisano. Navedeni podatak se upotrebljava za procenu frakcija genoma kao što je ovde opisano.
[0060] Dužine markerskih sekvenci (tagova) upotrebljenih u primerima izvođenja koji su ovde opisani, u principu će biti određene postupcima sekvenciranja upotrebljenim za generisanje tagova. Postupci su robusni i duž širokog su opsega dužina tagova. U određenim primerima primene, tagovi su dužine od između oko 20 i 300 baznih parova (ili oko 30 i 100 baznih parova).
[0061] Primer toka procesa za primenu pojedinih od opisanih primera izvođenja je prikazan na Slici 2. Kao što je prikazano, proces počinje sa postupkom 201, odnosno sa prikuplјanjem DNK (oslobođene od ćelija ili vezane za ćelije) iz krvi majke ili druge telesne tečnosti. Iz ove DNK se mapiraju višestruke sekvence da bi se utvrdilo prisustvo jednog ili na više polimorfizama u referentnoj sekvenci. Ovakvo mapiranje obezbeđuje učestalost alela za svaki od polimorfizama. Pogledati blok 203.
[0062] Preciznije, proces u okviru bloka 203 može obuhvatati očitavanje sekvenci prikuplјene DNK na lokacijama višestrukih polimorfizama. U pojedinim slučajevima, očitavanja mogu biti generisana kao deo procesa za određivanje ploidnosti ili druge analize koja se sprovodi za fetalnu DNK. Prema tome, u pojedinim primerima izvođenja, nije potrebno generisanje odvojenih sekvenci. Očitane sekvence se poravnavaju sa referentnom sekvencom da bi se do maksimuma povećalo poravnavanje, upotrebom BLAST ili sličnog programa.
[0063] Referentna sekvenca može biti obezbeđena u vidu baze podataka za polimorfizme. U pojedinim slučajevima, baza predstavlja referentni skup za pretraživanje alela dobijen kombinatornom ekspanzijom svih definicija polimorfizama (npr. u slučaju gde su polimorfizmi SNP-ovi, svih SNP sekvenci). Pogledati dodatni materijal kao primer. U specifičnom primeru, sekvence su dužina od oko 100 do 150 baznih parova.
[0064] Vraćajući se na Sliku 2, postupak određuje kombinaciju zigotnosti majke/fetusa za jedan ili za više polimorfizama koji se razmatraju u operativnom postupku bloka 203. Pogledati blok 205. U ovu svrhu, u određenim primerima izvođenja može biti upotrebljen model verovatnoće distribucije u smeši. Kao što je pomenuto, kombinacije su sledeće: M i F su homozigotni, M je homozigotna i F je heterozigotan, M je heterozigotna i F je homozigotan i M i F su heterozigotni.
[0065] Konačno, kao što je ilustrovano u okviru bloka 207, postupak upotrebljava kombinaciju slučaja zigotnosti i učestalosti alela za jedan ili za više polimorfizama radi procene frakcione količine fetalne komponente u DNK iz uzorka majke.
Definicije
[0066] Definicije koje slede su obezbeđene kao ispomoć u razumevanju određenih aspekata i prednosti prijavljenih primera izvođenja.
Termin "očitavanje" se odnosi na očitavanje sekvence iz dela uzorka nukleinske kiseline. Uobičajeno je, iako nije neophodno, da očitavanje predstavlјa kratku sekvencu koja predstavlja niz susednih baznih parova u uzorku. Očitavanje može biti predstavljeno simbolično, sekvencom baznih parova (kao ATCG) dela uzorka. Očitavnje može biti sačuvano na uređaju za čuvanje memorije i potom
1
obrađeno na odgovarajući način da bi se utvrdilo da li se očitavanje poklapa sa referentnom sekvencom ili ispunjava druge kriterijume. Očitavanje može biti dobijeno direktno iz uređaja za sekvenciranje ili može biti dobijeno indirektno, iz sačuvanih informacija o sekvenci koje su u vezi sa uzorkom.
Termin "marker sekvenca (tag)" se takođe odnosi na kratke sekvence iz uzorka nukleinske kiseline. Uobičajeno je da tag sadrži pridružene informacije, kao što je lokacija sekvence u genomu. Za pojedine svrhe, termini očitavanje i tag se ovde naizmenično upotrebljavaju. Uobičajeno je ipak da se očitavanja sekvenci poravnavaju u odnosu na referentnu sekvencu, kao i da se očitavanja koja mapiraju samo jedno mesto u referentom genomu označavuju kao tagovi. "Segment sekvence" se ovde ponekada koristi naizmenično sa terminom "tag".
"Očitavanja" se u tekstu često opisuju kao sekvence nukleinskih kiselina koje su dužine 36 baznih parova (36-omeri). Naravno, opisani primeri izvođenja nisu ograničeni na navedenu veličinu. Manja i veća očitavanja su pogodna u mnogim primenama. Za primene u kojima se očitavanja poravnavaju sa humanim genomom, očitavanja veličine 30 baznih parova ili više se generalno smatraju dovolјnim za mapiranje uzorka na pojedinačan hromozom. Mnogo duže marker sekvence/očitavanja su pogodne za pojedine primene. Za sekvenciranje celokupnog genoma mogu tako biti upotrebljena očitavanja reda veličine od 1000 baznih parova ili više. U određenim primerima izvođenja, očitavanja mogu biti dužine između oko 20 i 10,000 baznih parova ili između oko 30 i 1000 baznih parova ili između oko 30 i 50 baznih parova.
"Referentna sekvenca" je sekvenca biološkog molekula koji često predstavlja nukleinsku kiselinu kao što je hromozom ili genom. Uobičajena višestruka očitavanja predstavljaju članove navedene referentne sekvence. U određenim primerima izvođenja, očitavanje ili tag se upoređuju sa referentnom sekvencom da bi se utvrdilo da li referentna sekvenca sadrži očitanu sekvencu. Ovakav proces se ponekad označava kao poravnavanje.
U raznim primerima izvođenja, referentna sekvenca je značajno veća od očitavanja koja se sa njom poravnavaju. Na primer, ona može biti najmanje oko 100 puta veća ili najmanje oko 1000 puta veća ili najmanje oko 10000 puta veća ili najmanje oko 10<5>puta veća ili najmanje oko 10<6>puta veća ili najmanje oko 10<7>puta veća.
U jednom primeru, referentna sekvenca je ona koja predstavlja humani genom pune dužine. Takve sekvence mogu biti označene kao genomske referentne sekvence. U drugom primeru, referentna sekvenca je ograničena na specifičan humani hromozom, kao što je hromozom 13. Takve sekvence mogu biti označene kao hromozomske referentne sekvence. Drugi primeri referentnih sekvenci obuhvataju genome drugih vrsta, kao i hromozome, subhromozomske regione (kao što su lanci) itd. iz bilo koje vrste.
U raznim primerima izvođenja, referentna sekvenca je konsenzusna sekvenca ili druga kombinacija izvedena iz više individua. Međutim, u određenim primenama, referentna sekvenca može biti uzeta iz određene individue.
Pojam "poravnavanje" se odnosi na proces upoređivanja očitavanja ili taga sa referentnom sekvencom i time određivanje da li referentna sekvenca sadrži očitanu sekvencu. Ukoliko referentna sekvenca sadrži očitavanje, očitavanje može biti mapirano na referentnoj sekvenci ili, u određenim primerima izvođenja, na određenoj lokaciji referentne sekvence. U pojedinim slučajevima, poravnavanje jednostavno govori da li je očitavanje član određene referentne sekvence ili to nije slučaj (tj. da li je očitavanje prisutno ili odsutno u referentnoj sekvenci). Na primer, poravnavanje očitavanja sa referentnom sekvencom za humani hromozom 13 će pokazati da li je očitavanje prisutno u referentnoj sekvenci za hromozom 13. Oprema koji obezbeđuje ovu informaciju može biti označena kao postupak za ispitivanje pripadnosti skupu podataka. U pojedinim slučajevima, poravnavanje dodatno ukazuje na lokaciju u referentnoj sekvenci gde očitavanje ili tag mapiraju. Na primer, ukoliko referentna sekvenca predstavlja sekvencu celokupnog humanog genoma, poravnavanje može ukazati da je očitavanje prisutno na hromozomu 13, a dalјe može ukazati i na to da je očitavanje na specifičnom lancu hromozoma 13.
"Mesto" je jedinstvena pozicija (lokus) u referentnoj sekvenci, koja odgovara očitavanju ili tagu. U određenim primerima izvođenja, mesto precizira identitet hromozoma (npr. hromozom 13), lanac hromozoma i tačnu poziciju u hromozomu.
"Polimorfno mesto" je lokus na kome se javlјa divergencija nukleotidne sekvence. Lokus može biti toliko mali da označava jedan bazni par. Ilustrativni markeri podrazumevaju najmanje dva alela, pri čemu se svaki javlja sa učestalošću koja je veća od 1% i više, a uobičajeno je učestalost veća od 10% ili 20% u izabranoj populaciji. Polimorfno mesto može biti toliko malo da predstavlja jedan bazni par. Termini "polimorfni lokus" i "polimorfno mesto" se ovde upotrebljavaju naizmenično.
"Polimorfna sekvenca" se ovde odnosi na sekvencu nukleinske kiseline, npr. sekvencu DNK, koja sadrži jedno ili više polimorfnih mesta, npr. jedan SNP ili tandem SNP-ova. Polimorfne sekvence se, shodno postojećoj tehnologiji, mogu upotrebiti za specifično razlikovanje između alela koji jesu i nisu poreklom od majke, u uzorku majke koji sadrži mešavinu nukleinskih kiselina fetusa i majke.
Detalјni primeri izvođenja
[0067] Uobičajeno je da procesi koji su ovde opisani upotrebljavaju referentnu sekvencu u kojoj je prisutan jedan ili više polimorfizama i koja je srodna DNK koja se uzorkuje. Referentna sekvenca može biti, na primer, genom čoveka, hromozom ili region hromozoma. U svrhu procene frakcije fetalne DNK, može biti precizno definisan jedan ili više polimorfizama. Polimorfizmi koji se definišu za upotrebu u određivanju fetalne frakcije su polimorfizmi koji su unapred poznati. Na primer, sveobuhvatan spisak referenci, činjenica i podataka o sekvencama za prethodno poznate STR polimorfizme, kao i relevantni podaci o učestalosti u populacijama mogu biti sadržani u okviru tzv. STRBase, baze podataka kojoj se može pristupiti preko internet adrese ibm4.carb.nist.gov:8800/dna/home.htm. Informacije o sekvenci iz GenBank® baze podataka (http://www2.ncbi.nlm.nih.gov/cgi-bin/genbank) za najčešće korišćene STR lokuse su takođe dostupne u STRBase. Informacijama prethodno poznatih SNP-ova se može pristupiti putem javno dostupnih baza podataka, uklјučujući, ali ne ograničavajući se samo na, Bazu podataka za humne SNP-ove na internet adresi wi.mit.edu, početnu stranicu NCBI dbSNP baze na internet adresi ncbi.nlm.nih.gov, bazu na internet adresi lifesciences.perkinelmer.com firme Applied Biosystems, Life Technologies™ (Carlsbad, Kalifornija) sa internet adresom appliedbiosystems.com, Celera bazu humanih SNP-ova na internet adresi celera.com, SNP bazu podataka Grupe za analizu gena (GAN) na internet adresi gan.iarc.fr. U jednom primeru izvođenja, SNP-ovi koji su definisani za određivanje fetalne frakcije, izabrani su iz grupe koju čini 92 pojedinačna identifikaciona SNP-a (IISNPs) opisana od strane Pakstis-a i saradnika (Pakstis i saradnici, Hum Genet 127: 315-324 [2010]), a za koje
1
je pokazano da su sa veoma malom varijacijom učestalosti u okviru populacija (Fst<0,06), kao i da su visoko informativni širom sveta, pri čemu prosečna heterozigotnost iznosi ≥0,4. SNP-ovi koje su obuhvaćeni postupkom pronalaska uklјučuju međusovno povezane i nepovezane SNP-ove. Da bi se odredile odgovarajuće tandemske SNP sekvence, moguća je pretraga međunarodne baze podataka HapMap konzorcijuma (The International HapMap Project, Nature 426:789-796 [2003]). Baza podataka je dostupna na internet adresi hapmap.org.
[0068] Polimorfizmi upotrebljeni na navedeni način mogu predstavljati panele prethodno poznatih polimorfizama koji su i konstruisani za određivanje fetalne DNK frakcije ili onih koji su utvrđeni po principu slučajnosti prilikom analize DNK majke u druge svrhe, kao što je mapiranje markerskih sekvenci DNK uzorka na hromozomima.
[0069] U određenim primerima izvođenja, postupak podrazumeva sekvenciranje DNK u uzorku, upotrebom mešavine genoma, npr. uzorka majke koji sadrži fetalnu i DNK majke oslobođene od ćelija, da bi se obezbedilo mnoštvo markerskih sekvenci koje mapiraju na sekvencama koje sadrže prethodno poznata polimorfna mesta u referentnom genomu, kao i da bi se, upotrebom markerskih sekvenci koje mapiraju na prethodno poznata mesta, utvrdila fetalna frakcija kao što je detaljno opisano u nastavku teksta. Alternativno, nakon sekvenciranja DNK, markerske sekvence dobijene tehnologijom sekvenciranja, npr. NGS pristupom, mapiraju se u okviru referentnog genoma. npr. u hg19, nakon čega se markerske sekvence koji mapiraju na mesta na kojima se polimorfizmi javljaju po principu slučajnosti tj. koji nisu prethodno poznati, upotrebljavaju za određivanje fetalne frakcije.
[0070] Referentna sekvenca koja se upotrebljava za mapiranje markerskih sekvenci na prethodno poznata polimorfna mesta, može podrazumevati prethodno objavljen referentni genom ili može predstavljati veštački kreiranu bazu podataka ili drugu unapred definisanu kolekciju sekvenci za polimorfizme koji se razmatraju. Svaka od baza podataka sekvenci će obuhvatati jedan ili više nukleotida koji su asocirani sa polimorfizmom. Kao jedan primer, pogledati spisak polimorfizma sekvenci koji je predstavljen u nastavku teksta, u "Dodatnom materijalu 1."
[0071] U raznim primerima izvođenja, broj polimorfizama koji se koriste za procenu frakcije fetalne DNK iznosi najmanje 2 polimorfizma, a preciznije, upotrebljavaju se podaci za svaki od najmanje oko 10 polimorfizama i još prioritetnije, za svaki od najmanje oko 100 polimorfizama.
[0072] U jednom primeru, SNP pokrivenost i učestalost alela se određuju poravnavanjem generisanih sekvenci sa referentnim genomom konstrituisanim kombinatornom ekspanzijom SNP definicija. Baza podataka sa amplikonima sadrži podatke o bialelskim varijacijama mesta koja su okružena sa npr. najmanje oko 50 baza bočne sekvence. Na primer, amplikon sa podatkom o varijaciji za niz "[g/c]" (što predstavlјaju alternativne alele "g" i "c" može izgledati kao:
atcg ..... accg[g/c]ccgt ....
[0073] U pojedinim slučajevima, procedura za unos iz baze podataka za amplikone i generisane sekvence, kao i izlaz podataka o broju kopija SNP/alela je sledeći.
1. Kreiranje seta referentanih podataka za pretragu alela na osnovu kombinatorne ekspanzije SNP definicija. Za svaku sekvencu u bazi amplikona, za svaki alel u nizu podataka o varijaciji, kreira se alelska sekvenca u skladu sa nizom podataka o varijaciji upotrebom zamene alela.
1
a. Na primer, razmatrajući prethodni primer sekvence amplikona, trebalo bi kreirati dve sekvence: 1) atcg ..... accgGccgt .... i 2) atcg ..... accgCccgt ....
b. Primer kompletnog seta referentanih podataka za pretragu alela se može naći u okviru Liste baze podataka za pretraživanje alela.
2. Mapiranje sekvenci na osnovu seta referentnih sekvenci za pretraživanje alela uz zadržavanje samo onih mapiranja koja se poklapaju sa samo jednom sekvencom u skupu sekvenci koji se pretražuje.
3. Broj kopija alela se određuje prebrojavnjem sekvenci koje se poklapaju sa njegovom alelskom sekvencom.
[0074] Postupci koji su ovde opisani pretpostavlјaju "normalnu" trudnoću, tj. trudnoću u kojoj majka nosi samo jedan fetus, a ne blizance, trojke itd. Stručnjacima će biti od značaja napomena da su opisane i modifikacije koje uračunavaju trudnoće koje odstupaju od normalnih, posebno one u kojima je poznat broj fetusa.
[0075] Kao što je prethodno naznačeno, kada se određuje fetalna frakcija, postupak podrazumeva sekvenciranje DNK u uzorku iz krvi majke i prebrojavanje markerskih sekvenci koji mapiraju na svaki od razmatranh polimorfizama sekvenci. Za svaki polimorfizam, postupak obezbeđuje ukupan broj očitavanja koja su mapirana datom sekvencom (pokrivenost) i brojeve markerskih sekvenci koje su asocirani sa svakim alelom (broj kopija alela). U jednostavnom primeru, polimorfizam sa prepokrivenošću od 5, može sadržavati 3 očitavnja alela B i 2 očitavnja alela A. U ovom primeru, alel A se smatra ređim alelom, a alel B se razmatra kao učestaliji alel.
[0076] U pojedinim primerima izvođenja, navedeni operativni postupak upotrebljava veoma brzu opremu za sekvenciranje, kao što je oprema za uporedno sekvenciranje DNK u velikom obimu. Primeri takve opreme su detalјnije opisani u nastavku teksta. U pojedinim slučajevima, za jedan uzorak se očitava više hilјada ili miliona markerskih sekvenci. Poželjno je, međutim, da se sekvenciranje vrši na način koji omogućava brzu i direktnu karakterizaciju sekvencirane DNK u određene unapred definisane sekvence u kojima su prisutni polimorfizmi koja se razmatraju. U principu, za navedenu svrhu je dovoljno informacija obezbeđeno markerskim sekvencama veličine 30 baznih parova ili više. Markerske sekvence ove veličine mogu biti upotrebljene za nedvosmisleno mapiranje sekvenci od interesa. U specifičnim primerima izvođenja, markerske sekvence koji se koriste u procesu, dužine su od 36 baznih parova.
[0077] Markerske sekvence mapiraju u referentnom genomu ili u sekvencama iz baze podataka alelskih sekvenci (npr. pogledati Dodatni material 1, kao što je prethodno pomenuto), a na osnovu toga se dalje određuje broj markerskih sekvenci koje su tako mapirane. Navedeno će obezbediti i prepokrivenost i broj kopija ređeg alela za svaki polimorfizam koji se razmatra. U pojedinim slučajevima, ovo može biti urađeno istovremeno sa mapiranjem svake markerske sekvence na jedan od 23 humana hromozoma i određivanjem broja mapiranih markerskih sekvenci po hromozomu.
[0078] Kao što je već pomenuto, prepokrivenost predstavlja ukupan broj očitanih sekvenci koje su mapirane za određeni polimorfizam u referentnoj sekvenci. Broj kopija alela je ukupan broj očitanih sekvenci koje su mapirane za polimorfizam koga karakteriše postojanje alela. Suma svih brojeva kopija
1
alela mora biti jednaka prepokrivenosti. Alel sa najvećim brojem kopija predstavlja učestaliji alel, dok je alel sa najnižim brojem kopija ređi alel. U određenim primerima izvođenja, jedina informacija potrebna za procenu frakcije fetalne DNK je prepokrivenost i broj kopija ređeg alela za svaki od mnoštva polimorfizama. U pojedinim primerima izvođenja, upotrebljava se stopa greške imenovanja baze od strane aparature za sekvenciranje DNK.
[0079] Korisno je uzeti u obzir matematičke ili simboličke osnove određenih postupaka koji su ovde opisani. Kao što je pomenuto u raznim primerima, sekvence dobijene iz krvi majke se poravnavaju (superponiraju tako da identične baze budu maksimalno preklopljene) sa referentnim genomom ili drugom sekvencom nukleinske kiseline. Uzimajući u obzir položaj u genomu, j, kao i skup sekvenci koje su poravnate sa refentnom sekvencom, broj pojavljivanja svake od četiri baze DNK ("a", "t", "g" i "c", takođe nazvanih "aleli") u okviru poravnatih sekvenci može biti označen kao w(j,1), w(j,2), w(j,3), w(j,4), tim redom. Za potrebe ovakvog razmatranja, može se takođe pretpostaviti, a bez gubitka uopštavanja, da su sve varijacije bialelske. Stoga, mogu biti upotrebljene sledeće vrste označavanja:
Broj kopija učestalijeg alela na genomskoj poziciji j je kao statististička odlika prvog reda za broj kopija na poziciji j (učestaliji alel, b, predstavlja odgovarajući argmax. Indeksi se upotrebljavaju kada se razmatra više od jednog SNP-a),
Broj kopija ređeg alela na poziciji j je kao drugi satatistički red za broj kopija (tj. drugi najviši broj kopija alela) na poziciji j,
Prepokrivenost na poziciji j je D ≡ Dj= {d¡} = Aj+ Bj, a
Stopa greške uređaja za sekvenciranje se označava kao e.
[0080] Kada je kontekst jasan, zarad pogodnosti, označavanja se upotrebljavaju naizmenično; na primer, A, Ai ili {ai} se mogu upotrebljavati naizmenično za označavanje ređeg alela ili broja kopija ređeg alela. Indeksi mogu ili ne moraju biti upotrebljeni, u zavisnosti od toga da li se razmatra više od jednog SNP-a. (SNP-ovi se upotrebljavaju samo za potrebe primera. Druge vrste polimorfizama mogu biti upotrebljene kao što je ovde opisano u drugim delovima teksta).
[0081] Na Slici 1, prikazana je osnova za četiri stanja zigotnosti polimorfizma. Kao što je ilustrovano, majka može biti homo ili heterozigotna za dati polimorfizam. Slično tome, beba može biti ili heterozigotna ili homozigotna na istoj poziciji. Kao što je ilustrovano, Slučajevi 1 i 2 su slučajevi polimorfizama u kojima je majka homozigotna. Ukoliko su i beba i majka homozigotni, polimorfizam označava polimorfizam Slučaja 1. Kao što je prethodno naznačano, ova situacija obično nije posebno zanimlјiva. Ukoliko je majka homozigotna i beba je heterozigotna, fetalna frakcija, f, se nominalno dobija množenjem odnosa ređeg alela i prepokrivenosti sa dva. U slučaju polimorfizma gde je majka heterozigotna, a beba je homozigotna (Slučaj 3 na Slici 1), fetalna frakcija nominalno predstavlja razliku broja jedan i odnosa ređeg alela i prekrivenosti koji je pomnožen sa dva. Konačno, u slučaju kada su i majka i fetus heterozigotni, frakcija ređeg alela bi uvek trebala da bude 0,5 i da isključuje grešku. Fetalna frakcija se ne može izvesti za polimorfizme koji potpadaju pod Slučaj 4.
[0082] Četiri navedena slučaja će dalje biti detaljno izložena.
1
Slučaj1: Majka i beba su homozigoti
[0083]
● U ovom slučaju, utrvrđuje se greška u sekvenciranju ili kontaminacija i ne bi trebalo da se uoče razlike.
● E (minimalna učestalost alela) = E(A) = 0.
● U praksi, A ~ (tipa je distribucije kao što je) Binomna raspodela koja aproksimira dobro sa Poasonovom raspodelom za niske np. Parametar stope distribucije u Binomnoj ili Poasonovoj raspodeli je određen stopom greške sekvenciranja, e, kao i prepokrivenošću D. Slika 3 prikazuje razmimoilaženje učestalosti generistanih 36-mernih sekvenci poravnatih u odnosu na Humani referentni genom.
● Ovaj slučaj ne sadrži podatke o fetalnoj frakciji.
[0084] Slika 3 prikazuje procene grešaka u poziciji sekvenciranih baza dobijenih na osnovu poravnavanja podataka iz analize na preko 30 traka Illumina GA2 aparata i humanog geoma HG18, upotrebom programa Eland sa zadatom postavkom parametara.
Slučaj 2: Majka je homozigot, a beba je heterozigot
[0085]
● U ovom slučaju, za male fetalne frakcije (f), uočene učestalosti alela će biti znatno drugačije. Učestaliji alel se obično javlja sa učestalošću koja je nekoliko puta veća od učestalosti ređeg alela.
● Isključivanje greške, uzimajući u obzir jednu SNP poziciju (D,A), E(A) = Df/2 i nepristrasnu procenu za f je 2A/D
● Isključivanje greške, A ~ Binomna raspodela (f/2, D). Srednja vrednost Df/2, Varijansa (1-f/2)Df/2.
[Slično normalnoj raspodeli ukoliko je D>15].
Slučaj 3: Majka je heterozigot, a beba je homozigot
[0086]
● U ovom slučaju utvrđene učestalosti učestalijih i ređih alela su bliske i A/D je nešto ispod 0,5.
● Isključivanje greške, E(A) = D(1-f)/2 i E(1 - (2A/D)) = f
● Isključivanje greške, A ~ Binomna raspodela ((1-f)/2, D). Srednja vrednost D((1-f)/2), Varijansa D/4(1-f^2).
Slučaj 4: Majka je heterozigot i beba je heterozigot
[0087] Potrebno je zapaziti da, uz isključivanje greške, postoje dve potklase u navedenom slučaju.
Slučaj 4.1: Alel od oca se razlikuje od majčinih alela
1
[0088] Navedno bi uvelo treći alel koji bi predstavljao ređi alel sa E(A) = Df/2. Ovi slučajevi ne bi trebali da imaju uticaj na procene za f pošto će procedura za raspodelu sekvenci po amplikonima izdvojiti ove slučajeve kada su referentni SNP-ovi bialelski.
Slučaj 4.2: Alel od oca se poklapa sa jednim od majčinih alela
[0089]
● U ovom slučaju, uz isključivanje greske, dva alela bi se pojavila sa odnosom 1:1, tako da ovaj slučaj nije koristan za procenu fetalne frakcije.
● Isključivanje greške, E(A) = 0,5; i A ~ Binomna raspodela(0,5; D) skraćena na 0,5.
[0090] Na Slici 4 je prikazan grafikon broja kopija ređeg alela A nasuprot prepokrivenosti D (uz pretpostavku da nema greške) za Slučajeve heterozigotnosti od 1 do 4.
[0091] U raznim primerima izvođenja, postupak široko razmatra analizu učestalosti alela za jedan ili više SNP-ova (ili za druge polimorfizme) kako bi se polimorfizmi klasifikovali kao oni koji pripadaju bilo Slučaju 2 i/ili Slučaju 3. Upotrebom učestalost alela i udruživanjem podataka sa klasifikacijom, postupak može biti upotrebljen za procenu fetalne frakcije.
[0092] U pojedinim slučajevima, navedni broj kopija ređeg alela A i prepokrivenost D, preciznije rečeno (D,A), za pojedinačnu SNP poziciju omogućavaju da se postupcima utvrdi procena u vidu jedne tačke. Na primer, naznačeni postupci klasifikuju SNP sa brojem kopija alela (D,A) u jedan slučaj, pri čemu se procena fetalne frakcije izvodi na sledeći način:
ES1.1 Jednostavni pragovi za određivanje tipa slučaja
Imajući u vidu pojedinačnu poziciju (SNP), može se
1. Odlučiti da je u pitanju Slučaj 1, ukoliko je funkcija tipa 2A/D <e, ili kada je definisana kritična vrednost Binomne (e,D) ili Poasonove raspodele (De). Upotreba alternativne distribucije je takođe predmet ovog pronalaska. Nema procene fetalne frakcije (f).
2. Odlučiti da je u pitanju Slučaj 4, ukoliko je 2A/D > (0,5-e), ili kada je kritična vrednost Binomne raspodele (0,5; D) (ili druge pogodne aproksimativne raspodele). Ne koristiti se pozicija za procenu f.
3. U suprotnom, odlučiti da je u pitanju Slučaj 2 ukoliko je 2A/D < 0,25 (ili ukoliko je manualno postavljena ili automatski procenjena vrednost praga). Fetalna frakcija f se procenjuje kao 2A/D
4. Sve preostalo predstavlja Slučaj 3. Za porocenu fetalne frakcije se upotrebljava f = (1-2A/D).
[0093] Tačnost se može postići kombinovanjem informacija o broju kopija alela iz nekoliko SNP-ova da bi se procenila fetalna frakcija.
2
Postupak EM1: Kombinovanje višestrukih SNP-ova putem usrednjavanja.
[0094] Uzeti srednju vrednost, medijanu, drugi centralni parametar (na primer: parametar dvostuke ocene iz Tuki testa, m-ocenu itd...). Može takođe biti upotrebljen ponderisan prosek. Za primer kako ocene težine mogu biti definisane pogledati EM2.4 u nastavku. Mogu biti upotrebljene i dodatne robusne mere centralne tendencije.
Postupak EM2: Istovremena procena iz Slučaja 2 i Slučaja 3 upotrebom transformacija
[0095] Za slučajeve gde je f manje od X%, vrednosti (D,A) Slučaja 3 mogu biti transformisane tako da se poklope sa vrednostima za Slučaj 2. Iz ove linije može biti izračunat uobičajen nagib, regresionom analizom kroz koordinatni početak (pogledati Sliku 5).
[0096] Jedan od teorijskih nedostataka postupaka zasnovanih na transformaciji jeste što će binomna raspodela za Slučajeve 2 i 3 imati različit oblik. Pri uobičajenim nivoima fetalnih frakcija (<10%) podaci Slučaja 2 će imati distribuciju blisku Poasonovoj raspodeli izmeštenoj na desno, dok će Slučaj 3 biti sa distribucijom koja je bliska normalnoj.
[0097] Slika 5 prikazuje transformaciju podataka Slučaja 3 u Slučaj 2. Jedna regresiona analiza tako može istovremeno proceniti f na osnovu oba slučaja.
Postupak izračunavanja EM2.3:
[0098]
Korak 1: Izbacivanje podataka za Slučaj 4
Ukoliko je za svaki podatak (D,A) A > (0,5D-T1), isklјučiti (D,A) iz dalјe analize. T1(D,A) je funkcija realnih brojeva.
Korak 2: Transformacija podataka Slučaja 3
Pogledati Sliku 6. Ukoliko je A > T2*D, za svaki podatak (D,A) za koji nije utvrđeno da iznosi 4, transformisanti tačke u nove koordinate (D1,A1). T2(D,A) je funkcija realnih brojeva.
Korak 3: Uspostavljanje praga DT da bi se smanjila kontaminacija podacima Slučaja 1. Zanemariti sve tačke podataka ispod T2(D,A) funkcije realnih brojeva.
Korak 4: Procena regresije za preostale transformisane podatke Slučaja 2 i 3.
Primeniti regresionu analizu tipa kroz koordinatni početak na preostale tačake. Procena fetalne frakcije je dvostruka vrednost nagiba regresione krive.
[0099] Potrebno je zapaziti da mnoge klase transformacija mogu biti konstruisane tako da se postigne ista raspodela podataka Slučaja 2 i 3. Primeri obuhvataju trigonometrijsku, transformacionu ili upotrebu matrica rotacija. Predviđeno je da navedena odstupanja budu uključena u područje predmentog opisa. Štaviše, mogu biti upotrebljene mnoge klase regresione analaize (L2, L1, ....) ili optimizacije. Zamena algoritma za optimizaciju je trivijalna promena i predmet je predmetnog opisa.
[0100] Slika 6 prikazuje podatke nakon rotacije. Odabir D1 je takav da se Slučaj 1 i Slučajevi 2 i 3 ne preklapaju. E1 predstavlјa gornju granicu intervala pouzdanosti od 99. procenata za podatke Slučaja 1.
Postupak EM3: Ponderisanje najmanjih kvadrata
[0101] Regresioni postupak iz EM2.3 pretpostavlјa da sve prevedene tačke podataka imaju jednaku varijansu. Ispravnije je da se uračunava heteroskedastičnost različitih izvora podataka i čak tačaka iz istog obrazca heterozigotnosti.
Koraci od 1 do 3 su identični sa EM2.3.
Korak 4: Regresija
[0102] U regresionoj analizi iz EM2.3, tačke podataka iz Slučaja 2 će imati varijansu v2(f,D) = [0,5*Df -0,25*Df^2], a tačke iz podataka Slučaja 3 će imati varijansu v3(f,D)=[0,25D(1-f^2)]. Pod pretpostavkom da za svaku tačku odredimo drugačiju težinu, za w, kao u EM2.3, težimo da se se smanji do minimuma
Jednačina 1
[0103] Podešavanje prvih izvođenja na nulu i rešavanje za s:
Jednačina 2
[0104] Navedeni ponderisani postupak je sa inverznom varijansom svake tačke, procenjenom kao v2(2A/D,D) ili v3(2A/D, D), po potrebi. Procena fetalne frakcije je 2*s.
[0105] U određenim primerima izvođenja, model verovatnoće distribucije u smeši može biti iskorišćen za klasifikaciju kolekcije polimorfizama u dva ili više slučajeva zigotnosti i istovremenu procenu frakcije fetalne DNK na osnovu srednje vrednosti učestalosti alela za svaki od ovih slučajeva. U principu, model distribucije u smeši pretpostavlјa da se određena kolekcija podataka sastoji od pomešanih različitih vrsta podataka, od kojih svaka ima svoju očekivanu distribuciju (npr. normalnu distribuciju). Proces pokušava da pronađe srednju vrednost i eventualno druge karakteristike za svaku vrstu podataka. U primerima izvođenja koji su ovde opisani, postoje do četiri različita tipa podataka (slučajevi zigotnosti) koji koriguju podatke učestalosti ređih alelea za polimorfizme koji se razmatraju.
[0106] Jedna primena modela verovatnoće distribucije u smeši je predstavlјena u sledećem odeljku. U ovom primeru izvođenja, učestalost ređeg alela A predstavlja zbir četiri uslova, kao što je prikazano u Jednačini 3. Svaki od uslova odgovara jednom od četiri slučaja zigotnosti. Svaki uslov je proizvod frakcije polimorfizma α i binomne raspodele učestalosti ređeg alela. Frakcije polimorfizama koje pripadaju svakom od četiri slučaja su označene sa α. Svaka binominalna distribucija ima pridruženu verovatnoću, p, i prepokrivenost, d. Verovatnoća ređeg alela za Slučaj 2, na primer, data je sa f/2.
[0107] Primeri izvođenja koji su opisani upotrebljavaju "faktorske momente" za podatke o učestalosti alela koji se razmatraju. Kao što je poznato, srednja vrednost podrazumeva prvi momenat. To je očekivana vrednost učestalosti ređeg alela. Varijansa je drugi momenat. Ona se izračunava kao kvadrat očekivane vrednosti učestalosti alela.
[0108] Podaci o učestalosti alela za sve polimorfizme mogu biti upotrebljeni za izračunavanje faktorskih momenta (prvi faktorski momenat, drugi faktorski momenat itd.) kao što je prikazano u Jednačini 4. Kao što ove jednačine ukazuju, faktorski momenti predstavljaju zbir uslova iznad i, za pojedinačan polimorfizam u skupu podataka, pri čemu postoji n takvih polimorfizama u skupu podataka. Uslovi koji se sumiraju su funkcije brojeva kopija ređih alela, ai, i prepokrivenosti di.
[0109] Korisno je što faktorski momenti imaju odnos sa vrednostima αii pikao što je ilustrovano u Jednačini 5. Iz verovatnoća, pi, može se odrediti fetalna frakcija, f. Na primer, p2= f/2 i p3je 1-f/2. Tako, odgovarajućim logičkim operacijama se može rešiti sistem jednačina koje se odnose na nepoznate α i p sa faktorskim momentom ekspresija frakcija ređeg alel duž višestrukih polimorfizama koji se razmatraju. Naravno, predmet pronalaska su i druge tehnike za rešavanje modela verovatnoće distribucije u smeši.
[0110] Korisno je dalјe razmotriti matematičke ili simboličke osnove primera izvođenja modela verovatnoće distribucije u smeši koji je ovde opisan. Četiri slučaja heterozigoznosti koji su prethodno opisani sugerišu sledeći binomni model verovanoće distribuciji u smeši za sve ai u tačkama (ai,di):
Jednačina 3
[0111] Razni modeli relacija pisa fetalnom frakcijom i stopama grešaka u sekvenciranju su opisani u nastavku teksta. Parametri αikoji se odnose na parametre specifične za populaciju i sposobnost da ove vrednosti "plutaju", omogućavaju ovim postupcima dodatnu robusnost u odnosu na faktore kao što su etnička pripadnost i potomstvo roditelјa.
[0112] Za razne slučajeve heterozigotnosti, prethodna jednačina može biti rešena da bi se odredila fetalna frakcija. Možda je najlakši način rešavanja fetalne frakcije postupkom faktorskih momenata u
2
kome se parametri smeše mogu izraziti kroz momente koji se lako mogu proceniti na osnovu posmatranih podataka.
[0113] Imajući u vidu n SNP pozicija, faktorski momenti su definisani na sledeći način:
Jednačina 4
[0114] Faktorski momenti mogu biti dovedni u relaciju sa {αi, pi} upotrebom
Jednačina 5
[0115] Rešenje može biti identifikovano rešavanjem za {αi, pi} u sistemu jednačina izvedenih iz prethodno navedenog odnosa Jednačine 5 kada je n > 2* (broj parametara koji je potrebno proceniti). Očigledno, problem postaje matematički mnogo teži za više g pošto je potrebno proceniti više {αi, pi}.
[0116] Obično nije moguće precizno diskriminisati podatke Slučaja 1 i 2 (ili Slučaja 3 i 4), jednostavnim postavljanje pragova za niže zastupljene fetalne frakcije. Srećom, za upotrebu modela sa redukovanim brojem slučajeva, podaci slučaja 1/2 se lako razdvajaju od podataka slučaja 3⁄4, diskriminacijom u tački (2A/D) = T. Utvrđeno je da je upotreba T = 0,5 zadovolјavjuća.
[0117] Potrebno je napomenuti da postupak modeliranja verovatnoće distribucije u smeši koji koristi Jednačine 4 i 5 upotrebljava podatke za sve polimorfizme, ali ne uračunava posebno grešku sekvenciranja. Pogodni postuci koji razdvajaju podatke prvog i drugog slučaja od podataka za treći i četvrti slučaj mogu uračunavati grešku u sekvenciranju.
[0118] U dalјim primerima, skup podataka koji se primenjuje u model smeše sadrži podatke samo za polimorfizme Slučaja 1 i Slučaja 2. Ovo su polimorfizmi za koje je majka homozigotna. Tehnika praga može biti upotrebljena za polimorfizama Slučaja 3 i 4. Na primer, polimorfizmi sa učestačošću ređeg alela većom od određenog praga se eliminišu pre upotrebe modela smeše. Upotrebom adekvatno filtriranih podataka i faktorskih momenata koji su redukovani Jednačinama 7 i 8, može se izračunati fetalna frakcija, f, kao što je prikazano u Jednačini 9. Potrebno je napomenuti da Jednačina 7 predstavlja korigovanu Jednačinu 3 zarad primene u modelu verovatnoće distribucije u smeši. Potrebno je takođe napomenuti da u ovom konkretnom primeru, greška sekvenciranja koja se javlja pri očitavanjima aparata nije poznata. Posledično, sistem jednačina mora posebno rešavati grešku, e.
[0119] Na Slici 7 je prikazano poređenje rezultata dobijenih upotrebom ovog modela smeše i poznate fetalne frakcije (x osa), kao i procenjene fetalne frakcije. Ukoliko je model smeše savršeno predvideo fetalnu frakciju, rezultati uneti u grafik bi sledili isprekidanu liniju. Ipak, procenjene frakcije su izuzetno dobre, posebno imajući u vidu da je veliki deo podataka eliminisan pre primene modela smeše.
[0120] Da bi se dodatno razmotrio postupak, dostupno je nekoliko drugih postupaka za procenu parametara modela iz Jednačine 3. U pojedinim slučajevima, do rešenje koja se može prilagoditi se može doći postavljanjem podataka statističke analize najmanjih kvadrata na nulu. U slučajevima kada se ne može lako naći rešenje direktnom diferencijacijom, serije ekspanzija binomnog PDF po Tejloru ili drugi aproksimativni polinomi mogu biti efikasni. Minimalni estimatori metode najmanjih kvadrata su dobro poznati kao efikasni.
Jednačina 6
[0121] Pri čemu je Pi broj tačaka broja kopija i. Alternativan postupak iz publikacije Le Cam-a ["On the Asymptotic Theory of Estimation and Testing Hypotheses" Proceedings of the Third Berkeley Symposium on Mathematical Statistics and Probability, vol.1 Berkeley CA: University of CA Press, 1956, str. 129-156] koristi Ralf-Njutonovu iteraciju funkcije verovatnoće. Postupak rešenja momenata iz Jednačine 5 može biti upotrebljen kao polazna tačka za iteraciju.
[0122] U drugoj primeni postupka za razrešavanje modela distribucije u smeši koji uključuje postupke povećanja očekivanja do maksimuma, razmatra se operativni postupak na smešama sa aproksimativnim Beta distribucijama.
Model Slučajeva (1 2), greška sekvenciranja nepoznata
[0123] Potrebno je razmotriti redukovani model koji uzima u obzir samo Slučajeve heterozigotnosti 1 i 2. U ovom slučaju distribucija u smeši može biti napisana kao
Jednačina 7
[0124] A sistem
2
Jednačina 8
se rešava za e (stopa greške sekvenciranja), alfa (vrednost proporcionalnosti Slučaja 1) i f (fetalna frakcija). Gde je Fi definisan kao što je to učinjeno prethodno, u Jednačini 4. Algebarsko rešenje za fetalnu frakciju je izabrano da bude stvarno rešenje
Jednačina 9
koje je između 0 i 1.
[0125] Da bi se ocenile performanse estimatora, konstruisan je simuliran skup podataka tačaka (ai, di) po Hardi-Vajnbergovom principu ravnoteže, pri čemu je dizajn bio takav da fetalna frakcija bude {1%, 3%, 5%, 10%, 15%, 20% i 25%}, a konstanta stope greške sekvenciranja 1%. Stopa greške od 1% je trenutno prihvaćena stopa za uređaje za sekvenciranje i protokole koje upotrebljavamo, a koji su usklađeni sa grafikom podataka za instrument Illumina Genome analyzer II koji su prethodno prikazani na Slici 3. Jednačina 9 je primenjena na podatke i utvrđeno je, sa izuzetkom pozitivne pristrasnosti za četiri tačke, generalno slaganje sa "poznatom" fetalnom frakcijom. Zanimlјivo je da je stopa greške sekvenciranja, e, procenjena na nešto iznad 1%.
[0126] U sledećem primeru modela smeše, tehnika postavljanja praga ili druga tehnika filtriranja podataka je ponovo upotrebljena da bi se uklonili podaci za polimorfizme koji pripadaju Slučajevima 3 i 4. Međutim, u ovom slučaju je poznata greška sekvenciranja. Navedeno pojednostavlјuje rezultujući izraz za frakciju fetalne DNK, f, što je prikazano u Jednačinama 10. Slika 8 pokazuje da je ova verzija modela distribucije u smeši obezbedila poboljšane rezultate u odnosu na pristup koji je upotrebljen u Jednačini 9.
[0127] Sličan pristup je prikazan u Jednačinama 11 i 12. Ovaj pristup prepoznaje da samo pojedine greške sekvenciranja pridodaju broj kopija ređeg alela. Umesto toga, samo jedna od sve četiri greške sekvenciranja bi trebala da poveća broj kopija ređeg alela. Slika 9 pokazuje izuzetno dobro slaganje između stvarnih i procenjenih fetalnih frakcija upotrebom ove tehnike.
2
Model Slučajeva (1 2), poznata greška sekvenciranja
[0128] Pošto je stopa greške sekvenciranja aparata koji je upotrebljen u velikoj meri poznata, pristrasnost i složenost izračunavanja može biti redukovana eliminisanjem e kao varijable koju je potrebno rešiti. Stoga, dobijamo sistem jednačina
Jednačina 10
za fetalnu frakciju f da bi se dobilo rešenje:
[0129] Slika 8 pokazuje da upotreba stope greške aparata kao poznatog parametra redukuje pristrasnost za jedan podeok.
Model Slučajeva (1 2), poznata greška sekvenciranja, pobolјšani modeli grešaka
[0130] Da bismo pobolјšali pristrasnost u modelu, proširili smo model greške prethodno navedenih jednačina da bi se uračunala činjenica da svaki događaj greške prilikom sekvenciranja ne doprinosi povećanju broja kopija ređeg alela A=ai u slučaju heterozigotnosti Slučaja 1. Štaviše, u obzir je uzeta činjenica da događaji greške sekvenciranja mogu doprineti povećanju heterozigotnosti broja kopija Slučaja 2. Otuda je fetalna frakcija F određena rešavanjem sledećeg sistema relacija faktorskih momenata:
Jednačina 11
što daje rešenje
Jednačina 12
[0131] Na Slici 9 je pokazano da simulirani podaci, upotrebom stope greške aparata kao poznatog parametra, pobolјšavaju model grešaka za Slučajeve 1 i 2 i time značajno redukuju pozitivnu pristrasnost do ispod podeoka 0,2 za fetalnu frakciju.
Mogućnosti primene
UZORCI
[0132] Uzorci koji se upotrebljavaju u primerima izvođenja koji su ovde opisani, sadrže genomsku DNK koja je ćelijska ili oslobođena od ćelija. Ćelijska DNK je izolovana iz celih ćelija ručno ili mehaničkom
2
ekstrakcijom genomske DNK iz celih ćelija istog ili različitog genetičkog sastava. Ćelijska DNK može biti dobijena, na primer, iz celih ćelija istog genetičkog sastava koje su dobijene iz jednog subjekta, iz smeše celih ćelija različitih subjekata ili iz smeše celih ćelija jednog subjekta koje se razlikuju po genetičkom sastavu. Postupci za ekstrahovanje genomske DNK iz celih ćelija su poznati u oblasti tehnike i razlikuju se po vrsti izvora iz koga se ekstrahuje DNK.
[0133] U pojedinim slučajevima, prednost može imati fragmentacija ćelijske genomske DNK. Fragmentacija može biti nasumična, ili može biti specifična, što se postiže, na primer, upotrebom digestije restrikcionim endonukleazama. Postupci nasumične fragmentacije su dobro poznati u oblasti tehnike i obuhvataju, na primer, ograničenu digestiju DNazom, alkalni tretman i fizičko cepanje DNK. U određenim primerima izvođenja, uzorak nukleinskih kiselina se podvrgava fragmentaciji na fragmente dužine od približno 500 ili više baznih parova, a na koje se zatim lako mogu primeniti postupci tzv. sekvenciranja sledeće generacije (NGS). U jednom primeru izvođenja, uzorci nukleinskih kiselina se dobijaju kao cfDNK koja se dalje ne podvrgava fragmentaciji.
[0134] DNK oslobođena od ćelija predstavlja genomsku DNK koja se u prirodi javlјa kao smeša genomskih fragmenata, obično u biološkim tečnostima, npr. krvi subjekta. Genomska smeša može biti izolovana iz ćelija koje prirodnim putem, biološkim procesom, oslobađaju svoj genomski sadržaj, npr. putem apoptoze. Uzorak cfDNK može sadržavati cfDNK dobijenu iz smeše ćelija različitih subjekata iste vrste, iz smeše ćelija jednog subjekta koje se razlikuju po genetičkom sastavu ili iz smeše ćelija iz različitih vrsta, npr. subjekata.
[0135] Nukleinske kiseline oslobođena od ćelija, uklјučujući DNK oslobođenu od ćelija, mogu biti dobijene raznim postupcima koji su poznati u oblasti tehnike, iz bioloških uzoraka, uklјučujući, ali ne ograničavajući se samo na, plazmu, serum i urin (Fan i saradnici, ProcNatlAcadSci 105:16266-16271 [2008]; Koide i saradnici, Prenatal Diagnosis 25:604-607 [2005]; Chen i saradnici, Nature Med.2:1033-1035 [1996]; Lo i saradnici, Lancet 350:485-487 [1997]; Botezatu i saradnici, Clin Chem.46:1078-1084, 2000; i Su i saradnici, J Mol. Diagn. 6:101-107 [2004]). Za razdvajanje cfDNK od ćelija, mogu biti upotrebljeni postupci frakcionisanja, centrifugiranja (npr. centrifugiranje na gradijentu gustine), precipitacije koji su specifični za DNK ili postupci sortiranja i/ili razdvajanja ćelija u velikom obimu. Dostupni su i komercijalni kompleti za manualno i automatizovano razdvajanje cfDNK (Roche Diagnostics, Indianapolis, IN, Qiagen, Valencia, CA, Macherey-Nagel, Duren, DE).
[0136] Uzorak koji sadrži smešu nukleinskih kiselina na koju se primenjuju postupci koji su ovde opisani, može predstavljati biološki uzorak kao što je uzorak tkiva, uzorak biološke tečnosti ili uzorak ćelija. U pojedinim primerima izvođenja, smeša nukleinskih kiselina se prečišćava ili izoluje iz biološkog uzorka, bilo kojim od poznatih postupaka. Uzorak može biti i prečišćen ili izolovan polinukleotid. Primeri bioloških tečnosti obuhvataju, ali nisu ograničeni samo na, krv, plazmu, serum, znoj, suze, sputum, urin, sputum, sekret ušiju, limfu, plјuvačku, cerebrospinalnu tečnost, tečnost dobijenu ispiranjem (lavažom), suspenziju kosne srži, vaginalni sekret, transcervikalnu lavažu, tečnost mozga, ascite, mleko, sekrete respiratornog, intestinalnog i genitourinarnog trakta, amnionsku tečnost i uzorke leukoforeze. U pojedinim primerima izvođenja, uzorak je uzorak koji se lako dobija neinvazivnim procedurama iz npr. krvi, plazme, seruma, znoja, suza, sputuma, urina, sputuma, sekreta ušiju, plјuvačke ili fecesa. Poželjno je da biološki uzorak predstavlja uzorak periferne krvi ili njene frakcije poput plazme i seruma. U drugim primerima izvođenja, biološki uzorak je bris ili razmaz, uzorak biopsije ili kultura ćelija. U sledećem primeru izvođenja, uzorak je smeša dva ili više bioloških uzoraka, npr. biološki uzorak može
2
sadržavati dva ili više uzorka biološke tečnosti, uzorka tkiva i uzorka kulture ćelija. Kako se ovde upotrebljava, pojmovi "krv", "plazma" i "serum" izričito obuhvataju i njihove frakcije ili obrađene delove. Slično navedenom, kada se uzorak uzima iz biopsije, sa brisa, razmaza itd., "uzorak" obavezno podrazumeva i obrađenu frakciju ili deo materijala koji je dobijen iz biopsije, sa brisa, razmaza itd.
[0137] U pojedinim primerima izvođenja, uzorci mogu biti dobijeni iz različitih izvora, uklјučujući, ali ne ograničavajući se samo na, različite individue, različite razvojne faze istih ili različitih individua, različitie obolele individue (npr. individue obolele od kancera ili one za koje se sumnja da imaju genetički poremećaj), normalne individue, kao i uzorke dobijene u različitim stadijumima oboljenja kod individue, uzorke dobijene iz individua koje su podvrgavane različitim načinima lečenja oboljenja, uzorke individua izloženih različitim sredinskim faktorima ili individua koje imaju predispoziciju ka patologiji ili individua koje su bile izložene agensima koji dovode do infektivnih oboljenja (npr. HIV-u).
[0138] U jednom primeru izvođenja, uzorak predstavlja uzorak majke koji je dobijen iz trudne individue, na primer, trudne žene. U ovom slučaju, uzorak može biti analiziran upotrebom postupaka koji su ovde opisani da bi se obezbedila prenatalna dijagnoza potencijalnih hromozomskih abnormalnosti kod fetusa. Uzorak majke može biti uzorak tkiva, uzorak biološke tečnosti ili uzorak ćelija. Primeri biološke tečnosti obuhvataju, ali nisu ograničeni samo na, krv, plazmu, serum, znoj, suze, sputum, urin, sputum, sekret ušiju, limfu, plјuvačku, cerebrospinalnu tečnost, lavaže, suspenziju kosne srži, vaginalni sekret, transcervikalnu lavažu, tečnost mozga, ascite, mleko, sekrete respiratornog, intestinalnog i genitourinarnog trakta, amnionsku tečnost i uzorke leukoforeze. U drugom primeru izvođenja, uzorak majke je smeša dva ili više bioloških uzoraka, npr. biološki uzorak može sadržavati dva ili više uzoraka biološke tečnosti, uzoraka tkiva i uzoraka kulture ćelija. U pojedinim primerima izvođenja, uzorak je uzorak koji se lako može dobiti neinvazivnim procedurama iz npr. krvi, plazme, seruma, znoja, suza, sputuma, urina, sputuma, sekreta ušiju, plјuvačke ili fecesa. U pojedinim primerima izvođenja, biološki uzorak je uzorak periferne krvi ili njenih frakcija poput plazme i seruma. U drugim primerima izvođenja, biološki uzorak je bris ili razmaz, uzorak biopsije ili kulture ćelija.
[0139] Uzorci takođe mogu biti dobijeni iz in vitro kultura tkiva, ćelija ili drugih izvora koji sadrže polinukleotide. Uzorci kultura mogu biti uzeti iz izvora koji obuhvataju, ali nisu ograničeni samo na, kulture (npr. tkiva ili ćelija) koje se gaje u različitim medijumima i pod različitim uslovima (npr. pri različitom pH, pritisku ili temperaturi), kulture (npr. tkiva ili ćelija) koje se gaje različit vremenski period, kulture (npr. tkiva ili ćelija) tretirane različitim faktorima ili reagensima (npr. kandidatima za lekove ili modulatorima) ili kulture različitih vrsta tkiva ili ćelija. Postupci izolovanja nukleinskih kiselina iz bioloških izvora su dobro poznati i razlikovaće se u zavisnosti od prirode izvora, kao što je prethodno objašnjeno.
POLIMORFIZMI ZA UPOTREBU U IDENTIFIKACIJI GENOMSKE FRAKCIJE
[0140] Kao što je objašnjeno, polimorfizmi mogu biti upotrebljeni za određivanje fetalne frakcije. Za procenu frakcije se upotrebljavaju frakcija alela i zigotnost jednog ili više polimorfizama. Primeri korisnih polimorfizma obuhvataju, bez ograničavanja, polimorfizme u jednom nukleotidu (SNP), tandemske SNP, delecije ili insercije višestrukih baza malog obima označene kao IN-DELS (označene i kao polimorfizmi tipa delecija/insercija ili DIP), multinukleotidne polimorfizme (MNP), polimorfizme kratkih tandemskih ponovaka (STR), polimorfizme u dužini restrikcionih fragmenata (RFLP), delecije, uklјučujući mikrodelecije, insercije, uklјučujući mikroinsercije, duplikacije, inverzije, translokacije,
2
multiplikacije, kompleksne višestruke varijacije mesta polimorfizama, varijacije broja kopija (CNV) i polimorfizme koji obuhvataju bilo koju drugačiju promene sekvence u hromozomu.
[0141] U pojedinim primerima izvođenja, polimorfizmi koji se upotrebljavaju u opisanim postupcima obuhvataju SNP i/ili STR polimorfizme. SNP polimorfizmi mogu biti tipa pojedinačnih i tandemskih SNP-ova. Pojedinačni SNP-ovi obuhvataju individualne SNP-ove i SNP-ove markerskih sekvenci, odnosno SNP-ove prisutne u haplotipu i/ili haplotipskom bloku. U pojedinim primerima izvođenja, upotrebljavaju se kombinacije polimorfizama. Na primer, razlike u broju kopija mogu biti detektovane poređenjem kombinacije polimorfnih sekvenci koje sadrži jedan ili više SNP-ova i jedan ili više STR polimorfizama.
[0142] U principu, svako polimorfno mesto koje može biti obuhvaćeno očitavanjima generisanim postupcima sekvenciranja koji su ovde opisani, može biti upotrebljeno za identifikaciju genomske frakcije u uzorcima koji sadrže DNK različitih genoma. Polimorfne sekvence korisne za sprovođenje postupaka pronalaska u praksi, dostupne su u raznim javno dostupnim bazama podataka koje se kontinuirano i proširuju. Na primer, korisne baze podataka obuhvataju, bez ograničavanja samo na njih, Bazu humnih SNP-ova na internet adresi wi.mit.edu, početnu stranicu NCBI dbSNP baze na internet adresi ncbi.nlm.nih.gov, bazu na internet adresi lifesciences.perkinelmer.com, Celera bazu humanih SNP-ova na internet adresi celera.com, SNP bazu podataka Grupe za analizu gena (GAN) na internet adresi gan.iarc.fr, ATCC bazu podataka za kratke tandemske ponovke (STR) na internet adresi atcc.org. i HapMap bazu podataka na internet aresi hapmap.org.
[0143] Broj polimorfizama koji mogu biti upotrebljeni prilikom utvrđivanja fetalne frakcije može biti najmanje 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 ili više. Na primer, procenjuje se da lјudski genom sadrži najmanje oko 10 miliona SNP-ova. Stoga, broj raspoloživih polimorfizama koji mogu biti genotipizovani u uzorku iz humanog subjekta može iznositi najmanje oko 10 miliona SNP, ali se mogu upotrebiti i mnogi drugi tipovi polimorfizama koji su prisutni u svakom humanom genomu. U pojedinim primerima izvođenja, identifikacija jednog ili više polimorfizama u prvom genomu uzorka koji sadrži smešu DNK, npr. cfDNK prvog i drugog genoma, može biti obavljena sekvenciranjem celokupnog genoma, upotrebom NGS postupka, kao što je ovde opisano. U pojedinim primerima izvođenja, postupak sekvenciranja celokupnog genoma podrazumeva NGS postupak koji identifikuje polimorfne sekvence masovnim uporednim sekvenciranjem molekula klonalno amplifikovanih nukleinskih kiselina ili masovnim uporednim sekvenciranjem molekula jedne nukleinske kiseline, tj. sekvenciranjem pojedinačnih molekula.
PRIMENE
[0144] Frakcija nukleinske kiseline koja potiče iz svakog od dva različita genomska izvora u uzorku može biti upotrebljena u različite svrhe. U raznim primerima izvođenja koji su ovde opisani, frakcija fetalne DNK u materijalu uzorka sa DNK oslobođenom od ćelija, upotrebljava se za lakše postavljanje prenatalnih dijagnoza i za ispomoć u donošenju odluka vezanih za lečenje tokom trudnoća. U drugim primerima izvođenja, genomi koji se razmatraju ne predstavljaju genome majke i fetusa. Razni primeri izvora genoma u kojima se utvrđuje prisustvo frakcionog genoma su prikazani u nastavku teksta.
[0145] Fetalne DNK i RNK oslobođene od ćelija koje cirkulišu u krvi majke, mogu biti upotrebljene za ranu neinvazivnu prenatalnu dijagnostiku (NIPD) sve većeg broja genetičkih stanja, kako radi kontrole toka trudnoće, tako i zarad ispomoći pri donošenju odluka vezanih za reprodukciju. Male količine cirkulišuće fetalne DNK su prisutne u krvotoku majke tokom trudnoće (Lo i saradnici, Lancet 350: 485-487 [1997]). Iako se smatralo da DNK potiče od umirujućih ćelija placente, pokazano je da se DNK oslobođena od ćelija sastoji od kratkih fragmenata koji su uobičajeno dužine manje od 200 bp (Chan i saradnici, ClinChem 50: 88-92 [2004]) i da se njihovo prisutvo u krvi majke može utvrditi veoma rano, već u 4. nedelјi gestacije (Illanes i saradnici, Early Human Dev 83: 563-566 [2007]). Poznato je takođe da se njihovo prisustvo u cirkulacije majke gubi u roku od nekoliko sati nakon porođaja (Lo i saradnici, Am J Hum Genet 64: 218-224 [1999]). Pored cfDNK, u krvotoku majke je moguće utvrditi prisustvo fragmenta fetalne RNK oslobođene od ćelija (cfRNK) koja potiče od gena koji se prepisuju u fetusu ili placenti. Ekstrakcija i naknadna analiza ovih fetalnih genetičkih elemenata iz uzorka krvi majke nudi nove mogućnosti za NIPD.
[0146] Kao što je objašnjeno, postupci koji su ovde opisani služe za određivanje frakcije drugog genoma u biološkom uzorku. Postupci opciono mogu poslužiti za utvrđivanje prisustva ili odsustva brojnih poremećaja, upotrebom uzorka krvi koji sadrži smešu DNK (kao što je cfDNK) prvog i drugog genoma. U pojedinim primerima izvođenja, određivanje fetalne frakcije može obuhvatati (a) sekvenciranje genoma najmanje jednog dela smeše cfDNK, da bi se dobilo mnoštvo markerskih sekvenci; (b) utvrđivanje prisustva ili odsustva višestrukih polimorfizama u mnoštvu markerskih sekvenci, i (c) utvrđivanje povezanosti višestrukih polimorfizama sa prvim i/ili drugim genomom u smeši. U poželjnim primerima izvođenja, smeša nije obogaćena višestrukim polimorfizmima. Identifikacija višestrukih polimorfizama u smeši DNK se vrši upoređivanjem sekvence mapiranih markerskih sekvenci dobijenih postupkom sekvenciranja celokupnog genoma sa referentnim sekvencama koje sadrže višestruke polimorfizme, kao što je ovde opisano.
[0147] U primerima izvođenja koji su prethodno opisani, prvi genom označava genom fetusa, dok drugi genom predstavlja genom majke. U drugom primeru izvođenja, prvi genom je genom neizmenjene ćelije, a drugi genom je genom iz izmenjene ćelije, npr. ćelija kancera. U pojedinim primerima izvođenja, izmenjene i neizmenjene ćelije se dobijaju iz istog subjekta. Na primer, izmenjena ćelija može biti ćelija čiji je genom izmenjen poremećajem. U pojedinim primerima izvođenja, poremećaj označava monogenski poremećaj. U drugim primerima izvođenja, poremećaj je poligenski poremećaj. Poremećaji mogu biti identifikovani jednim polimorfizmom, npr. SNP-om markerske sekvence, ili višestrukim polimorfizmima prisutnim u haplotipu. U pojedinim primerima izvođenja, višestruki polimorfizmi identifikovani postupkom predmetnog pronalaska su prisutni u haplotipskom bloku.
[0148] Poremećaji koji mogu biti identifikovani upotrebom predmetnog postupka predstavljaju genetičke poremećaje, odnosno oboljenja prouzrokovana, barem delom, abnormalnostima u genima ili hromozomima. Poznavanje fetalne frakcije u uzorku može pomoći u identifikaciji navedenih poremećaja u kontekstu prenatalne dijagnostike. Poremećaji identifikovani predmetnim postupkom obuhvataju monogenske tj. poremećaje jednog gena, kao i poligenske, tj. složene poremećaje. Poremećaji jednog gena obuhvataju autozomno-dominantne, autozomno-recesivne, X-vezane dominantne, X-vezane recesivne i Y-vezane poremećaje.
[0149] U autozomno-dominantnim poremećajima, potrebna je samo jedna mutirana kopija gena da bi kod individue došlo do pojave poremećaja. Uobičajeno je da individua sa poremećajem ima jednog roditelja sa poremećajem, a šansa da će potomstvo naslediti mutirani gen iznosi 50%. Stanja koja su autozomno-dominantna ponekad karakteriše smanjena penetrabilnost, što označava da iako je
1
potrebna samo jedna mutirana kopija, do razvijanja bolesti ne dolazi kod svih individua koje su tu mutaciju nasledile. Primeri autozomno-dominantnih poremećaja koji mogu biti identifikovani predmetnim postupkom obuhvataju, bez ograničavanja samo na njih, familijarnu hiperholesterolemiju, naslednu sferocitozu, Marfanov sindrom, neurofibromatozu tipa 1, nasledni nepolipni kolorektalni kancer, nasledne višestruke egzostoze i Hantingtonovu bolest.
[0150] Autozomno-recesivni poremećaji koji mogu biti detektovani upotrebom predmetnog postupka obuhvataju srpastu anemiju, cističnu fibrozu, Taj-Sahovu bolest, Taj-Sahovu bolest, mukopolisaharidozu, bolesti skladištenja glikogena i galaktozemiju. X-vezani poremećaji koji se mogu detektovati predmetnim postupkom obuhvataju Dišenovu mišićnu distrofiju i hemofiliju. U autotozomno-recesivnim poremećajima, dve kopije gena moraju biti mutirane da bi subjekat oboleo od autotozomno-recesivnog poremećaja. Individue sa poremećajem obično imaju roditelјe koji nemaju poremećaj, pri čemu svaki od roditelja nosi jednu kopiju mutiranog gena (označavaju se kao nosioci). Dvoje ljudi koji nisu oboleli, a od kojih svaki nosi jednu kopiju mutiranog gena, imaju šansu od 25% da, nakon svake trudnoće, dobiju dete sa poremećajem. Primeri ovakvih vrsta poremećaja koji mogu biti identifikovan predmetnim postupkom obuhvataju: cističnu fibrozu, srpastu anemiju, Taj-Sahovu bolest, Njuman-Pikovu bolest, spinalnu mišićnu atrofiju i Robertov sindrom. Pojedini drugi fenotipovi, kao što su vlažan nasuprot suvog voska u ušima, takođe su determinisani na autozomno-recesivan način. Uzrok X-vezanih dominantnih poremećaja su mutacije u genima na X hromozomu. Samo nekoliko poremećaja ima ovakav obrazac nasleđivanja, a najvažniji primer je X-vezani hipofosfatemični rahitis. Od ovog poremećaja oboljevaju i muškarci i žene, pri čemu muškarci obično više oboljevaju od žena. Pojedina X-vezana dominantna stanja, kao što su Retov sindrom, inkontinencija pigmenti tipa 2 i Ajkardi sindrom, obično su fatalna kod muškaraca i stoga se pretežno sreću kod žena. Izuzeci od ovog nalaza su izuzetno retki slučajevi u kojima dečaci s Klinefelterovim sindromom (47, XXY) takođe nasleđuju X-vezano dominantno stanje i ispoljavaju simptome koji su po ozbilјnosti slični onima koji se javljaju kod žena. Šanse za prenošenje X-vezanog dominantnog poremećaja se razlikuju između muškaraca i žena. Sinovi čoveka sa X-vezanim dominantnim poremećajem neće biti sa poremećajem (budući da dobijaju Y hromozom oca), dok će njegove ćerke naslediti stanje. Žena sa X-vezanim dominantnim poremećajem ima šansu od 50% da u svakoj trudnoći fetus bude sa poremećajem, iako je potrebno napomenuti da su u principu, u slučajevima kao što je inkontinencija pigmenti, samo ženski potomci vijabilni. Pored toga, iako navedena stanja ne menjaju plodnost sama po sebi, individue sa Retovim sindromom ili Ajkardi sindromom se retko reprodukuju.
[0151] Predmetni postupak takođe može olakšati identifikaciju polimorfizama koji asociraju sa X-vezanim poremećajima. Uzrok X-vezanih recesivnih stanja su takođe mutacije u genima na X hromozomu. Muškarci su češće pogođeni od žena, a šanse da se prenese poremećaj se razlikuju između muškaraca i žena. Sinovi čoveka sa X-vezanim recesivnim poremećajem neće biti sa poremećajem, dok će njegove ćerke nositi jednu kopiju mutiranog gena. Žena koja je nosilac X-vezanog recesivnog poremećaja (X<R>X<r>) ima šansu od 50% da dobije sinove koji su sa poremećajem i 50% šanse da ima ćerke koji nose jednu kopiju mutiranog gena i koje su time nosioci. X-vezana recesivna stanja obuhvataju, bez ograničavanja, ozbilјne bolesti poput hemofilije A, Dišenove mišićne distrofije i Leš-Nihanovog sindroma, kao i česta i manje ozbilјna stanja kao što su muška ćelavost i slepilo za crvenu i zelenu boju. X-vezana recesivna stanja se ponekad mogu manifestovati kod ženskih osoba usled izmenjene inaktivacije X hromozoma ili X-monozomije (Tarnerovog sindroma).
2
[0152] Y-vezani poremećaji nastaju usled mutacija na Y hromozomu. Pošto muškarci nasledjuju Y hromozom od svojih očeva, svaki sin oca sa poremećajem će takođe imati poremećaj. Žene od očeva nasleđuju X hromozom, tako da kod ženskog potomstva nikada ne dolazi od pojave poremećaja. Kako je Y hromozom relativno mali i sadrži vrlo mali broj gena, relativno je mali broj i Y-vezanih poremećaja. Simptomi često uključuju neplodnost, koja se može zaobići upotrebom pojedinih postupaka lečenja steriliteta. Primeri su muška neplodnost i hipertrihoza pinnae.
[0153] Kao što je objašnjeno, opisani postupci za detekciju genomskih frakcija u uzorku mogu biti upotrebljeni za olakšavanje detekcije aneuploidije iz materijala uzoraka. U pojedinim primerima izvođenja, aneuploidija je tipa potpune hromozomske trizomije ili monozomije, ili je pak tipa delimične trizomije ili monozomije. Parcijalne aneuploidije nastaju gubitkom ili dobijanjem dela hromozoma i podrazumevaju gubitak hromozomske ravnoteže usled neuravnoteženih translokacija, neuravnoteženih inverzija, delecija i insercija. Do sada, najčešća poznata aneuploidija koja je kompatibilna sa životom je trizomija 21, tj. Daunov sindrom (DS), koji nastaje usled prisutva dela ili čitavog hromozoma 21. Retko, uzrok DS može biti nasledan ili sporadičan defekt u kome dodatna kopija celog ili dela hromozoma 21 postaje vezana za drugi hromozom (obično hromozom 14) usled čega se obrazuje jedan aberantan hromozom. DS karkaterišu oštećenja intelektualnih sposobnosti, izražene teškoće u učenju i povećan mortalitet usled dugotrajnih zdravstvenih problema kao što je oboljenje srca. Druge aneuploidije sa poznatim kliničkim značajem obuhvataju Edvardov sindrom (trizomiju 18) i Patauov sindrom (trizomiju 13) koji su često fatalni u prvih nekoliko meseci života. Abnormalnosti povezane sa brojem polnih hromozoma takođe su poznate i obuhvataju monozomiju X, npr. Tarnerov sindrom (XO), kao i sindrom trizomije X hromozoma (XXX) kod ženskih potomaka i Klinefelterov sindrom (XXY) i XYY sindrom kod muških potomaka. Svaki od ovih poremećaja je praćen raznim fenotipovima, uklјučujući sterilnost i smanjenje intelektualnih sposobnosti. Monozomija X [45,X] je uobičajeni uzrok gubitka rane trudnoće kod oko 7% spontanih abortusa. Na osnovu učestalosti živorođenih kod 45,X (označenog i kao Tarnerov sindrom) od 1-2/10,000, procenjeno je da će manje od 1% 45,X zametaka preživeti do termina. Oko 30% pacijenata sa Tarnerovim sindromom ispoljava mozaicizam, odnosno prisustvo i 45,X i 46,XX ćelijskih linija ili pak prisustvo jedne linije koja sadrži rearanžiran X hromozom (Hook i Warburton 1983). Fenotip živorođenog deteta je relativno blag uzimajući u obzir visoku smrtnost embriona, tako da je postavljena hipoteza da verovatno svi živorođeni ženski potomci sa Tarnerovim sindromom nose liniju ćelija koja sadrži dva polna hromozoma. Monozomija X se može javiti kod ženskih individua kao 45,X ili 45,X/46,XX, a kod muških kao 45,X/46XY. U principu, pretpostavlja se da su autozomne monozomije kod ljudi nekompatibilne sa životom; ipak, postoji priličan broj citogenetičkih izveštaja koji opisuju potpunu monozomiju jednog hromozoma 21 kod živorođene dece (VosranovaI i saradnici, Molecular Citogen.1:13 [2008]; Joosten i saradnici, Prenatal Diagn. 17: 271-5 [1997]. Postupak pronalaska može biti upotrebljen za lakše postavljanje prenatalne dijagnoze ovih i drugih hromozomskih abnormalnosti.
[0154] Prema pojedinim primerima izvođenja, fetalna frakcija može biti korisna za utvrđivanje prisustva ili odsustva hromozomskih trizomija bilo kog od hromozoma 1-22, X i Y. Primeri hromozomskih trizomija koji mogu biti detektovani predmetnim postupkom obuhvataju, bez ograničavanja samo na njih, trizomiju 21 (T21; Daunov sindrom), trizomiju 18 (T18; Edvardov sindrom), trizomiju 16 (T16), trizomiju 20 (T20), trizomiju 22 (T22; sindrom mačijeg oka), trizomiju 15 (T15; Prader-Vilijev sindrom), trizomiju 13 (T13; Patau sindrom), trizomiju 8 (T8; Varkanijev sindrom), trizomiju 9 i trizomije tipa XXY (Klinefelterov sindrom), XYY ili XXX. Kompletna trizomija drugih autozoma u stanjima u kojima nije prisutan mozaicizam je smrtonosna, ali ista može biti kompatibilna sa životom ukoliko je mozaicizam prisutan. Važno je napomenuti da razne potpune trizomije, bez obzira da li je prisutan ili odsutan mozaicizam, kao i parcijalne trizomije, mogu biti određene u fetalnoj cfDNK upotrebom znanja izloženih u predmetnom pronalasku.
[0155] Neograničavajući primeri parcijalnih trizomija koji mogu biti utvrđeni predmetnim postupkom obuhvataju, ali nisu ograničeni samo na njih, parcijalnu trizomiju 1q32-44, trizomiju 9 p, mozaicizam trizomije 4, trizomiju 17p, parcijalnu trizomiju 4q26-qter, parcijalnu 2p trizomiju, parcijalnu trizomiju 1q i/ili parcijalnu trizomiju 6p/monozomiju 6q.
[0156] Postupci koji su ovde opisani takođe mogu biti upotrebljeni kao ispomoć pri određivanju hromozomske monozomije X, hromozomske monozomije 21 i parcijalnih monozomija kao što su monozomija 13, monozomija 15, monozomija 16, monozomija 21 i monozomija 22, a za koje je poznato da imaju ulogu u spontanim pobačajima. Parcijalne monozomije hromozoma koja su uobičajeno uključene u potpune aneuploidije mogu takođe biti utvrđene postupkom pronalaska. Neograničavajući primeri delecionih sindroma koji mogu biti utvrđeni predmetnim postupkom obuhvataju sindrome čiji je uzrok parcijalna delecija hromozoma. Primeri parcijalnih delecija koji mogu biti utvrđeni upotrebom predmetnog postupka obuhvataju, bez ograničavanja, parcijalne delecije hromozoma 1, 4, 5, 7, 11, 18, 15, 13, 17, 22 i 10 koje su opisane u nastavku teksta.
[0157] Sindromi delecije 1q21.1 ili (rekurentne) mikrodelecije 1q21.1 su retka aberacija hromozoma 1. Pored sindroma delecije, postoji i sindrom duplikacije 1q21.1. Dok delecioni sindrom podrazumeva nedostatak dela DNK na određenom mestu, sindrom duplikacije karakteriše prisustvo dve ili tri kopije sličnog dela DNK na istom mestu. Literatura razmatra i delecije i duplikacije ovog tipa kao varijacije broja kopija (CNV) za 1q21.1. Delecija 1q21.1 može biti udružena sa TAR sindromom (trombocitopenijom sa odsustvom radijusa).
[0158] Volf-Hiršhornov sindrom (WHS) (OMIN #194190) je sindrom delecije susednih gena asociran sa hemizigotnom delecijom hromozoma 4p16.3. Volf-Hiršhornov sindrom predstavalja kongenitalni malformacijski sindrom koga karakterišu pre- i postnatalni deficit rasta, poremećaj u razvoju varijabilnog stepena i dalje specifične kraniofacijalne karakteristike (pojava grbe na nosu tipa od “šlema grčkog ratnika”, visoko čelo, izražena glabela, razmaknute očne jabučice, obrve visoko postavljene na očnim lukovima, ispupčene oči sa epikantalnim naborima, kratki usni nabor, karakterističan oblik usta sa uglovima okrenutim nadole i uvučena brada), kao i epiletični napadi.
[0159] Parcijalna delecija hromozoma 5, poznata i kao 5p- ili 5p minus, koja se označava kao “sindrom mačijeg plača” (OMIN # 123450), nastaje usled delecije kratkog kraka (p kraka) hromozoma 5 (5p15.3-p15.2). Decu sa ovim stanjem često karakteriše plač prodornog zvuka koji liči na zvuk koji ispuštaju mačke. Poremećaj prate intelektualne nesposobnosti i kašnjenje u razvoju, mala veličina glave (mikrocefalija), niska telesna težina na rođenju i slab tonus mišića (hipotonija) u detinjstvu, kao i pojava specifičnih facijalnih karakteristika i eventualno poremećaji u radu srca.
[0160] Viliams-Beurenov sindrom, poznat i kao sindrom delecije hromozoma 7q11.23 (OMIN 194050), je sindrom sa delecijom susednih gena koji dovodi do multisistemskog poremećaja usled hemizigotne delecije regiona veličine od 1,5 do 1,8 Mb na hromozomu 7q11.23 u okviru koga se nalazi oko 28 gena.
[0161] Jakobsenov sindrom, poznat i kao delecioni poremećaj 11q, je redak urođeni poremećaj koji nastaje usled delecije terminalnog regiona hromozoma 11 koja uključuje region 11q24.1. Poremećaj
4
karakterišu intelektualni poremećaji, prepoznatljiv izgled lica i raznovrsni fizički problemi, uključujući oštećenja srca i poremećaj krvarenja.
[0162] Parcijalna monozomija hromozoma 18, poznata kao monozomija 18p, je redak hromozomski poremećaj u kome dolazi do delecije celog ili dela kraćeg kraka (p) hromozoma 18 (monozomno). Poremećaj obično karakterišu nizak rast, varjabilni stepeni mentalne retardacije, kašnjenje u govoru, malformacija lobanje i regiona lica (kranofacijalne malformacije), kao i/ili dodatne fizičke abnormalnosti. Karakteristični kraniofacijalni defekti mogu značajno varirati u opsegu i ozbiljnosti od slučaja do slučaja.
[0163] Stanja prouzrokovana promenama u strukturi ili broju kopija hromozoma 15 obuhvataju Angelmanov sindrom i Prader-Vilijev sindrom, koji podrazumevaju gubitak aktivnosti gena u istom delu hromozoma 15, regionu 15q11-q13. Potrebno je napomenuti da nekoliko translokacija i mikrodelecija može biti asimptomasko kod roditelja nosioca, ali da iste mogu izazvati značajno genetičko oboljenje kod potomstva. Na primer, zdrava majka sa 15q11-q13 mikrodelecijom može roditi dete s Angelmanovim sindromom, teškim neurodegenerativnim poremećajem. Prema tome, postupak pronalaska može biti upotrebljen za identifikaciju navedene delimične delecije i drugih delecija kod fetusa.
[0164] Parcijalna monozomija 13q je redak hromozomski poremećaj koji se javlja usled nedostatka dela dugog kraka (q) hromozoma 13 (monozomalno). Decu rođenu sa parcijalnom monozomijom 13q mogu karakterisati niska težina na rođenju, malformacije glave i lica (kraniofacijalne regije), abnormalnosti skeleta (naročito ruku i stopala) i druge fizičke abnormalnosti. Mentalna retardacija je karakteristična za ovo stanje. Stopa mortaliteta među individuama rođenim sa ovim poremećajem je tokom detinjstva visoka. Skoro svi slučajevi parcijalne monozomije 13q se javljaju nasumično, bez jasnog razloga (sporadično).
[0165] Smit-Magenisov sindrom (SMS - OMIM #182290) nastaje usled delecije ili gubitka genetičkog materijala na jednoj kopiji hromozoma 17. Ovaj dobro poznat sindrom karakterišu kašnjenje u razvoju, mentalna retardacija, urođene anomalije kao što su oštećenja srca i bubrega, kao i neurobihejvioralne abnormalnosti poput teškog poremećaja spavanja i samopovređujućeg ponašanja. Smit-Magenisov sindrom (SMS) je u većini slučajeva (90%) prouzrokovan intersticijskom delecijom veličine 3,7 Mb u okviru hromozomskog regiona 17p11.2.
[0166] Sindrom delecije 22q11.2, poznat i kao Di-Georgov sindrom, je sindrom prouzrokovan delecijom malog dela hromozoma 22. Delecija (22q11.2) se javlјa u blizini sredine hromozoma na dugom kraku jednog od para hromozoma. Karakteristike ovog sindroma široko variraju, čak i među članovima iste porodice, a pogađeni su mnogi delove tela. Karakteristični znaci i simptomi mogu obuhvatati defekte na rođenju kao što su urođene bolesti srca, defekti nepca koje najčešće prate neuromuskulatorni problem sa zatvaranjem usta (velo-faringealna insuficijencija), a nadalje se javljaju i teškoće u učenju, blago izmenjen izgled lica i sklonost infekcijama. Mikrodelecije u hromozomskom regionu 22q11,2 su udružene sa povećanim rizikom za šizofreniju, za 20 do 30 puta.
[0167] Delecije u okviru kratkog kraka hromozoma 10 karakteriše fenotip sličan feotipu Di-Georgovog sindroma. Parcijalna monozomija hromozoma 10p je retka, ali je primećena kod dela pacijenata sa simptomima Di-Georgovog sindroma.
[0168] U jednom primeru izvođenja, postupak pronalaska se upotrebljava za lakše određivanje parcijalnih monozomija uključujući, ali se ne ograničavajući samo na njih, parcijalnu monozomiju hromozoma 1, 4, 5, 7, 11, 18, 15, 13, 17, 22 i 10, npr. parcijalnu monozomiju 1q21.11, parcijalnu monozomiju 4p16.3, parcijalnu monozomiju 5p15.3-p15.2, parcijalnu monozomiju 7q11.23, parcijalnu monozomiju 11q24.1, parcijalnu monozomiju 18p, parcijalnu monozomiju hromozoma 15 (15q11-q13), parcijalnu monozomiju 13q, parcijalnu monozomiju 17p11.2, parcijalnu monozomiju hromozoma 22 (22q11.2). Parcijalna monozomija 10p takođe može biti utvrđena upotrebom predmetnog postupka.
[0169] Ostale parcijalne monozomije koje mogu biti utvrđene postupkom pronalaska obuhvataju neuravnoteženu translokaciju t(8;11) (p23.2;p15.5); mikrodeleciju 11q23; deleciju 17p11.2; deleciju 22q13.3; mikrodeleciju Xp22.3; deleciju 10p14; mikrodeleciju 20p, [del(22)(q11.2q11.23)]; delecije 7q11.23 i 7q36; deleciju 1p36; mikrodeleciju 2p; neurofibromatozu tipa 1 (mikrodeleciju 17q11.2) ; deleciju Yq; mikrodeleciju 4p16.3; mikrodeleciju 1p36.2; deleciju 11q14; mikrodeleciju 19q13.2; Rubinštajn-Taibi sindrom (mikrodelecija 16p13.3); mikrodeleciju 7p21; Miler-Dajkerov sindrom (17p13.3) i mikrodeleciju 2q37. Parcijalne delecije mogu biti male delecije dela hromozoma ili mogu biti mikrodelecije hromozoma u kojima može doći do delecije jednog gena.
[0170] Identifikovano je nekoliko sindroma sa duplikacijama koji nastaju usled duplikacije dela kraka hromozma (pogledati OMIN bazu podataka [Online Mendelian Inheritance in Man, dostupnu na internet adresi ncbi.nlm.nih.gov/omim]). U jednom primeru izvođenja, predmetni postupak može biti upotrebljen za utvrđivanje prisustva ili odsustva duplikacija i/ili multiplikacija segmenata bilo kog od hromozoma 1-22, X i Y. Neograničavajući primeri sindroma duplikacija koji mogu biti utvrđeni predmetnim postupkom obuhvataju duplikacije dela hromozoma 8, 15, 12 i 17 koje su opisane u nastavku teksta.
[0171] Sindrom duplikacije 8p23.1 je redak genetički poremećaj koji nastaje duplikacijom regiona iz humanog hromozoma 8. Ovaj sindrom duplikacije je sa procenjenom prevalencom od 1 u 64,000 novorođenih i recipročan je sindromu delecije 8p23.1. Duplikaciju 8p23.1 prati pojava varjabilnih fenotipova koji uključuju jedan ili više od simptoma poput kašnjenja u govoru, kašnjenje u razvoju, blagog dismorfizma sa istaknutim čelom i visoko podignutim obrvama, kao i pojava urođenih srčanih obolјenja (CHD).
[0172] Sindrom duplikacije hromozoma 15q (Dup15q) je klinički prepoznatlјiv sindrom koji nastaje usled duplikacije hromozoma 15q11-13.1. Bebe sa Dup15q obično karakteriše hipotonija (slab tonus mišića) i kašnjenje u rastu; one mogu biti rođene sa rascepljenom usnom i/ili nepcem, kao i sa malformacijama srca, bubrega ili drugih organa; decu karakterie određeni stepen kognitivnog kašnjenja/poremećaja (mentalna retardacija), kašnjenje u govoru i jezičkom izražavanju, kao i poremećaji obrade senzornih nadražaja.
[0173] Palister-Kilijanov sindrom nastaje kao posledica prisustva dodatnog hromozomskog materijala na #12. Obično je prisutna smeša ćelija (mozaicizam), od kojih su pojedine sa viškom #12 materijala, dok su pojedine normalne (sadrže 46 hromozoma bez dodatnog materijala na #12). Bebe sa ovim sindromom imaju mnogo problema, uključujući ozbilјnu mentalnu retardaciju, slab tonus mišića, "grub" izraz lica i izraženo čelo. Kod obolelih se uočava tendencija prisustva veoma tanke gornje usne, zadebljale donje usne i kratkog nosa. Ostali zdravstveni problemi obuhvataju epileptične napade, poteškoće sa uzimanjem hrane, krute zglobove, kataraktu u odraslom dobu, gubitak sluha i defekte srca. Osobe sa Palister-Kilijanovim sindromom su skraćenog životnog veka.
[0174] Osobe sa genetičkim stanjim označenim kao dup(17)(p11.2p11.2) ili dup 17p nose dodatne genetičke informacije (poznate kao duplikacije) na kratkom kraku hromozoma 17. Duplikacije hromozoma 17p11.2 su u osnovi Potocki-Lupski sindroma (PTLS), koji je skoro prepoznat kao genetičko stanje iako su desetine slučajeva prijavlјene u medicinskoj literaturi. Pacijente sa ovom duplikacijom često karakteriše nizak tonus mišića, poteškoće u uzimanju hrane, kao i problemi u razvoju tokom detinjstva, a prisutna su i kašnjenja u motornom i verbalnom razvoju. Mnoge individue sa PTLS-om imaju poteškoće u artikulaciji i obradi jezičkih podataka. Dodatno, pacijenti mogu imati karakteristike ponašanja slične onima koje se uočavaju kod osoba sa autizmom ili poremećajima iz spektra autizma. Individue sa PTLS-om mogu imati srčane deficite i skloni su apnei tokom spavanja. Poznato je da duplikacije velikog velikog regiona u hromozomu 17p12 koji obuhvata gen PMP22, dovode do pojave Šarko-Mari Tut oboljenja.
[0175] Pokazana je povezanost CNV sa pojavom mrtvorođenčadi. Ipak, usled karakterističnih ograničenja konvencionalne citogenetike, smatra se da je doprinos CNV pojavi mrtvorođenih zapravo potcenjen (Harris i saradnici, PrenatalDiagn 31:932-944 [2011]). Predmetni postupci su stoga korisni kao ispomoć prilikom utvrđivanja prisustva parcijalnih aneuploidija npr. delecija i multiplikacija segmenata hromozoma, a mogu biti upotrebljeni i da bi se potpomogla identifikacija i utvrđivanje prisustva ili odsustva CNV koji su povezani sa pojavom mrtvorođenčadi.
[0176] Predmetni postupak takođe može pomoći u identifikaciji polimorfizama asociranih sa genetičkim poremećajima koji su složeni, multifaktorski ili poligenski, što podrazumeva da su oni verovatno povezani sa efektima višestrukih gena u kombinaciji sa načinom života i faktorima životne sredine. Multifaktorski poremećaji obuhvataju, na primer, bolesti srca i dijabetes. Iako se složeni poremećaji često javljaju u okviru porodice, oni nemaju jasan obrazac nasleđivanja. Ispitivanja porodičnog stabla ukazuju da poligene bolesti imaju trend "pojave u porodicama", ali tip nasleđivanja nije tako jednostavan kao što je to slučaj sa bolestima koje se nasleđuju po Mendelovom principu. Snažan uticaj komponenti životne sredine asocira sa mnogim složenim poremećajima, na primer, sa krvnim pritiskom. Predmetni postupak može stoga biti upotrebljen za identifikaciju polimorfizama koji asociraju sa poligenim poremećajima, uključujući, ali ne ograničavajući se samo na, astmu, autoimune bolesti kao što je multipla skleroza, ili kao što su kanceri, ciliopatije, rascep nepca, dijabetes, oboljenje srca, hipertenzija, inflamatorna bolest creva, mentalna retardacija, poremećaj raspoloženja, gojaznost, refrakciona greška kao poremećaj u funkciji oka i sterilitet. U pojedinim primerima izvođenja, polimorfizmi su tipa SNP. U drugim primerima izvođenja, polimorfizmi su tipa STR. U još drugim primerima izvođenja, polimorfizmi predstavljaju kombinaciju SNP-ova i STR polimorfizama.
[0177] U jednom primeru izvođenja, identifikacija polimorfnih sekvenci koje asociraju sa poremećajima obuhvata sekvenciranje barem dela ćelijskog genoma koji odgovara drugom genomu u smeši cfDNK. Identifikacija polimorfnih sekvenci koje predstavljaju doprinos prvog genoma se izvodi utvrđivanjem više polimorfnih mesta u sekvenci iz prvog uzorka koji sadrži DNK molekule suštinski dobijene samo iz drugog genoma, i zatim karakterizacijom odgovarajućih višestrukih polimorfnih mesta u sekvenci drugog uzorka koji sadrži smešu molekula DNK dobijenih iz prvog i drugog genoma, nakon čega sledi upoređivanje polimorfnih sekvenci koje su utvrđene u oba uzorka čime se zapravo identifikuju višestruki polimorfizmi u prvom genomu uzorka koji sadrži smešu dva genoma. Na primer, identifikacija polimorfnih sekvenci koje predstavljaju doprinos fetalnog genoma, tj. prvog genoma, vrši se karakterizacijom višestrukih polimorfnih mesta u sekvenci iz uzorka interfaze plazme majke tj. u uzorku koji sadrži molekule DNK suštinski dobijene samo iz drugog genoma, pa zatim karakterizaciju odgovarajućih višestrukih polimorfnih mesta u sekvenci iz prečišćenog uzorka plazme tj. iz drugog uzorka koji sadrži smešu cfDNK molekula dobijenih iz genoma fetusa i genoma majke, nakon čega sledi upoređivanje polimorfnih sekvenci koje su utvrđene u oba uzorka da bi se identifikovali višestruki polimorfizmi kod fetusa. U jednom primeru izvođenja, prvi genom je fetalni genom, a drugi genom je genom majke. U drugom primeru izvođenja, prvi genom je genom neizmenjene ćelije, dok je drugi genom iz ćelije koja je izmenjenja. U pojedinim primerima izvođenja, izmenjene i neizmenjene ćelije potiču iz istog subjekta. Na primer, izmenjena ćelija može biti ćelija čiji je genotip izmenjen poremećajem.
[0178] U jednom primeru izvođenja, opisani postupci procene genomske frakcije mogu pomoći u otkrivanju kancera kod pacijenta. U raznim primerima, kancer se detektuje postupkom koji obuhvata: obezbeđivanje uzorka iz pacijenta, uzorka koji sadrži smešu genoma poreklom iz normalne, tj. neizmenjene, i kancerske, tj. izmenjene ćelije; kao i identifikaciju višestrukih polimorfizama koji su povezani sa kancerom. U pojedinim primerima izvođenja, uzorak je odabran iz grupe koju čine krv, plazma, serum i urin. U pojedinim primerima izvođenja, uzorak je uzorak plazme. U drugim primerima izvođenja, uzorak je uzorak urina.
[0179] U jednom primeru izvođenja, identifikacija višestrukih polimorfizama koji asociraju sa kancerom obuhvata obogaćivanje DNK sa polimorfnim cilјnim sekvencama u uzorku. U drugim primerima izvođenja, ne vrši se obogaćivanje uzorka sa polimorfnim cilјnim sekvencama. U pojedinim primerima izvođenja, identifikacija višestrukih polimorfizama koji su povezani sa kancerom obuhvata kvantifikaciju broja kopija polimorfne sekvence.
[0180] Kanceri koji mogu biti identifikovani i/ili praćeni postupkom opisa obuhvataju solidne tumore, kao i hematološke tumore i/ili malignitete. Razni kanceri koji mogu biti uzeti u obzir obuhvataju sarkome, karcinome i adenokarcinome koji nisu ograničeni na kancer dojke, kancer pluća, kolorektalni kancer, kancer pankreasa, kancer jajnika, kancer prostate, renalni karcinom, hepatom, kancer mozga, melanom, multipli mijelom, limfom, Hočkinov limfom, ne-Hočkinov limfom, limfome kod dece i limfome limfocitnog i kutanog porekla, leukemiju, leukemiju kod dece, triholeukemiju, akutnu limfocitnu leukemiju, akutnu mijelocitnu leukemiju, hroničnu limfocitnu leukemiju, hroničnu mijelocitnu leukemiju, hroničnu mijelogenu leukemiju, leukemiju mastocitnih ćelija, mijeloidne neoplazije, neoplazije mastocitnih ćelija, hematološki tumor i limfoidni tumor, uključujući metastatske lezije u drugim tkivima ili organima udalјenim od primarnog mesta tumora.
[0181] Postupci predmetnog pronalaska su korisni, na primer, u postavljanju dijagnoze ili utvrđivanju prognoze kod bolesnih stanja koja su asocirna sa specifičnim haplotipom/haplotipovima, kao i za utvrđivanje novih haplotipova i povezanosti haplotipova sa odgovorom na farmaceutike. Povezanost višestrukih polimorfnih sekvenci sa višestrukim poremećajima može biti utvrđena na osnovu identiteta pojedinačne polimorfne sekvence za svaki od višestrukih poremećaja. Alternativno, povezanost višestrukih polimorfnih sekvenci sa višestrukim poremećajima može biti utvrđena na osnovu identiteta višestrukih polimorfnih sekvenci za svaki od višestrukih poremećaja.
[0182] Konvencionalne tehnike genotipizacije su bile ograničene na identifikaciju polimorfizama u kratkim genomskim regionima od nekoliko kilobaza, a identifikacija haplotipova se oslanjala na podatke iz porodice i statističku procenu upotrebom računarskih algoritama. Sekvenciranje celokupnog genoma omogućava identifikaciju haplotipova direktnom identifikacijom polimorfizama u genomu. Identifikacija haplotipova u skladu sa raznim primerima izvođenja nije ograničena interventnim rastojanjem između polimorfizama. U pojedinim primerima izvođenja, postupak obuhvata sekvenciranje celokupnog genoma ćelijske DNK majke. Ćelijska DNK majke može biti dobijena iz biološkog uzorka lišenog fetalne genomske DNK. Na primer, DNK majke može biti dobijena iz interfaze plazme krvi majke. Moguće je odredititi haplotipove za mnoštvo polimorfnih sekvenci koji se prostiru duž čitavog hromozoma. U jednom primeru izvođenja, fetalni haplotipovi se upoređuju sa poznatim haplotipovima koji asociraju sa poremećajem, a međusobno preklapanje fetalnog haplotipa sa bilo kojim od poznatih haplotipova asociranih sa poremećajem, ukazuje da fetus ima poremećaj ili da je fetus sklon poremećaju. Fetalni haplotipi mogu takođe biti upoređeni sa haplotipovima asociranim sa pojavom ili odsustvom odgovora specifičnih polimorfizama na lečenje. Upoređivanje identifikovanih fetalnih haplotipova sa poznatim bazama podataka haplotipova omogućava postavljanje dijagnoze i/ili prognoze poremećaja. Bilo koji biološki uzorak koji sadrži smešu fetalne i cfDNK majke može biti upotrebljen za utvrđivanje prisustva ili odsustva poremećaja fetusa. Poželjno je da je biološki uzorak odabran iz grupe koju čine krv ili njene frakcije, uključujući plazmu, i urin. U jednom primeru izvođenja, biološki uzorak je uzorak krvi. U drugom primeru izvođenja, biološki uzorak je uzorak plazme. U još jednom primeru izvođenja, biološki uzorak je uzorak urina.
[0183] U jednom primeru izvođenja, pronalazak obezbeđuje postupak za utvrđivanje prisustva ili odsustva višestrukih poremećaja kod fetusa koji obuhvata (a) dobijanje uzorka krvi majke koji sadrži smešu fetalne i DNK majke oslobođenih od ćelija, (b) sekvenciranje celokupnog genoma iz najmanje dela smeše fetalne i DNK majke koje su oslobođene od ćelija, čime se dobija mnoštvo markerskih sekvenci; (c) određivanje višestrukih fetalnih polimorfizama u markerskih sekvencama, i (d) utvrđivanje prisustva ili odsustva višestrukih poremećaja fetusa. Primeri višestrukih fetalnih poremećaja koji se mogu identifikovati predmetnim postupkom obuhvataju monogenske i poligenske poremećaje koji su ovde opisani.
[0184] U jednom primeru izvođenja, pronalazak obezbeđuje postupak za utvrđivanje prisustva ili odsustva višestrukih fetalnih poremećaja, koji zapravo obuhvata identifikaciju višestrukih fetalnih polimorfizama koji asociraju sa haplotipovima povezanim sa višestrukim poremećajima. U pojedinim primerima izvođenja, svaki od haplotipova sadrži najmanje najmanje dva, najmanje tri, najmanje četiri, najmanje pet, najmanje deset ili najmanje petnaest različitih polimorfizama markerskih sekvenci. Polimorfizmi markerskih sekvenci koji su prisutni u haplotipu mogu biti istog tipa polimorfizma, npr. sve mogu biti SNP polimorfizmi markerskih sekvenci, ili to može biti kombinacija polimorfizama markerskih sekvenci, npr. polimorfizama SNP tipa i delecija. U jednom primeru izvođenja, polimorfizmi markerskih sekvenci su SNP tipa. U još jednom primeru izvođenja, polimorfizmi markerskih sekvenci su STR tipa. U još jednom primeru izvođenja, polimorfizmi markerskih sekvenci predstavljaju kombinaciju SNP i STR polimorfizama. Polimorfizmi markerskih sekvenci mogu biti u kodirajućim i/ili nekodirajućim regionima genoma. Identifikacija polimorfizama se sprovodi sekvenciranjem celokupnog genoma upotrebom NGS tehnologije, kao što je ovde opisano.
[0185] Pronalazak obezbeđuje i postupak za identifikaciju varijacija u broju kopija (CNV) kao vrstu polimorfizma sekvence od interesa u uzorku koji se ispituje i koji sadrži smešu nukleinskih kiselina dobijenih iz dva različita genoma, a za koje je poznato ili se pretpostavlja da se razlikuju u količini jedne ili više sekvenci od interesa. Varijacije u broju kopija utvrđene postupkom pronalaska obuhvataju dodavanja ili gubitke celokupnih hromozoma, izmene koje obuhvataju veoma velike segmente hromozoma koji su mikroskopski vidlјivi, kao i brojne varijacije u broju kopija DNK segmenata koje se ne mogu videti pod mikroskopom, sa opsegom veličina od nekoliko kilobaza (kb) do nekoliko megabaza (Mb).
[0186] CNV u humanom genomu značajno utiče na raznolikost kod ljudi, kao i na njihovu sklonost ka oboljenju (Redon i saradnici, Nature 23:444-454 [2006], Shaikhet i saradnici, Genome Res 19:1682-1690 [2009]). Poznato je da CNV doprinose genetičkim oboljenima putem različitih mehanizama koji dovode, u većini slučajeva, bilo do remećenja balansa u dozi gena ili do remećenja samog gena. Pored njihove direktne korelacije sa genetičkim poremećajima, poznato je da CNV posreduju u fenotipskim promenama koje mogu biti štetne. Nedavno je nekoliko studija prijavilo povećanje opterećenjima za retke ili de novo nastale CNV u kompleksnim poremećajima kao što su autizam, ADHD i šizofrenija, a na osnovu poređenja sa normalnim kontrolama, što je naglasilo potencijalnu patogenost retkih ili jedinstvenih CNV-ova (Sebat i saradnici, 316:445-449 [2007]; Walsh i saradnici, Science 320: 539-543 [2008]). CNV nastaju usled genomskih rearanžmana, prvenstveno zahvalјujući događajima tipa delecija, duplikacija, insercija i neuravnoteženih translokacija.
[0187] Primeri izvođenja pronalaska obezbeđuju postupak utvrđivanja varijacija u broju kopija sekvence od interesa, npr. klinički relevantne sekvence, u uzorku koji se ispituje i koji sadrži smešu nukleinskih kiselina dobijenih iz dva različita genoma, a za koje je poznato ili se pretpostavlja da se razlikuju u količini jedne ili više sekvenci od interesa. Smeša nukleinskih kiselina je dobijena iz dve ili više vrsta ćelija. U jednom primeru izvođenja, smeša nukleinskih kiselina je dobijena iz normalnih i kancerskih ćelija poreklom iz subjekta koji boluje od medicinskog stanja, npr. kancera.
[0188] Smatra se da mnogi solidni tumori, kao što je kancer dojke, napreduju od inicijacije do metastaze kroz akumulacije nekoliko genetičkih aberacija. [Sato i saradnici, Cancer Res., 50:7184-7189 [1990]; Jongsma i saradnici, J ClinPathol: Mol Path 55:305-309 [2002])]. Takve genetičke aberacije, dok se akumuliraju, mogu doprineti sposobnosti proliferacije, genetičkoj nestabilnosti i pratećoj sposobnosti brzog razvoja rezistencije na lekove, kao i povećanju sposobnosti angiogeneze, proteolize i metastaziranja. Genetičke aberacije mogu uticati bilo na recesivne "gene supresor tumora" ili onkogene sa dominantnim efektom. Smatra se takođe da delecije i rekombinacije koje vode gubitku heterozigotnosti (LOH) imaju glavnu ulogu u progresiji tumora usled mogućnosti ekspresije mutiranih alela gena sa funkcijom u supresiji tumora.
[0189] CfDNK je pronađena u cirkulaciji pacijenata sa dijagnostifikovanim malignitetima, uključujući, ali bez ograničavanja samo na, kancer pluća (Pathak i saradnici, ClinChem 52:1833-1842 [2006]), kancer prostate (Schwartzenbach i saradnici, Clin Cancer Res 15:1032-8 [2009]) i kancer dojke (Schwartzenbach i saradnici, dostupno na internet adresi breast-cancerresearch.com/content/11/5/R71 [2009]). Identifikacija genomskih nestabilnosti povezanih sa kancerom koja može biti utvrđena u cfDNK iz cirkulacije pacijenata sa kancerom, potencijalni je dijagnostički i prognostički parametar. U jednom primeru izvođenja, postupak pronalaska utvrđuje CNV za sekvence od interesa u uzorku koji sadrži smešu nukleinskih kiselina izvedenih iz subjekta za koga se sumnja ili je poznato da ima kancer, npr. karcinom, sarkom, limfom, leukemiju, tumore i blastome germinativnih ćelija. U jednom primeru izvođenja, uzorak je uzorak plazme dobijen (obrađen) iz periferne krvi, a koji sadrži smešu cfDNK koje potiču iz normalnih i kancerskih ćelija. U drugom primeru izvođenja, biološki uzorak koji je potreban da bi se utvrdilo da li je CNV prisutan, dobija
4
se iz smeše kancerskih i nekancerskih ćelija u drugim biološkim tečnostima, uključujući, ali bez ograničavanja samo na, serum, znoj, suze, sputum, urin, sputum, sekret ušiju, limfu, plјuvačku, cerebrospinalnu tečnost, lavaže, suspenziju kosne srži, vaginalni sekret, transcervikalnu lavažu, tečnost mozga, ascite, mleko, sekrete respiratornog, intestinalnog i genitourinarnog trakta i uzorke leukoforeze, kao i u uzorcima dobijenim nakon biopsija tkiva, iz briseva ili razmaza.
[0190] Sekvenca od interesa je sekvenca nukleinske kiseline koja je poznata ili za koju se sumnja da ima ulogu u razvoju i/ili progresiji kancera. Primeri sekvence od interesa obuhvataju sekvence nukleinskih kiselina koje su amplifikovane ili delecijom uklonjene u ćelijama kancera, kao što je opisano u tekstu koji sledi.
[0191] Geni sa dominantnim efektom koji su povezani sa solidnim tumorima kod ljudi, obično ispoljavaju svoje efekte prekomernom eksresijom ili izmenjenom ekspresijom. Amplifikacija gena predstavlja uobičajen mehanizam koji vodi povećanju genske ekspresije. Dokazi iz citogenetičkih studija ukazuju da se značajna amplifikacija javlja u preko 50% humanin kancera dojke. Najzapaženija je amplifikacija proto-onkogena za receptor humanog epidermalnog faktora rasta tipa 2 (HER2) koji se nalazi na hromozomu 17 (17(17q21-q22)), a koja dovodi do prekomerne ekspresije HER2 receptora na površini ćelije i dalje do prekomerne i poremećene regulacije signalizacije u ćelijama kancera dojke i drugim humanim malignitetima (Park i saradnici, Clinical Breast Cancer 8:392-401 [2008]). Utvrđeno je da se raznovrsni onkogeni amplifikuju u drugim humanim malignitetima. Primeri amplifikacije ćelijskih onkogena u tumorima kod ljudi obuhvataju amplifikacije: c-myc u ćelijskoj liniji HL60 promijelocitne leukemije i u ćelijskim linijama sitnoćelijskog karcinoma pluća, N-myc u primarnim neuroblastomima (stadijuma III i IV), ćelijskim linijama neuroblastoma, ćelijskim linijama retinoblastoma i primarnim tumorima, kao i u linijama i tumorima sitnoćelijskog karcinoma pluća, L-myc u ćelijskim linijama i tumorima sitnoćelijskog karcinoma pluća, c-myb u akutnoj mijeloidnoj leukemiji i ćelijskim linijama karcinoma kolona, c-erbb u ćelijama epidermoidnog karcinoma i primarnim gliomima, c-K-ras-2 u primarnim karcinomima pluća, debelog creva, bešike i rektuma, N-ras u ćelijskoj liniji mamilarnog karcinoma (Varmus H., Ann Rev Genetics 18:553-612 (1984) [citirano u Watson i saradnici, Molecular Biology of the Gene (4. izd., Benjamin/Cummings Publishing Co.1987)].
[0192] Hromozomske delecije koje obuhvataju tumor-supresorske gene mogu imati važnu ulogu u razvoju i progresiji solidnih tumora. Tumor-supresorski gen retinoblastoma (Rb-1), lociran na hromozomu 13q14, je najobimnije okarakterisan tumor-supresorski gen. Genski proizvod Rb-1, jedarni fosfoprotein od 105 kDa, očigledno ima važnu ulogu u regulaciji ćelijskog ciklusa (Howe i saradnici, ProcNatlAcadSci (USA) 87:5883-5887 [1990]). Izmena ili gubitak ekspresije Rb proteina je prouzrokovana inaktivacijom oba genska alela bilo putem tačkaste mutacije ili hromozomske delecije. Utvrđeno je da su izmene Rb-i gena prisutne ne samo kod retinoblastoma, već i u drugim malignitetima kao što su osteosarkomi, sitnoćelijski kancer pluća (Rygaard i saradnici, Cancer Res 50:5312-5317 [1990)]) i kancer dojke. Studije polimorfizama u dužini restrikcionih fragmenta (RFLP) su ukazale da navedene tipove tumora često karakteriše gubitak heterozigotnost na 13q, što dalje sugeriše da je jedan od Rb-1 genskih alela izgublјen usled obimne hromozomske delecije (Bowcock i saradnici, Am J Hum Genet, 46:12 [1990]). Abnormalnosti hormozoma 1, uključujući duplikacije, delecije i neuravnotežene translokacije koje obuhvataju hromozom 6 i druge partnerske hromozome, ukazuju da regioni hromozoma 1, posebno 1q21-1q32 i 1p11-13, mogu sadržavati onkogene ili tumorsupresorske gene koji su relevantni za patogenezu kako hroničnih tako i uznapredovalih stadijuma mijeloproliferativnih neoplazija (Caramazza i saradnici, Eur J Hematol84:191-200 [2010]).
Mijeloproliferativne neoplazije su takođe povezane sa delecijama hromozoma 5. Poptun gubitak ili intersticijska delecija hromozoma 5 su najčešća kariotipska abnormalnost kod mijelodisplastičnih sindroma (MDS). Izolovana del(5q)/5q kod MDS pacijenata je sa najpovoljnijom prognozom u odnosu na one sa dodatnim defektima kariotipa, a koje dalje karakteriše tendencija razvoja mijeloproliferativnih neoplazija (MPN) i akutne mijeloidne leukemije. Učestalost neuravnoteženih delecija na hromozomu 5 je dovela do ideje da se u okviru 5q nalaze jedan ili više tumor-supresorskih gena koji imaju fundamentalnu ulogu u kontroli rasta hematopoetskih matičnih/progenitorskih ćelija (HSC/HPC). Citogenetičko mapiranje uobičajeno deletiranih regiona (CDR) centriranih na 5q31 i 5q32 je identifikovalo kandidate za tumor-supresorske gene, uključujući ribozomsku subjedinicu RPS14, transkripcioni faktor Egr1/Krox20 i protein remodelovanja citoskeleta, alfa-katenin (Eisenmann i saradnici, Oncogene 28:3429-3441 [2009]). Citogenetičke i alelotipske studije sveže izolovanih tumora i tumorskih ćelijskih linija su pokazale da su gubici alela iz nekoliko jasno različitih regiona hromozoma 3p, uključujući 3p25, 3p21-22, 3p21.3, 3p12-13 i 3p14, najranije i najčešće genomske abnormalnosti koje su uklјučene u širok spektar većine epitelnih kancera pluća, dojke, bubrega, glave i vrata, jajnika, grlića materice, debelog creva, pankreasa, jednjaka, bešike i drugih organa. Nekoliko tumorsupresorskih gena je mapirano u hromozomskom regionu 3p, a smatra se da intersticijalne delecije ili hipermetilacija promotora prethode gubitku 3p ili čitavog hromozoma 3 tokom razvoja karcinoma (Angeloni D., Briefings Functional Genomics 6:19-39 [2007]).
[0193] Novorođenčad i deca sa Daunovim sindromom (DS) često razvijaju urođene tranzientne leukemije i imaju povećan rizik pojave akutne mijeloidne leukemije i akutne limfoblastne leukemije. Hromozom 21, koji sadrži oko 300 gena, može biti uklјučen u brojne strukturne aberacije, npr. translokacije, delecije i amplifikacije kod leukemija, limfoma i solidnih tumora. Štaviše, identifikovano je da geni koji se nalaze na hromozomu 21 imaju važnu ulogu u tumorogenezi. Somatske numeričke, kao i strukturne aberacije hromozoma 21, povezane su sa leukemijama, a specifični geni uključujući RUNX1, TMPRSS2 i TFF koji se nalaze u 21q, imaju ulogu u tumorogenezi (Fonatsch C, Gene Chromozomes Cancer 49:497-508 [2010]).
[0194] U jednom primeru izvođenja, opis obezbeđuje način za procenu asocijacije između amplifikacije gena i stepena evolucije tumora. Korelacija između amplifikacije i/ili delecije i stadijuma ili gradusa kancera može biti prognostički važna, pošto takve informacije mogu doprineti definisanju genetički zasnovanog gradusa tumora koji može dalje poslužiti za prognozu daljeg toka oboljenja, pri čemu više uznapredovali tumori imaju najgoru prognozu. Dodatno, informacije o ranim događajima amplifikacije i/ili delecije mogu biti korisne u uspostavljanju veze tih događaja kao prediktora za naknadnu progresiju bolesti. Amplifikacija i delecije gena koje se identifikuju postupkom, mogu biti dovedene u vezu sa drugim poznatim parametrima kao što su gradus tumora, histologija, indeks obeležavanja sa Brd/Urd, hormonski status, zahvaćenost limfnih čvorova, veličina tumora, period preživlјavanja i druge karakteristike tumora koje su dostupna u okviru epidemioloških i biostatističkih istraživanja. Na primer, tumorska DNK koja će biti ispitana postupkom, može podrazumevati atipičnu hiperplaziju, in situ duktalni karcinom, kancer stadijuma I-III i metastatske limfne čvorove, čime se zapravo omogućava identifikacija asocijacije između amplifikacija i delecija i stadijuma. Utvrđene asocijacije mogu omogućiti terapijsku intervenciju koja je delotvorna. Na primer, konzistentno amplifikovani regioni mogu sadržavati prekomerno eksprimiran gen čiji proizvod može biti ciljni molekul za terapiju (na primer, tirozin kinazni receptor faktora rasta, p185<HER2>).
[0195] Postupak može biti upotrebljen za identifikaciju događaja amplifikacije i/ili delecije koji su povezani sa rezistencijom na lekove i to određivanjem varijacija u broju kopija nukleinskih kiselina primarnih kancera u onim ćelijama koje su metastazirale na druge lokacije. Ukoliko amplifikacija gena i/ili delecija predstavlja manifestaciju kariotipske nestabilnosti koja omogućava brz razvoj rezistencije na lekove, očekuje se više amplifikacije i/ili delecija u primarnim tumorima kod hemiorezistentnih pacijenata nego u tumorima kod hemiosenzitivnih pacijenata. Na primer, ukoliko je amplifikacija specifičnih gena odgovorna za razvoj rezistencije na lekove, očekuje se da su regioni koji okružuju te gene konzistentno amplifikovani u tumorskim ćelijama iz pleuralnih efuzija hemiorezistentnih pacijenata, ali ne i u primarnim tumorima. Otkriće povezanosti između amplifikacije i/ili delecije gena i razvoja rezistencije na lekove može omogućiti identifikaciju pacijenata koji će ili onih koji neće imati koristi od adjuvansne terapije.
[0196] U drugim primerima izvođenja, predmetni postupak može biti upotrebljen za identifikaciju polimorfizama asociranih sa poremećajima trinukleotidnih ponovaka koji predstavljaju skup genetičkih poremećaja prouzrokovanih ekspanzijom trinukleotidnih ponovaka. Trinukleotidne ekspanzije su podskup nestabilnih mikrosatelitskih ponovaka koji se javljaju duž svih genomskih sekvenci. Ukoliko su ponovci prisutni u zdravim genima, dinamičke mutacije mogu povećati broj ponovaka i dovesti do obrazovanja defektnog gena. U jednom primeru izvođenja, postupak može biti upotrebljen za identifikaciju trinukleotidnih ponavaka koji asociraju sa fragilnim X sindromom. Dugi krak X hromozoma pacijenata koji boluje od fragilnog X sindroma može sadržavati od 230 do 4000 CGG, a što je bitno različito u odnosu na 60 do 230 ponavaka koji se javljaju kod nosioca i 5 do 54 ponavka koji su prisutni kod normalnih individua. Hromozomsku nestabilnost koja proizilazi iz ove trinukleotidne ekspanzije klinički karakterišu mentalna retardacija, karakterističan izraz lica i makroorhidizam kod muškaraca. Drugo, srodno oboljenje sa trinukleotidnim ponovcima u DNK, fragilni X-E sindrom, takođe je identifikovan na X hromozomu, ali je utvrđeno da je ovo oboljenje rezultat ekspanzije CCG ponovaka. Predmetni postupak može identifikovati i trinukleotidne ponovke koji su povezani sa drugim poremećajima sa ekspanzijama ponovaka, uključujući poremećaje iz Kategorija I, II i III. Poremećaji kategorije I obuhvataju Hantingtonovu bolest (HD) i spinocerebelarne ataksije, koji nastaju usled ekspanzija CAG ponovaka u regionima specifičnih gena koji kodiraju proteine. Ekspanzije kategorije II imaju tendenciju da budu više fenotipski raznovrsne i sa heterogenim su ekspanzijama koje su uglavnom male po svoj veličini, ali su iste pronađene i u egzonima gena. Kategorija III obuhvata fragilni X sindrom, miotoničnu distrofiju, dve od spinocerebelarnih ataksija, juvenilnu miokloničnu epilepsiju i Fridrihovu ataksiju. Navedene bolesti obično karakterišu mnogo veće ekspanzije ponovaka nego što je to slučaj sa prve dve grupe, a ponavci su locirani izvan kodirajućih regiona gena.
[0197] U sledećim primerima izvođenja, predmetni postupak može identifikovati CAG trinukleotidne ponovke koji su povezani sa najmanje deset neuroloških poremećaja za koje je poznato da nastaju usled povećanog broja CAG ponavaka, obično u kodirajućim regionima drugačije nesrodnih proteina. Tokom sinteze proteina, ekspandirani CAG ponovci se prevode u neprekinutu seriju ostataka glutamina čime se obrazuje ono što je poznato kao poliglutaminski niz ("polyQ"). Takvi poliglutaminski nizovi mogu biti predmet povećane agregacije. Navedene poremećaje karakteriše autozomno-dominantni način nasleđivanja (sa izuzetkom spino-bulbarne mišićne atrofije koju karakteriše X-vezano nasleđivanje), početak bolesti u srednjem životnom dobu, progresivan tok bolesti i korelacija broja CAG ponovaka sa ozbiljnošću oboljenja i starošću pacijenta na početku bolesti. Uzročni geni su široko eksprimirani u svim poznatim poliglutaminskim obolјenjima. Uobičajen simptom PoliQ oboljenja je progresivna degeneracija nernih ćelija, koja obično pogađa ljude u kasnijoj životnoj dobi. Iako ova
4
oboljenja karakterišu isti ponovci kodona (CAG) i pojedini isti simptomi, ponovci se u različitim poliglutaminskim oboljenjima javljaju na različitim hromozomima. Primeri poliQ poremećaja koji mogu biti identifikovani predmetnim postupkom obuhvataju, bez ograničavanja samo na njih, DRPLA (DentatorubropalidoLuisovu atrofiju), HD (Huntingtonovu bolest), SBMA (Spinobulbarnu mišićnu atrofiju ili Kenedijevu bolest), SCA1 (Spinocerebelarnu ataksiju tipa 1), SCA2 (Spinocerebelarnu ataksiju tipa 2), SCA3 (Spinocerebelarnu ataksiju tipa 3 ili Makado-Džozefovu bolest), SCA6 (Spinocerebelarnu ataksiju tipa 6), SCA7 (Spinocerebelarnu ataksiju tipa 7), SCA17 (Spinocerebelarnu ataksiju tipa 17). Primeri poremećaja koji nisu poliQ tipa, a koji mogu biti identifikovani predmetnim postupkom obuhvataju FRAXA (Fragilni X sindrom), FXTAS (Sindrom fragilnog-X-a udružen sa tremorom/ataksijom), FRAXE (Fragilni XE sindrom sa mentalnom retardacijom), FRDA (Fridrihovu ataksiju), DM (Miotoničnu distrofiju), SCA8 (Spinocerebelarnu ataksiju tipa 8), SCA12 (Spinocerebelarnu ataksiju tipa 12).
[0198] Pored uloge CNV u kanceru, pokazana je veza CNV sa rastućim brojem uobičajenih složenih oboljenja, uključujući oboljenja prouzrokovana virusom humane imunodeficijencije (HIV), autoimuna oboljenja i spektar neuropsihijatrijskih poremećaja.
[0199] Do danas, brojne studije su prijavile vezu između CNV u genima uklјučenim u inflamaciju i imunološki odgovor sa HIV infekcijom, astmom, Kronovom bolešću i drugim autoimunim poremećajima (Fanciulli i saradnici, Clin Genet 77:201-213 [2010]). Na primer, pokazano je da je CNV u CCL3L1 uklјučen u podložnost HIV infekciji/SIDI (CCL3L1, delecija 17q11.2), reumatoidnom artritisu (CCL3L1, delecija 17q11.2) i Kavasaki bolesti (CCL3L1, duplikacija 17q11.2); prijavljeno je da CNV u HBD-2 povećeva podložnost Kronovoj bolesti kolona (HDB-2, delecija 8p23.1) i psorijazi (HDB-2, delecija 8p23.1); za CNV u FCGR3B je pokazano da povećava predispoziciju za glomerulonefritis u sistemskom eritemskom lupusu (FCGR3B, delecija 1q23, duplikacija 1q23), vaskularitis asociran sa anti-neutrofilnim citoplazmitskim antitelom (ANCA) (FCGR3B, delecija 1q23) i da povećava rizik razvoja reumatoidnog artritisa. Postoje najmanje dva inflamatorna ili autoimuna oboljenja za koja je pokazano da asociraju sa CNV u različitim genskim lokusima. Na primer, Kronova bolest asocira sa niskim brojem kopija HDB-2, ali i sa uobičajenim polimorfizmon tipa delecije uzvodno od IGRM gena koji kodira p47 člana familije GTPaza povezanih sa imunitetom. Pored asocijacije sa brojem kopija FCGR3B, takođe je prijavlјeno da je značajno povećana podložnost na SLE među subjektima sa nižim brojem kopija komponente sistema komplemenata C4.
[0200] Veze genomskih delecija u lokusima GSTM1 (GSTM1, delecija 1q23) i GSTT1 (GSTT1, delecija 22q11.2) sa povećanim rizikom za atopijsku astmu su prijavlјene u nekoliko nezavisnih studija. U pojedinim primerima izvođenja, predmetni postupak može biti upotrebljen za utvrđivanje prisustva ili odsustva CNV koji su povezni sa inflamacijom i/ili autoimunim obolјenjima. Na primer, predmetni postupak može biti upotrebljen za utvrđivanje prisustva CNV kod pacijenta za koga se sumnja da boluje od HIV infekcije, astme ili Kronove bolesti. Primeri CNV-ova koji asociraju sa takvim obolјenjima obuhvataju, bez ograničavanja samo na njih, delecije na 17q11.2, 8p23.1, 1q23 i 22q11.2, kao i duplikacije na 17q11.2 i 1q23. U pojedinim primerima izvođenja, predmetni postupak može biti upotrebljen za utvrđivanje prisustva CNV u genima, uključujući, ali ne ograničavajući se samo na, CCL3L1, HBD-2, FCGR3B, GSTM, GSTT1, C4 i IRGM.
[0201] Veze de novo i naslednih CNV sa nekoliko čestih neuroloških i psihijatrijskih oboljenja su prijavlјene kod autizma, šizofrenije i epilepsije, kao i kod nekih slučajeva neurodegenerativnih oboljenja kao što su Parkinsonova bolest, amiotrofična lateralna skleroza (ALS) i autozomnodominantna Alchajmerova bolest (Fanciulli i saradnici, Clin Genet 77: 201-213 [2010]). Citogenetičke abnormalnosti uočene kod pacijenata sa autizmom i poremećajima iz spektra autizma (ASD) predstavljaju duplikacije u 15q11-q13. Prema konzorcijumu projekta za analizu genoma kod autizma (Autism Genome project), sa ASD se preklapa 154 CNV, uključujući nekoliko ponavljajućih (rekurentnih) CNV-ova, bilo na hromozomu 15q11-q13 ili na novim genomskim lokacijama koje obuhvataju hromozome 2p16, 1q21, kao i 17p12, a u regionu koji je povezan sa Smit-Magenisovim sindromom. Rekurentne mikrodelecije ili mikroduplikacije na hromozomu 16p11.2 su naglasile ono što je uočeno, da su de novo CNV-ovi detektovani u lokusima za gene kao što su SHANK3 (delecija 22q13.3), neureksin 1 (NRXN1, delecija 2p16.3) i neuroglini (NLGN4, delecija Xp22.33), za koje je poznato da regulišu sinaptičku diferencijaciju, kao i oslobađanje glutamina kao neurotransmitera. Šizofrenija je takođe povezana sa višestrukim de novo CNV. Mikrodelecije i mikroduplikacije koje asociraju sa šizofrenijom sadrže prekomerno zastuplјene gene koji pripadaju putevima razvoja nervnog sisitema i glutamatergičkog sistema, što zapravo ukazuje da višestruki CNV koji deluju na ove gene mogu direktno doprineti patogenezi šizofrenije. Navedeni geni su npr. ERBB4, delecija 2q34, SLC1A3, delecija 5p13.3; RAPEGF4, delecija 2q31.1; CIT, delecija 12.24; i višestruki geni sa de novo CNV-ovima. CNV-ovi su takođe povezani sa drugim neurološkim poremećajima, uključujući epilepsiju (CHRNK7, delecija 15q13.3), Parkinsonovu bolest (SNCA, duplikacija 4q22) i ALS (SMN1, delecija 5q12.2-q13.3; i delecija SMN2). U pojedinim primerima izvođenja, predmetni postupak može biti upotrebljen za utvrđivanje prisustva ili odsustva CNV asociranog sa bolestima nervnog sistema. Na primer, predmetni postupak može biti upotrebljen za utvrđivanje prisustva CNV kod pacijenta za koje se sumnja da boluju od autizma, šizofrenije, epilepsije, neurodegenerativnih bolesti kao što su Parkinsonova bolest, amiotrofična lateralna skleroza (ALS) ili autozomno-dominantna Alchajmerova bolest. Predmetni postupak može biti upotrebljen za određivanje CNV gena povezanih sa drugim bolestima nervnog sistema, uključujući, bez ograničavanja, bilo koji od poremećaja iz spektra autizma (ASD), kao i šizofreniju i epilepsiju ili pak CNV gena koji su povezani sa neurodegenerativnim poremećajima poput Parkinsonove bolesti. Primeri CNV koji asociraju sa navedenim obolјenjima obuhvataju, bez ograničavanja, duplikacije na 15q11-q13, 2p16, 1q21, 17p12, 16p11.2 i 4q22, kao i delecije u okviru 22q13.3, 2p16.3, Xp22.33, 2q34, Sp13.3, 2q31.1, 12.24, 15q13.3 i 5q12.2. U pojedinim primerima izvođenja, predmetni postupak može biti upotrebljen za utvrđivanje prisustva CNV u genima koji obuhvataju, bez ograničavanja samo na njih, SHANK3, NLGN4, NRXN1, ERBB4, SLC1A3, RAPGEF4, CIT, CHRNK7, SNCA, SMN1 i SMN2.
[0202] Povezanosti metaboličkih i kardiovaskularnih karakteristik, kao što su one u familijarnoj hiperholesterolemiji (FH), aterosklerozi i bolesti koronarnih arterija, sa CNV-ovima, prijavlјene su u brojnim studijama (Fanciulli i saradnici, Clin Genet 77: 201-213 [2010]). Na primer, rearanžmani u germinativnim ćelijama, uglavnom delecije, uočene su u LDLR genu (LDLR, delecija/duplikacija 19p13.2) kod nekih bolesnika sa FH kod kojih nisu prisutne druge mutacije u LDLR. Drugi primer je LPA gen koji kodira apolipoprotein(a) (apo(a)) čija koncentracija u plazmi asocira sa rizikom za nastanak obolјenja koronarnih arterija, infarkt miokarda (MI) i moždani udar. Koncentracije apo(a) u plazmi, koji sadrži lipoprotein Lp(a), varira preko 1000 puta između pojedinaca, a 90% ovih varijabilnosti je genetički determinisano LPA lokusom, pri čemu su koncentracija u plazmi i veličina Lp(a) izoforme proporcionalni visoko varjabilnom broju 'kringle 4' ponavljajućih sekvenci (opseg 5-50). Ovi podaci ukazuju da CNV u najmanje dva gena može asocirati sa kardiovaskularnim rizikom. Predmetni postupak može biti upotrebljen u velikim studijama za specifično pretraživanje povezanosti CNV sa
4
kardiovaskularnim poremećajima. U pojedinim primerima izvođenja, predmetni postupak može biti upotrebljen za utvrđivanje prisustva ili odsustva CNV-ova koji asociraju sa metaboličkim ili kardiovaskularnim oboljenjem. Na primer, predmetni postupak može biti upotrebljen za utvrđivanje prisustva CNV kod pacijenta za koji se sumnja da boluje od familijarne hiperholesterolemije. Predmetni postupak može biti upotrebljen za određivanje CNV u genima koji asociraju sa metaboličkim ili kardiovaskularnim oboljenjem, npr. hiperholesterolemijom. Primeri CNV-ova koji asociraju sa takvim oboljenjim obuhvataju, bez ograničavanja samo na njih, deleciju/duplikaciju LDLR gena u 19p13.2 i multiplikacije u LPA genu.
SEKVENCIRANJE
[0203] U raznim primerima izvođenja, postupak koji je ovde opisan upotrebljava tehnologiju sekvenciranja sledeće generacije (NGS) u kojoj se klonalno amplifikovane DNK matrice ili pojedinačni molekuli DNK sekvenciraju u velikim količinama i istovremeno, unutar protočne ćelije (npr. kao što je opisano u Volkerding i saradnici, ClinChem 55:641-658 [2009]; Metzker M, Nature Rev 11:31-46 [2010]). Pored velikog obima informacija o sekvencama, NGS obezbeđuje digitalne kvantitativne podatke, u kojima je svako očitavanje sekvence predstavljeno kao “markerska sekvenca” koja se može izbrojati i zapravo predstavlja pojedinačne klonalne DNK matrice ili jedan molekul DNK. Tehnologije NGS sekvenciranja podrazumeva pirosekvenciranje, “sekvenciranje-po-sintezi”, upotrebom reverzibilno obojenih markera krajeva, “sekvenciranje-po-ligaciji oligonukleotidnih proba” i sekvenciranje u realnom vremenu.
[0204] U raznim primerima izvođenja, mogu se analizirati uzorci koji nisu amplifikovani ili su samo delimično amplifikovani (cilјana amplifikacija). U pojedinim slučajevima, postupci utvrđivanja fetalne frakcije mogu biti postignuti bez potrebe za bilo kakvom vrstom cilјane amplifikacije.
[0205] Amplifikacija celokupnog genoma koja se vrši kao deo procesa sekvenciranja obezbeđuje dovolјno kopija kojima se može pokriti region, povećanjem broja ciklusa sekvenciranja, a da bi se obezbedila bolјa prepokrivenost.
[0206] U poželjnim primerima izvođenja, uzorak koji sadrži smešu molekula DNK dobijenih iz dva različita genoma nije specifično obogaćen materijalom za sekvenciranje celokupne genomske sekvence pre sekvenciranja celokupnog genoma, tj. amplifikacija čitavog genoma se vrši pre sekvenciranja.
[0207] Nespecifično obogaćivanje uzorka DNK se može odnositi na amplifikaciju celokupnog genoma i time genomskih DNK fragmenata uzorka, koji dalje mogu biti upotrebljeni da bi se povećao nivo uzorka DNK pre identifikacije polimorfizama sekvenciranjem. Nespecifično obogaćivanje može predstavljati selektivno obogaćivanje jednog od dva genoma prisutnih u uzorku. Na primer, nespecifično obogaćivanje može biti selektivno za fetalni genom u uzorku majke, a koje može biti obavljeno poznatim postupcima za povećanje relativne proporcije fetalne u odnosu na DNK majke u uzorku. Alternativno, nespecifično obogaćivanje može biti tipa neselektivne amplifikacije oba genoma koji su prisutni u uzorku. Na primer, nespecifična amplifikacija može označavati amplifikaciju fetalne i DNK majke u uzorku koji sadrži smešu DNK genoma fetusa i majke. Postupci za amplifikaciju čitavog genoma su poznati u oblasti tehnike. Degenerativni PCR sa oligonukleoitidnim probama (DOP), PCR tehnike ekstenzije prajmera (PEP) i višestruka amplifikacija izmeštanjem (MDA) su primeri postupaka amplifikacije celokupnog genoma. U pojedinim primerima izvođenja, uzorak koji sadrži smešu cfDNK iz različitih genoma nije obogaćen sa cfDNK onih genoma koji su prisutni u smeši. U drugim primerima
4
izvođenja, uzorak koji sadrži smešu cfDNK iz različitih genoma je nespecifično obogaćen sa bilo kojim od genoma koji su prisutni u uzorku.
[0208] U drugim primerima izvođenja, cfDNK u uzorku je specifično obogaćena. Specifično obogaćivanje se odnosi na obogaćivanje genomskog uzorka specifičnim sekvencama, npr. polimorfnom ciljnom sekvencom, pri čemu se sekvence biraju za amplifikaciju pre sekvenciranja uzorka DNK. Ipak, prednost opisanih primera izvođenja je u tome što cilјana amplifikacija nije potrebna. Polimorfna
[0209] Pojedine od tehnologija sekvenciranja su komercijalno dostupne, kao što su to platforma za sekvenciranje-po-hibridizaciji kompanije Affymetrix Inc. (Sunnivale, CA), platforme za sekvenciranjepo-sintezi firmi 454 Life Sciences (Bradford, CT), Illumina/Solexa (Hayward, CA) i Helicos Biosciences (Cambridge, MA) i platforma za sekvenciranje-po-ligaciji firme Applied Biosistems (Foster City, CA), kao što je opisano u nastavku teksta. Pored sekvenciranja pojedinačnog molekula koje se obavlja sekvenciranjem-po-sintezi na platform firme Helicos Biosciences, druge tehnologije sekvenciranja pojedinačnih molekula su obuhvaćene opisanim postupkom i uključuju SMRT™ tehnologiju firme Pacific Biosciences, Jonsku Torrent™ tehnologiju i sekvenciranje na nanoporama koje trenutno razvija, na primer, firma Oxford Nanopore Technologies.
[0210] Iako se automatizovani Sangerov postupak smatra tehnologijom "prve generacije", sekvenciranje po Sanger-u, uključujući automatizovano sekvenciranje po Sanger-u, takođe može biti upotrebljeno u okviru opisanog postupka. Dodatni postupci sekvenciranja koji obuhvataju upotrebu tehnologija snimanja nukleinskih kiselina i koji se još razvijaju, npr. mikroskopija atomskih sila (AFM) ili transmisiona elektronska mikroskopija (TEM), takođe su obuhvaćeni opisanim postupkom. Primeri tehnologija sekvenciranja su opisani u nastavku teksta.
[0211] U jednom primeru izvođenja, tehnologija DNK sekvenciranja koja se upotrebljava u opisanim postupcima je tipa Helicos True sekvenciranja pojedinačnog molekula (tSMS) (npr. kao što je opisano u Harris T.D. i saradnici, Science 320:106-109 [2008]). U tSMS tehnici, uzorak DNK se kida na lance dužine od približno 100 do 200 nukleotida, nakon čega se na 3' kraj svakog DNK lanca dodaje poliA sekvenca. Svaki lanac se obleležava dodavanjem fluorescentno obeleženog adenozinskog nukleotida. DNK lanci se podvrgavaju hibridizaciji u protočnoj ćeliji uređaja, koja sadrži milione mesta na svojoj površini za koje je vezana oligo-T proba. Matrice mogu biti sa gustinom od oko 100 miliona matrica/cm<2>. Protočna ćelija se zatim stavlja unutar instrumenta, npr. HeliScope™ sekvencera, gde laser osvetlјava površinu protočne ćelije, čime se utvrđuje pozicija svake matrice. CCD kamera može mapirati položaj matrice na površini protočne ćelije. Fluorescentni obeleživač na matrici se zatim skida sa matrice i uklanja ispiranjem. Reakcija sekvenciranja počinje uvođenjem DNK polimeraze i fluorescentno obeleženih nukleotida. Oligo-T nukleinska kiselina služi kao prajmer. Polimeraza ugrađuje obeležene nukleotide u nastavku prajmera, shodno matrici. Zatim se uklanjaju polimeraza i neugrađeni nukleotidi. Matrice koje su usmeravale redosled ugrađivanja fluorescentno obeleženih nukleotida bivaju detektovane putem snimanja površine protočne ćelije. Nakon snimanja, fluorescentni obeleživač se uklanja korakom cepanja, pa se proces ponavlja sa drugim fluorescentno obeleženim nukleotidima, dok se ne postigne željena dužina očitavanja. Podaci o sekvenci se prikupljaju za svaki korak dodavanja nukleotida. Sekvenciranje celokupnog genoma tehnologijom sekvenciranja pojedinačnog molekula isključuje amlifikaciju zasnovanu na PCR-u u pripremi biblioteka
4
za sekvenciranje, a direktna priprema uzorka omogućava direktno merenje uzorka, a ne merenje kopija tog uzorka.
[0212] U jednom primeru izvođenja, tehnologija DNK sekvenciranja koja se upotrebljava u opisanim postupcima je sekvenciranje tipa 454 (Roche) (npr. kao što je opisano u publikaciji Margulies M. i saradnici, Nature 437:376-380 (2005)).454 sekvenciranje podrazumeva dva koraka. U prvom koraku, DNK se kida na fragmente dužine od po približno 300-800 baznih parova, pri čemu su fragmenti tupih krajeva. Oligonukleotidni adapteri se zatim povezuju sa krajevima fragmenata ligacijom. Adapteri služe kao prajmeri za amplifikaciju i sekvenciranje fragmenata. Fragmenti mogu biti zatim pričvršćeni za globule koja hvataju DNK, npr. globule obložene streptavidinom, upotrebom, na primer, Adaptera B koji sadrži 5'-biotin kao obeleživač. Fragmenti vezani za globule se dalje amplifikuju upotrebom PCR-a, unutar kaplјica emulzije tipa ulјe-u-vodi. Rezultat je više kopija klonalno amplifikovanih fragmenata DNK na svakoj globuli. U drugom koraku, globule se zadržavaju u bunarićima (pikolitarske zapremine). Pirosekvenciranje se vrši paralelno na svakom fragmentu DNK. Dodavanje jednog ili više nukleotida generiše svetlosni signal koji se snima pomoću CCD kamere od strane instrumenta za sekvenciranje. Jačina signala je proporcionalna broju ugrađenih nukleotida. Pirosekvenciranje upotrebljava pirofosfat (PPi) koji se oslobađa nakon dodavanja nukleotida. PPi se prevodi u ATP dejstvom ATP sulfurilaze u prisustvu adenozin 5' fosfosulfata. Luciferaza upotrebljava ATP za prevođenje luciferina u oksilciferin, a ova reakcija generiše svetlost koja se prepoznaje i analizira.
[0213] U jednom primeru izvođenja, tehnologija DNK sekvenciranja koja se upotrebljava u postupku koji je opisan je SOLiD™ tehnologija (Applied Biosystems). U SOLiD™ platformi za “sekvenciranje-poligaciji”, genomska DNK se kida na fragmente, pa se na 5' i 3' krajeve fragmenta vezuju adapteri da bi se generisala biblioteka fragmenta. Alternativno, mogu biti uvedeni interni adapteri, ligacijom adatera za 5' i 3' krajeve fragmenata, nakon čega dolazi do cirkularizacije fragmenata i digestije kružnog fragmenta, da bi se generisao interni adapter. Adapter se dalje vezuje na 5' i 3' krajeve dobijenih fragmente da bi se dobila biblioteka uparenih fragmenata. Potom se priprema populacija klonalnih globula u mikroreaktorima. Mikroreaktori sadrže globule, prajmere, matrice i PCR komponente. Nakon PCR-a, matrice se denaturišu i globule se obogaćuju da bi se izdvojila globule sa matricama koje su produžene. Matrice na selektovanim globulama se potom podvrgavaju modifikacijama 3' krajeva što omogućava vezivanje za staklenu ploču. Sekvenca može biti određena sekvencijalnom hibridizacijom i ligacijom delimično nasumičnih oligonukleotida sa centralno determinisanom bazom (ili parom baza) koji se identifikuje specifičnim fluoroforom. Nakon snimanja boje, vezani oligonukleotid se cepa i uklanja, nakon čega se proces ponavlja.
[0214] U jednom primeru izvođenja, tehnologija DNK sekvenciranja koja se upotrebljava u opisanim postupcima je tehnologija sekvenciranja pojedinačnog molekula u realnom vremenu (SMRT™) firme Pacific Biosciences. U SMRT sekvenciranju, kontinuirano ugrađivanje nukleotida obeleženih bojom se snima tokom sinteze DNK. Pojedinačni molekuli DNK polimeraze su pričvršćeni na donju površinu pojedinačnih identifikatora talasnih dužina u nultom operativnom načinu rada (ZMW identifikatori), a koji dobijaju informacije o sekvenci dok se nukleotidi za koje je vezana fosforna grupa ugrađuju u rastući lanac prajmera. ZMW je zatvorena struktura koja omogućava praćenje ugradnje pojedinačnog nukleotida od strane DNK polimeraze naspram pozadinskog signala fluorescentnih nukleotida koji brzo difunduju u i van ZMW (u mikrosekundama). Potrebno je nekoliko milisekundi da se nukleotid ugradi u rastući lanac. Tokom ovog vremena, fluorescentni obeleživač se ekscitira i proizvodi fluorescentni
4
signal, a fluorescentni obeleživač se zatim odvaja cepanjem. Identifikacija odgovarajuće fluorescencije boje ukazuje na bazu koja je ugrađena. Proces se ponavlјa.
[0215] U jednom primeru izvođenja, tehnologija DNK sekvenciranja koja se upotrebljava u opisanim postupcima je sekvenciranje na nanoporama (npr. kao što je opisano u Soni GV i Meller A., ClinChem 53:1996-2001 [2007]). Tehnike analize sekvenciranja DNK na nanoporama su industrijski razvijene od strane brojnih kompanija, uključujući Oxford Nanopore Technologies (Oxford, Velika Britanija). Sekvenciranje na nanoporama je tehnologija sekvenciranja pojedinačnog molekula, pri čemu se pojedinačni molekul DNK sekvencira direktno prilikom prolaska kroz nanopore. Nanopore predstavljaju male otvore, prečnika reda veličine 1 nanometra. Uranjanje nanopore u provodlјivu tečnost i primena potencijala (napona) duž tečnosti, dovodi do stvaranja slabe električne struje useld provođenja jona kroz nanopore. Količina struje koja prolazi je osetlјiva na veličinu i oblik nanopore. Kako molekul DNK prolazi kroz nanopore, svaki nukleotid na molekulu DNK menja veličinu nanopore u različitom stepenu, čime se menja i red veličine struje koja prolazi kroz nanopore u različitim stepenima. Ova promena u struji prilikom prolaska molekula DNK kroz nanopore predstavlјa stoga očitavanje DNK sekvence.
[0216] U jednom primeru izvođenja, tehnologija DNK sekvenciranja koja se upotrebljava u opisanim postupcima podrazumeva ploču sa efektom tranzistora hemijski osetljivog polja (chemFET) (npr. kao što je opisano u SAD patentnoj publikaciji br.2009/0026082, podnetoj 17. decembra 2007. godine). U jednom primeru tehnike, molekuli DNK mogu biti postavlјeni u reakcione komore, a molekuli matrice mogu biti hibridizovani sa prajmerima za sekvenciranje koji su vezani za polimerazu. Ugradnja jednog ili više trifosfata u novi lanac nukleinske kiseline na 3' kraju prajmera za sekvenciranje može biti prepoznato usled promene struje u chemFET. Ploča može imati više chemFET senzora. U drugom primeru, pojedinačne nukleinske kiseline mogu biti pričvršćene za globule na kojima nukleinske kiseline mogu biti i amplifikovane, nakon čega pojedinačna globule mogu biti prebačena u pojedinačne reakcione komore na chemFET ploči, a DNK sekvencirana, pri čemu svaka komora ima chemFET senzor.
[0217] U jednom primeru izvođenja, tehnologija DNK sekvenciranja koja se upotrebljava u opisanim postupcima je Halcyon-ov molekulski postupak koji upotrebljava transmisionu elektronsku mikroskopiju (TEM). Postupak, nazvan “Brzi nanotransfer pozicije individualnog molekula” (IMPRNT od engl. Individual Molecule Placement Rapid Nano Transfer), podrazumeva upotrebu rezolucije na nivou pojedinačnog atoma prilikom snimanja na transmisionom elektronskom mikroskopu DNK sa velikom molekulskom težinom (150kb ili veće) obeleženu atomima velike težine kao markerima, kao i raspoređivanje ovih molekula u okviru ultra tankih filmova sa ultra gustim paralelno postavljenim pločama sa konzistentnim razmakom između baza (razmak između lanaca je 3nm). Za slikanje molekula na filmovima se upotrebljava elektronski mikroskop, da bi se odredila pozicija teškog atomskog markera i da bi se izdvojile informacija o sekvenci baza u okviru DNK. Postupak je dalјe opisan u PCT patentnoj publikaciji WO 2009/046445. Postupak dozvolјava sekvenciranje kompletnih humanih genoma za manje od deset minuta.
[0218] U jednom primeru izvođenja, tehnologija sekvenciranja DNK je tipa Jonskog Torrent sekvenciranja pojedinačnih molekula, koja uparuje tehnologiju poluprovodnika sa jednostavnim hemijskim tipom sekvenciranja da bi se hemijski kodirana informacija (A, C, G, T) direktno prevela u digitalnu informaciju (0, 1) u okviru poluprovodničkog čipa. U prirodi, kada se nukleotid ugrađuje u lanac DNK dejstvom polimeraze, oslobađa se jon vodonika kao sporedni proizvod. Jonska Torrent
4
tehnologija upotrebljava ploče visoke gustine bunarića koji funkcionišu kao mikro mašine, a da bi se sproveo navedeni biohemijski proces u velikom obimu i uporedo. Svaki bunarić sadrži različite DNK molekule. Ispod bunarića se nalazi sloj osetljiv na dejstvo jona, a ispod njega se nalazi jonski senzor. Kada se nukleotid, na primer C, ugradi u DNK matricu i dalje ugradi u lanac DNK, oslobađa se jon vodonika. Naelektrisanje ovog jona menja pH rastvora, što se može identifikovati pomoću jonskog senzora tipa Jonskog Torrent-a. Sekvencer - u suštini najmanji pHmetar na svetu za čvrste supstance – imenuje bazu i time direktno prevodi hemijsku informaciju u digitalnu. Sekvencer tipa tzv. jonske personalne genomske mašine (PGM™) dalje sekvencijalno preliva čip jednim za drugim nukleotidom. Ukoliko sledeći nukleotid koji poplavi čip ne bude ugrađen pošto nema par, neće biti snimljena promena u voltaži i baza neće biti imenovana. Ukoliko postoje dve identične baze u DNK lancu, napon će se udvostručiti i čip će snimiti i imenovati dve identične baze. Direktna identifikacija omogućava snimanje ugradnje nukleotida u sekundama.
[0219] U pojedinim primerima izvođenja, postupci koriste PCR ili srodnu tehniku za amplifikaciju uzoraka nukleotidnih sekvenci pre nego identifikacije ili mapiranja. Ipak, algoritamske tehnike koje su ovde opisane uglavnom ne zahtevaju amplifikaciju, posebno cilјanu amplifikaciju polimorfizama koji se dalje upotrebljavaju za procenu genomske frakcije.
[0220] Određeni primeri izvođenja koriste digitalni PCR i sekvenciranje po hibridizaciji. Digitalna lančana reakcija polimeraze (digitalni PCR ili dPCR) može biti upotrebljen za direktno identifikovanje i kvantifikovanje nukleinskih kiselina u uzorku. Digitalni PCR može biti izveden u emulziji. Pojedinačne nukleinske kiseline se razdvajaju, npr. u mikrofluidnom komornom uređaju, a svaka nukleinska kiselina se pojedinačno amplifikuje PCR-om. Nukleinske kiseline mogu biti razdvojene tako da je u proseku oko 0,5 nukleinskih kiselina/bunariću, ili ne više od jedne nukleinske kiseline/bunariću. Da bi se razlikovali fetalni aleli i aleli od majke, mogu biti upotrebljene različite probe. Aleli mogu biti numerisani da bi se odredio broj kopija. U “sekvenciranju-po-hibridizaciji”, hibridizacija podrazumeva dovođenje u kontakt mnoštva polinukleotidnih sekvenci sa mnoštvom polinukleotidnih proba, pri čemu svaka od mnoštva polinukleotidnih proba može opciono biti čvrsto vezana za podlogu. Podloga može biti ravna površina koja na ploči sadrži niz poznatih nukleotidnih sekvenci. Obrazac hibridizacije u okviru ploče može biti upotrebljen za utvrđivanje polinukleotidnih sekvenci koje su prisutne u uzorku. U drugim primerima izvođenja, svaka proba je čvrsto vezana za kuglicu/globulu, npr. namagnetisanu globulu ili slično. Hibridizacija za globule može biti identifikovana i upotrebljena za identifikaciju mnoštva polinukleotidnih sekvenci unutar uzorka.
[0221] U jednom primeru izvođenja, postupak upotrebljava masivno, uporedno sekvenciranje miliona fragmenata DNK, upotrebom hemije za “sekvenciranje-po-sintezi” i za “sekvenciranje zanovano na reverzibilnom vezivanju obeleživača krajeva” firme Illumina (npr. kao što je opisano u Bentley i saradnici, Nature 6:53-59 [2009]). DNK matrica može predstavljati genomsku DNK, npr. cfDNK. U pojedinim primerima izvođenja, kao matrica se koristi genomska DNK iz izolovanih ćelija koja se fragmentacijom cepa na fragmente dužine od nekoliko stotina baznih parova. U drugim primerima izvođenja, kao matrica se upotrebljava cfDNK, a fragmentacija nije potrebna pošto cfDNK i postoji u vidu kratkih fragmenata. Na primer, fetalna cfDNK cirkuliše u krvotoku u vidu fragmenata <300 bp, a procenjuje se da se cfDNK majke u cirkulaciji nalazi u vidu fragmenata veličine između oko 0,5 i 1 Kb (Li i saradnici, ClinChem, 50: 1002-1011 (2004)). Illumina tehnologija sekvenciranja se oslanja se na vezivanje fragmentisane genomske DNK na planarnu, optički providnu površinu za kojoj su vezane strukture za usidravanje oligonukleotida. Krajevi DNK matrica se zatim “popravlјaju” kako bi se generisali tupi krajevi koji su 5'-fosforilisani, nakon čega se upotrebljava polimerazna aktivnost Klenovog fragmenta za dodavanje jedne A baze na 3' kraj tupih, fosforilisanih DNK fragmenata. Ovakavo dodavanje priprema fragmente DNK za ligaciju oligonukleotidnih adaptera koji imaju jednu T bazu viška na svom 3' kraju, a da bi se povećala efikasnost ligacije. Adapterni oligonukleotidi su komplementarni mestima usidravanja u protočnoj ćeliji. U uslovima ograničenog razblaženja, u protočnu ćeliju se dodaju jednolančane matrice DNK modifikovane sa adapterima koje zatim postaju imobilisane usled vezivanja za mesta usidravanja. Vezani DNK fragmenti se produžavaju i dalje amplifikuju u okviru tzv. stuktura mosta da bi se dobila protočna ćelija gusto napakovana stotinama miliona klastera sekvenci, od kojih svaki sadrži -1.000 kopija iste matrice. U jednom primeru izvođenja, nasumično fragmentisana genomska DNK npr. cfDNK, se amplifikuje PCR-om pre nego što se podvrgava amplifikaciji u okviru klastera. Alternativno se upotrebljava preparat genomske biblioteke bez amplifikacije, a nasumično fragmentisana genomska DNK, npr. cfDNK se obogaćuje amplifikacijom samo u okviru klastera (Kozarewa i saradnici, Nature Methods 6:291-295 [2009]). Matrice se sekvenciraju uptrebom robusne tehnologije “sekvenciranja-po-sintezi” DNK u četiri boje, koja zapravo koristi reverzibilno vezivanje proba sa fluorescentnim bojama za krajeve, pri čemu se boje mogu lako ukloniti. Identifikacija fluorescencije velike osetlјivosti se postiže upotrebom laserske ekscitacije i optike za ukupnu internu refleksiju. Očitavanja kratkih sekvenci od oko 20-40 bp, npr. od 36 bp, se poravnavaju sa referentnim genomom u kome su maskirani ponovci i genetičke razlike se imenuju upotrebom specifično razvijenih kompjuterskih programa za analizu podataka. Nakon završetka prvog očitavanja, matrice mogu biti regenerisane in situ da bi se omogućilo drugo očitavanje sa suprotnih krajeva fragmenata. Prema tome, u postupku se upotrebljava bilo sekvenciranje sa jednog kraja ili sa parnih krajeva DNK fragmenata. Dalje se sprovodi delimično sekvenciranje fragmenta DNK koji su prisutni u uzorku i broje se markerske sekvence koje sadrže očitavanja unapred određene dužine, npr. od 36 bp, koje su mapirane u okviru poznatog referentnog genoma.
[0222] Dužina očitavanja sekvence zavisi od određene tehnologije sekvenciranja. NGS postupci obezbeđuju sekvence očitavanja koje variraju u veličini od desetina do stotina baznih parova. U pojedinim primerima izvođenja postupka koji je ovde opisan, sekvence očitavanja su oko 20bp, oko 25bp, oko 30bp, oko 35bp, oko 40bp, oko 45bp, oko 50bp, oko 55bp, oko 60bp, oko 65bp, oko 70bp, oko 75 bp, oko 80bp, oko 85bp, oko 90bp, oko 95bp, oko 100bp, oko 110bp, oko 120bp, oko 130, oko 140bp, oko 150bp, oko 200bp, oko 250bp, oko 300bp, oko 350bp, oko 400bp, oko 450bp ili oko 500bp. Očekuje se da će tehnološki napredak omogućiti da očitavanja sa jednog kraja budu veća od 500bp što bi dalje omogućilo da očitavanje budu veća od 1000bp prilikom generisanja očitavanja sa suprotnih krajeva. U jednom primeru izvođenja, sekvence očitavanja su od 36bp. Drugi postupci sekvenciranja koji se mogu koristiti upotrebom opisanih postupaka obuhvataju postupke pojedinačnog molekulskog sekvenciranja koji mogu sekvencirati molekule nukleinskih kiselina >5000 bp. Količina sekvenci velikog obima koja se dobija kao rezultat, prenosi se zatim kroz poseban kanal za analizu koji transformiše primarno očitavanje slike u okviru sekvencera, u nizove baze. Paket integrisanih algoritama vrši osnovne primarne korake transformacije podataka: analizu slike, procenu intenziteta, imenovanje baza i poravnavanje.
MAPIRANJE
[0223] Razni računarski postupci mogu biti upotrebljeni za mapiranje svake identifikovane sekvence u binove kao podskupe za analizu, npr. identifikacijom svih sekvenci u uzorku koji mapiraju u okviru određenog gena, hromozoma, alela ili druge strukture. Za poravnavanje sekvenci postoje brojni
1
kompjuterski algoritmi, uključujući, bez ograničavanja samo na njih, BLAST (Altschul i saradnici, 1990), BLITZ (MPsrch) (Sturrock i Collins, 1993), FASTA (Person i Lipman, 1988), BOWTIE (Langmead i saradnici, Genome Biology 10:R25.1-R25.10 [2009]) ili ELAND (Illumina, Inc., San Dijego, Kalifornija, SAD). U pojedinim primerima izvođenja, sekvence binova se pronalaze u bazama podataka nukleinskih kiselina koje su poznate u oblasti tehnike, uključujući, bez ograničavanja samo na, GenBank, dbEST, dbSTS, EMBL (the European Molecular Biology Laboratory) i DDBJ (DNK baza podataka Japana). BLAST ili slični alati mogu biti upotrebljeni za pretraživanje identifikovanih sekvenci u okviru baza podataka sekvenci, a pogoci pretrage mogu biti upotrebljeni za sortiranje identifikovanih sekvenci u odgovarajuće binove.
APARATURA
[0224] Analiza podataka sekvenciranja i dijagnoze koje se time dobijaju, uobičajeno se obavljaju upotrebom računarskog hardvera koji funkcioniše u skladu sa definisanim algoritmima i programima. Prema tome, u određenim primerima izvođenja se upotrebljavaju procesi koji uključuju podatke koji se čuvaju ili prenose u okvirima jednog ili više računarskih sistema ili drugih sistema obrade. Primeri izvođenja se takođe odnose na aparaturu koja izvodi ove operativne postupke. Navedena aparatura može biti posebno konstruisana za potrebnu namenu ili može predstavljati računar opšte namene (ili grupu računara) koji se selektivno aktivira ili rekonfiguriše kompjuterskim programom i/ili strukturom podataka koji se čuvaju na računaru. U pojedinim primerima izvođenja, grupa procesora obavlјa pojedine ili sve definisane analitičke operacije istovremeno (npr. računski rad preko mreže ili klauda) i/ili uporedo. Procesor ili grupa procesora za obavljanje postupaka koji su ovde opisani, mogu biti raznih tipova, uključujući mikrokontrolere i mikroprocesore kao što su uređaji koji se mogu programirati (npr. CPLD i FPGA), kao i drugi uređaji poput ASIC integralnih kola, procesora digitalnog signala i/ili mikroprocesora opšte namene.
[0225] Dodatno, određeni primeri izvođenja se odnose na prenosne i/ili neprenosne medijume koji mogu biti očitani od strane računara ili pak na proizvode kompjuterskih programa koji obuhvataju programska uputstva i/ili podatke (uključujući strukture podataka) za obavlјanje raznih operativnih postupaka koji se primenjuju u okviru računara. Primeri medijuma koji mogu biti očitani od strane računara obuhvataju, ali nisu ograničeni samo na, poluprovodničke memorijske uređaje, magnetne medijume kao što su disk jedinice, magnetna traka, optički medijumi kao što su CD-ovi, magnetnooptički medijumi i hardverski uređaji koji su posebno konfigurisani tako da čuvaju i obavljaju programskih uputstava, kao što su uređaji za trajnu memoriju (ROM) i radnu memoriju (RAM). Medijumi koji mogu biti očitani od strane računara mogu biti direktno kontrolisani od strane krajnjeg korisnika ili mogu biti indirektno kontrolisani od strane krajnjeg korisnika. Primeri direktno kontrolisanih medijuma obuhvataju medijume locirane na korisničkom postrojenju i/ili medijume koji se ne dele sa drugim entitetima. Primeri indirektno kontrolisanih medijuma su medijumi kojima korisnik može indirektno pristupiti putem spoljne internet mreže i/ili preko servisa koji obezbeđuje zajedničke resurse kao što je "klaud". Primeri programskih uputstava obuhvataju i mašinski kod, kao što je onaj proizveden od strane računara, kao i datoteke koje sadrže viši nivo koda koji računar može izvršiti upotrebom programa za tumačenje.
[0226] U jednom primeru izvođenja, opisan je kompjuterski programski proizvod za generisanje izlaznih podataka koji ukazuju na frakciju nukleinske kiseline dobijene iz definisanog genoma (kao što je fetalni) i opciono druge informacije poput prisustva ili odsustva fetalne aneuploidije u uzorku koji se
2
ispituje. Kompjuterski proizvod može sadržavati uputstva za obavlјanje bilo kog jednog ili više od prethodno opisanih postupaka, tj. za određivanje frakcije nukleinskih kiselina iz određenog organizma. Kao što je prethodno objašnjeno, kompjuterski proizvod može podrazumevati neprenosivi i/ili prenosivi medijum koji može biti očitan od strane računara, a na kome su snimljene izvršne ili kompilibilne logičke operacije za kompjuter (npr. uputstva), što zapravo omogućava procesoru da utvrdi frakciju genoma i, u pojedinim slučajevima, da li je aneuploidija ili drugo stanje prisutno ili odsutno u genomu. U jednom primeru izvođenja, kompjuterski proizvod sadrži medijum koji ne može biti očitan od strane računara, a koji sadrži snimljene izvršne ili kompilibilne logičke operacije za kompjuter (npr. uputstva), što zapravo omogućava procesoru da utvrdi frakciju genoma i postavi dijagnozu fetalne aneuproidije, postupak koji obuhvata: primanje procedure za primanje podataka sekvenciranja najmanje dela molekula nukleinske kiseline iz biološkog uzorka majke, gde navedeni podaci sekvenciranja obuhvataju sekvence lokusa sa jednim ili sa više polimorfizama; komjuterski asistirane logičke operativne postupke za analizu sekvenci da bi se utvrdio broj kopija alela za jedan ili više polimorfizama, i određivanje fetalne frakcije nukleinskih kiselina u biološkom uzorku majke, ali i izlaznu proceduru za generisanje izlaznih podataka koji ukazuje na fetalnu frakciju nukleinskih kiselina u uzorku.
[0227] Informacije o sekvencama iz uzorka koji se razmatra, mogu biti mapirane na osnovu polimorfizma referentnih sekvenci, kao što je to opisano. Dodatno, informacije o mapiranim sekvencama mogu biti upotrebljene za dobijanje broja kopija alela i/ili određivanje slučaja zigotnosti za polimorfizme. Takve informacije se dalje mogu upotrebiti za određivanje fetalne frakcije. U raznim primerima primene, polimorfizam referentnih sekvenci se čuva u bazi podataka kao što je, na primer, relacijska ili objektna baza podataka. Potrebno je napomenuti da nije praktično, ili u većini slučajeva čak moguće, da neovlašćena osoba obavlja bilo koju jednu ili sve od ovih računskih operacija. Na primer, mapiranje jednog očitavanja od 30 bp iz uzorka u bazi podataka referentnih sekvenci polimorfizma bi potencijalno trajalo ograničavajuće dug period bez pomoći računarskog uređaja. Naravno, problem se komplikuje time što pouzdana imenovanja često zahtevaju mapiranje hilјada (npr. najmanje oko 10.000) ili čak milion očitavanja za jedan ili više hromozoma.
[0228] U određenim primerima izvođenja, opisani postupci koriste sačuvanu listu ili drugu organizovanu kolekciju podataka koja se odnosi na referentne polimorfizme kod organizma iz koga se dobijaju proizvodi tipa sekvenci nukleinskih kiselina za analizu. Kao što je prethodno objašnjeno, sekvence iz uzorka koji se razmatra mogu biti poravnate ili na drugi način mapirane u odnosu na sačuvane polimorfizme. Pojedinačni polimorfizmi uobičajeno predstavljaju sekvence dužine koja je dovolјna da se nedvosmisleno mapiraju sekvence identifikovane u uzorku nukleinske kiseline. Polimofizmi su obično organizovani u grupama, za svaki od alelea. U raznim primerima izvođenja, referentni polimorfizmi se skladište u bazi podataka koja pored njihovih sekvenci sadrži i karakteristike polimorfizma. Ovakva kolekcija informacija o polimorfizmima može biti, na primer, sačuvana u relacionoj ili objektnoj bazi podataka.
[0229] Slika 10 ilustruje uobičajen računarski sistem koji, kada je adekvatno konfigurisan ili projektovan, može poslužiti kao aparatura za analizu predmetnog pronalaska. Računarski sistem 200 obuhvata bilo koji broj procesora 202 (takođe označenih i kao centralne procesne jedinice ili CPU-ovi) koji su spojene sa uređajima za skladištenje, uključujući primarnu memoriju 206 (obično radna memorija ili RAM) i primarnu memoriju 204 (obično trajna memorija ili ROM). CPU 202 može biti raznovrsnih tipova, uključujući mikrokontrolere i mikroprocesore kao što su uređaji koji se mogu programirati (npr. CPLD i FPGA) i uređaje koji se ne mogu programirati poput ASIC integralnih kola ili mikroprocesora opšte namene. Kao što je dobro poznato u oblasti tehnike, primarna memorija 204 radi na prenošenju podataka i uputstava na CPU, dok se primarna memorija 206 obično upotrebljava za prenos podataka i instrukcija na dvosmerni način. Oba ova primarna uređaja za skladištenje mogu uklјučivati bilo koji prikladan medijum koji može biti očitan od strane računara, kao što je prethodno opisano. Uređaj 208 za skladištenje u velikom obimu takođe je dvosmerno povezan sa CPU 202 i obezbeđuje dodatni kapacitet za skladištenje podataka, a može sadržavati i bilo koji od medijuma koji može biti očitan od strane računara koji je prethodno opisan. Uređaj za skladištenja većeg obima 208 može biti upotrebljen za čuvanje programa, podataka i sličnog, a uobičajeno je da on predstavlja sekundarni medijum za skladištenje podataka kao što je hard disk. Potrebno je napomenuti da informacije koje se zadržavaju unutar uređaja za skladištenje 208, mogu, u odgovarajućim slučajevima, biti inkorporisane na standardan način, kao deo primarne memorije 206, u vidu virtuelne memorije. Specifičaj uređaj za skladištenja velikog obima, kao što je CD-ROM 214, može takođe jednosmerno preneti podatke na CPU.
[0230] CPU 202 je takođe povezan sa komandnom tablom 210 koja se povezuje sa jednim ili sa više ulaznih/izlaznih uređaja kao što su video monitori, miševi, tastature, mikrofoni, ekrani osjetlјivi na dodir, čitači kartice, tableti, uređaji za snimanje, prepoznavanje glasa ili rukopisa ili drugi dobro poznati uređaji za unos, kao što su, naravno, drugi kompjuteri. Konačno, CPU 202 opciono može biti spojen sa spolјnim uređajem, kao što je baza podataka ili računarska ili telekomunikaciona mreža koja koristi spolјnu vezu, a što je uopšteno prikazano kao 212. Sa takvom vezom, predviđeno je da CPU može primati informacije sa mreže, ali i da može slati informacije na mrežu tokom obavlјanja koraka postupaka koji su ovde opisani.
[0231] Sekvenca ili drugi podaci mogu direknto ili indirektno biti uneti u komjuter od strane korisnika. U jednom primeru izvođenja, računarski sistem 200 je direktno povezan sa opremom za sekvenciranje koji čita i/ili analizira sekvence amplifikovanih nukleinskih kiselina. Sekvence ili druge informacije iz takve opreme se tako obezbeđuju, preko komandnog uređaja 212, u svrhu analize od strane sistema 200. Alternativno, sekvence koje obrađuje sistem 200 bivaju obezbeđene iz izvora za skladištenja sekvence kao što su baza podataka ili drugi vid repozitorijuma. Jednom kada se poveže sa uređajem za obradu 200, memorijski uređaj kao što je primarna memorija 206 ili memorijski uređaj velikog obima 208, puferiše ili barem privremeno skladišti sekvence nukleinskih kiselina. Dodatno, memorijski uređaj može sačuvati brojeve markerskih sekvenci za razne hromozome ili gene, izračunate brojeve kopija itd. Memorija takođe može služiti za skladištenje raznih rutinskih postupaka i/ili programa za analizu koji prikazuju sekvence ili mapirane podatake. Navedeni programi/rutinski postupci mogu uklјučivati programe za obavlјanje statističkih analiza itd.
[0232] U jednom primeru, korisnik pohranjuje uzorak u uređaj za sekvenciranje. Podaci se prikuplјaju i/ili analiziraju aparaturom za sekvenciranje koja je povezana sa računarom. Kompjuterski program na računaru omogućava prikuplјanje podataka i/ili analizu. Podaci mogu biti sačuvani, prikazani (preko monitora ili sličnog uređaja) i/ili poslati na drugu lokaciju. Kao što je naznačeno, računar može biti povezan preko interneta koji se koristi za prenos podataka, sa ručnim uređajem koga upotrebljava udalјeni korisnik (npr. lekar, naučnik ili analitičar). Podrazumeva se da podaci mogu biti sačuvani i/ili analizirani pre prenosa. U pojedinim primerima izvođenja, neobrađeni podaci se prikuplјaju i šalјu udalјenom korisniku (ili aparaturi) koji će analizirati i/ili čuvati podatke. Prenos se može odvijati putem interneta, ali se može obaviti i putem satelita ili druge veze. Alternativno, podaci mogu biti sačuvani
4
na medijumu koji može biti očitan od strane računara (npr. na CD-u ili poluprovodničkom memorijskom uređaju), nakon čega medijum može biti poslat krajnjem korisniku (npr. poštom). Udaljeni korisnik može biti na istoj ili na drugačijoj geografskoj lokaciji, uključujući, ali ne ograničavajući se samo na, zgradu, grad, državu, zemlјu ili kontinent.
[0233] U pojedinim primerima izvođenja, postupci pronalaska dodatno obuhvataju prikuplјanje podataka u vezi sa mnoštvom polinukleotidnih sekvenci, kao i slanje podataka na računar. Na primer, računar može biti povezan sa laboratorijskom opremom, npr. sa aparaturom za prikuplјanje uzorka, aparaturom za nukleotidnu amplifikaciju, aparaturom za sekvenciranje nukleotida ili aparaturom za hibridizaciju. Računar može zatim prikupiti primenlјive podatke prikuplјene od strane laboratorijske opreme. Podaci mogu biti sačuvani na računaru u bilo kom koraku, npr. dok se podaci prikuplјaju u realnom vremenu, pre slanja, tokom ili istovremeno sa slanjem ili nakon slanja. Podaci mogu biti sačuvani na medijumu koji može biti očitan od strane komjutera, a koji se potom mogu izvući sa računara. Podaci koji se prikuplјaju ili čuvaju mogu dalje biti preneti sa računara na udalјenu lokaciju, npr. putem lokalne mreže ili mreže širokog osega kao što je internet.
[0234] Prema jednom aspektu, opis dalјe obezbeđuje sistem koji je sposoban da obavi kvantitativnu analizu nukleotidnog sekvenciranja sa preciznošću od najmanje 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ili najmanje 99%. Nukleotidno sekvenciranje može podrazumevati sekvenciranje po Sanger-u, uporedno sekvenciranje velikog obima, hibridizaciju ili druge tehnike, kao što je ovde opisano. Sistem može sadržavati različite komponente, npr. laboratorijsku opremu i računarske sisteme, a može biti i konfigurisan tako da izvodi postupke pronalaska koji su ovde opisani.
[0235] U pojedinim primerima izvođenja, aparatura i/ili instrukcije za programiranje mogu dalјe sadržavati uputstva za automatsko snimanje informacija koje su relevantne za postupak, kao što je frakcija fetalne DNK, a opciono i prisustvo ili odsustvo fetalne hromozomske aneuploidije, u medicinski karton pacijenta koji je zapravo humani subjekat koji obezbeđuje uzorak majke koji se ispituje. Zdravstveni karton pacijenta može voditi, na primer, laboratorija, kancelarija ordinirajućeg lekara, bolnica, zdravstvena organizacija, osiguravajuće društvo ili služba internet stranice za ličnu medicinsku dokumentaciju. Dodatno, na osnovu rezultata analize koja je primenjena od strane procesora, postupak dalje može obuhvatati propisivanje, započinjanje i/ili izmenu lečenja humanog subjekta od koga je uzet uzorak majke za ispitivanje. Navedeno može podrazumevati obavljanje jednog ili više dodatnih ispitivanja ili analiza na dodatnim uzorcima koji se uzimaju od subjekta.
Primer
Fetalna frakcija predviđena na osnovu varijacija dobijenih sekvenciranjem: Slučaj 2
[0236] Da bi se prikazalo da predmetni postupak može biti upotrebljen za pouzdanu procenu fetalne frakcije u uzorku majke, kreiran je veštački uzorak "majke", a varijacije baza su identifikovane u svim lokusima hromozoma 1 i 7 da bi se predvidela frakcija genoma koji je manjeg doprinosa.
[0237] cfDNK koja je izolovana iz trudne ženske individue predstavlja smešu cfDNK majke i fetusa, sa nivoom fetalne cfDNK koji odgovara medijani od ∼ 10% ukupne cfDNK (Lo i saradnici, 2010, "Maternal Plasma DNA seqeucning reveals the genome-wide genetic and mutational profile of the fetus", Prenatal Diagnosis, 2, 1-12). Da bi se napravio veštački uzorak majke, upotrebljena je genomska DNK (gDNK) dobijena od majke i njenog sina (DNK majke i sina su označene kao NA10924 i NA10925, tim redom, The Coriell Institute for Medical Research, Camden, NJ) za kreiranje uzorka smeše genoma. Pet mikrograma svake gDNK, i majke i sina, podvrgnuta je cepanju do fragmenata od oko 200 bp, pa je određena koncentracija svakog od njih. Veštački uzorak koji je sadržavao 10% DNK sina i 90% DNK iz majke, pripremljen je tako da oponaša uzorak krvi majke, a za koji se pretpostavlja da obično sadrži 2-40% fetalne cfDNK, u zavisnosti od gestacijske starosti fetusa [Lun i saradnici, 2008, "Microfluidics digital PCR reveals a higher than expected fraction of fetal DNA in maternal plasma", Clinical Chemistry, 54, 1664-1672]. Sekvenciona biblioteka je pripremlјena upotrebom DNK veštačkog uzorka, pa je uzorak dalje podvrgnut sekvenciranju u 50 ciklusa, upotrebom protočne ćelije sa 4 trake i IlluminaHiSeq 2000 aparata. Generisano je približno 800 miliona 49-mernih očitavanja sekvenci.
[0238] Navedenih ∼800 miliona očitavanja je poravnato sa humanim referentnim genomom u kome su maskirani ponovci (hg19 build), upotrebom GSNAP algoritma (http://researchpub.gene.com/gmap/) koji omogućava jedno pogrešno preklapanje i isključuje insercije i delecije. Sekvence koje su mapirale na više lokacija u genomu su zanemarene. Sva ostala mapirana očitavanja su prebrojana kao markerske sekvence i samo su lokusi na koje je mapiralo 40 i 100 markerskih sekvenci razmatrano u daljoj analizi, tj. razmatrane su samo baze čija je prepokrivenosti iznosila 40 i 100 markerskih sekvenci.
[0239] Za svaku poziciju baze, izbrojan je broj markerskih sekvenci koje su mapirale svaku od četiri baze. Lokusi sa više od dve moguće baze su eliminisani i samo su markerske sekvence koje mapiraju monoalelske i bialelske lokuse upotrebljene za predikciju veštački kreirane fetalne frakcije. Ukupan broj markerskih sekvenci koje su mapirale svaku bazu lokusa je predstavljao prepokrivenost (D) datog lokusa. U ovako simuliranom uzorku majke, očekuje se da će doprinos češćeg alela majke (B) biti odraz 90% delova markerskih sekvenci, dok će doprinos ređeg alela sina (A) biti odraz 10% delova markerskih sekvenci.
[0240] Na Slikama 11A i B su prikazani histogrami broja zableženih varijacija baza (učestalosti) na hromozomima 1 i 7, redom, u vidu procenata ređih alela (A/D) za hromozome 1 i 7. Procenat ređeg alela je predstavljen kao procenat od ukupnog broja alela na datom lokusu. Na primer, za dati lokus za koji je zabeleženo postojanje 8 kopija ređe zastupljenog alela A i 56 kopija češćeg alela B, procenat ređeg alela je iznosio 8%. Podaci pokazuju da se najveći broj pojavljivanja (učestalosti) ređeg alela uočava kada je ređi alel prisutan sa 5%, što predstavlјa polovinu fetalne frakcije. Shodno tome, podaci su predvideli da uzorak sadrži fetalnu frakciju od 10%, što odgovara onome što je upotrebljeno za kreiranje veštačkog uzorka majke.
[0241] Slike 12A i B pokazuju distribuciju učestalosti alela duž hromozoma 1 i 7, tim redom. Oba grafika prikazuju da se maksimalan broj varijatni alela duž hromozoma javlja pri učestalosti ređeg alela od 5% i učestalosti češćeg alela od 95%. Neke od preostalih tačaka podataka predstavlјaju bialelske lokuse koji su prisutni u genomu majke, dok drugi predstavlјaju podatke šuma poreklom od same metodologije sekvenciranja. Centralni deo svakog grafika u kome varijatne alela nisu prikazane, preklapa se sa centromerama homozoma, za koje je poznato da su regioni hromozoma bogati ponovcima i u kojima markerske sekvence mapiraju više od jednog lokusa zbog čega su isklјučene iz analize. U drugim regionima, na primer, regionima koji okružuju centromere i regione koji odgovaraju telomerama, varijatni aleli su prekomerno zastuplјeni. Prekomerna zastuplјenost ovih regija se može pripisati metodologiji sekvenciranja, pri čemu se pojedini regioni sekvenciraju u većim nivoima od drugih.
[0242] Shodno navedenom, predmetni postupak može biti upotrebljen za predviđanje fetalne frakcije. Postupak je posebno koristan pošto ne zahteva identifikaciju cilјnih sekvenci, npr. SNP-ova, a svaka varijacija na bilo kojoj poziciji u okviru bilo kog hromozoma može poslužiti da se predvidi procenat fetalne frakcije.
Ostali primeri izvođenja
[0243] Iako je prethodno navedni tekst u principu opisao specifične procese i aparaturu, premetni opis karakteriše mnogo širi spektar primenjivosti. Preciznije, predmetni opis je opisan u svrhu detekcije fetalne DNK u uzorku DNK uzetom iz trudne individue, ali nije time ograničen, pošto koncepti i postupci koji su ovde predstavljeni mogu takođe biti primenjeni za druge kontekste kao što je detektovanje relativnih količina tipova DNK u uzorku sa DNK koja potiče iz dva ili više različitih genoma. Naravno, prosečno iskusni stručnjaci će uvideti i druge varijacije, modifikacije i alternative.
[0244] Na primer, iako većina primera i primena koje su ovde opisane razmatraju procenu frakcije fetalne DNK u uzorku DNK uzetom od individue koja nosi fetus, opis nije toliko ograničen. U opštijem slučaju, razni primeri izvođenja opisuju postupke za procenu relativnih količina nukleinskih iz dva različita genoma u ispitivanom uzorku koji sadrži smešu nukleinskih kiselina iz dva različita genoma, a za koje je poznato ili se sumnja da se razlikuju u količini jedne ili više sekvenci od interesa. Smeša nukleinskih kiselina se dobija iz dve ili više vrsta ćelija.
[0245] Nadalje, iako se većina primera koji su ovde predstavlјeni odnosi na uzorke uzete od trudne žene, opis nije time ograničen. Na primer, individua iz koje je obezbeđen uzorak koji će biti ispitan može biti organizam koji sadrži polinukleotidne sekvence, npr. bilјka, insekt kao što je mušica ili životinja. U pojedinim primerima izvođenja, subjekat je sisar, npr. miš, pacov, pas, majmun ili čovek. Kao što je naznačeno, subjekat može biti trudna individua. Subjekat može biti i individua sa oboljenjem kao što je kancer, ili može biti individua inficirana stranim telom kao što je mikroorganizam, npr. virus. Uzorak može sadržavati telesnu tečnost subjekta, npr. krv, plazmu, serum, sputum, plјuvačku, urin, izlučevinu, gnoj, limfu, sluz i slično. Na primer, uzorak može biti uzorak plazme majke koji sadrži smešu DNK majke i fetusa oslobođene od ćelija. U principu, opisani postupci mogu obuhvatati sekvenciranje DNK iz uzorka; mapiranje očitavanja sekvence u kontekstu polimorfizama; klasifikaciju polimorfizama na osnovu zigotnosti; i procenu frakcije DNK iz sekundarnog izvora u uzorku.
Dodatni materijal 1 - Lista sekvenci baze podataka za pretraživanje alela
[0246]
>rs560681.1|Hr.1|dužina=111|alel=A
>rs560681.2|Hr.1|dužina=111|alel=G
>rs1109037.1|Hr.2|dužina=126|alel=A
>rs1109037.2|Hr.2|dužina=126|alel=G
>rs9866013.1|Hr.3|dužina=121|alel=C
>rs9866013.2|Hr.3|dužina=121|alel=T
>rs13182883.1|Hr.5|dužina=111|alel=A
>rs13182883.2|Hr.5|dužina=111|alel=G
>rs13218440.1|Hr.6|dužina=139|alel=A
>rs13218440.2|Hr.6|dužina = 139|alel=G
>rs4606077.1|Hr.8|dužina=114|alel=C
>rs4606077.2|Hr.8|dužina=114|alel=T
>rs7041158.1|Hr.9|dužina=117|alel=C
>rs7041158.2|Hr.9|dužina=117|alel=T
>rs740598.1|Hr.10|dužina=114|alel=A
>rs740598.2|Hr.10|dužina=114|alel=G
>rs10773760.1|Hr.12|dužina=128|alel=A
>rs10773760.2|Hr.12|dužina=128|alel=G
>rs4530059.1|Hr.14|dužina=110|alel=A
>rs4530059.2|Hr.14|dužina=110|alel=G
>rs1821380.1|Hr.15|dužina=139|alel=C
>rs1821380.2|Hr.15|dužina=139|alel=G
>rs7205345.1|Hr.16|dužina=116|alel=C
>rs7205345.2|Hr.16|dužina=116|alel=G
>rs8078417.1|Hr.17|dužina=110|alel=C
>rs8078417.2|Hr.17|dužina=110|alel=T
>rs576261.1|Hr.19|dužina=114|alel=A
>rs576261.2|Hr.19|dužina=114|alel=C
>rs2567608.1|Hr.20|dužina=110|alel=A
>rs2567608.2|Hr.20|dužina=110|alel=A
>rs2073383.1|Hr.22|dužina=140|alel=C
>rs2073383.2|Hr.22|dužina=140|alel=T
LISTA SEKVENCI NUKLEOTIDA
1
2
4

Claims (9)

Patentni zahtevi
1. Postupak procene frakcije fetalne DNK u DNK dobijenoj iz telesne tečnosti trudne individue, postupak koji obuhvata:
(g) ekstrahovanje DNK iz uzorka telesne tečnosti pod uslovima koji ekstrahuju DNK i genoma majke i fetalnog genoma koji su prisutni u telesnoj tečnosti;
(h) sekvenciranje ekstrahovane DNK sa sekvencerom nukleinskih kiselina, pod uslovima koji proizvode sekvence DNK segmenta koje sadrže jedan ili više polimorfizama;
(i) poravnavanje, ili mapiranje na drugi način, sekvenci DNK segmenta izvedenih sekvenciranjem DNK iz telesne tečnosti, sa jednim ili sa više naznačenih polimorfizama na referentnoj sekvenci, pri čemu se mapiranje izvodi upotrebom računarske aparature koja je programirana da mapira sekvence nukleinskih kiselina u kontekstu jednog ili više od naznačenih polimorfizama;
(j) određivanje učestalosti alela mapiranih sekvenci DNK segmenta za najmanje jedan od naznačenih polimorfizama;
(k) klasifikovanje najmanje jednog naznačenog polimorfizma, zasnovano na kombinaciji zigotnosti trudne individue i zigotnosti fetusa; i
(l) procenjivanje frakcije fetalne DNK u DNK dobijenoj iz trudne individue, upotrebom učestalosti alela određenih u (d) u kombinaciji sa klasifikacijom zigotnosti iz (e),
pri čemu se (d) - (f) izvode na jednom ili na više procesora koji rade po programskim uputstvima za određivanje, klasifikaciju i procenu; i
pri čemu klasifikovanje u (e) klasifikuje najmanje jedan naznačeni polimorfizam u jednu od sledećih kombinacija: (i) trudna individua je homozigotna i fetus je homozigotan, (ii) trudna individua je homozigotna, a fetus je heterozigotan, (iii) trudna individua je heterozigotna, a fetus je homozigotan i (iv) trudna individua je heterozigotna i fetus je heterozigotan.
2. Postupak prema patentnom zahtevu 1 koji:
(a) dodatno obuhvata uklanjanje iz razmatranja bilo kog polimorfizma koji je klasifikovan u kombinaciju (i) ili kombinaciju (iv);
(b) dodatno obuhvata filtriranje najmanje jednog naznačenog polimorfizma radi uklanjanja iz razmatranja bilo kog polimorfizma koji je sa učestalošću ređeg alela većom od definisanog praga;
(c) dodatno obuhvata filtriranje najmanje jednog naznačenog polimorfizma radi uklanjanja iz razmatranja bilo kog polimorfizma koji je sa učestalošću ređeg alela manjom od definisanog praga;
(d) pri čemu klasifikovanje najmanje jednog naznačenog polimorfizma obuhvata primenu praga na učestalost alela određenu u (d);
(e) pri čemu klasifikovanje najmanje jednog naznačenog polimorfizma obuhvata primenu podataka o učestalosti alela iz (d), dobijenih za mnoštvo polimorfizama, u model distribucije u smeši, opciono gde model distribucije u smeši koristi faktorske momente;
(f) pri čemu DNK dobijena iz telesne tečnosti trudne individue predstavlja DNK oslobođenu od ćelija, dobijenu iz plazme trudne individue;
(g) pri čemu mapiranje DNK segmenata, dobijenih iz krvi individue koja nosi fetus, obuhvata računarsko mapiranje navedenih segmenata u okviru baze podataka polimorfizama;
(h) pri čemu se sekvenciranje izvodi bez selektivnog umnožavanja bilo kod jednog ili više od naznačenih polimorfizama;
(i) dodatno obuhvata izvršavanje programskih uputstava na jednom ili na više procesora za automatsko snimanje frakcije fetalne DNK, kao što je ona procenjena u (f), u medicinsku dokumentaciju pacijenta koja se čuva na medijumu koji može biti očitan od strane računara, za trudnu individuu;
(j) dodatno obuhvata, zasnovano na proceni frakcije fetalne DNK, propisivanje, započinjanje i/ili izmenu lečenja humanog subjekta iz koga je uzet uzorak majke za ispitivanje;
(k) dodatno obuhvata, zasnovano na proceni frakcije fetalne DNK, naručivanje i/ili obavlјanje jednog ili više dodatnih testova; ili
(l) dodatno obuhvata primanje uzorka telesne tečnosti pre koraka (a).
3. Postupak prema patentnom zahtevu 1, koji obuhvata sekvenciranje sintezom.
4. Postupak prema patentnom zahtevu 1, koji obuhvata sekvenciranje hibridizacijom.
5. Postupak prema patentnom zahtevu 4, gde hibridizacija obuhvata ostvarivanje kontakta mnoštva polinukleotidnih sekvenci s mnoštvom polinukleotidnih proba, pri čemu je svaka od mnoštva polinukleotidnih proba čvrsto povezana sa supstratom, gde je supstrat ravna površina koja sadrži nizove poznatih nukleotidnih sekvenci.
6. Postupak prema patentnom zahtevu 5, gde se obrazac hibridizacije na čipu upotrebljava za određivanje polinukleotidnih sekvenci prisutnih u uzorku.
7. Postupak prema bilo kom od patentnih zahteva 1-6, gde je referentna sekvenca u vidu sačuvane liste ili kolekcije podataka organizovane na drugi način za razmatranje referentnih polimorfizama kod trudne individue, opciono gde referentna sekvenca predstavlja bazu podataka sekvenci, na primer, bazu podataka alelskih sekvenci.
8. Aparatura za procenu frakcije fetalne DNK u DNK dobijenoj iz telesne tečnosti trudne individue, aparatura koja sadrži:
1
(a) sekvencer, konfigurisan tako da (i) prima DNK ekstrahovanu iz uzorka telesne tečnosti koja sadrži DNK i genoma majke i fetalnog genoma i (ii) sekvencira ekstrahovanu DNK pod uslovima koji proizvode sekvence DNK segmenta koji sadrže jedan ili više od naznačenih polimorfizama; i
(b) računarsku aparaturu konfigurisanu tako da instruira jedan ili više procesora da se poravnaju, ili mapiraju sekvence nukleinskih kiselina na drugi način, u odnosu na jedan ili više od naznačenih polimorfizama iz referentne sekvence, i tako da se dalje
određuje učestalosti alela mapiranih sekvenci DNK segmenta za najmanje jedan od naznačenih polimorfizama,
klasifikuje najmanje jedan od naznačenih polimorfizama na osnovu kombinacije zigotnosti trudne individue i zigotnosti fetusa, i
procenjuje frakciju fetalne DNK u DNK dobijenoj od trudne individue, upotrebom učestalosti alela u kombinaciji sa klasifikacijom zigotnosti; a
pri čemu je računarska aparatura dodatno kofigurisana tako da instruira jedan ili više procesora da klasifikuje najmanje jedan od naznačenih polimorfizama u jednu od sledećih kombinacija: (i) trudna individua je homozigotna i fetus je homozigotan, (ii) trudna individua je homozigotna, a fetus je heterozigotan, (iii) trudna individua je heterozigotna, a fetus je homozigotan i (iv) trudna individua je heterozigotna i fetus je heterozigotan.
9. Aparatura prema patentnom zahtevu 8 koja:
(a) dodatno sadrži opremu za ekstrahovanje DNK iz uzorka pod uslovima koji ekstrahuju DNK i genoma majke i fetalnog genoma;
(b) pri čemu je računarska aparatura dodatno konfigurisana tako da instruira jedan ili više procesora da se iz razmatranja ukloni bilo koji polimorfizam koji je klasifikovan u kombinaciju (i) ili kombinaciju (iv);
(c) pri čemu je računarska aparatura dodatno konfigurisana tako da instruira jedan ili više procesora da se iz razmatranja ukloni bilo koji polimorfizam sa učestalošću ređeg alela koja je veća od definisanog praga;
(d) pri čemu je računarska aparatura dodatno konfigurisana tako da instruira jedan ili više procesora da se filtira jedan ili više od naznačenih polimorfizama radi uklanjanja iz razmatranja bilo kog polimorfizma sa učestalošću ređeg alela koja je manja od definisanog praga;
(e) pri čemu je računarska aparatura dodatno konfigurisana tako da instruira jedan ili više procesora da se klasifikuje najmanje jedan naznačeni polimorfizam primenom praga na učestalost alela;
(f) pri čemu je računarska aparatura dodatno konfigurisana tako da instruira jedan ili više procesora da se klasifikuje najmanje jedan naznačeni polimorfizam primenom podataka za
2
učestalosti alela, dobijenih za mnoštvo polimorfizama, u model distribucije u smeši, opciono gde model distribucije u smeši koristi faktorske momente;
(g) dodatno sadrži aparaturu za ekstrakciju DNK oslobođene od ćelija, koja je dobijena iz plazme trudne individue za sekvenciranje u sekvenceru;
(h) dodatno sadrži bazu podataka polimorfizama, pri čemu je računarska aparatura dodatno konfigurisana tako da instruira jedan ili više procesora da mapira DNK segmente dobijene iz krvi individue koji nosi fetus putem računarskog mapiranja navedenih segenata u okviru baze podataka polimorfizama; ili
(i) pri čemu je računarska aparatura dodatno konfigurisana tako da instruira jedan ili više procesora da automatski snima frakcije fetalne DNK u medicinsku dokumentaciju pacijenta, sačuvanu na medijumu koji može biti očitan od strane računara, za trudnu individuu, opciono gde navedenu medicinsku dokumentaciju pacijenta vodi laboratorija, kancelarija ordinirajućeg lekara, bolnica, zdravstvena organizacija, osiguravajuće drušvo ili služba internet stranice za ličnu medicinsku dokumentaciju.
RS20200985A 2011-04-12 2012-04-12 Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama RS60710B1 (sr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161474362P 2011-04-12 2011-04-12
EP18186518.9A EP3456844B1 (en) 2011-04-12 2012-04-12 Resolving genome fractions using polymorphism counts

Publications (1)

Publication Number Publication Date
RS60710B1 true RS60710B1 (sr) 2020-09-30

Family

ID=46001809

Family Applications (3)

Application Number Title Priority Date Filing Date
RS20181302A RS57837B1 (sr) 2011-04-12 2012-04-12 Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama
RS20200985A RS60710B1 (sr) 2011-04-12 2012-04-12 Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama
RS20220224A RS63008B1 (sr) 2011-04-12 2012-04-12 Rešavanje frakcija genoma koristeći brojanje polimorfizma

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RS20181302A RS57837B1 (sr) 2011-04-12 2012-04-12 Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama

Family Applications After (1)

Application Number Title Priority Date Filing Date
RS20220224A RS63008B1 (sr) 2011-04-12 2012-04-12 Rešavanje frakcija genoma koristeći brojanje polimorfizma

Country Status (20)

Country Link
US (4) US9447453B2 (sr)
EP (5) EP3456844B1 (sr)
JP (3) JP5863946B2 (sr)
CN (2) CN106319047B (sr)
AU (1) AU2012242698C1 (sr)
CA (1) CA2832468C (sr)
CY (4) CY1117574T1 (sr)
DK (4) DK3567124T3 (sr)
ES (4) ES2907069T3 (sr)
HR (3) HRP20220296T1 (sr)
HU (3) HUE041411T2 (sr)
IL (1) IL228843A (sr)
LT (3) LT3456844T (sr)
PL (4) PL3078752T3 (sr)
PT (3) PT3567124T (sr)
RS (3) RS57837B1 (sr)
SI (3) SI3456844T1 (sr)
SM (3) SMT202200090T1 (sr)
TR (1) TR201816062T4 (sr)
WO (1) WO2012142334A2 (sr)

Families Citing this family (127)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
EP2321642B1 (en) 2008-08-04 2017-01-11 Natera, Inc. Methods for allele calling and ploidy calling
WO2011041485A1 (en) 2009-09-30 2011-04-07 Gene Security Network, Inc. Methods for non-invasive prenatal ploidy calling
EP2513341B1 (en) 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
EP2370599B1 (en) 2010-01-19 2015-01-21 Verinata Health, Inc Method for determining copy number variations
US20120010085A1 (en) 2010-01-19 2012-01-12 Rava Richard P Methods for determining fraction of fetal nucleic acids in maternal samples
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
WO2011091063A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Partition defined detection methods
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
US12545960B2 (en) 2010-05-18 2026-02-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US12221653B2 (en) 2010-05-18 2025-02-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US12152275B2 (en) 2010-05-18 2024-11-26 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US10167508B2 (en) 2010-08-06 2019-01-01 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US11031095B2 (en) 2010-08-06 2021-06-08 Ariosa Diagnostics, Inc. Assay systems for determination of fetal copy number variation
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
CN103608466B (zh) 2010-12-22 2020-09-18 纳特拉公司 非侵入性产前亲子鉴定方法
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
US9994897B2 (en) 2013-03-08 2018-06-12 Ariosa Diagnostics, Inc. Non-invasive fetal sex determination
US10131947B2 (en) 2011-01-25 2018-11-20 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
US8756020B2 (en) 2011-01-25 2014-06-17 Ariosa Diagnostics, Inc. Enhanced risk probabilities using biomolecule estimations
RU2671980C2 (ru) 2011-02-09 2018-11-08 Натера, Инк. Способы неинвазивного пренатального установления плоидности
CA2827873C (en) 2011-02-24 2022-08-16 The Chinese University Of Hong Kong Molecular testing of multiple pregnancies
RS57837B1 (sr) 2011-04-12 2018-12-31 Verinata Health Inc Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
WO2014014498A1 (en) 2012-07-20 2014-01-23 Verinata Health, Inc. Detecting and classifying copy number variation in a fetal genome
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
EP2768978B1 (en) 2011-10-18 2017-11-22 Multiplicom NV Fetal chromosomal aneuploidy diagnosis
US10289800B2 (en) 2012-05-21 2019-05-14 Ariosa Diagnostics, Inc. Processes for calculating phased fetal genomic sequences
EP2875156A4 (en) 2012-07-19 2016-02-24 Ariosa Diagnostics Inc SEQUENTIAL LIGATION-BASED MULTIPLEX DETECTION OF GENETIC VARIANTS
US20140100126A1 (en) 2012-08-17 2014-04-10 Natera, Inc. Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CN111254500B (zh) 2012-12-10 2024-01-23 分析生物科学有限公司 靶向基因组分析的方法
GB201304810D0 (en) * 2013-03-15 2013-05-01 Isis Innovation Assay
WO2014151117A1 (en) 2013-03-15 2014-09-25 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
KR102665592B1 (ko) 2013-05-24 2024-05-21 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
WO2015026967A1 (en) * 2013-08-20 2015-02-26 Natera, Inc. Methods of using low fetal fraction detection
US20170132364A1 (en) * 2013-09-03 2017-05-11 Welgene Biotech Co., Ltd. Non-invasive prenatal testing method based on genome-wide normalized score
US9499870B2 (en) 2013-09-27 2016-11-22 Natera, Inc. Cell free DNA diagnostic testing standards
WO2015042649A1 (en) * 2013-09-27 2015-04-02 Murdoch Children's Research Institute A quantitative assay for target dna in a mixed sample comprising target and non-target dna
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
RU2543155C1 (ru) * 2014-02-03 2015-02-27 Закрытое акционерное общество "Геноаналитика" Способ неинвазивной диагностики анеуплоидий плода методом секвенирования
WO2015148776A1 (en) * 2014-03-27 2015-10-01 The Scripps Research Institute Systems and methods for genomic annotation and distributed variant interpretation
US12492429B2 (en) * 2014-04-21 2025-12-09 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
CA2945962C (en) 2014-04-21 2023-08-29 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US20180173846A1 (en) 2014-06-05 2018-06-21 Natera, Inc. Systems and Methods for Detection of Aneuploidy
EP3169803B1 (en) * 2014-07-18 2019-11-20 Illumina, Inc. Non-invasive prenatal diagnosis of fetal genetic condition using cellular dna and cell free dna
US11783911B2 (en) 2014-07-30 2023-10-10 Sequenom, Inc Methods and processes for non-invasive assessment of genetic variations
US20160053301A1 (en) 2014-08-22 2016-02-25 Clearfork Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna
JP7441584B6 (ja) * 2014-08-22 2024-03-15 レゾリューション バイオサイエンス, インコーポレイテッド 無細胞DNA(cfDNA)の定量的遺伝子解析のための方法
US9857328B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Chemically-sensitive field effect transistors, systems and methods for manufacturing and using the same
CA2971589C (en) 2014-12-18 2021-09-28 Edico Genome Corporation Chemically-sensitive field effect transistor
US9859394B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10020300B2 (en) 2014-12-18 2018-07-10 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10006910B2 (en) 2014-12-18 2018-06-26 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
AU2016281193B2 (en) * 2015-06-15 2022-06-16 Murdoch Childrens Research Institute Method of measuring chimerism
BE1023274A9 (nl) * 2015-07-17 2017-03-17 Multiplicom Nv Schattingswerkwijze en -systeem voor het schatten van een foetale fractie
CN115035949A (zh) * 2015-09-22 2022-09-09 香港中文大学 通过母亲血浆dna的浅深度测序准确定量胎儿dna分数
BE1022771B1 (nl) * 2015-10-14 2016-08-31 Multiplicom Nv Werkwijze en systeem om te bepalen of een vrouw zwanger is op basis van een bloedstaal
JP6913089B2 (ja) 2015-11-11 2021-08-04 レゾリューション バイオサイエンス, インコーポレイテッド Dnaライブラリーの高効率構築
CA3016077A1 (en) 2016-03-22 2017-09-28 Counsyl, Inc. Combinatorial dna screening
RU2760913C2 (ru) 2016-04-15 2021-12-01 Натера, Инк. Способы выявления рака легкого
WO2017201081A1 (en) 2016-05-16 2017-11-23 Agilome, Inc. Graphene fet devices, systems, and methods of using the same for sequencing nucleic acids
US11319594B2 (en) 2016-08-25 2022-05-03 Resolution Bioscience, Inc. Methods for the detection of genomic copy changes in DNA samples
WO2018064486A1 (en) 2016-09-29 2018-04-05 Counsyl, Inc. Noninvasive prenatal screening using dynamic iterative depth optimization
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
GB201618485D0 (en) 2016-11-02 2016-12-14 Ucl Business Plc Method of detecting tumour recurrence
IL266346B2 (en) * 2016-11-18 2024-07-01 Univ Hong Kong Chinese Universal haplotype-based noninvasive prenatal testing for single gene diseases
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
GB2559319B (en) 2016-12-23 2019-01-16 Cs Genetics Ltd Reagents and methods for the analysis of linked nucleic acids
CA3207879A1 (en) 2017-01-24 2018-08-02 Sequenom, Inc. Methods and processes for assessment of genetic variations
RU2636618C1 (ru) * 2017-02-14 2017-11-24 Федеральное государственное бюджетное учреждение "Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии имени академика В.И. Кулакова" Министерства здравоохранения Российской Федерации Способ и тест-система для определения доли плодовой ДНК в плазме крови беременной женщины с помощью методов высокопроизводительного секвенирования
US12006533B2 (en) * 2017-02-17 2024-06-11 Grail, Llc Detecting cross-contamination in sequencing data using regression techniques
WO2018156418A1 (en) 2017-02-21 2018-08-30 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
JP7370862B2 (ja) * 2017-03-17 2023-10-30 セクエノム, インコーポレイテッド 遺伝子モザイク症のための方法およびプロセス
KR102145417B1 (ko) * 2017-05-24 2020-08-19 지니너스 주식회사 무세포 핵산으로부터 수득된 서열 분석 데이터에 대한 배경 대립인자의 빈도 분포를 생성하는 방법 및 이를 이용하여 무세포 핵산으로부터 변이를 검출하는 방법
CA3067419A1 (en) * 2017-06-20 2018-12-27 Illumina, Inc. Methods and systems for decomposition and quantification of dna mixtures from multiple contributors of known or unknown genotypes
CN110770839B (zh) * 2017-06-20 2024-12-06 伊鲁米那股份有限公司 来自未知基因型贡献者的dna混合物的精确计算分解的方法
WO2019005877A1 (en) 2017-06-27 2019-01-03 Grail, Inc. CROSS CONTAMINATION DETECTION IN SEQUENCING DATA
CN108220451B (zh) * 2017-12-08 2020-10-27 北京科迅生物技术有限公司 胎儿游离核酸浓度的检测方法及试剂盒
US12084720B2 (en) 2017-12-14 2024-09-10 Natera, Inc. Assessing graft suitability for transplantation
US12398389B2 (en) 2018-02-15 2025-08-26 Natera, Inc. Methods for isolating nucleic acids with size selection
US12024738B2 (en) 2018-04-14 2024-07-02 Natera, Inc. Methods for cancer detection and monitoring
GB201810571D0 (en) 2018-06-27 2018-08-15 Cs Genetics Ltd Reagents and methods for the analysis of circulating microparticles
US12234509B2 (en) 2018-07-03 2025-02-25 Natera, Inc. Methods for detection of donor-derived cell-free DNA
ES2738176B2 (es) * 2018-07-20 2021-01-11 Bioarray S L Metodo para el estudio de mutaciones en embriones en procesos de reproduccion in vitro
CA3107467A1 (en) * 2018-09-07 2020-03-12 Sequenom, Inc. Methods, and systems to detect transplant rejection
CN109378037B (zh) * 2018-10-31 2023-04-14 中国石油大学(华东) 基于遗传学规律的等位基因准确推断方法
WO2020172164A1 (en) * 2019-02-19 2020-08-27 Sequenom, Inc. Compositions, methods, and systems to detect hematopoietic stem cell transplantation status
US20200381079A1 (en) * 2019-06-03 2020-12-03 Illumina, Inc. Methods for determining sub-genic copy numbers of a target gene with close homologs using beadarray
US12305235B2 (en) 2019-06-06 2025-05-20 Natera, Inc. Methods for detecting immune cell DNA and monitoring immune system
GB201909325D0 (en) 2019-06-28 2019-08-14 Cs Genetics Ltd Reagents and methods for analysis for microparticles
CN110438220A (zh) * 2019-08-16 2019-11-12 深圳市人民医院 纤毛不动综合症基因面板试剂盒及其应用
US12305242B2 (en) 2020-04-24 2025-05-20 The Johns Hopkins University Methods and related aspects for quantitative polymerase chain reaction to determine fractional abundance
US11946104B2 (en) 2020-07-07 2024-04-02 Billiontoone, Inc. Non-invasive prenatal testing at early stage of pregnancy
EP4266315A4 (en) * 2020-12-16 2024-11-20 Seedna Inc. METHOD FOR CALCULATING THE RELIABILITY VALUE OF A POLYMORPHISM LOCUS SIGNAL
CN113345515B (zh) * 2021-06-17 2024-05-31 苏州贝康医疗器械有限公司 新发平衡易位家系中胚胎遗传性检测方法及装置
CN113667734B (zh) * 2021-07-16 2022-05-24 四川大学华西医院 Shank3片段序列甲基化检测试剂在制备精神分裂症诊断试剂盒中的用途
EP4381099A1 (en) 2021-08-02 2024-06-12 Natera, Inc. Methods for detecting neoplasm in pregnant women
CA3223315A1 (en) 2022-02-16 2023-08-24 Michael Mehan Minimizing fetal fraction bias in maternal polygenic risk score estimation
CN115035950B (zh) * 2022-06-28 2025-08-12 广州燃石医学检验所有限公司 基因型检测方法、样本污染检测方法、装置、设备及介质
JP2025043574A (ja) * 2023-09-19 2025-04-01 株式会社東芝 試料識別方法及びバイオマーカー

Family Cites Families (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6270961B1 (en) 1987-04-01 2001-08-07 Hyseq, Inc. Methods and apparatus for DNA sequencing and DNA identification
US5976790A (en) 1992-03-04 1999-11-02 The Regents Of The University Of California Comparative Genomic Hybridization (CGH)
WO1994003638A1 (en) 1992-07-30 1994-02-17 Applied Biosystems, Inc. Method of detecting aneuploidy by amplified short tandem repeats
US5776737A (en) 1994-12-22 1998-07-07 Visible Genetics Inc. Method and composition for internal identification of samples
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
AU735272B2 (en) 1996-10-04 2001-07-05 Intronn Llc Sample collection devices and methods using markers and the use of such markers as controls in sample validation, laboratory evaluation and/or accreditation
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
JP2002503954A (ja) 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
US20020142324A1 (en) 2000-09-22 2002-10-03 Xun Wang Fungal target genes and methods to identify those genes
US6691042B2 (en) 2001-07-02 2004-02-10 Rosetta Inpharmatics Llc Methods for generating differential profiles by combining data obtained in separate measurements
US7226732B2 (en) 2001-07-16 2007-06-05 Cepheid Methods, apparatus, and computer programs for verifying the integrity of a probe
US6927028B2 (en) * 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US7893248B2 (en) 2002-02-20 2011-02-22 Sirna Therapeutics, Inc. RNA interference mediated inhibition of Myc and/or Myb gene expression using short interfering nucleic acid (siNA)
IL163600A0 (en) 2002-03-01 2005-12-18 Ravgen Inc Methods for detection of genetic disorders
US6977162B2 (en) * 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US20030194704A1 (en) 2002-04-03 2003-10-16 Penn Sharron Gaynor Human genome-derived single exon nucleic acid probes useful for gene expression analysis two
US7727720B2 (en) * 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
EP2359689B1 (en) 2002-09-27 2015-08-26 The General Hospital Corporation Microfluidic device for cell separation and use thereof
US10229244B2 (en) 2002-11-11 2019-03-12 Affymetrix, Inc. Methods for identifying DNA copy number changes using hidden markov model based estimations
US20040224331A1 (en) 2003-01-17 2004-11-11 The Trustees Of Boston University Haplotype analysis
EP1599608A4 (en) 2003-03-05 2007-07-18 Genetic Technologies Ltd Identification of fetal DNA and fetal cell marker in maternal plasma or serum
US20040209299A1 (en) 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
WO2005023091A2 (en) 2003-09-05 2005-03-17 The Trustees Of Boston University Method for non-invasive prenatal diagnosis
US20050221341A1 (en) 2003-10-22 2005-10-06 Shimkets Richard A Sequence-based karyotyping
US20050114205A1 (en) * 2003-11-21 2005-05-26 Kenneth Nelson Multi-media digital cartridge storage and playback units
WO2005072133A2 (en) 2004-01-27 2005-08-11 Zoragen, Inc. Nucleic acid detection
US20100216151A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20100216153A1 (en) * 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20060046258A1 (en) 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
WO2005116257A2 (en) 2004-05-17 2005-12-08 The Ohio State University Research Foundation Unique short tandem repeats and methods of their use
DE102004036285A1 (de) 2004-07-27 2006-02-16 Advalytix Ag Verfahren zum Bestimmen der Häufigkeit von Sequenzen einer Probe
JP2007327743A (ja) 2004-09-07 2007-12-20 Univ Of Tokyo 遺伝子コピーの解析方法及び装置
TW200624106A (en) 2004-09-07 2006-07-16 Uni Charm Corp Warming article
US20060286566A1 (en) * 2005-02-03 2006-12-21 Helicos Biosciences Corporation Detecting apparent mutations in nucleic acid sequences
US20060178835A1 (en) 2005-02-10 2006-08-10 Applera Corporation Normalization methods for genotyping analysis
US7645576B2 (en) 2005-03-18 2010-01-12 The Chinese University Of Hong Kong Method for the detection of chromosomal aneuploidies
AU2006256374A1 (en) 2005-06-08 2006-12-14 Compugen Ltd. Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis
US20060286558A1 (en) 2005-06-15 2006-12-21 Natalia Novoradovskaya Normalization of samples for amplification reactions
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
DE102005057988A1 (de) 2005-08-04 2007-02-08 Bosch Rexroth Ag Axialkolbenmaschine
EP3591068A1 (en) 2006-02-02 2020-01-08 The Board of Trustees of the Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
US20100184043A1 (en) * 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
EP2351858B1 (en) 2006-02-28 2014-12-31 University of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
US20080064098A1 (en) 2006-06-05 2008-03-13 Cryo-Cell International, Inc. Procurement, isolation and cryopreservation of maternal placental cells
WO2007147079A2 (en) 2006-06-14 2007-12-21 Living Microsystems, Inc. Rare cell analysis using sample splitting and dna tags
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
US20080050739A1 (en) 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
EP2589668A1 (en) 2006-06-14 2013-05-08 Verinata Health, Inc Rare cell analysis using sample splitting and DNA tags
EP2029779A4 (en) 2006-06-14 2010-01-20 Living Microsystems Inc HIGHLY PARALLEL SNP GENOTYPING UTILIZATION FOR FETAL DIAGNOSIS
US9328378B2 (en) 2006-07-31 2016-05-03 Illumina Cambridge Limited Method of library preparation avoiding the formation of adaptor dimers
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
AU2008213634B2 (en) 2007-02-08 2013-09-05 Sequenom, Inc. Nucleic acid-based tests for RhD typing, gender determination and nucleic acid quantification
US12180549B2 (en) 2007-07-23 2024-12-31 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using genomic sequencing
PL2557520T3 (pl) 2007-07-23 2021-10-11 The Chinese University Of Hong Kong Określanie zaburzenia równowagi sekwencji kwasu nukleinowego
CN101889074A (zh) 2007-10-04 2010-11-17 哈尔西恩莫尔丘勒公司 采用电子显微镜对核酸聚合物测序
EP2271772B1 (en) * 2008-03-11 2014-07-16 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US20090307180A1 (en) 2008-03-19 2009-12-10 Brandon Colby Genetic analysis
WO2009120808A2 (en) 2008-03-26 2009-10-01 Sequenom, Inc. Restriction endonuclease enhanced polymorphic sequence detection
US20090270601A1 (en) 2008-04-21 2009-10-29 Steven Albert Benner Differential detection of single nucleotide polymorphisms
EP2853601B1 (en) 2008-07-18 2016-09-21 TrovaGene, Inc. Methods for PCR-based detection of "ultra short" nucleic acid sequences
CA3069082C (en) 2008-09-20 2022-03-22 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US20100285537A1 (en) 2009-04-02 2010-11-11 Fluidigm Corporation Selective tagging of short nucleic acid fragments and selective protection of target sequences from degradation
AU2010311535B2 (en) 2009-10-26 2015-05-21 Lifecodexx Ag Means and methods for non-invasive diagnosis of chromosomal aneuploidy
EP3783110B1 (en) * 2009-11-05 2022-11-23 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
CN102597272A (zh) 2009-11-12 2012-07-18 艾索特里克斯遗传实验室有限责任公司 基因座的拷贝数分析
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US20120237928A1 (en) 2010-10-26 2012-09-20 Verinata Health, Inc. Method for determining copy number variations
EP2370599B1 (en) 2010-01-19 2015-01-21 Verinata Health, Inc Method for determining copy number variations
WO2011091063A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Partition defined detection methods
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
EP2513341B1 (en) * 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US20120010085A1 (en) 2010-01-19 2012-01-12 Rava Richard P Methods for determining fraction of fetal nucleic acids in maternal samples
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
WO2012012037A1 (en) 2010-07-19 2012-01-26 New England Biolabs, Inc. Oligonucleotide adaptors: compositions and methods of use
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
CN105243295B (zh) 2010-11-30 2018-08-17 香港中文大学 与癌症相关的遗传或分子畸变的检测
CN103620055A (zh) * 2010-12-07 2014-03-05 利兰·斯坦福青年大学托管委员会 在全基因组规模非侵入性确定亲本单倍型的胎儿遗传
WO2012088348A2 (en) 2010-12-23 2012-06-28 Sequenom, Inc. Fetal genetic variation detection
US20120190020A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
RU2671980C2 (ru) * 2011-02-09 2018-11-08 Натера, Инк. Способы неинвазивного пренатального установления плоидности
RS57837B1 (sr) 2011-04-12 2018-12-31 Verinata Health Inc Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama
GB2484764B (en) 2011-04-14 2012-09-05 Verinata Health Inc Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
AU2011373694A1 (en) 2011-07-26 2013-05-02 Verinata Health, Inc. Method for determining the presence or absence of different aneuploidies in a sample

Also Published As

Publication number Publication date
CY1117574T1 (el) 2017-04-26
WO2012142334A2 (en) 2012-10-18
SI3078752T1 (sl) 2018-12-31
SMT202000403T1 (it) 2020-09-10
PT3456844T (pt) 2020-08-25
EP3567124B1 (en) 2021-12-15
JP2018061514A (ja) 2018-04-19
CA2832468A1 (en) 2012-10-18
JP6760917B2 (ja) 2020-09-23
US20200251180A1 (en) 2020-08-06
AU2012242698B2 (en) 2014-09-04
HRP20181770T1 (hr) 2018-12-28
RS57837B1 (sr) 2018-12-31
PT3567124T (pt) 2022-02-01
PL3456844T3 (pl) 2020-11-16
HRP20220296T1 (hr) 2022-05-13
HRP20201249T1 (hr) 2020-11-13
PL3078752T3 (pl) 2019-02-28
DK3456844T3 (da) 2020-06-29
HK1195103A1 (zh) 2014-10-31
SI3456844T1 (sl) 2020-10-30
PL2697392T3 (pl) 2016-08-31
US9447453B2 (en) 2016-09-20
SI3567124T1 (sl) 2022-05-31
JP6268153B2 (ja) 2018-01-24
JP2014512817A (ja) 2014-05-29
EP2697392B1 (en) 2016-03-02
EP3567124A1 (en) 2019-11-13
ES2692333T3 (es) 2018-12-03
AU2012242698A1 (en) 2013-05-09
CA2832468C (en) 2023-10-31
EP3078752B1 (en) 2018-08-01
LT3456844T (lt) 2020-08-25
SMT201800558T1 (it) 2018-11-09
CN106319047B (zh) 2020-02-18
US20120264121A1 (en) 2012-10-18
US10658070B2 (en) 2020-05-19
CN106319047A (zh) 2017-01-11
SMT202200090T1 (it) 2022-03-21
ES2907069T3 (es) 2022-04-21
DK2697392T3 (en) 2016-03-29
DK3078752T3 (en) 2018-11-12
TR201816062T4 (tr) 2018-11-21
HUE041411T2 (hu) 2019-05-28
JP2016101168A (ja) 2016-06-02
ES2806728T3 (es) 2021-02-18
CN103797129A (zh) 2014-05-14
EP3456844B1 (en) 2020-06-10
EP3456844A1 (en) 2019-03-20
IL228843A0 (en) 2013-12-31
IL228843A (en) 2016-07-31
CY1125362T1 (el) 2024-02-16
US20170039318A1 (en) 2017-02-09
DK3567124T3 (da) 2022-03-07
JP5863946B2 (ja) 2016-02-17
EP3078752A1 (en) 2016-10-12
CY1123287T1 (el) 2021-12-31
ES2572912T3 (es) 2016-06-03
LT3567124T (lt) 2022-04-11
PT3078752T (pt) 2018-11-22
AU2012242698C1 (en) 2015-06-04
LT3078752T (lt) 2018-11-26
RS63008B1 (sr) 2022-03-31
HUE050032T2 (hu) 2020-11-30
EP4039820A1 (en) 2022-08-10
CY1120851T1 (el) 2019-12-11
PL3567124T3 (pl) 2022-04-19
EP2697392A2 (en) 2014-02-19
HUE057424T2 (hu) 2022-05-28
US20260038632A1 (en) 2026-02-05
CN103797129B (zh) 2016-08-17
WO2012142334A3 (en) 2013-04-25

Similar Documents

Publication Publication Date Title
US20260038632A1 (en) Resolving genome fractions using polymorphism counts
HK40072002A (en) Resolving genome fractions using polymorphism counts
HK40016329A (en) Resolving genome fractions using polymorphism counts
HK40016329B (en) Resolving genome fractions using polymorphism counts
HK40006382B (en) Resolving genome fractions using polymorphism counts
HK40006382A (en) Resolving genome fractions using polymorphism counts
WO2024249175A1 (en) Methods for discriminating between fetal and maternal events in non-invasive prenatal test samples
HK1233311B (zh) 使用多态计数来解析基因组分数
HK1195103B (en) Resolving genome fractions using polymorphism counts
HK1233311A1 (en) Resolving genome fractions using polymorphism counts